تعد الأدبيات العلمية في عصرنا الحديث متزايدة بشكل مذهل، مما يجعل من الصعب على الباحثين والممارسين التنقل بين كم المعلومات الهائل. في هذا السياق، يأتي دور نظم استرجاع المعلومات البحثية التي تساعد على تسهيل هذه العملية من خلال مهام مثل تلخيص النصوص وتصنيفها. وتعد هذه المهام أساسية لدعم العلماء والمهنيين في جهودهم للتنقل في هذه القارة المعرفية.
دراسة حديثة تناولت تقييم أداء نماذج اللغات الضخمة (Large Language Models) في تحليل النصوص العلمية وفقاً لمخططات تصنيف محددة. استخدمت هذه الدراسة تصنيف ORKG كأساس للتصنيف، بالاعتماد على مجموعة بيانات FORC كحقائق أرضية. تم اختبار استراتيجيات متقدمة للهندسة التحفيزية، منها التعلم السياقي (In-Context Learning) وسلسلة التعزيزات (Prompt Chaining).
أظهرت التجارب أن سلسلة التعزيزات تتفوق في دقة التصنيف مقارنةً بالتعلم السياقي البحت، خصوصاً عند تطبيقها على الهيكل المتداخل لتصنيف ORKG. حيث حققت نماذج اللغات الضخمة التي استخدمت سلسلة التعزيزات نتائج أفضل من نماذج الحالة الحالية في توقعات المستوى الأول، وأظهرت أداءً متفوقًا لتوقعات المستوى الثاني مقارنةً بنموذج BERT الأقدم. ومع ذلك، لا تزال نماذج اللغات الضخمة تواجه صعوبة في تصنيف المواضيع البحثية في المستوى الثالث وفقًا لهذا التصنيف الهرمي، حيث لم تتجاوز دقتها 50%.
باختصار، يرسم هذا البحث خريطة مفصلة لكيفية تحسين تصنيف النصوص العلمية وتحديات البحث المستمر في هذا المجال الحيوي.
ثورة في تصنيف النصوص العلمية: كيف يعمل التعلم السياقي على تحسين دقة التصنيف في نماذج اللغات الضخمة؟
تواجه الأدبيات العلمية المتزايدة تحديات كبيرة في التصفح واكتشاف المعرفة. دراسة حديثة تكشف كيف تعزز استراتيجيات التعلم السياقي من دقة تصنيف النصوص باستخدام نماذج اللغات الضخمة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
