في عالم معالجة اللغة الطبيعية (Natural Language Processing)، تظل مهمة الإجابة على الأسئلة السردية (Narrative Question Answering) واحدة من أكثر المهام تعقيدًا. تحتاج النماذج الذكية إلى قدرة على فهم سياقات نصية طويلة، والاستيعاب الجيد للعلاقات بين الأحداث، وتوليد ردود متماسكة. على الرغم من التقدم الملحوظ في نماذج اللغة المدربة مسبقًا، تعتمد معظم الأساليب الحالية على توليد جواب واحد فقط أثناء عملية الاستنتاج، مما يجعلها عرضة لتباين النتائج ويؤدي غالبًا إلى إجابات غير مكتملة أو غير متسقة.

لمعالجة هذه التحديات، قدم الباحثون إطار عمل مبتكر يسمى إعادة التصنيف القائم على الاتساق الذاتي (Self-Consistency-Based Reranking). يعتمد هذا الإطار على تشكيل عدة إجابات مرشحة لكل مزيج من القصة والسؤال، ثم يتم اختيار الإجابة النهائية بناءً على توافق المعاني بين الردود المتولدة. يمكّن هذا النموذج من استكشاف صيغ إجابات متنوعة مع تحسين الثبات من خلال الاختيار القائم على الإجماع، دون الحاجة لتعديل الهيكل الأساسي.

يجمع الإطار بين توليد اللغة المدربة مسبقًا والدقيقة، مع الاستنتاج متعدد الإجابات وإعادة التصنيف المعتمد على التشابه. تم تقييم هذه المقاربة الجديدة باستخدام مجموعة بيانات NarrativeQA وتمت تجربتها on نماذج متعددة مثل FLAN-T5 (Base وSmall) وPegasus-Large، سواء في إعدادات قاعدة البيانات أو الإعدادات الدقيقة.

أظهرت النتائج التجريبية أن الأسلوب الجديد يعزز الأداء باستمرار عبر جميع النماذج. على وجه الخصوص، سجل نموذج FLAN-T5-Base أفضل أداء إجمالي، حيث ارتفع من 82.32% إلى 86.66% (+4.34%) عند دمجه مع الاستنتاج القائم على الاتساق الذاتي. وكانت الزيادة الأكبر ملحوظة مع نموذج Pegasus-Large، حيث ارتفعت النسبة من 72.50% إلى 87.07% (+14.57%)، مما يبرز فعالية الاستراتيجية المقترحة.

هذه الابتكارات تعد بمثابة خطوة هامة نحو تحسين قدرة النماذج على استيعاب السياق وتقديم إجابات دقيقة ومتماسكة.

ما رأيكم في هذه التكنولوجيا الجديدة؟ هل تعتقدون أنها ستحدث ثورة في مجال معالجة اللغة الطبيعية؟ شاركونا آراءكم في التعليقات!