تواجه نماذج اللغة الكبيرة (Large Language Models) تحديات كبيرة تتعلق بظهور ما يُعرف بالهلوسات، وهي استجابات ملائمة لكنها غير دقيقة من الناحية الواقعية. بينما كانت الدراسات السابقة تُعزو هذه الظاهرة إلى نقص في المعرفة، يكشف بحث جديد أن هذه الهلوسات يمكن أن تحدث حتى في وجود المعرفة المطلوبة. يُشير البحث إلى أن الأمر يتعلق بعدم استقرار الاسترجاع أكثر من كونه نقصاً في المعرفة.

ولفهم هذه الظاهرة بشكل أفضل، تم تقديم إطار هندسي جديد يُسمى "APORIA"، الذي يعني "جمع الملاحظات حول عدم استقرار الاسترجاع عبر غير التماثل". يركز هذا الإطار على دراسة الردود المتكررة لنفس الطلب في فضاء تمثل الجمل، ويعد فرضنا المركزي هو أن الردود الصحيحة تتجمع بشكل أكثر تماسكًا مقارنة بالردود الهلوسية.

من خلال التجارب العملية، تم التحقق من صحة هذا المفهوم، حيث أصبحت الفئات المختلفة من الردود تتباين بشكل واضح بعد إجراء التحويل باستخدام طريقة "فشر". مما يتيح لنا استغلال هذا التباين باستخدام طريقة تصنيف فعّالة يُطلق عليها "APORIA-LP"، حيث يمكن تصنيف مجموعة كبيرة من الردود باستخدام أقل من 30-50 توضيح، محققًا درجات F1 تزيد عن 90% عبر عشر نماذج صغيرة.

وبهدف دعم المزيد من الأبحاث في هذا المجال، تم إصدار مجموعة بيانات "SOCRATES-300K"، التي تشمل 300,000 رد مع علامات كاملة، بالإضافة إلى الشيفرة اللازمة لتوليد هذه البيانات وإعادة إنتاج النتائج. تكمن أهمية هذه النتائج في إعادة صياغة فهمنا للهلوسات من منظور هندسي، مما يمكّن من فتح آفاق جديدة للأبحاث في مجالات أخرى تخص الذكاء الاصطناعي.