تُعد ظاهرة الهلوسة (Hallucination) إحدى التحديات الكبرى التي تواجه نماذج اللغة الكبيرة (Large Language Models)، وقد خصص الباحثون جهودًا كبيرة لفهم هذه الظاهرة والحد من تأثيرها. في دراسة جديدة مقدمة من قِبل كالاى وفيمبلا، تم تقديم إطار probabilistic يُعرّف كيف أن الهلوسة تتعلق بمعدل 'المساحة المفقودة' (missing mass)، وهو مقياس يعكس نقص بيانات التدريب بالمقارنة مع مصدرها.
السؤالان الأساسيان اللذان يثيرهما هذا البحث هما: ما هي الخاصية التي تجعل الهلوسة في نماذج اللغة المحسوبة (calibrated LLMs) أمرًا لا مفر منه؟ وهل يمكن تجنب الهلوسة بالتخلي عن التوازن؟
للإجابة على هذه الأسئلة، قدم الباحثون خاصية جديدة تعرف بالابتكار (Innovation)، التي تقيس ميل النموذج لإنتاج مخرجات تتجاوز بيانات التدريب. توصل الباحثون إلى أن الابتكار هو نتيجة للشرط الذي حدده كالاى وفيمبلا للهلوسة.
المثير في الأمر أن الهلوسة تتضمن الابتكار، والابتكار بدوره يقود إلى الهلوسة بمعدل عالٍ من الاحتمالية. كما قدم الباحثون حدودًا أدنى لمعدل الهلوسة بناءً على 'معدل الابتكار' (innovation rate)، وبربط هذا المعدل بالمادة المفقودة، حققوا حدود جديدة لمعدل الهلوسة تأخذ بعين الاعتبار فقدان البيانات.
هذه الاكتشافات تخبرنا بأن الهلوسة ليست مجرد عيب في نماذج اللغة الكبيرة، بل هي جانب معقد يعكس كيفية معالجة البيانات غير المكتملة وكيف يمكن للنماذج أن تبتكر من خلال ما تعلمته. العلاقة بين الابتكار والهلوسة تدفعنا للتفكير في كيفية تحسين نماذج الذكاء الاصطناعي لمواجهة تحديات البيانات غير المكتملة.
الاكتشاف الجديد في نماذج اللغة: الابتكار كعامل في هلوسة البيانات!
يعد مفهوم الهلوسة من القيود الأساسية لنماذج اللغة الكبيرة، وقد قدم الباحثان كالاى وفيمبلا إطارًا probabilistic جديدًا لفهم هذا الظاهرة. يتمثل الابتكار في قدرة النموذج على إنتاج مخرجات تتجاوز بيانات التدريب مما يطرح تساؤلات جديدة حول طبيعة الهلوسة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
