تعد رؤية الهلاوس (Hallucinations) في نماذج اللغة الضخمة (Large Language Models) واحدة من القضايا الملحة التي تؤثر على أمان هذه التقنية وموثوقيتها. على الرغم من أن الأساليب الحالية لاكتشاف الهلاوس تحقق نتائج جيدة في مهام الإجابة على الأسئلة، إلا أنها تواجه صعوبات في المهام التي تتطلب التفكير والتحليل.

في هذا العمل الجديد، نستعرض اكتشاف الهلاوس من منظور اكتشاف البيانات الخارجة عن التوزيع (Out-of-Distribution Detection)، وهو مجال دراسي راسخ يتم تطبيقه في مجالات القدرة الحاسوبية مثل رؤية الكمبيوتر. من خلال إعادة صياغة عملية توقع الكلمة التالية في نماذج اللغة على أنها مهمة تصنيف، يمكننا تطبيق تقنيات اكتشاف البيانات الخارجة عن التوزيع، مع إجراء تعديلات مناسبة تأخذ في الحسبان الاختلافات الهيكلية في نماذج اللغة الضخمة.

لقد أظهرنا أن طرق الاكتشاف المبنية على البيانات الخارجة عن التوزيع توفر آليات كشف تعتمد على عينة واحدة ودون الحاجة إلى تدريب مسبق، مما يحقق دقة قوية في كشف الهلاوس في المهام التي تتطلب التفكير.

بشكل عام، يقترح عملنا أن إعادة صياغة كشف الهلاوس ككشف للبيانات الخارجة عن التوزيع يمثل طريقًا واعدًا وقابلًا للتوسع نحو تحقيق أمان نماذج اللغة.