تتزايد أهمية نماذج اللغة الضخمة (LLMs) في العديد من التطبيقات الحياتية من الرعاية الصحية إلى الخدمات المالية، إلا أن الهلاوس التي تنتج عنها يمكن أن تؤدي إلى نتائج كارثية في القرارات بناءً على تلك النماذج. ومع تزايد الاعتماد على هذه التكنولوجيا، يصبح من الضروري فهم كيفية اكتشاف الهلاوس ومعالجة آثارها السلبية.

تتناول دراسة حديثة هذه المشكلة من خلال تقديم تصنيف هندسي يتيح لنا فهم كيفية اكتشاف الهلاوس في نماذج اللغة رغم التحديات المرتبطة ببيئات التشغيل. في معظم الأحيان، لا تتوفر للباحثين سوى معلومات بسيطة تتعلق بالسؤال والإجابة، مما يجعل من الصعب تصور ما يحدث داخل النموذج.

تقدم الدراسة ثلاثة أنواع تشغيلية من الهلاوس استنادًا إلى العلاقة بين استجابة النموذج ومجال الاستجابة المقبولة على الفضاء الهندسي. تم تعريف الأنواع كالتالي:

1. **عدم الإخلاص القريب من الاستعلام**: يمكن اكتشافه من خلال نسبة زاوية.
2. **التركيب الوهمي خارج مجال الاقتراحات**: ينتج توقيعًا اتجاهيًا يتفوق على الطرق التقليدية مثل NLI في تصنيف الأخطاء.
3. **الأخطاء الواقعية التي تشترك في المفردات والأطر مع الإجابات الصحيحة**: لا يمكن فصلها من خلال الهندسة الزاوية.

لإثبات صحة هذا التصنيف، قام الباحثون ببناء مجموعة بيانات مكونة من 212 زوجًا من الهلاوس البشرية عبر تسعة مجالات باستخدام أساليب تحفيز الهلاوس. من خلال هذا البحث، يمكن أن نصل إلى أدوات أفضل للكشف عن الهلاوس وفهم تفاصيلها.

استكشاف هذه الطبقات من الفهم يفتح آفاقاً جديدة لتحسين نماذج الذكاء الاصطناعي وضمان فاعلية استخدامها في المجالات الحساسة. فهل نحن على أعتاب ثورة في فهمنا للهلاوس في الذكاء الاصطناعي؟ شاركونا آراءكم حول هذه الدراسة وما يمكن أن تقدمه في مجال البحوث.