في عالم الذكاء الاصطناعي، تعتبر الهلوسة مشكلة شائعة تواجه النماذج اللغوية الكبيرة (LLM) ونماذج الرؤية واللغة (VLM). في اكتشاف حديث، تم تقديم وسيلة جديدة تعتمد على "التنبؤ الانتقائي" للكشف عن هذه الهلوسة، حيث يقوم جهاز الكشف بتعيين درجة الثقة ويقرر عدم الاستجابة عند تدني الثقة.
المشكلة تكمن في أن تقنيات الكشف غير المشروطة مثل Semantic Entropy وEigenScore تؤدي إلى نتائج مرضية ولكنها تصل إلى مستوى معين من الجودة دون المزيد من التحسن. في المقابل، فإن الفحوصات الخاضعة للإشراف مثل SAPLMA تحقق نتائج أقوى ولكنها تتدهور بشكل حاد عندما تكون تسميات المعايرة نادرة.
يقوم الباحثون بإعادة بناء مانفولد الاستجابة لنموذج LLM عن طريق تقدير كثافة البيانات على خريطة ميزات حركية بعدة أبعاد، مما يسهل تسجيل التصنيفات استنادًا إلى ما يعرف بـ "قمة الكثافة". تتحدد النقاط في النموذج بواسطة المسافة الإقليدية السالبة من النقطة الموجودة في الفضاء إلى أقرب قمة، مما يسهل تصور التوزيع العشوائي الناتج.
تعتمد التجارب على سبع معايير تقييم (HaluEval-QA، TriviaQA، GSM8K، POPE، ScienceQA، A-OKVQA) باستخدام تسعة من نماذج LLM في بروتوكول يفتقر إلى تسميات المعايرة. تشير النتائج إلى أن السكور القائم على القمة يجلب تحسينات ملحوظة تصل إلى 20 نقطة في دقة المستويات، ويظهر تدهورًا مقبولًا تحت ضغط نقص تسميات المعايرة.
هذا البحث يمثل خطوة هامة نحو تحسين دقة نماذج الذكاء الاصطناعي وتعزيز موثوقيتها في تطبيقات متنوعة، مما يدعو الباحثين والمهتمين لمواصلة ابتكار تقنيات تكشف عن الهلوسة في مراحل متقدمة.
اكتشاف الهلوسة في نماذج الذكاء الاصطناعي: كيف يمكن للتنبؤ الانتقائي جلب الدقة في ظل نقص البيانات؟
تسلط الدراسة الجديدة الضوء على تحسين تقنيات اكتشاف الهلوسة في نماذج اللغات الكبيرة (LLM) ورؤية اللغة (VLM) من خلال استخدام التنبؤ الانتقائي. يكشف الباحثون كيف يمكن لتحليل النمسنة الأمنية التخفيف من تأثير نقص تسميات المعايرة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
