في عصر تزايد الاعتماد على الذكاء الاصطناعي، أصبحت نماذج اللغة (Language Models) عنصراً أساسياً في العديد من التطبيقات. ولكن، تظهر دراسة حديثة أعدت تحت عنوان 'فانتوم بنش' (PhantomBench) مخاطر كبيرة يكمن وراءها تفاعلات معرفية غير دقيقة.
الهلاوس، تلك اللحظات التي تنتج فيها نماذج اللغة استجابات غير مستندة إلى الحقائق، باتت تمثل تهديداً حقيقياً، وخاصة في مجالات مثل الرعاية الصحية أو القضاء، حيث يمكن أن تؤدي المعلومات الخاطئة لنتائج مدمرة.
استعرض الباحثون في هذه الدراسة أكثر من 60,000 مصطلح وجسم غير موجود مأخوذ من مفاهيم حقيقية في مجالات متعددة، لتقييم 21 نموذجاً من نماذج اللغة عبر مختلف الأنواع والأحجام. النتائج كانت صادمة، إذ أظهرت معدلات هلاوس تصل إلى 86.7% في بعض الحالات، مما يكشف عن ضعف قدرة حتى النماذج الرائدة على التعرف على الحدود المعرفية.
'فانتوم بنش' هو الأول من نوعه كمعيار جماعي يحمل في طياته إمكانيات هائلة لدراسة سلوك النماذج تجاه المفاهيم النادرة والتي تميل للنماذج لإنتاج هلاوس بشأنها. بالإضافة إلى ذلك، يوفر الباحثون آلية لإنشاء 'فانتوم بنش' بشكل قابل للتوسع، مما يسمح بتوليد مفاهيم غير موجودة تتناسب مع احتياجاتهم الخاصة.
يحمل هذا البحث أهمية خاصة للممارسين والباحثين في مجال الذكاء الاصطناعي، داعياً إياهم إلى التعامل بحذر مع المعلومات التي تنتجها نماذج اللغة والحرص على التحقق منها.
فانتوم بنش: كيف تسلط الضوء على المخاطر الخفية لنماذج اللغة!
تكشف دراسة جديدة عن مخاطر 'الهلاوس' في نماذج اللغة التي تؤدي إلى استجابات غير دقيقة، مما يشكل تهديداً جدياً خاصة في المجالات الحساسة. مع ظهور 'فانتوم بنش'، أصبح لدينا أداة لتقييم سلوك هذه النماذج تجاه المفاهيم الغير موجودة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
