في عصر الذكاء الاصطناعي المتقدم، قدمت نماذج اللغات الضخمة (LLMs) وعودًا كبيرة في فهم البشر وسلوكياتهم. ومع ذلك، فقد وجدت دراسة جديدة شائقة أن هذه النماذج قد تفشل في توقع سلوكها الفعلي بناءً على التقارير الذاتية المرتبطة بالشخصية.
تتناول هذه الدراسة استخدام أداة نفسية مبتكرة تم تطويرها من السلوكيات المتاحة للنماذج اللغوية. حيث تم تحليل 300 عنصر تعكس 12 بُعدًا سلوكيًا محتملًا عبر 25 نموذجًا من عائلات نموذجية مختلفة. نتائج التحليل العواملي الاستكشافية (EFA) أسفرت عن هيكل من خمسة عوامل: الاستجابة، التقدير، الجسارة، الحذر، والثرثرة، مع مستوى عالٍ من موثوقية البيانات.
لإجراء اختبار صلاحية التنبؤ، تم جمع 2500 عينة سلوكية مفتوحة قُيمت بواسطة 151 مقيّماً بشرياً وثلاثة قضاة من نماذج اللغات. أظهرت النتائج أن تقييمات البشر وقضاة النماذج كانت متوافقة، لكن تقارير الشخصية الذاتية لم تتطابق مع سلوكياتهم. حيث أظهرت ارتباطات ضعيفة بين التقارير الذاتية وتقييمات البشر، مما يشير إلى أن النماذج قد تشترك في صفات معينة قد لا تكون مرئية للبشر.
هذه النتائج تثير تساؤلات حول فعالية تقارير النماذج اللغوية في تقييم سلوكها وكيف يمكن استخدامها بشكل صحيح في تطبيقات الذكاء الاصطناعي. إنها دعوة عاجلة للبحث عن أدوات قياس أكثر دقة، وتحذير من النتائج المترتبة على استخدام تقارير الشخصية في تحديد السلوكيات. ما هو رأيكم في هذا التطور؟ شاركونا في التعليقات!
كيف تخفق النماذج اللغوية الضخمة في توقع سلوكها؟ دراسة تكشف الفجوة الغامضة!
تظهر دراسة حديثة أن النماذج اللغوية الضخمة (LLMs) تحقق نتائج مستقرة في تقارير الشخصية، لكن هذه التقارير لا تتنبأ بالسلوك الفعلي. هل تعكس هذه الفجوة تفاوتًا بين المفاهيم الإنسانية والذكاء الاصطناعي؟
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
