في عالم الذكاء الاصطناعي، أصبحت نماذج اللغات الضخمة (MLLMs) محط أنظار الباحثين بفضل تقدمها اللفظي والبصري الاستثنائي. ومع ذلك، تظل بعض الجوانب المرتبطة بالذكاء الذاتي - أي قدرة النموذج على التعرف على نفسه وذاته - محل تساؤل. ولتلبية هذه الحاجة، تم تقديم MirrorBench، وهو معيار جديد يعكس المفاهيم النفسية الكلاسيكية لاختبار التعرف على الذات (MSR).
يعمل MirrorBench على توسيع هذا المبدأ من خلال إطار عمل يتضمن مجموعة من المهام المتزايدة التحدي، مما يسمح بتقييم النماذج في مجالات متعددة، بدءًا من الإدراك البصري الأساسي وصولاً إلى تمثيل الذات على مستوى عالٍ.
أظهرت التجارب القائمة على نماذج MLLMs الرائدة أن أداءها، حتى في أدنى المستويات، يبقى بعيدًا عن القدرات البشرية، مما يكشف النقاب عن قيود أساسية في فهم الذات. هذه النتائج، التي تربط بين الفلسفات النفسية والذكاء المجسد، توفر إطارًا متسقًا لتقييم ظهور الذكاء العام في النماذج الكبيرة.
اقفز إلى هذا المجال المثير من البحث، واستكشف كيف يمكن لمعيار MirrorBench تغيير فهمنا للذكاء الاصطناعي وكيفية تفاعله مع العالم.
MirrorBench: ثورة في تقييم الذكاء الذاتي في نماذج اللغات الضخمة!
تقدم MirrorBench إطارًا جديدًا لقياس الذكاء الذاتي في نماذج اللغات الضخمة، مستوحى من اختبارات التعرف على الذات في علم النفس. نتائج التجارب تكشف عن محدودية في الأداء مقارنة بالبشر، مما يفتح آفاق جديدة لفهم الذكاء العام.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
