في عالم الذكاء الاصطناعي، أصبحت نماذج اللغات الضخمة (MLLMs) محط أنظار الباحثين بفضل تقدمها اللفظي والبصري الاستثنائي. ومع ذلك، تظل بعض الجوانب المرتبطة بالذكاء الذاتي - أي قدرة النموذج على التعرف على نفسه وذاته - محل تساؤل. ولتلبية هذه الحاجة، تم تقديم MirrorBench، وهو معيار جديد يعكس المفاهيم النفسية الكلاسيكية لاختبار التعرف على الذات (MSR).

يعمل MirrorBench على توسيع هذا المبدأ من خلال إطار عمل يتضمن مجموعة من المهام المتزايدة التحدي، مما يسمح بتقييم النماذج في مجالات متعددة، بدءًا من الإدراك البصري الأساسي وصولاً إلى تمثيل الذات على مستوى عالٍ.

أظهرت التجارب القائمة على نماذج MLLMs الرائدة أن أداءها، حتى في أدنى المستويات، يبقى بعيدًا عن القدرات البشرية، مما يكشف النقاب عن قيود أساسية في فهم الذات. هذه النتائج، التي تربط بين الفلسفات النفسية والذكاء المجسد، توفر إطارًا متسقًا لتقييم ظهور الذكاء العام في النماذج الكبيرة.

اقفز إلى هذا المجال المثير من البحث، واستكشف كيف يمكن لمعيار MirrorBench تغيير فهمنا للذكاء الاصطناعي وكيفية تفاعله مع العالم.