في السنوات الأخيرة، شهدنا تقدماً هائلاً في مجالات الذكاء الاصطناعي، حيث نجحت نماذج اللغة متعددة الوسائط (Multimodal Large Language Models - MLLMs) في تحقيق إنجازات ملحوظة في مجالات مثل reasoning اللغوي والتصور البصري. ولكن، على الرغم من هذه الإمكانيات المثيرة، فإن هناك فجوة عميقة بين الذكاء الاصطناعي والذكاء البشري.

تظهر الأبحاث أن وكلاء الذكاء الاصطناعي، حتى مع وجود أدوات قوية ونماذج لغوية متطورة، يعانون من أداء ضعيف في المهام الأساسية التي يمكن للأطفال إنجازها بسهولة. وهذا يطرح أسئلة حول مدى قدرتهم على تقليد سلوكيات التفكير المعرفي لدى البشر.

استلهمًا من مقياس ويشزلر لذكاء الأطفال (WISC)، تم تقديم معيار ChildAgentEval، الذي يُعد الأول من نوعه الذي يقيم توافق العمر المعرفي في الوكلاء قائمين على نماذج MLLM. هذا المعيار يوفر منهجًا منهجيًا لمقارنة أداء التفكير لدى وكلاء الذكاء الاصطناعي التفاعلي مع مراحل التطور البشري العمرية، مما يكشف النقاط التي يمكن فيها للأنظمة الحالية تقليد سلوكيات معرفية محددة حسب العمر، والنقاط التي تعجز فيها.

مما لا شك فيه، أن هذا التطور يعد خطوة مهمة نحو تحقيق ذكاء اصطناعي أكثر إنسانية وفاعلية. ماذا سيكون تأثير هذا المعيار على تطوير مستقبل الذكاء الاصطناعي؟ هل يمكن أن يقودنا نحو خلق وكلاء قادرين على التفكير بطريقة مماثلة للبشر؟ لا تترددوا في مشاركتنا آراءكم حول هذا الموضوع الشيق في التعليقات!