مع تزايد اندماج نماذج اللغة الكبيرة (Large Language Models) في مجالات تلامس المشاعر، أصبح من الضروري التحقق من سلامة الذكاء العاطفي (Emotional Intelligence) لهذه النماذج. المشكلة تكمن في أن المعايير الحالية غالبًا ما تخلط بين السلوك اللائق السطحي وبين التفكير العاطفي العميق، مما يؤدي إلى عدم التمييز بين الدقة الإدراكية والفاعلية التفاعلية.

في هذا السياق، تم تقديم إطار عمل جديد يعرف باسم FACET (اختبار الكفاءة العاطفية الوظيفية والتعاطف) الذي يحتوي على 480 عنصرًا تم تصميمها بواسطة خبراء. خلافًا لمقاييس السابقة، يعتمد FACET على نموذج القدرة المكون من أربعة فروع لماير وسالوفي وكاروسو، مما يُشغل الذكاء العاطفي من خلال الإدراك والتسهيل والفهم وإدارة العواطف.

من خلال تقييم تسعة نماذج رائدة، بما في ذلك GPT-5 وClaude-Sonnet-4، تبين أن الذكاء العاطفي ليس قدرة واحدة موحدة، بل يعاني من تفرقة في الأبعاد المعرفية والتفاعلية. ورغم أن النماذج الرائدة تُظهر كفاءة قوية في التعرف على المشاعر الموضوعية والتفكير الاجتماعي، إلا أن هذا لا يترجم باستمرار إلى نجاح تفاعلي.

تم تصنيف هذه التباينات إلى ثلاثة ملفات أداء متميزة: مهيمنة معرفيًا، مهيمنة تفاعليًا، والاعتمادية على السياق. تشير هذه الأنماط إلى أن المهارات العاطفية لا تتزايد بشكل متساوٍ مع الذكاء العام أو حجم النموذج، بل تتشكل وفقًا لنماذج التوافق المحددة. ومن المثير للاهتمام، تم تحديد التعرف على المشاعر الخفية كعنق زجاجة عالمي في كافة الهياكل.

تشير نتائج البحث إلى أن العمليات الحالية للذكاء الاصطناعي المعتمد على التعلم من التغذية الراجعة البشرية (RLHF) قد تعزز "التعاطف العشوائي"، وهو محاكاة إحصائية للغة العاطفية، على حساب التفكير العاطفي المتكامل. هذه الاكتشافات تتحدّى الفرضية القائلة بأن التعزيز العاطفي يتزايد بشكل خطي، وتوفر خارطة طريق دقيقة لتطوير وكلاء اجتماعيين قادرين على تحقيق صدى سريري حقيقي.