في عصر التحول الرقمي وازدهار تقنيات الذكاء الاصطناعي، يكتسب دمج الذكاء العاطفي (Emotional Intelligence) في النماذج اللغوية المتعددة الوسائط (Multimodal Large Language Models) أهمية متزايدة. فخلال الدمج مع أنظمة الروبوتات والتطبيقات الذكية، يصبح من الضروري لهذه النماذج القدرة على فهم المشاعر البشرية وتفسيرها والاستجابة لها بفعالية في سيناريوهات الحياة الواقعية.
تأسس EmoBench-M كمعيار شامل يهدف إلى تقييم الذكاء العاطفي للنماذج اللغوية المتعددة الوسائط عبر 13 سيناريو تقييم، موزعة على ثلاثة أبعاد هرمية: التعرف على المشاعر الأساسية (Foundational Emotion Recognition)، فهم المشاعر في المحادثات (Conversational Emotion Understanding)، وتحليل المشاعر الاجتماعية المعقدة (Socially Complex Emotion Analysis). هذا المعيار مصمم بمراعاة النظريات النفسية المثبتة، مما يوفر إطار عمل قادراً على التقاط التحديات الديناميكية والمعقدة للتفاعلات العاطفية.
تم اختبار EmoBench-M على 27 من أحدث نماذج اللغات المتعددة الوسائط، مستخدمة معايير موضوعية ومتخصصة. أظهرت النتائج وجود فارق أداء كبير مقارنة بقدرات البشر، حيث حققت النموذجين الأبرز، Gemini-3.0-Pro وGPT-5.2، أعلى النقاط بـ 70.5 و66.5 على التوالي. ومع ذلك، فإن النماذج المتخصصة مثل AffectGPT أظهرت تبايناً في الأداء، حيث تألقت في بعض السيناريوهات لكنها تعاني من نقص في الذكاء العاطفي الشامل.
يتيح EmoBench-M للباحثين والمطورين تقييم نقاط القوة والضعف للنماذج اللغوية المتعددة الوسائط في سياقات عاطفية متنوعة. جميع الموارد المتعلقة بالمعيار متاحة للجمهور بما في ذلك البيانات البرمجية، مما يسهل المزيد من البحث والتطوير في هذا المجال الحيوي. لمزيد من التفاصيل، يمكنك زيارة [رابط EmoBench-M](https://emo-gml.github.io/).
EmoBench-M: ثورة في قياس الذكاء العاطفي لنماذج اللغة المتعددة الوسائط
تقدم EmoBench-M معياراً جديداً لتقييم الذكاء العاطفي للنماذج اللغوية المتعددة الوسائط، مما يعزز قدرتها على فهم المشاعر البشرية في مختلف السيناريوهات. هذه الأداة تعد خطوة هامة نحو تحسين تفاعل الروبوتات والتطبيقات الذكية مع البشر.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
