في عالم الذكاء الاصطناعي، يعد [فهم المشاعر](/tag/[فهم](/tag/فهم)-[المشاعر](/tag/المشاعر)) أحد أبرز التحديات التي تواجه [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) ([LLMs](/tag/llms)). فالقدرة على [التفاعل](/tag/التفاعل) بفعالية مع البشر تتطلب قدرة عاطفية عميقة، وهذا ما يفشل فيه العديد من [النماذج](/tag/النماذج) الحالية. هنا يأتي دور [أداة](/tag/أداة) CAREBench، التي تعد الأولى من نوعها في [تقييم](/tag/تقييم) هذه القدرة.
تستند CAREBench إلى [نظرية](/tag/نظرية) [التقييم](/tag/التقييم) (Appraisal Theory)، وتقدم إطاراً تقييمياً فريداً يتضمن سلاسل [استدلال](/tag/استدلال) كاملة من وجهتي نظر الفرد الثالث والأول على أحداث سردية واقعية. تسلط هذه الأداة الضوء على عملية التقييم، وتقييم التقييمات، وتوصيف [المشاعر](/tag/المشاعر) المتعددة. من خلال إجراء [تجارب](/tag/تجارب) منهجية على ست [نماذج](/tag/نماذج) ([LLMs](/tag/llms))، تم [تنظيم](/tag/تنظيم) هذا [البحث](/tag/البحث) حول أربعة تساؤلات رئيسية.
يظهر [البحث](/tag/البحث) أن [النماذج](/tag/النماذج) الأقوى قادرة على مجاراة أو تجاوز البشر في بعض المهام، ولكنها تعاني من صعوبات في [استدلال](/tag/استدلال) [التقييم](/tag/التقييم) والتعرف على [المشاعر](/tag/المشاعر) الإيجابية. كما تكشف النتائج عن تباين ملحوظ في [الأداء](/tag/الأداء) [عبر](/tag/عبر) خطوات السلسلة وحساسية التدخلات المتعلقة بالاستدلال، مما يشير إلى أن [النماذج](/tag/النماذج) الحالية لم تتغلغل بعد في الآليات اللازمة لالتقاط الفروق الفردية العاطفية لدى البشر.
تشير هذه النتائج إلى أن المقاييس المستخدمة حاليًا في توقع [المشاعر](/tag/المشاعر) قد تفرط في تقدير الفهم الحقيقي للمشاعر في هذه النماذج، مما يجعل CAREBench أساسًا لتقييم تشخيصي أكثر [معلوماتية](/tag/معلوماتية) لقدرات الانفعالات العقلية في [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي). هل أنتم مستعدون لاستكشاف عوالم جديدة من [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) وفهم [المشاعر](/tag/المشاعر)؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات)!
CAREBench: الاختبار الثوري لفهم المشاعر في نماذج الذكاء الاصطناعي!
تقدم دراسة جديدة أداة CAREBench، الأولى من نوعها لتقييم فهم المشاعر في نماذج اللغات الضخمة (LLMs). هذه الأداة تعتمد على نظرية التقييم وتسلط الضوء على ثغرات مهمة في الطريقة الحالية لتقييم المشاعر.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
