أصبح [تحسين](/tag/تحسين) [نظرية العقل](/tag/[نظرية](/tag/نظرية)-العقل) (Theory of Mind) أمراً محورياً في [تطوير](/tag/تطوير) [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) ([LLMs](/tag/llms)) القادرة على [التفاعل](/tag/التفاعل) بشكل أفضل مع البشر. على الرغم من الجهود السابقة في [تقييم](/tag/تقييم) هذه القدرات [عبر](/tag/عبر) [أسئلة متعددة الخيارات](/tag/أسئلة-متعددة-الخيارات) أو [قصص](/tag/قصص) مقروءة، غالباً ما تغفل هذه الطرق الطبيعة الديناميكية والتفاعلية للعلاقات بين البشر والذكاء الاصطناعي.

في خطوة جديدة [نحو](/tag/نحو) [فهم](/tag/فهم) كيف تسهم [تقنيات](/tag/تقنيات) [تحسين](/tag/تحسين) [نظرية العقل](/tag/[نظرية](/tag/نظرية)-العقل) في [تحسين](/tag/تحسين) هذه التفاعلات، اقترح الباحثون نموذجاً جديداً للتقييم التفاعلي ينطوي على تبني وجهات نظر متعددة وقياسات مختلفة. من خلال هذه المقاربة، أجروا [دراسة](/tag/دراسة) منهجية على أربع [تقنيات](/tag/تقنيات) بارزة لتعزيز قدرة [نظرية](/tag/نظرية) العقل، مستخدمين [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) حقيقية ودراسة مستخدمين عكست التوجهين: المهام الموجهة [نحو](/tag/نحو) الهدف مثل [البرمجة](/tag/البرمجة) والرياضيات، والمهام المرتكزة على [التجربة](/tag/التجربة) مثل الاستشارات.

وكشفت النتائج أن التحسينات التي تظفر بها [النماذج](/tag/النماذج) في الاختبارات الثابتة لا تعكس دائماً أداءً أفضل في [التفاعلات](/tag/التفاعلات) الديناميكية مع البشر. تقدم هذه [الدراسة](/tag/الدراسة) [رؤى](/tag/رؤى) حاسمة حول [تقييم](/tag/تقييم) [نظرية](/tag/نظرية) العقل، مما يبرز ضرورة اعتماد [تقييمات](/tag/تقييمات) مبنية على [التفاعل](/tag/التفاعل) لتطوير [نماذج لغة](/tag/[نماذج](/tag/نماذج)-[لغة](/tag/لغة)) [اجتماعية](/tag/اجتماعية) الواعية للبشرية، والتي تعكس [التعاون](/tag/التعاون) المثمر بين البشر والذكاء الاصطناعي.