في عالم الذكاء الاصطناعي، تتزايد الاهتمامات حول كيفية فهم الآلات للعقل البشري. في هذا السياق، تم تقديم مجموعة بيانات مبتكرة تحمل اسم DialToM، والتي تم تطويرها لاختبار قدرات نماذج اللغة الكبيرة (Large Language Models) على فهم الحوارات البشرية وتوقع التفاعلات الاجتماعية.

تتعمق دراسة DialToM في مفهوم نظرية العقل (Theory of Mind)، وهو القدرة على فهم حالات عقل الآخرين والتفاعل معها بشكل مناسب. تجري الدراسة باستخدام إطار عمل يعتمد على خيارات متعددة، حيث تم تقييم نماذج الذكاء الاصطناعي في تخمين الحالات الذهنية (Literal ToM) ووظائفها العملية (Functional ToM) من خلال التنبؤ التشخيصي المستقبلي.

تشير النتائج إلى وجود عدم تناسق ملحوظ في التفكير: فعلى الرغم من أن نماذج اللغة مثل Gemini 3 Pro أظهرت قدرة كبيرة على تحديد الحالات العقلية، إلا أن معظم هذه النماذج فشلت في استخدام هذا الفهم للتنبؤ بمسارات الحوار الاجتماعية بطريقة دقيقة. وتعكس النتائج أيضًا تشابهًا ضعيفًا في المعاني بين الاستنتاجات البشرية وتلك التي تولدها نماذج الذكاء الاصطناعي.

لضمان تكرارية التجارب ومراجعة النتائج، تم توفير مجموعة بيانات DialToM ورمز التقييم بشكل علني، مما يفتح المجال للباحثين لاستكشاف هذه القدرات المعقدة والتفاعلات الديناميكية.

هل أنت مستعد لاكتشاف كيف يمكن أن تؤثر هذه الاكتشافات على مجال الذكاء الاصطناعي وتفاعلاته مع البشرية؟ شاركنا برأيك في التعليقات!