في عالم يتسارع فيه تطور الذكاء الاصطناعي، أصبحت الوكلاء الذكيون (AI Agents) ذات إمكانيات عقلية معقدة، مثل التفكير متعدد الخطوات والتخطيط واستخدام الأدوات. هذه التطورات تدفع الوكلاء الذكيين نحو العمل كرفاق بشريين. ولكن، لنجاح التعاون الفعّال، يتعين على جميع الأطراف المعنية الحفاظ على نماذج عقلية دقيقة، سواء كانت مرتبطة بفهمهم الخاص للأمور، أو بتوقعاتهم لتوجهات شركائهم، أو حتى بالأهداف المشتركة التي يسعون لتحقيقها.

مع ذلك، تكاد الأجندة الحالية لذكاء الأعمال تفتقر إلى مجموعة بيانات موثوقة تعكس التعاون البشري الحقيقي خلف نماذج عقلية دقيقة. هنا يأتي دور مجموعة بيانات ALMANAC، التي تمثل خطوة ثورية في هذا الاتجاه.

تتكون ALMANAC من 2,987 عملية تعاون، مرتبطة بتعليقات نظرية توضح نماذج المشاركين العقلية، مثل تفكيرهم الذاتي، ونوايا الشريك، والأهداف المشتركة. هذه البيانات تستفيد من مهمة الخرائط الكلاسيكية (Map Task)، وهي مهمة ثنائية تتعلق بالتوجيه من علم الاجتماع.

لقد قمنا باختبار ستة نماذج لغوية ضخمة (Large Language Models) على توقع سلوكيات البشر في الأدوار التالية ونماذجهم العقلية. وقد أظهرت النتائج كيف يمكن لمجموعة بيانات ALMANAC أن تُستخدم بشكل فعّال لتقييم قدرات النماذج في محاكاة سلوكيات التعاون البشري واستنتاج نماذجهم العقلية الأساسية.

يمكن القول إن مجموعة بيانات ALMANAC تمثل علامة فارقة في سعي أكبر لفهم كيفية تحسين التفاعل بين البشر والذكاء الاصطناعي، مما يمهد الطريق لمستقبل أكثر تكاملاً وفاعلية في التعاون.