مع تطور نماذج اللغة الكبيرة (Large Language Models) لتصبح وكلاء تفاعليين، يصبح من الضروري فهم مدى توافق سلوكهم مع الديناميكيات الاجتماعية البشرية. رغم أن نظرية الألعاب السلوكية تقدم إطارًا لدراسة هذه التفاعلات، إلا أن الأعمال السابقة اعتمدت بشكل أساسي على مقاييس مستندة إلى النتائج مثل المتوسطات، ما أغفل الآليات التي تسهم في التعاون المستدام.

المعالجة الجديدة التي نقدمها هي إطار SODE (تقييم الديناميكيات الاجتماعية)، والذي يقيم وكلاء نماذج اللغة الكبيرة عبر ثلاثة أبعاد تطورية:
1. **التعاون المباشر (Direct Reciprocity)** لتكيف الاستراتيجيات.
2. **التعاون غير المباشر (Indirect Reciprocity)** لحساسية السمعة.
3. **ديناميكيات المجموعات (Group Dynamics)** للمرونة التعاونية.

من خلال تطبيق SODE، تم الكشف عن تباينات منهجية: النماذج المدربة على التعليمات غالبًا ما تظهر "امتثالًا سلبيًا"، مما يجعلها عرضة للاستغلال، في حين أن نماذج التفكير تعطي الأولوية للتفاؤل على المدى القصير، مما يؤدي إلى عدم استقرار التعاون على المدى الطويل.

الأكثر إثارة للدهشة هو ما توصلنا إليه، وهو أن "إطار الزمان الطويل (long-horizon framing)" يمكن أن يفتح القدرات التبادلية في نماذج التفكير. ومن ثم، يوفر SODE معيارًا منهجيًا قائمًا على الآليات لتمكين وكالات الذكاء الاصطناعي من التوافق مع الديناميات الاجتماعية البشرية المعقدة.