في العقد الأخير، أصبحت نماذج اللغات الضخمة (LLMs) تُستخدم بشكل متزايد كعملاء مستقلين يتفاوضون، وينسقون، ويعملون بالنيابة عن المستخدمين. لكن هل تتعاون هذه النماذج في مثل هذه السياقات؟ هذا السؤال لم يعد مجرد موضوع أكاديمي، بل أصبح أحد القضايا المركزية في حوكمة الذكاء الاصطناعي.

تتناول دراسة حديثة هذا الموضوع من منظور سلوكي استراتيجي، حيث تسلط الضوء على كيفية تأثير حجم المكافآت (Payoff Scaling) واللغة على استراتيجيات التعاون بين النماذج. من خلال تجربة تشبه لعبة السجين (Prisoner’s Dilemma) المتكررة، تم استخدام مصنفات مشرف عليها للتعرف على استراتيجيات اللعبة الكلاسيكية (مثل التعاون المستمر، الخيانة المستمرة، المثل بالمثل، الفوز والبقاء أو الخسارة والتبديل).

تشير النتائج إلى أن النماذج تبرز سلوكاً مدهشاً: كلما كبرت المخاطر، توقعت نظرية الألعاب التطورية (Evolutionary Game Theory) أن تزداد حالات الخيانة بين المشاركين، لكن النماذج أظهرت بالعكس؛ حيث أصبحت أكثر تعاونية. ويبدو أن هذا السلوك يعكس نمط تفكير مشابه للبشر مستمد من بيانات التدريب.

للمزيد من العمق، وجد الباحثون أن هذا التأثير ليس خاصاً بالنماذج الكبيرة فقط، بل ينطبق أيضاً على نماذج أصغر ذات وزن مفتوح، مما يوسع آفاق البحث ويطرح تساؤلات عن كيفية تصميم وتحسين الأداء في النظم متعددة العملاء في بيئات متعددة اللغات.

في النهاية، تُظهر هذه الدراسة أن تصميم المكافآت وإطار اللغة يعدان أدوات قوية ولكن غير مستكشفة بشكل كافٍ لدفع سلوك النماذج، مما له تأثير مباشر على تقييم وتوجيه وإدارة أنظمة الذكاء الاصطناعي المعقدة.