هل تخيلت يومًا أن نماذج اللغة الضخمة (Large Language Models) يمكن أن تتنافس في لعبة استراتيجية مثل مافيا؟ في تجربة جديدة ومثيرة، تم تطوير لعبة مافيا مصغرة تُسمى extit{Mini-Mafia} تتكون من أربعة لاعبين، حيث تركز ديناميكيات اللعبة على الذكاء الاجتماعي والتفاعلات بين الوكلاء بشكل مثير.

تدور أحداث اللعبة حول تفاعل واحد حاسم بين شخصية مافيا، ومحقق، وقرية، مما يُحتم على كل وكيل استخدام مهاراته في الخداع والكشف والتفريق بين الحقيقة والمزيف. وقد أظهرت الدراسات أن معدلات فوز المافيا يمكن التنبؤ بها باستخدام صيغة تحليلية معقدة تعتمد على قدرات الخداع والإفصاح.

ومع استخدام هذا الإطار التحليلي، تم إنشاء معيار extit{Mini-Mafia Benchmark}، الذي يعتمد على استنتاج بايزي من بيانات اللعب. هذا النهج جعل من الممكن تقدير المعلمات الأساسية لكل نموذج. وبهرنا بالأداء المثير للاهتمام، حيث تم الكشف عن أن Grok 3 Mini هو أفضل كاشف، بينما GPT-5 Mini يعتبر الأكثر فاعلية في الإفصاح.

الأرقام تكشف نتائج غير متوقعة، حيث ظل Claude Sonnet 4 هو الأضعف في الكشف، مما يعكس تنوعًا كبيرًا في موازين القوى بين نماذج الذكاء الاصطناعي المتنافسة. هذا يظهر كيف أن extit{Mini-Mafia}، رغم بساطتها، تقدم لنا نظرة معمقة على كيفية تفاعل نماذج اللغة الضخمة في سياقات متعددة الوكلاء، مما يجعلها معيارًا مثيرًا للاهتمام لفهم التفاعلات الاجتماعية في الذكاء الاصطناعي.

ماذا عنكم؟ هل تعتقدون أن الذكاء الاصطناعي يمكنه أن يتفوق في مثل هذه الألعاب الاستراتيجية؟ شاركونا آراءكم في التعليقات!