تمثل المآزق الاجتماعية المتتابعة (Sequential Social Dilemmas) تحديات معقدة تحتاج إلى حلول فعّالة وقادرة على التعامل مع السلوكيات البشرية غير المتوقعة. في هذا السياق، يسعى البحث الجديد إلى دراسة نموذج جديد يُعرف بقنوات التعاون، حيث يقوم وكيل ذكاء اصطناعي بمهمة إعادة تصميم أنظمة التعاون بشكل مستقل.

تتضمن الدراسة التي قام بها الباحثون استخدام نظام لكتابة السياسات يمكّنه من تشغيل عملية بحث تلقائي (autoresearch) لمعدل الأداء، حيث يقوم وكيل الباحث (Researcher Agent) بمراجعة الشيفرات المصدرية، وتعديل وظائف التغذية الراجعة ومكتبات المساعدة. هذا الوكيل لا يكتفي بدور الاستعراض، فهو أيضًا يقوم بتقييم الأنظمة وتحديد العناصر الجيدة التي يمكن الاحتفاظ بها.

أظهرت الدراسات التي تم تنفيذها على مجموعتين من الألعاب (Cleanup وGathering) وهدفين رعاية مختلفين، أن الوكيل الباحث يتفوق بموثوقية على الأساليب التصميمية التقليدية. كما أن طريقة البحث هذه تقلل بصورة حادة من تباين الأداء بين الجولات، متجاوزةً تحسينات تعتمد فقط على التوجيه النصي.

ليس ذلك فحسب، بل قام الوكيل الباحث بإدخال آلية للعدالة تُعتبر جوهرية في خطط المزيج المتعلق بالعوائد، وهو ما لم يكن موجودًا في الأنظمة الأصلية التي تم تصميمها للأهداف الكفاءة. هذا الاكتشاف يشير إلى جانب مثير للاهتمام في كيفية اختيارات الوكيل لكشف المعلومات الضرورية من أجل تحقيق الأهداف الاجتماعية.

لمزيد من التفاصيل حول هذا المشروع المبتكر، يُمكنك الاطلاع على الكود المتاح هنا: رابط المشروع.