في زمن يتزايد فيه الاعتماد على الذكاء الاصطناعي (Artificial Intelligence)، أتت آخر الأبحاث لتؤكد على أهمية تطوير الوكلاء البرمجيين المدعومين بالنماذج العالمية التنفيذية (Executable World Models). تم تقييم النظام الجديد في تقرير جديد من قبل الباحثين، والذي يهدف إلى تحسين أداء الوكلاء في تجارب ARC-AGI-3.

يقوم النظام المبتكر بتوفير نموذج عالمي تنفيذي يعتمد على لغة بايثون، حيث يتحقق الوكيل من صحة هذا النموذج بمقارنتها بالملاحظات السابقة، ويقوم بإعادة هيكلته نحو تبسيط تجريبي، كوسيلة لتحسين كفاءته. وفي خطوة مذهلة، لا يعتمد النظام على أي منطق مخصص للعبة، بل يستخدم أدوات مساعدة متخصصة وواجهات نماذج عالمية محددة مسبقًا.

ومن جهة الأداء، أظهرت التجارب الأولية نتائج مبشرة، حيث استطاع الوكيل الذي يستخدم جهود تفكير عالية من GPT-5.5 حل 15 لعبة بالكامل، محققًا نسبة متوسط RHAE لكل لعبة بلغت 58.12%. بينما الوكيل المدعوم بـ GPT-5.4 تمكن من حل 8 ألعاب بمعدل RHAE بلغ 41.29%.

هذه النتائج تعكس بداية واعدة لاستخدام النماذج التنفيذية القائمة على المراجعة (Verifier-driven Executable World Models) كاستراتيجية فعالة لتعزيز أداء الوكلاء في مجموعة متنوعة من الألعاب. هل تريد تحقيق المزيد من التحسينات في عوالم الذكاء الاصطناعي؟ فلننتظر ونرى ما ستكشفه تلك الأبحاث المستقبلية.

ما رأيكم في هذا التطور الثوري؟ شاركونا أفكاركم في التعليقات!