في عالم الذكاء الاصطناعي، أصبح التحول من إنتاج النصوص إلى تحقيق الأهداف من خلال تفاعل مستمر تطورًا مثيرًا. ولكن، تبقى مثل هذه التحديات تواجهها القدرة على نمذجة ديناميكيات البيئة، وهو ما يمثل عائقًا مركزيًا. تُظهر الأبحاث الحديثة أن الوكلاء الذين يقومون بأعمال مثل تحريك الأشياء أو التنقل بين البرمجيات أو التنسيق مع الآخرين يحتاجون إلى نماذج بيئية predictives قوية.

ولكن ما هي نماذج العالم (World Models)؟ يتم تفسير هذا المصطلح بشكل مختلف في مجتمعات البحث. هنا نطرح تصنيفًا يعتمد على محورين: الأول يحدد ثلاث مستويات للقدرة:

1. **المستوى 1 - المنبئ (L1 Predictor)**: يتعلم هذه النماذج القادرة على التعامل مع الانتقالات المحلية.
2. **المستوى 2 - المحاكي (L2 Simulator)**: يقوم بتجميع الانتقالات المحلية في تسلسلات متعددة الخطوات تحترم قوانين المجال.
3. **المستوى 3 - المطور (L3 Evolver)**: يعدل نموذج الوكيل بشكل مستقل عند فشل التوقعات مقابل الأدلة الجديدة.

المحور الثاني يحدد أربعة نظم حاكمة تحكم البيئة: البدنية، الرقمية، الاجتماعية، والعلمية. تحدد هذه الأنظمة القيود التي يجب أن تلبيها نماذج العالم وأين من المرجح أن تفشل.

باستخدام هذا التصنيف، قمنا بتجميع أكثر من 400 دراسة وملخص لأكثر من 100 نظام تمثيلي تشمل التعلم المعزز القائم على النموذج، وتوليد الفيديو، ووكلاء الويب والواجهات، والمحاكاة الاجتماعية متعددة الوكلاء، واكتشافات علمية مدفوعة بالذكاء الاصطناعي. كما نقوم بتحليل الأساليب، وأنماط الفشل، وممارسات التقييم عبر تعدد مستويات الأنظمة، ونقترح مبادئ تقييم مركزية واتفاقيات حد أدنى للتقييم القابل للتكرار، ونوضح إرشادات معمارية وتحديات حوكمة.

الخريطة الناتجة تربط بين مجتمعات كانت معزولة سابقًا وترسم مسارًا من التنبؤات السلبية نحو نماذج يمكنها محاكاة، وفي النهاية إعادة تشكيل البيئات التي تعمل فيها الوكالات. فما رأيكم في هذه التطورات؟ شاركونا في التعليقات!