في عالم الذكاء الاصطناعي المتسارع، يواجه وكلاء النماذج الأساسية (Foundation Model Agents) تحدياً يهدد نجاحهم في اتخاذ قرارات فعّالة في التطبيق العملي: وهو ما يُعرف بالفجوة بين المحاكاة والواقع (sim-to-real gap). هذه الفجوة تعني أن ما يتم تدريبه في بيئات محاكاة ليس دائماً ما ينطبق على الظروف الحقيقية، مما يقود إلى تصرفات غير صحيحة حتى مع وجود نية صحيحة.

ملك خبراء الروبوتات وإدارة السيطرة الكلاسيكية تحديات مماثلة وقد طوروا أطر عمل فعالة لمعالجتها. لكن مع الموجة الجديدة من وكلاء النماذج الأساسية، يجري تناول مشكلة موثوقية هذه الوكلاء كمفهوم جديد بالكامل. في دراستنا، نقترح رسم مشكلة الفجوة هذه كمسألة تقليدية مرتبطة بعملية اتخاذ القرار المبنية على ماركوف (Markov Decision Process)، والتي تشمل أربعة عناصر رئيسية: الملاحظة (Observation)، العمل (Action)، الانتقال (Transition)، والمكافأة (Reward).

نبدأ بتحديد جدول بحث شامل يترجم التحديات التقليدية إلى مجال نماذج المفاهيم، داعين إلى اعتماد حلول معروفة مثل تكييف المجال (Domain Randomization). نقدم أيضًا أمثلة عملية مثل أداة متعددة اللغات لإظهار كيف تؤدي الفجوات في الفضاء الملاحظ إلى تصرفات غير صالحة رغم النية الصحيحة.

الهدف النهائي لمخططنا هو دفع تحول جذري، يخلق مفردات موحدة ومعايير اختبار موحدة لتعزيز جيل جديد من الوكلاء الموثوقين لمجموعة واسعة من التطبيقات الواقعية.