في عالم الذكاء الاصطناعي، يتسارع تطوير نماذج جديدة قادرة على الارتقاء بتقنيات الروبوتات. واحدة من هذه التطورات المستقبلية هي CoRAL (التحكم التكيفي المعتمد على نماذج اللغات الكبيرة في البيئات الغنية بالتواصل). يتجاوز هذا النظام حدود نماذج اللغات الكبيرة (LLMs) ونماذج الرؤية واللغة (VLMs)، والتي رغم قدرتها المذهلة في الفهم العالي المستوى، تواجه تحديات عند تطبيقها في مواقف تتطلب تواصلًا ماديًا غنيًا.

CoRAL يتميز بإطاره المعياري الذي يمكّن من التخطيط بدون إعداد مسبق من خلال فصل التفكير العالي المستوى عن التحكم المنخفض المستوى. وبعكس السياسات التقليدية التي تُعتبر كصندوق أسود، يستخدم CoRAL نماذج اللغات الكبيرة كمصممي تكاليف، حيث يقوم بتجميع وظائف أهداف سياقية لمخطط حركة يعتمد على أخذ العينات.

لتعزيز الفهم المادي، يدمج CoRAL حلقة تعديل عصبي رمزي، حيث يوفر VLM مفاهيم دلالية حول ديناميات البيئة مثل تقديرات الكتلة والاحتكاك، والتي يتم تحسينها في الوقت الحقيقي عبر التعرف على النظام عبر الإنترنت. بينما تعدل نماذج اللغات الكبرى هيكل دالة التكلفة بناءً على ملاحظات التفاعل.

ويحتوي النظام أيضًا على وحدة ذاكرة قائمة على الاسترجاع تتيح له إعادة استخدام استراتيجيات ناجحة عبر المهام المتكررة. يضمن هذا الهيكل الهرمي استقرار التحكم في الوقت الحقيقي من خلال فصل التفكير الدلالي العالي المستوى عن التنفيذ التفاعلي، مما يسد الفجوة بين استدلال نماذج اللغات الكبيرة البطيء ومتطلبات الملامسة الديناميكية.

لقد تم اختبار CoRAL في بيئات محاكاة وأجهزة حقيقية، حيث أظهر فعالية ملحوظة في مهام جديدة ومعقدة، مثل قلب الأجسام ضد الجدران باستخدام الملامسات الخارجية. أشارت التجارب إلى أن CoRAL يتفوق على نماذج التخطيط المعتمدة على نماذج اللغة الكبيرة وأساسها بنسبة تجاوزت 50% في معدلات النجاح في ظروف غنية بالملامسات لم تُرَ من قبل، مما يعالج الفجوات بين المحاكاة والواقع من خلال فهمه التكيفي للمادة.