قدم الباحثون نموذجًا مبتكرًا يحمل اسم Embodied-R1.5، وهو نموذج متجسد موحد (Unified Embodied Foundation Model) يجمع بين قدرات التفكير المتجسد والتخطيط والتصحيح والإشارة، كلها ضمن هيكل واحد يهدف إلى تحقيق الذكاء الفيزيائي العام.

تم تطوير هذا النموذج من خلال استغلال ثلاث عمليات آلية ضخمة لبناء البيانات، تسهم بشكل كبير في توسيع نطاق البيانات التي تغطي قدرات حرجة. ونتيجة لذلك، تم إنشاء نظام بيانات ضخم يضم أكثر من 15 مليار وحدة نصية (Token)، كما تم تصميم وصفة متوازنة للتعلم المعزز (Reinforcement Learning) لتخفيف النزاعات بين المهام المتنوعة.

أحد أبرز ملامح Embodied-R1.5 هو الإطار المغلق المعروف باسم Planner-Grounder-Corrector (PGC)، والذي يمكّن النموذج من تنفيذ المهام بنفسه وتصحيح الأداء على مدى فترات طويلة.

على الرغم من امتلاكه فقط 8 مليارات متغير، إلا أن Embodied-R1.5 يتجاوز الأبعاد الرائدة لنماذج الذكاء الاصطناعي الأخرى، حيث يحتل المرتبة الأولى في 16 من 24 مؤشراً للذكاء المتجسد (Embodied VLM).

لقد أثبت النموذج أيضًا كفاءته العالية في مجموعة واسعة من التجارب التي تتم بدون تدريب مسبق (Zero-shot) باستخدام روبوتات فعلية، مما يبرز قدرته على اتباع التعليمات، تحديد القدرات، والتلاعب بالأشياء المعقدة على مدى فترات طويلة.

بالإضافة إلى ذلك، تم فتح نموذج Embodied-R1.5 كمرجع مفتوح المصدر عبر توفير أوزان النموذج، مجموعات البيانات، شيفرات التدريب، وإطار تقييم محدد لمهام الذكاء المتجسد، مما يعزز الفرص المستقبلية للبحث في هذا المجال.