في خطوة تطورية جديدة في مجال روبوتات التنقل، يقدم فريق من الباحثين نموذجًا مبتكرًا يُعرف بـ CoFL-S، والذي يركز على تحسين تمثيل الأفعال منخفضة المستوى في بيئات موجهة باللغة. يعد التنقل المدعوم بالرؤية والتفاعل اللغوي (Vision-Language Navigation) أحد أهم الاتجاهات في الذكاء الاصطناعي، لكن التحديات ما زالت قائمة في تمثيل الأفعال بشكل دقيق.
وبدلاً من الاعتماد فقط على التفكير العالي والذاكرة، يأتي نموذج CoFL-S لتوفير إطار عمل فعال يمكنه من التنبؤ ببرامج حركة مستندة إلى التعليمات اللغوية، مما يمكّن الروبوتات من إنشاء مسارات متصلة عبر رؤيتها المحلية. يعتمد هذا النموذج على تحويل كل حلقة من حلقات التعليمات (VLN-CE) إلى إشراف محلي متعدد المستويات، مما يسهل اتصال كل جزء من التعليمات بالإجراءات المناسبة.
لتحقيق ذلك، قام الفريق بتصميم معيار قياسي متواصل يركز على واجهات الأفعال منخفضة المستوى، حيث يسمح بإجراء مقارنات مغلقة الحلقة بين مختلف ترددات التخطيط. وقد أظهرت التجارب أن CoFL-S يتفوق بشكل متواصل على نماذج الأساس الأخرى، مما يعكس تفوقه على السيناريوهات الحقيقية بالإضافة إلى بيئات المحاكاة.
يعتبر CoFL-S علامة فارقة في سعي الذكاء الاصطناعي نحو التنقل الذاتي، حيث يعزز من قدرة الروبوتات على فهم التعليمات المعقدة وتنفيذها بكفاءة عالية.
ما رأيكم في هذا الابتكار المثير؟ كيف ترون تأثيره على مستقبل الروبوتات؟ شاركونا آراءكم في التعليقات.
ثورة في التنقل: تقديم نموذج CoFL-S لتمثيل الأفعال منخفضة المستوى في الروبوتات
يعلن الباحثون عن تطوير نموذج CoFL-S الذي يعزز التنقل في الروبوتات من خلال تمثيل الأفعال بدقة عالية. النموذج الجديد يعد بتحقيق أداء استثنائي مع التعامل مع التعليمات باللغة الطبيعية بشكل أفضل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
