تعتبر تكنولوجيا الذكاء الاصطناعي رائدة في تقديم حلول مبتكرة للتحديات التي تواجه الإنسان، ومن أبرز تلك التحديات هو كيفية فهم الروبوتات للسياقات المحيطة بها عند تنفيذ المهام الاستكشافية. في حين كان يُعتقد أن الفشل في المهام هو عبارة عن عائق، فإن دراسة جديدة أثبتت أن هذا الفشل يمكن أن يتحول إلى دليل قوي يساعد على اتخاذ القرار الصحيح في الخطوات التالية.
على سبيل المثال، إذا حاول روبوت سحب درج مغلق ولم ينجح، فإن عدم القدرة على السحب يكشف عن حالة خفية: الدرج مقفل. وهذا يتطلب سلسلة من الإجراءات البسيطة لتحقيق النجاح، وهي: [فتح القفل، سحب الدرج]. وبالتالي، يحتاج الروبوت إلى قراءة صحيحة لهذا السجل ليتعلم كيفية إتمام المهمة.
تم تقديم إطار عمل جديد يُعرف بـ “Exploratory Manipulation Trace QA” (EMT-QA)، حيث يهدف إلى فهم كيفية استنتاج سلسلة الإجراءات الأساسية بناءً على التدفق الاستكشافي من الفيديو والأحاسيس الحركية المتزامنة. لكن بالرغم من التقدم الهائل في نماذج الفهم البصري المتعدد (VLM) ونماذج اللغة الضخمة المدمجة (multimodal LLMs)، فإن معظم هذه الأنظمة لم تتمكن من القراءة الصحيحة لهذا الدليل والسجل.
لحل هذه المشكلة، تم إدخال تقنية “Closed-Loop Trace Distillation”، التي تستخدم وكيل تشفير لكل مهمة لفحص سجلات التدريب الموصوفة وتقطير تعليمات بسيطة تُعرف باسم “Distilled Reading Heuristic” (DRH). عند مرحلة الاختبار، لا يتم استدعاء أي وكيل ولا يتم تحديث أي أوزان للنموذج؛ بل يستقبل نموذج VLM المجمد السجل الفوري بالإضافة إلى DRH كمدخلات.
عبر خمس مهام سواء في المحاكاة أو الروبوتات الحقيقية، أظهرت DRH تحسينًا في دقة السلسلة بنسبة تتراوح بين +0.38 إلى +0.47 مقارنة بأفضل الحالات الأساسية. وهكذا، أظهرت DRH أيضًا أنها تمثل المواصفات الوحيدة للمتعلمين البرمجيين الذين يمكنهم التوافق مع نموذج VLM الموجه.
هذا الإنجاز يمثل خطوة كبيرة نحو تحسين القدرات الذكية للروبوتات ويعطي لمحة عن المستقبل الذي ستصبح فيه الروبوتات أكثر قدرة على التعلم وفهم العوائق التي قد تواجهها. هل أنتم متحمسون لمستقبل الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!
ثورة جديدة في فهم الروبوتات: كيف تعزز تقنيات التصريف المغلق دقة المهام الاستكشافية!
تشهد robotics تطوراً حديثاً من خلال تقنية التصريف المغلق (Closed-Loop Distillation) التي تعزز من قدرة الروبوتات على فهم السياقات الخفية خلال المهام الاستكشافية. هذه التقنية الجديدة تعد بفتح آفاق جديدة في مجالات الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
