مما لا شك فيه أن نماذج رؤية اللغة والحركة (Vision-Language-Action Models) قد حققت إنجازات مذهلة في مجالات الروبوتات، لكن القيود المتعلقة بلغة الأحداث المستخدمة أثناء التدريب، والمعروفة ب"الأفق"، كانت تشكل تحديًا أمام تحسين أدائها.
دراسة جديدة تقترح استراتيجية مبتكرة تدعى "مزج الآفاق" (Mixture of Horizons)، والتي تهدف إلى التغلب على العيوب المرتبطة بزيادة طول الآفاق وتقليل الدقة في المهام قصيرة المدى. تميزت هذه الاستراتيجية بقدرتها على إعادة ترتيب كتل الأحداث إلى أجزاء متعددة ذات آفاق مختلفة، مما يسمح بمعالجة هذه الأجزاء بشكل متزامن بواسطة أداة تحويل واحدة مشابهة، وتمزج المخرجات باستخدام بوابة خطية خفيفة.
تقدم استراتيجية مزج الآفاق ثلاث فوائد رئيسية:
1) الاستفادة من البصيرة على المدى الطويل والدقة على المدى القصير في نموذج واحد، مما يعزز الأداء وقدرة النموذج على التعميم على المهمات المعقدة.
2) سهولة دمجها في وحدات الأحداث الكاملة مع الحد الأدنى من الفترات التدريبية أو الزمنية للتنفيذ.
3) إمكانية الاستنتاج الديناميكي مع آفاق متنبأ بها، حيث تختار الإجراءات المستقرة من خلال توافق الآفاق المختلفة، مما يؤدي إلى زيادة إنتاجية تصل إلى 2.5 ضعف مقارنة بالمعايير السابقة دون التفريط في الأداء.
البحوث التجريبية التي تم إجراؤها على سياسات تدفق متعددة (مثل π_0 وπ_{0.5}) و سياسة الانحدار لخطوة واحدة (π_{ ext{reg}}) أظهرت أن هذه الاستراتيجية توفر تحسينات ملحوظة في الأداء، سواء في البيئات المحاكية أو في التطبيقات الواقعية. من المثير للاهتمام أن الاستراتيجية ضمن بيئة متعددة المهام أظهرت نتائج مذهلة، حيث حقق النموذج مع مزج الآفاق نسبة نجاح تصل إلى 99% على مجموعة بيانات LIBERO بعد 30,000 دورة تدريب.
في النهاية، يستمر البحث في توظيف نماذج الذكاء الاصطناعي لتحسين أداء الروبوتات، مما يفتح آفاقاً جديدة نحو تطبيقات مستقبلية مبتكرة.
استكشاف آفاق جديدة في نماذج الذكاء الاصطناعي: استراتيجية مزج الآفاق
قدمت الأبحاث الجديدة استراتيجية مبتكرة تدعى مزج الآفاق (Mixture of Horizons) لتحسين أداء نماذج رؤية اللغة والحركة (VLA) في الروبوتات، مما يحقق توازناً مثالياً بين الدقة والتحكم. هذه الاستراتيجية تعد بتقديم أداء متفوق مع زيادة في الإنتاجية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
