تتجه [الأبحاث الحديثة](/tag/[الأبحاث](/tag/الأبحاث)-الحديثة) في مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) [نحو](/tag/نحو) [تطبيقات](/tag/تطبيقات) أكثر تفاعلاً وكفاءة، ومن بين هذه التطورات المثيرة يأتي مفهوم "[التدريب الهجين](/tag/[التدريب](/tag/التدريب)-الهجين)" (Hybrid Training) الذي يمهد الطريق لتحسين [أداء](/tag/أداء) [الروبوتات](/tag/الروبوتات) من خلال استخدام [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) والأفعال (Vision-Language-Action [Models](/tag/models)).
تظهر [الأبحاث](/tag/الأبحاث) أن استخدام [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) (Large Language [Models](/tag/models)) لإنتاج "[أفكار](/tag/أفكار) متسللة" (Chain-of-thought) قبل تقديم الإجابات قد ساهم في حل مهام لغوية معقدة بنجاح ملحوظ. في عالم الروبوتات، تبين أن [استراتيجيات](/tag/استراتيجيات) [التفكير](/tag/التفكير) المتجسد (embodied CoT) التي تنشئ أفكارًا قبل اتخاذ الإجراءات تؤدي أيضًا إلى تحسن كبير في [الأداء](/tag/الأداء) عند استخدام [نماذج](/tag/نماذج) (VLAs).
لكن كما هو الحال في معظم الابتكارات، فإن زيادة طول المدخلات الناتجة من النموذج تشمل تلك الأفكار يمكن أن تؤثر سلبًا على زمن الاستنتاج، مما يؤدي إلى تأخير [تنفيذ](/tag/تنفيذ) الإجراءات في الإعدادات [العملية](/tag/العملية). فهل فعلاً تعتبر "[توليد](/tag/توليد) سلاسل [أفكار](/tag/أفكار) طويلة" شرطًا مسبقًا رئيسيًا لتحقيق [تحسينات](/tag/تحسينات) في [الأداء](/tag/الأداء)؟
تقدم دراستنا فكرة [التدريب الهجين](/tag/[التدريب](/tag/التدريب)-الهجين) (HyT) كإطار [عمل](/tag/عمل) يتيح لنماذج (VLAs) [التعلم](/tag/التعلم) من الأفكار والاستفادة من [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) المرتبط، مع إمكانية تجاوز [توليد الأفكار](/tag/[توليد](/tag/توليد)-الأفكار) أثناء [الاستنتاج](/tag/الاستنتاج). من خلال [تعلم](/tag/تعلم) توقع مجموعة متنوعة من المخرجات بشكل شرطي، يدعم HyT [المرونة](/tag/المرونة) في زمن الاستنتاج، مما يمكّن النموذج من [التنبؤ](/tag/التنبؤ) بالإجراءات مباشرة، أو [توليد](/tag/توليد) الأفكار، أو اتباع [التعليمات](/tag/التعليمات).
قمنا بتقييم الطريقة المقترحة من خلال مجموعة من [التجارب](/tag/التجارب) [المحاكاة](/tag/المحاكاة) والتجارب الواقعية، مما يعكس الإمكانيات الواسعة لهذا النوع من [التدريب](/tag/التدريب) في استخدامات [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المختلفة.
تدريب هجين للذكاء الاصطناعي: كيف تعزز نماذج اللغة والرؤية والأفعال أداء الروبوتات؟
تقديم نموذج التدريب الهجين (Hybrid Training) لنماذج الرؤية واللغة والأفعال (VLAs) يعزز من أداء الروبوتات مع تقليل زمن الاستجابة. استكشاف استراتيجيات تفكير البوت المتقدمة يعد خطوة نحو استخدام أكثر كفاءة للذكاء الاصطناعي في تطبيقات العالم الحقيقي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
