تتجه [الأبحاث الحديثة](/tag/[الأبحاث](/tag/الأبحاث)-الحديثة) في مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) [نحو](/tag/نحو) [تطبيقات](/tag/تطبيقات) أكثر تفاعلاً وكفاءة، ومن بين هذه التطورات المثيرة يأتي مفهوم "[التدريب الهجين](/tag/[التدريب](/tag/التدريب)-الهجين)" (Hybrid Training) الذي يمهد الطريق لتحسين [أداء](/tag/أداء) [الروبوتات](/tag/الروبوتات) من خلال استخدام [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) والأفعال (Vision-Language-Action [Models](/tag/models)).

تظهر [الأبحاث](/tag/الأبحاث) أن استخدام [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) (Large Language [Models](/tag/models)) لإنتاج "[أفكار](/tag/أفكار) متسللة" (Chain-of-thought) قبل تقديم الإجابات قد ساهم في حل مهام لغوية معقدة بنجاح ملحوظ. في عالم الروبوتات، تبين أن [استراتيجيات](/tag/استراتيجيات) [التفكير](/tag/التفكير) المتجسد (embodied CoT) التي تنشئ أفكارًا قبل اتخاذ الإجراءات تؤدي أيضًا إلى تحسن كبير في [الأداء](/tag/الأداء) عند استخدام [نماذج](/tag/نماذج) (VLAs).

لكن كما هو الحال في معظم الابتكارات، فإن زيادة طول المدخلات الناتجة من النموذج تشمل تلك الأفكار يمكن أن تؤثر سلبًا على زمن الاستنتاج، مما يؤدي إلى تأخير [تنفيذ](/tag/تنفيذ) الإجراءات في الإعدادات [العملية](/tag/العملية). فهل فعلاً تعتبر "[توليد](/tag/توليد) سلاسل [أفكار](/tag/أفكار) طويلة" شرطًا مسبقًا رئيسيًا لتحقيق [تحسينات](/tag/تحسينات) في [الأداء](/tag/الأداء)؟

تقدم دراستنا فكرة [التدريب الهجين](/tag/[التدريب](/tag/التدريب)-الهجين) (HyT) كإطار [عمل](/tag/عمل) يتيح لنماذج (VLAs) [التعلم](/tag/التعلم) من الأفكار والاستفادة من [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) المرتبط، مع إمكانية تجاوز [توليد الأفكار](/tag/[توليد](/tag/توليد)-الأفكار) أثناء [الاستنتاج](/tag/الاستنتاج). من خلال [تعلم](/tag/تعلم) توقع مجموعة متنوعة من المخرجات بشكل شرطي، يدعم HyT [المرونة](/tag/المرونة) في زمن الاستنتاج، مما يمكّن النموذج من [التنبؤ](/tag/التنبؤ) بالإجراءات مباشرة، أو [توليد](/tag/توليد) الأفكار، أو اتباع [التعليمات](/tag/التعليمات).

قمنا بتقييم الطريقة المقترحة من خلال مجموعة من [التجارب](/tag/التجارب) [المحاكاة](/tag/المحاكاة) والتجارب الواقعية، مما يعكس الإمكانيات الواسعة لهذا النوع من [التدريب](/tag/التدريب) في استخدامات [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المختلفة.