في السنوات الأخيرة، برزت أهمية نماذج البيانات الضخمة (Foundation Models) في مجالات معالجة اللغة الطبيعية (Natural Language Processing) والرؤية الحاسوبية (Computer Vision)، ولكن ما زالت المبادئ الأساسية لتوسيع البيانات الفعالة في مجال التحكم بالروبوتات (Robotic Manipulation) غامضة إلى حد ما.

في دراسة حديثة، تم التحقيق في دور التنوع في البيانات بشكل معمق عن طريق تحليل ثلاث أبعاد حيوية في تعلم الروبوتات:

1. **المهمة**: ماذا يتعين عليه القيام به؟
2. **الجسد**: أي روبوت ينبغي استخدامه؟
3. **الخبير**: من يقوم بعرض الأداء؟

تحدت هذه الدراسة الفهم التقليدي القائل بأن "المزيد من التنوع هو الأفضل"، وكشفت من خلال تجارب واسعة النطاق على منصات روبوتية متعددة النقاط التالية:

- **أهمية تنوع المهام**: تبين أن تنوع المهام هو العامل الأكثر أهمية مقارنة بعدد عروض الأداء لكل مهمة، مما يسهل انتقال المعرفة من مهام تدريب متنوعة إلى سيناريوهات جديدة.
- **توافر بيانات متعددة الأجساد**: استخدام بيانات متعددة الأجساد أثناء التدريب ليس ضرورياً لنقل المعرفة بين الأجساد المختلفة؛ حيث أن النماذج المدربة على بيانات أجساد ذات جودة عالية تستطيع العمل بكفاءة على منصات مختلفة، مما يظهر خواص تصعيدية أفضل أثناء تحديد معالم النموذج.
- **تنوع الخبراء**: يؤدي التنوع بين المتخصصين المستمد من تفضيلات الأداء الفردية إلى صعوبة في تعلم السياسات، مع ظهور نمط السرعة كعامل رئيسي مسهم في هذه الازدواجية.

استنادًا إلى هذه النتائج، اقترح الباحثون طريقة لتقليل الغموض المرتبط بالسرعة، مما أدى إلى تحقيق أداء متفوق عبر النموذج GO-1-Pro، حيث سجل زيادة ملحوظة في الأداء تصل إلى 15%، وهو ما يعادل استخدام 2.5 مرة من بيانات التدريب السابقة.

تقدم هذه النتائج رؤى جديدة وتوجيهات عملية حول كيفية توسيع مجموعات بيانات الروبوتات بشكل فعال، مما يعزز الابتكار في هذا المجال.