في عالم الذكاء الاصطناعي، لا يزال التحكم في التفاعل الجسدي الطبيعي مع الروبوتات يمثل تحديًا كبيرًا، ويرجع ذلك إلى التكاليف المرتفعة لجمع بيانات التشغيل عن بُعد (Teleoperation Data). لكن تظهر الأنوار في الأفق مع ظهور ZeroWBC، الإطار الثوري الذي يعد بتغيير قواعد اللعبة في هذا المجال.
ZeroWBC هو نظام يتجاوز الحاجة إلى البيانات مكلفة التشغيل عن بُعد، حيث يقوم بتعليم تفاعلات الروبوتات باستخدام مقاطع الفيديو الإيجوسنتري (Egocentric) لكل من البشر، مصحوبة بحركات جسمانية كاملة وتعليقات نصية منسقة. كل ذلك يتم عبر نموذج متطور يجمع بين الرؤية واللغة (Vision-Language Model) لتحقيق تفاعل سلس وطبيعي.
بفضل ZeroWBC، يتمكن الروبوت من فهم التعليمات اللفظية وتحويلها إلى حركات جسدية، مما يسمح له بتوليد سلوكيات تفاعلية لم يسبق لها مثيل، دون الاعتماد على العروض السابقة للروبوت. فهو يعتمد على صيغة توليد-ثم-تتبع (Generation-Then-Tracking) لمواجهة مشكلة التحكم في التفاعل الجسدي في المشاهد الثابتة. من خلال صورة إيجوسنتري أولية وتعليمات لغوية، تنتج النماذج حركات مستقبلية يمكن تحويلها إلى حركات متواصلة، مما يعزز تفاعلية الروبوت في استجابته للمواقف المختلفة.
كما تم تحسين الأداء التفاعلي عبر تقديم مكافأة تتبع موجهة للتفاعل، تركز على محاذاة الحركات الرئيسية مع الحفاظ على سلاسة الحركة الطبيعية للروبوت. أجريت تجارب أنجحت على الروبوت humanoid من نوع Unitree G1، والتي أظهرت أن ZeroWBC يمكّن الأداء المتنوع في المشاهد الواعية دون الحاجة إلى بيانات من تشغيل الروبوت.
هذا الابتكار يعد بفتح آفاق جديدة لتعلم كيفية التفاعل الجسدي الطبيعي لدى الروبوتات من البيانات البشرية، مما يشير إلى استراتيجية قابلة للتوسيع تتيح للروبوتات العمل بشكل أكثر انسجامًا مع البشر.
هل تعتقد أن ZeroWBC يمكن أن يغير صناعة الروبوتات بشكل جذري؟ شاركونا آرائكم في التعليقات.
ثورة جديدة في التحكم الروبوتي: ZeroWBC يغير قواعد اللعبة في التفاعل الجسدي!
تقدم ZeroWBC إطار عمل مبتكر يتيح تفاعلات جسدية طبيعية للروبوتات دون الحاجة إلى البيانات باهظة الثمن. عبر استخدام مقاطع فيديو إنسانية، يتمكن الروبوت من محاكاة سلوكيات تفاعلية متنوعة بكل سلاسة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
