تعد عملية جمع بيانات الحركة المتنوعة عالية الجودة اللازمة لتدريب نماذج الرؤية-اللغة-الإجراء (VLA) واحدة من التحديات الكبرى التي تواجه العديد من مجموعات البحث، إذ تظل التكاليف المرتبطة بالأطر الحالية للتحكم عن بعد باهظة للغاية. ومع ذلك، يأتي الابتكار الجديد Phone2Act بوحشية المنافسة كحل ثوري في هذا المجال.
**ما هو Phone2Act؟**
Phone2Act هو إطار عمل للتحكم عن بعد بتكلفة منخفضة وبدون اعتماد على أجهزة محددة، حيث يحول الهاتف الذكي العادي إلى وحدة تحكم لأجهزة الروبوت ذات الـ 6 درجات من الحرية (6-DoF) باستخدام Google ARCore. يعتمد النظام على معمارية ROS 2 القابلة للتعديل، مما يفصل منطق التحكم عن تفاصيل الأجهزة المحددة من خلال استخدام عقد جسر قابلة للتبديل، مما يتيح الدعم لبرامج الروبوتات الصناعية أو الأذرع ثنائية اليد الاقتصادية دون الحاجة لأي تعديلات برمجية معقدة.
**توثيق وتصدير البيانات بسلاسة**
كما تم تضمين مسجل عالمي (Universal Recorder) يعمل على مزامنة تدفقات فيديو متعددة الكاميرات مع ملاحظات حالة الروبوت، مما يسهل تصدير العروض بشكل أصلي في تنسيق مجموعة بيانات LeRobot، مما يلغي الحاجة لعمليات المعالجة اللاحقة. هذا يضمن إمكانية تدريب نماذج VLA في وقت قياسي وبدون جهد إضافي.
**تحقيق نتائج مذهلة**
أثبت النظام فعاليته من خلال تحسين نموذج GR00T-N1.5 على 130 حلقة تم جمعها، وقد حقق معدل نجاح يبلغ 90% في مهمة حقيقية تتضمن التقاط ووضع أشياء متعددة على روبوت فعلي، وهو Dobot CR5.
في عالم يتزايد فيه الاعتماد على الذكاء الاصطناعي والتكنولوجيا، يمثل Phone2Act خطوة عملاقة لتيسير الوصول إلى تقنيات التحكم عن بعد وتعزيز الأبحاث في مجال الروبوتات والذكاء الاصطناعي.
ما رأيكم في هذا التطور؟ شاركونا في التعليقات!
Phone2Act: نظام تحكم عن بعد ثوري للجميع بتكلفة منخفضة يجمع بيانات الذكاء الاصطناعي!
تقدم Phone2Act نظام تحكم عن بعد مبتكر يحول الهواتف الذكية إلى وحدات تحكم روبوتية متطورة، مما يمكّن الباحثين من جمع بيانات عالية الجودة بتكلفة معقولة. النظام يدعم مجموعة واسعة من الروبوتات دون الحاجة لتعديلات برمجية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
