في عالم الروبوتات، تلعب توقعات الحركة دورًا محوريًا في خطط المهام والتلاعب. ومع ذلك، تشكل البيئات الفوضوية تحديًا كبيرًا، حيث يمكن أن تتسبب محاولات التخطيط غير الممكنة بواسطة ملاحِظات الحركة المعتمدة على العينة (Sampling-based Motion Planners - SBMPs) في تكاليف حسابية مرتفعة جدًا.
قدم باحثون حلولًا جديدة تتجاوز قيود الطرق التقليدية، حيث قاموا بدراسة كيفية تعلم توقعات الحركة المباشرة من المشاهد الصريحة RGB-D. وقدموا أول مرجع واسع النطاق يتضمن 2.7 مليون علامة جدوى الإمساك عبر 88 كائن مُمسَح و190 مشهد طاولة مزدحم.
عبر اختبارات تجريبية، قام الباحثون بتقييم ثلاث عائلات من النماذج: الشبكات العصبية متعددة الطبقات (MLP)، والشبكات العصبية المكانية (Volumetric-CNN)، ونماذج تحويل النقاط (Point-cloud-based Transformers). وقد أظهر النموذج الأفضل، GRASPFC-PTX، أداءً استثنائيًا حيث حقق نصيبًا دقيقًا يصل إلى 0.996 على الكائنات الجديدة، مع تقديم توقعات أسرع بكثير مقارنة بالأنظمة التقليدية.
هذا الابتكار يعد خطوة جديدة تقربنا نحو استخدام الروبوتات في مهام معقدة وسط فوضى حقيقية، مما يعكس تطورات مثيرة في مجال الذكاء الاصطناعي وتطبيقاته المستقبلية.
استكشف كيف يمكن للذكاء الاصطناعي تحقيق توقعات حركية دقيقة في بيئات فوضوية!
تقرير جديد يكشف عن كيفية استخدام التعلم العميق لتقدير إمكانية الحركة من مشاهد RGB-D في بيئات معقدة. النموذج الجديد GRASPFC-PTX يحقق نتائج مذهلة بسرعة تفوق الأنظمة التقليدية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
