في عالم الذكاء الاصطناعي، تعتبر قدرات الروبوتات في استخدام الأدوات من أبرز الفجوات التي يسعى الباحثون إلى سدها. لكن السؤال الجوهري يبقى: هل يمكن للروبوت استخدام صحن لقطع كعكة إذا لم يتوفر سكين؟ هنا يأتي دور GROW$^2، النظام الجديد الذي يهدف إلى تحسين هذه القدرات وتعزيز الإبداع في استخدام الأدوات.
تتجاوز GROW$^2 القيود التقليدية من خلال تطوير عملية حسابية تحت اسم "التمركز الحسي المجال المفتوح" (open-world affordance grounding). تتيح هذه العملية للروبوت اختيار كائنات من فئة مفتوحة للعمل كأدوات وتحديد مناطق العمل الدقيقة.
يعتمد GROW$^2 على تقسيم عملية التمركز بشكل هرمي إلى مستويين: السيمانتك (semantic) والهندسي (geometric). في المستوى الأول، يستفيد النظام من معالجة اللغة الطبيعية لنماذج الرؤية-اللغة (Vision-Language Models أو VLMs) لتحليل التعليمات واستنتاج الكائن المناسب لاستخدامه كأداة، بالإضافة إلى تحديد الأجزاء المعنية في الكائن المستهدف.
أما في المستوى الهندسي، فإن نماذج الأساس للرؤية تقوم بتمركز الأجزاء المحددة في مناطق ثلاثية الأبعاد دقيقة باستخدام صورة RGB-D واحدة. أظهرت التجارب المجراة على معايير معترف بها أن GROW$^2 يتفوق على الأساليب الرائدة الحالية في تصنيف إمكانية استخدام الأدوات، بل وينجح في تعميم النتائج على كائنات من فئات مفتوحة في بيئات محاكاة وعالمية حقيقية.
إن GROW$^2 يمثل خطوة هائلة نحو استخدام الروبوتات بطرق أكثر ذكاءً وإبداعًا، مما يفتح أبوابًا جديدة لمستقبل التفاعل بين الإنسان والآلة.
GROW$^2$: الرؤية الثورية لاستغلال الأدوات في الروبوتات
تقدم GROW$^2 استخدامًا متقدمًا للأدوات في الروبوتات، مما يساعدها على تخطي القيود التقليدية واستكشاف إمكانيات جديدة. هذا النظام يحدث ثورة في كيفية إدراك الروبوتات للأشياء واستخدامها.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
