في عالم الذكاء الاصطناعي، تسهم نماذج الرؤية-اللغة-العمل (Vision-Language-Action) في دفع حدود التحكم في الروبوتات إلى آفاق جديدة. ورغم تقدم هذه النماذج، فإنها غالبًا ما تسلط الضوء على عملية التهيئة (pretraining) باعتبارها سلوكًا مُرشدًا تقليديًا، دون الأخذ في الاعتبار طبيعة التعلم الروبوتي كعملية يومية تعتمد على تحقيق الأهداف.
هنا يأتي دور نظام PRTS (نظام التفكير الأساسي والتكليف)، الذي يمثل نموذجًا مبتكرًا في مجال الرؤية-اللغة-العمل. يقوم PRTS بإعادة صياغة عملية التهيئة من خلال مفهوم التعلم المعزز القائم على الأهداف (Goal-Conditioned Reinforcement Learning)، حيث يتم اعتبار التعليمات اللغوية كأهداف للروبوتات.
وظيفة هذا النظام تكمن في تعلم فضاء ترميز موحد، حيث تتم مقارنة إنها المكونات الأساسية للمساحة مع الأهداف المحددة، وذلك باستخدام التعلم المعزز التبايني. يقوم النظام بتقييم إمكانية الوصول إلى الأهداف بدقة عالية، متجاوزًا التوافق الدلالي الثابت.
يدرج PRTS المعلومات من مسارات سابقة دون الحاجة إلى إشارات مكافأة، ويعمل على دمجها ضمن نموذج الدالة الخلفية (VLM) باستخدام قناع سببي مدرك للأدوار، مع زيادة بسيطة في الحمل الحسابي.
يعتبر هذا الأسلوب تطورًا كبيرًا في تحسين قدرة النظام على فهم التقدم الزمني للمهام، مما يعزز من نجاح تنبؤات الأفعال المستندة إلى الأهداف.
بعد تدريبه على 167 مليار وحدة من بيانات التطوير والتحليل، يحقق نظام PRTS أداءً مذهلاً في عدة بيئات مثل LIBERO وSimplerEnv، مما يؤكد أن زيادة الوعي بالوصول للأهداف يعزز كل من نجاح التنفيذ والتخطيط بعيد المدى لسياسات الروبوتات العامة.
إذا كنتم مثلاً تفكرون في تطبيق هذا النوع من الأنظمة في مجالات أخرى، ما هي الأفكار التي تأتي في ذهنكم؟ شاركونا في التعليقات!
نظام التفكير الأساسي والتكليف PRTS: ثورة في التحكم بالروبوتات باستخدام التعلم القائم على الأهداف!
يقدم نظام PRTS (نظام التفكير الأساسي والتكليف) رؤية جديدة لتحسين التحكم في الروبوتات من خلال التعلم المعتمد على الأهداف. يعيد هذا النظام تشكيل عملية التعلم بواسطة نماذج الرؤية واللغة من خلال دمج المعلومات الزمنية والفهم العميق للأهداف.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
