في عالم الذكاء الاصطناعي، يعد التخطيط تحت عدم اليقين من القدرات الأساسية التي يجب أن تتمتع بها الروبوتات المستقلة. ويعد نموذج عملية القرار ماركوف الجزئية (Partially Observable Markov Decision Process - POMDP) إحدى الأدوات الفعالة لتطبيق هذا النوع من التخطيط. ورغم التقدم الذي حققه التخطيط القائم على POMDP، إلا أن تطبيقه على المشكلات الواقعية يواجه تحديات متعددة من أبرزها صعوبة الحصول على نماذج POMDP دقيقة.
تقدم VOiLA (التخطيط عبر الإنترنت المعتمد على النماذج التعلمية) حلاً مبتكراً من خلال تطوير إطار يُمكِّن الروبوتات من التعلم والتخطيط تحت عدم اليقين. يستخدم VOiLA نماذج الانتشار الشرطية لتعلم عينات الانتقال والملاحظة، بالإضافة إلى نماذج للملاحظة التي تسمح بتحديثات تصديق تعتمد على الجسيمات.
لحماية فعالية التخطيط عبر الإنترنت، تُحوّل العينات الموجودة في النماذج إلى مولدات عصبية مضغوطة، وتندمج هذه المولدات مع مُخطط POMDP عبر الإنترنت (Vectorized Online POMDP Planner - VOPP) الذي تم تصميمه للاستفادة من تسريع GPU.
تشير النتائج التجريبية إلى أن استراتيجية التحويل تُقلل تكلفة العينة بما يصل إلى ثلاث مرات، مما يجعل النماذج الجينية المتعلمة لـ POMDP عملية وفعالة في التخطيط عبر الإنترنت. ويظهر تقييم VOiLA في ثلاثة مشكلات معيارية أنها تحقق أداءً متساوٍ أو أفضل من نموذج Recurrent Soft Actor Critic، مع استخدام أقل من 10% من بيانات التدريب، كما أنها تُظهر قدرة أفضل على تعميم الحلول على تكوينات بيئية جديدة.
تجارب تقييم الروبوتات الفيزيائية تشير إلى أن VOiLA قد تمكنت من استخدام النماذج المتعلمة من بيانات محاكاة فقط، ونجحت في تنفيذ المهام بنجاح في 10 من أصل 10 محاولات. تعد VOiLA خطوة كبيرة نحو تحقيق التحكم الذكي والتخطيط الفعال في الروبوتات المستقلة، مما يفتح آفاقًا جديدة لتطبيقات الذكاء الاصطناعي في الحياة اليومية.
ما رأيكم في هذا التطور المبهر؟ شاركونا في التعليقات.
VOiLA: تحقيق التخطيط الذكي في ظل عدم اليقين باستخدام نماذج الانتشار التعلمي
تقدم VOiLA إطاراً مبتكراً للتخطيط الذكي تحت ظروف عدم اليقين. بمساعدة نماذج التعلم، يثبت هذا النظام قدرته على تحسين أداء الروبوتات بشكل كبير في مهام التخطيط.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
