أصبح مجال القيادة الذاتية (Autonomous Driving) يشهد تقدمًا ملحوظًا بفضل طرق جديدة في التعلم الآلي. إحدى هذه الطرق هي التعلم الذاتي (Self-play Reinforcement Learning)، الذي يتيح تدريب أنظمة القيادة بدون الحاجة للبيانات البشرية باهظة الثمن. بدلاً من الاعتماد على بيانات القيادة المجمعة من البشر، تعتمد هذه الطريقة على المحاكاة واسعة النطاق التي تعزز فعالية التدريب.
ومع ذلك، كانت هناك تحديات كبيرة مرتبطة بالقيادة التي تم تعلمها فقط من خلال هذه الطريقة. فقد وجدت الدراسة أن الأنظمة قد تتبنى عادات قيادة غريبة لا تتوافق مع أساليب البشر، مما يؤدي إلى سلوكيات غير متوقعة.
لحل هذه المعضلة، قدم الباحثون منهجًا جديدًا يقوم بمعالجة البيانات البشرية ليس كنموذج مستقيم، ولكن كهدف للتضييق على التدريب الذاتي. يشبه هذا الأسلوب إضافة توابل إلى طبق لذيذ، حيث يظهر أن القليل من البيانات البشرية، حتى بمعدل 30 دقيقة، يمكن أن يُحسن بشكل كبير من فعالية الأنظمة. بفضل هذا الأسلوب، تمكنا من تطوير سياسات قيادة تتوافق مع مسارات بشرية حقيقية، واختُتم التدريب في زمن قياسي يبلغ 15 ساعة باستخدام بطاقة رسوميات عادية.
لمن يرغب في التعرف أكثر على هذه الابتكارات، تم توفير مقاطع الفيديو وكود المصدر الكامل على الموقع spiced-self-play.com. هذه التطورات تعيد تعريف الإمكانيات المستقبلية للقيادة الذاتية وتوفر خطوات مهمة نحو عالم تفاعلي بين البشر والآلات. ما رأيكم في هذا التطور؟ شاركونا في التعليقات!
نحو قيادة ذاتية شبيهة بالبشر بفضل التعلم الذاتي وجرعة من البيانات البشرية
اكتشاف جديد يتيح تدريب أنظمة القيادة الذاتية بكفاءة عالية باستخدام بيانات بشرية قليلة جدًا. تعرفوا على كيفية تأثير التعلم الذاتي في تحسين سلوكيات القيادة بطريقة متوافقة مع البشر.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
