أصبح مجال القيادة الذاتية (Autonomous Driving) يشهد تقدمًا ملحوظًا بفضل طرق جديدة في التعلم الآلي. إحدى هذه الطرق هي التعلم الذاتي (Self-play Reinforcement Learning)، الذي يتيح تدريب أنظمة القيادة بدون الحاجة للبيانات البشرية باهظة الثمن. بدلاً من الاعتماد على بيانات القيادة المجمعة من البشر، تعتمد هذه الطريقة على المحاكاة واسعة النطاق التي تعزز فعالية التدريب.

ومع ذلك، كانت هناك تحديات كبيرة مرتبطة بالقيادة التي تم تعلمها فقط من خلال هذه الطريقة. فقد وجدت الدراسة أن الأنظمة قد تتبنى عادات قيادة غريبة لا تتوافق مع أساليب البشر، مما يؤدي إلى سلوكيات غير متوقعة.

لحل هذه المعضلة، قدم الباحثون منهجًا جديدًا يقوم بمعالجة البيانات البشرية ليس كنموذج مستقيم، ولكن كهدف للتضييق على التدريب الذاتي. يشبه هذا الأسلوب إضافة توابل إلى طبق لذيذ، حيث يظهر أن القليل من البيانات البشرية، حتى بمعدل 30 دقيقة، يمكن أن يُحسن بشكل كبير من فعالية الأنظمة. بفضل هذا الأسلوب، تمكنا من تطوير سياسات قيادة تتوافق مع مسارات بشرية حقيقية، واختُتم التدريب في زمن قياسي يبلغ 15 ساعة باستخدام بطاقة رسوميات عادية.

لمن يرغب في التعرف أكثر على هذه الابتكارات، تم توفير مقاطع الفيديو وكود المصدر الكامل على الموقع spiced-self-play.com. هذه التطورات تعيد تعريف الإمكانيات المستقبلية للقيادة الذاتية وتوفر خطوات مهمة نحو عالم تفاعلي بين البشر والآلات. ما رأيكم في هذا التطور؟ شاركونا في التعليقات!