شهدت الرياضة الذاتية تحولات مذهلة بفضل التعلم العميق المعزز (Deep Reinforcement Learning) خاصة في مجال السيارات ذات الأربع عجلات. لكن مع إدخال الدراجات النارية، تبرز تحديات جديدة تتعلق بالتحكم في التوازن وزاوية الميل، بالإضافة إلى الحاجة لاستجابة سريعة للتحكم والتوجيه.في هذا السياق، يأتي البحث الجديد ليعرض إطار عمل مبتكر يهدف إلى تدريب وكيل خوارزمي (agent) لسباق دراجة نارية ضمن بيئة محاكاة قائمة على Unity تحت اسم VRider SBK.

يعتمد هذا النموذج على دمج خوارزمية Soft Actor-Critic (SAC) مع تعلم تعليمي ذاتي (Self-Paced curriculum Deep reinforcement Learning - SPDL)، الذي يقوم ديناميكيًا بتوليد مهمات تدريجية تتزايد صعوبتها بناءً على أداء الوكيل. هذا الأسلوب لا يتطلب تصميم المناهج يدوياً، بل يتكيف تلقائيًا مع مستوى الوكيل.

كما يتضمن فضاء الحالة للوكيل ميزات استشعارية متكاملة مع تاريخ زاوية الميل، ومعلومات عامة عن المضمار عبر نقاط المسار. ولتشجيع التقدم على المسار، تم تشكيل إشارة المكافأة لتكون رادعة للسلوكيات غير المستقرة التي تتعلق بالديناميكيات ذات العجلتين.

أظهرت التجارب الأولية أن SPDL يتفوق على SAC وحده من حيث كفاءة التدريب، زمن اللفة، واستقرار القيادة عبر مسارات ونماذج دراجات مختلفة، مما يؤسس قاعدة قياسية جديدة للسباقات الذاتية للدراجات النارية المعتمدة على التعلم المعزز.