تعتبر الطائرات بدون طيار (UAV) من التقنيات المتقدمة التي تعتمد بشكل متزايد على تقنيات تعلم التعزيز (Reinforcement Learning) لتحسين مهارات الملاحة الخاصة بها. لكن مع تزايد الاعتماد على نظم تحديد المواقع العالمية (GNSS)، أصبحت هذه الطائرات تتعرض لخطر الهجمات التزويرية التي تؤدي إلى انزياحات في الملاحظات، مما يؤثر سلبًا على تقديرات القيم وأداء المهام.
للحد من هذا المشكلة، اقترح الباحثون إطار عمل مبتكر يتمحور حول التكيف الإرشادي (curriculum-guided adaptation framework) الذي يسمح للطائرات بدون طيار بالاستجابة تدريجياً لانحرافات الملاحظات العدائية التي تزداد شدتها. ويعتمد هذا الإطار على مبادئ الثبات في تقديرات الفرق الزمني (Temporal-Difference Error) للحفاظ على الاتساق بين مراحل المنهج التعليمي.
الدراسة أظهرت نتائج مذهلة عند تقييم النظام في بيئات تفكيك الصراع مع وجود عوائق ثلاثية الأبعاد متحركة وهجمات تزوير غير مسبوقة لم يتم التعرض لها سابقًا. حيث حققت السياسة التكيف الموجه معدلات نجاح في المهام تقترب من الكمال في ظل ظروف التزوير الثابتة، بينما بلغت معدلات النجاح بين 20-56% للطرق التقليدية والموثوقة في التعلم.
أظهرت السياسة المُعدلة تحت ظروف الهجمات التزويرية الديناميكية أعلى مكافآت في الحلقات، مع تقليل خطوات إكمال المهمة حتى 45% في ظل كثافة حركة جوية متزايدة. هذا التطور يعد إنجازًا كبيرًا في مجال الطائرات بدون طيار، ويعتبر خطوة نحو تعزيز الأمان والثقة في نظم الملاحة الذاتية.
تعلم التعزيز المتين: ثورة في تفكيك صراعات الطائرات بدون طيار في بيئات عدائية
تقدم هذه الدراسة إطار عمل مبتكر يستخدم تعلم التعزيز (RL) لمواجهة هجمات التزوير على أنظمة الملاحة للطائرات بدون طيار (UAV). وقد أظهرت النتائج تحقيق معدلات نجاح قريبة من الكمال في المهام في ظروف التزوير الثابتة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
