تعتبر الطائرات بدون طيار (UAV) من التقنيات المتقدمة التي تعتمد بشكل متزايد على تقنيات تعلم التعزيز (Reinforcement Learning) لتحسين مهارات الملاحة الخاصة بها. لكن مع تزايد الاعتماد على نظم تحديد المواقع العالمية (GNSS)، أصبحت هذه الطائرات تتعرض لخطر الهجمات التزويرية التي تؤدي إلى انزياحات في الملاحظات، مما يؤثر سلبًا على تقديرات القيم وأداء المهام.

للحد من هذا المشكلة، اقترح الباحثون إطار عمل مبتكر يتمحور حول التكيف الإرشادي (curriculum-guided adaptation framework) الذي يسمح للطائرات بدون طيار بالاستجابة تدريجياً لانحرافات الملاحظات العدائية التي تزداد شدتها. ويعتمد هذا الإطار على مبادئ الثبات في تقديرات الفرق الزمني (Temporal-Difference Error) للحفاظ على الاتساق بين مراحل المنهج التعليمي.

الدراسة أظهرت نتائج مذهلة عند تقييم النظام في بيئات تفكيك الصراع مع وجود عوائق ثلاثية الأبعاد متحركة وهجمات تزوير غير مسبوقة لم يتم التعرض لها سابقًا. حيث حققت السياسة التكيف الموجه معدلات نجاح في المهام تقترب من الكمال في ظل ظروف التزوير الثابتة، بينما بلغت معدلات النجاح بين 20-56% للطرق التقليدية والموثوقة في التعلم.

أظهرت السياسة المُعدلة تحت ظروف الهجمات التزويرية الديناميكية أعلى مكافآت في الحلقات، مع تقليل خطوات إكمال المهمة حتى 45% في ظل كثافة حركة جوية متزايدة. هذا التطور يعد إنجازًا كبيرًا في مجال الطائرات بدون طيار، ويعتبر خطوة نحو تعزيز الأمان والثقة في نظم الملاحة الذاتية.