في عالم الذكاء الاصطناعي، أصبحت الهجمات المعاكسة (Adversarial Attacks) واحدة من أكثر المجالات إثارة للجدل والبحث. مؤخراً، أعلنت مجموعة من الباحثين عن تقديمهم لأساليب جديدة تعتمد على تعزيز التعلم (Reinforcement Learning) في هذه الهجمات، مما قد يغير من معالم الأمان السيبراني.

ولأول مرة، تم توظيف وكيل معزز لتطوير خوارزميات جديدة تنتج نماذج معاكسة، وذلك من خلال استغلال خبرات الهجمات السابقة. على عكس الأساليب التقليدية التي تعتمد على تطوير نماذج معاكسة بشكل مستقل، فإن النهج الجديد يستفيد من التجارب السابقة لتصميم استراتيجيات أكثر كفاءة وفاعلية.

توظف هذه الدراسة عملية اتخاذ القرار ماركوف (Markov Decision Process) لتحسين إنتاج العينات المعاكسة. وقد أظهرت النتائج أن الوكيل المعزز تمكن من زيادة معدل نجاح الهجوم بنسبة تصل إلى 13.2% وتقليص عدد الاستفسارات المطلوبة لنموذج الضحية بنسبة تصل إلى 16.9% من بداية التدريب إلى نهايته.

عند المقارنة مع أفضل الأساليب الحالية، أظهر الوكيل المعزز قدرة على توليد عينات معاكسة بنسبة نجاح تفوق 17% في التعامل مع مدخلات غير مرئية بعد انتهاء التدريب. هذه النتائج تمثل نقلة نوعية في كيفية رؤية الهجمات المعاكسة، مما يبشر باستخدامها كوسيلة فعالة للتغلب على نماذج التعلم الآلي بشكل آمن وسريع.