تتزايد التحديات التي تواجه أنظمة التحكم اللاسلكية المعتمدة على الذكاء الاصطناعي، وأحد أبرز هذه التحديات هو هجوم تلوث المكافآت (Reward Poisoning) الذي يمثل خطرًا جدياً على فعالية هذه الأنظمة. وكما يكشف البحث الجديد حول هجوم تلوث المكافآت القائم على الاختلاف (DGRP) المجهز على وكيل (Soft Actor-Critic) في بيئة الشبكة اللاسلكية المدعومة بالألواح الذكية (Reconfigurable Intelligent Surfaces - RIS).

يتمثل هدف وكيل الـ SAC في تحقيق أقصى قدر من معدل المستخدمين الثانويين (Secondary Users - SUs)، مما يعني تحسين كل من قوة الإرسال للمرسل الثانوي وتحولات الطور للـ RIS. لكن، عند وجود اختلافات كبيرة بين النقاد، يصبح دمار المكافآت محتملًا، مما يؤدي إلى تقديرات قيم مشوهة وتوجيه السياسات نحو إجراءات دون المستوى المطلوب.

تكشف النتائج أن هجوم DGRP يقلل بشكل كبير من تحسينات الأداء التي تعود عادة على الأنظمة من استخدام الـ RIS، مما يتسبب في تدهور جودة الإرسال. كما يتناول البحث دراسة مفصلة لناحية الهجوم وما يتطلبه من معايير رئيسية، مضيفًا أهمية فهم التهديدات المرتبطة بالاختلافات بين النقاد عند تقييم قوة تعلم التعزيز العميق (Deep Reinforcement Learning - DRL) في الشبكات المدعومة بـ RIS.

في ظل التقدم المتسارع في تقنيات الذكاء الاصطناعي، تبرز الحاجة الماسة للفهم العميق لهذه التهديدات وآليات مواجهتها.