في دراسة رائدة، تم تقديم RIPA، وهي أول دراسة شاملة تعتمد على التجارب المتعددة القنوات لدراسة هجمات حقن الأوامر التي تُنفذ عبر تدفق المعلومات الحسية لنظام روبوتي قائم على ROS 2 ويديره نموذج لغوي ضخم (LLM). تم اختبار 100 عملية مستقلة لكل نوع من أنواع الحقن عبر خمسة نماذج لغوية تشمل أربع عائلات نموذجية، مع أحجام من 4 مليار إلى حوالي 284 مليار (مثل DeepSeek-V4-Flash وLlama-3-8B-Instruct-Lite).

الفحص أظهر وجود ملفات ضعف نموذجية لا تتبع اتجاهًا ثابتًا: حيث حققت Llama-3.3-70B-Instruct-Turbo معدل نجاح في الهجمات يصل إلى 100% على جميع أنواع الحقن، بينما نجحت كل من Llama-3-8B-Instruct-Lite وQwen 2.5-7B-Instruct-Turbo في مقاومة هجمات الحقن المباشرة.

الغريب أن النموذج الأصغر المُقيم (Gemma-3n-E4B، الذي يصل وزنه إلى 4 مليارات) وجد أنه يتناسب مع ملف الضعف الخاص بالنموذج 70B، مما يشير إلى أن قوة النموذج تعتمد على نوعه وليس على حجمه.

اقترح الباحثون جدارًا ناريًا هجينًا يحقق 0% من معدل نجاح الهجمات المعروفة دون وجود إيجابيات كاذبة على مجموعة أولية من الأوامر السليمة، ولكنه أظهر معدل تجاوز قدره 10.2% ضد هجمات مشوشة.

تم تقديم ثلاثة قنوات حقن حسية: القناة البصرية (التي تستخدم OCR)، والقناة الصوتية (عبر Whisper STT)، وقناة تلوث سياق مستشعر LiDAR. تبين أن القناة الأخيرة، التي تقوم بحقن بيانات عقبات مصنوعة في تمثيل حالة البيئة الروبوتية على مستوى النظام، حققت معدل نجاح 100% على DeepSeek-V4-Flash.

مستقبل تقنيات الأمان في الأنظمة الروبوتية يبدو واعدًا مع هذا البحث، حيث تم تقديم تصنيف لتجاوز الجدران النارية الذي يشمل 19 نوعًا من حمولات التشويش.

كل الأكواد والبيانات والنتائج متاحة للجمهور، مما يسهل التفاعل مع هذه الابتكارات واستكشاف المزيد في مجال الأمن الروبوتي.