في ظل التطور السريع للروبوتات، تتزايد أهمية نماذج الرؤية-اللغة-العمل (Vision-Language-Action) في التطبيقات التي تعتمد على الأمان. ومع ذلك، فإن الثغرات الأمنية في هذه الأنظمة لا زالت غير مستكشفة بشكل كافٍ. في هذا السياق، تم اكتشاف ضعف أمني أساسي: الجمع بين تجزئة الأفعال (Action Chunking) وتمثيلات الوضعية (Delta Pose Representations) يُنشئ حلقة مفتوحة بصرية داخل الكتلة، مما يجبر الروبوت على تنفيذ تسلسلات من الأفعال تتكون من K خطوات. هذه الآلية تتيح تراكم الت perturbations في كل خطوة من خلال التكامل.
لتسليط الضوء على هذا الضعف، تم اقتراح طريقة SILENTDRIFT، وهي هجوم خلفي خفي يعتمد على استغلال هذه الثغرة. تعتمد الطريقة على دالة Smootherstep لإنشاء الت perturbations مع ضمان استمرارية C2، مما يضمن عدم وجود سرعة أو تسارع عند حدود المسار لتلبية القيود الحركية الصارمة.
بالإضافة إلى ذلك، تعتمد استراتيجيتنا لهجوم نقاط المفتاح (Keyframe Attack Strategy) على تسميم فقط مرحلة الاقتراب الحرجة، مما يزيد التأثير مع تقليل التعرض للزناد. المثير للاهتمام هنا أن المسارات المسمومة الناتجة تبدو غير قابلة للتمييز بصريًا عن العروض الناجحة.
وفقًا للتقييمات على مجموعة LIBERO، حققت SILENTDRIFT نسبة نجاح تصل إلى 93.2% في الهجوم مع معدل تسميم أقل من 2%، بينما حافظت على نسبة نجاح في المهام النظيفة تصل إلى 95.3%.
إطلاق العنان لطريقة SILENTDRIFT: هجوم خفي على نماذج الرؤية-اللغة-العمل!
يستكشف الباحثون ثغرة أمنية خطيرة في نماذج الرؤية-اللغة-العمل (Vision-Language-Action)، مما يتيح تطبيق هجوم خلفي خفي يدعى SILENTDRIFT. هذه الطريقة تمكّن الروبوتات من تنفيذ مهام معقدة بطرق غير مرئية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
