في عصر تتزايد فيه اعتمادية الذكاء الاصطناعي في التطبيقات الحيوية مثل القيادة الذاتية والروبوتات، يظهر تهديد جديد يثير القلق: الاختراق الدلالي المدرك. توضح دراسة حديثة كيفية استغلال نموذج اللغة متعدد الوسائط (MLLMs) من خلال استخدام اضطراب عالمي يؤثر على القرارات غير المتزامنة.
تقدم الدراسة مفهوم 'الاضطراب الكوني المدرك دلالةً' (Semantic-Aware Universal Perturbation - SAUP)، الذي يعتبر بمثابة 'موجه دلالي'، حيث يقوم بفهم مدخلات البيانات بشكل ناشط ويرسلها إلى أهداف معينة يعرفها المهاجم. من خلال هذا المفهوم الجديد، يعكف الباحثون على فحص الخصائص الهندسية في الفضاء الكامن التي تسهل تنفيذ هذا النوع من الهجمات.
تمت مراجعة وتحليل استراتيجيات جديدة لتقديم تحسينات بين التدفقات الدلالية، يقودها منهج 'التحسين المعتمد على الدلالة' (Semantic-Oriented - SORT). بالإضافة إلى ذلك، تم إنشاء مجموعة بيانات جديدة تحمل دلالات دقيقة لتقييم أداء هذه الأساليب.
تظهر التجارب التي أجريت على ثلاثة نمادج تمثل MLLMs إمكانية التنفيذ الأساسية لهذا الهجوم، حيث حققت الدراسة معدل نجاح يصل إلى 66% عند استهداف خمسة أهداف خلال استخدام إطار واحد فقط ضد نموذج 'كوين' (Qwen).
تثير هذه النتائج تساؤلات حول سلامة الأنظمة التي تعتمد على الذكاء الاصطناعي وتدعو إلى مزيد من البحث في أساليب التحصين ضد هذه التهديدات.
اختراق الذكاء الاصطناعي: كيف يمكن لتأثير واحد تغيير مسار نماذج اللغة متعددة الوسائط؟
تكشف دراسة حديثة عن إمكانية اختراق النماذج اللغوية متعددة الوسائط (MLLMs) باستخدام مؤثر واحد فقط، مما يثير مخاوف جديدة في عالم الذكاء الاصطناعي. تم تقديم منهجية مبتكرة تحمل اسم 'الاضطراب الكوني المدرك دلالةً' كوسيلة لهجوم متطور.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
