في السنوات الأخيرة، شهدت نماذج تعديل الصور الكبرى (Large Image Editing Models) تحولاً جذريًا، حيث انتقلنا من عملية التعديل المستندة إلى النصوص إلى ما يُعرف بتعديل الإدخال البصري. هذا الاتجاه الجديد يُستخدم فيه المدخلات مثل العلامات والأسهم والعناصر النصية المرئية لتفسير نية المستخدم بشكل مباشر.
لكن هذا التحول لا يخلو من المخاطر، حيث يعرض النظام لمجموعة جديدة من التهديدات الأمنية. فعلى سبيل المثال، تم تقديم ما يُعرف بهجوم 'الاختراق الموجه لرؤية' (Vision-Centric Jailbreak Attack - VJA)، وهو أول هجوم يعتمد بالكامل على المدخلات البصرية لنقل تعليمات ضارة.
للتعامل مع هذا التهديد الجديد، تم تقديم معيار جديد يُسمى IESBench مُعني بتقييم سلامة نماذج تعديل الصور. أظهرت التجارب الواسعة على هذا المعيار أن VJA قادر على اختراق نماذج تجارية رائدة بمعدلات نجاح تصل إلى 80.9% على نموذج Nano Banana Pro و70.1% على نموذج GPT-Image-1.5.
وللحد من هذا الضعف، اقترح الباحثون اعتماد تقنيات جديدة تعتمد على التفكير المتعدد الوسائط دون الحاجة إلى تدريب إضافي، مما يحسن بشكل كبير من سلامة النماذج غير المتوافقة. هذه الاكتشافات تكشف عن ثغرات جديدة وتوفر أدوات عملية لتحسين أنظمة تعديل الصور الحديثة وتوفير مستوى عالٍ من الأمان والثقة.
لكن وجب التنبيه إلى أن هذا البحث يحتوي على صور قد تُعتبر غير مناسبة تم إنشاؤها بواسطة نماذج تعديل الصور الكبرى.
عندما يصبح الإدخال بصريًا: هجمات اختراق موجهة لرؤية نماذج تعديل الصور
تسهم التطورات الحديثة في نماذج تعديل الصور الكبرى في تغيير طريقة التعامل مع الإدخال البصري، ما يفتح أبوابًا جديدة للمخاطر الأمنية. يتم الكشف عن نوع جديد من الهجمات يحمل اسم 'هجوم اختراق موجه لرؤية'، يهدد سلامة هذه النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
