في السنوات الأخيرة، شهدت نماذج تعديل الصور الكبرى (Large Image Editing Models) تحولاً جذريًا، حيث انتقلنا من عملية التعديل المستندة إلى النصوص إلى ما يُعرف بتعديل الإدخال البصري. هذا الاتجاه الجديد يُستخدم فيه المدخلات مثل العلامات والأسهم والعناصر النصية المرئية لتفسير نية المستخدم بشكل مباشر.

لكن هذا التحول لا يخلو من المخاطر، حيث يعرض النظام لمجموعة جديدة من التهديدات الأمنية. فعلى سبيل المثال، تم تقديم ما يُعرف بهجوم 'الاختراق الموجه لرؤية' (Vision-Centric Jailbreak Attack - VJA)، وهو أول هجوم يعتمد بالكامل على المدخلات البصرية لنقل تعليمات ضارة.

للتعامل مع هذا التهديد الجديد، تم تقديم معيار جديد يُسمى IESBench مُعني بتقييم سلامة نماذج تعديل الصور. أظهرت التجارب الواسعة على هذا المعيار أن VJA قادر على اختراق نماذج تجارية رائدة بمعدلات نجاح تصل إلى 80.9% على نموذج Nano Banana Pro و70.1% على نموذج GPT-Image-1.5.

وللحد من هذا الضعف، اقترح الباحثون اعتماد تقنيات جديدة تعتمد على التفكير المتعدد الوسائط دون الحاجة إلى تدريب إضافي، مما يحسن بشكل كبير من سلامة النماذج غير المتوافقة. هذه الاكتشافات تكشف عن ثغرات جديدة وتوفر أدوات عملية لتحسين أنظمة تعديل الصور الحديثة وتوفير مستوى عالٍ من الأمان والثقة.

لكن وجب التنبيه إلى أن هذا البحث يحتوي على صور قد تُعتبر غير مناسبة تم إنشاؤها بواسطة نماذج تعديل الصور الكبرى.