عندما يصبح الإدخال بصريًا: هجمات اختراق موجهة لرؤية نماذج تعديل الصور

Q: ما هو موضوع مقال "عندما يصبح الإدخال بصريًا: هجمات اختراق موجهة لرؤية نماذج تعديل الصور"؟

يتناول المقال بالتفصيل والتحليل آخر الأخبار والتطورات المتعلقة بـ "عندما يصبح الإدخال بصريًا: هجمات اختراق موجهة لرؤية نماذج تعديل الصور" في عالم الذكاء الاصطناعي والتكنولوجيا الناشئة.

في السنوات الأخيرة، شهدت نماذج تعديل الصور الكبرى (Large Image Editing Models) تحولاً جذريًا، حيث انتقلنا من عملية التعديل المستندة إلى النصوص إلى ما يُعرف بتعديل الإدخال البصري. هذا الاتجاه الجديد يُستخدم فيه المدخلات مثل العلامات والأسهم والعناصر النصية المرئية لتفسير نية المستخدم بشكل مباشر.

لكن هذا التحول لا يخلو من المخاطر، حيث يعرض النظام لمجموعة جديدة من التهديدات الأمنية. فعلى سبيل المثال، تم تقديم ما يُعرف بهجوم 'الاختراق الموجه لرؤية' (Vision-Centric Jailbreak Attack - VJA)، وهو أول هجوم يعتمد بالكامل على المدخلات البصرية لنقل تعليمات ضارة.

للتعامل مع هذا التهديد الجديد، تم تقديم معيار جديد يُسمى IESBench مُعني بتقييم سلامة نماذج تعديل الصور. أظهرت التجارب الواسعة على هذا المعيار أن VJA قادر على اختراق نماذج تجارية رائدة بمعدلات نجاح تصل إلى 80.9% على نموذج Nano Banana Pro و70.1% على نموذج GPT-Image-1.5.

وللحد من هذا الضعف، اقترح الباحثون اعتماد تقنيات جديدة تعتمد على التفكير المتعدد الوسائط دون الحاجة إلى تدريب إضافي، مما يحسن بشكل كبير من سلامة النماذج غير المتوافقة. هذه الاكتشافات تكشف عن ثغرات جديدة وتوفر أدوات عملية لتحسين أنظمة تعديل الصور الحديثة وتوفير مستوى عالٍ من الأمان والثقة.

لكن وجب التنبيه إلى أن هذا البحث يحتوي على صور قد تُعتبر غير مناسبة تم إنشاؤها بواسطة نماذج تعديل الصور الكبرى.

عندما يصبح الإدخال بصريًا: هجمات اختراق موجهة لرؤية نماذج تعديل الصور

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة جديدة في عالم البرمجة: شركة Gitar الناشئة تؤمن الكود باستخدام الذكاء الاصطناعي!

جوجل تطلق ميزة الذكاء الشخصي جيمني في الهند: تجربة مخصصة في متناول يدك!

أوبن أيه آي تستحوذ على شركة هيرو لتكنولوجيا التمويل الشخصي: خطوة نحو التخطيط المالي الذكي!