في مجال الذكاء الاصطناعي، تُعتبر نماذج تحويل النصوص إلى صور (Text-to-Image Diffusion Models) من بين الأدوات الواعدة التي تُستخدم لتوليد صور جديدة بناءً على أوصاف نصية. ومع ذلك، فإن هذه النماذج، رغم قوتها، لا تزال عرضة للهجمات الخلفية، التي تتيح للمهاجمين تفعيل وظائف معينة دون أن يتم رصدهم.
قدم الباحثون مؤخرًا أسلوبًا جديدًا يُعرف باسم "الهجوم الخفي على المستوى الدلالي" (Semantic-level Backdoor Attack - SemBD)، الذي يُمثل طفرة في آليات الهجمات على هذه النماذج.
بدلاً من الاعتماد على محفزات نصية ثابتة، يقوم الهجوم الجديد بدمج محفزات على مستوى التمثيل ترتكز على مناطق دلالية مستمرة، مما يجعله أقل عرضة للكشف. حيث يتم زرع هذه الأبواب الخلفية من خلال تعديل مصفوفات الاستعلام والقيمة في طبقات الانتباه المتقاطع، مما يُمكّن من تفعيل وظائف دلالية متعددة بنصوص متنوعة.
وعلى الرغم من هذه المخاطر، يُظهر البحث أيضًا أن الهجوم الخفي الجديد يمكنه الاستمرار في تحقيق معدل نجاح 100% في الهجمات، مع الحفاظ على قوة كافية للتصدي لأساليب الدفاع الحديثة.
مع تزايد الاعتماد على الذكاء الاصطناعي وتطبيقاته، يصبح فهم مثل هذه التهديدات أمراً ضرورياً لتعزيز أمان الأنظمة الذكية.
ما رأيكم في هذه التطورات المدهشة؟ شاركونا في التعليقات!
الهجوم الخفي: كيف تواجه نماذج تحويل النصوص إلى صور تهديدات الذكاء الاصطناعي؟
اكتشاف جديد يكشف عن هجوم خفي قد يُهدد نماذج تحويل النصوص إلى صور. التقنية الجديدة تُسهل عمليات الهجوم باستخدام أنماط دلالية معقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
