في عالم الذكاء الاصطناعي (AI)، تسود نماذج اللغة البصرية المتعددة (Vision-Language Models - VLMs) التي أظهرت أداءً قوياً في مجموعة متنوعة من المهام متعددة الوسائط. ومع ذلك، لا تزال قدرة هذه النماذج على الحفاظ على الأمان والسلامة موضوعًا ساخنًا للنقاش. أظهرت الدراسات السابقة أن استخدام محفزات بصرية منظمة، مثل المخططات الانسيابية، يمكن أن يؤدي إلى تسرب الأمان لهذه النماذج.

في هذا الإطار، يقدم الباحثون نموذج MLingualFC، وهو معيار متعدد اللغات يهدف إلى تقييم ثغرات الهروب، ويعتمد على استخدام تمثيلات المخططات الانسيابية عبر لغات مختلفة مثل الهندية، البنجابية، الإسبانية، الرومانية، والألمانية. يتم تشفير التعليمات الضارة في صور المخططات الانسيابية، مما يوفر وسيلة فعالة لاختبار أمان النماذج.

تم تقييم عدة نماذج رائدة في هذا المجال، بما في ذلك Qwen2.5-VL وGemma-4 وPangea، تحت نموذج تهديد أسود الصندوق. أظهرت النتائج أن هناك فجوات كبيرة في الأمان بين اللغات المختلفة، حيث حققت الهجمات المعتمدة على المخططات الانسيابية نسب نجاح مرتفعة خاصة في اللغات التي تستخدم الأبجدية اللاتينية. بينما أظهرت اللغات غير اللاتينية مثل البنجابية نسب نجاح أقل بكثير، مما يشير إلى قيود محتملة في التعرف على النصوص البصرية بدلاً من تحسين أمان النموذج.

تسلط هذه النتائج الضوء على أن آليات السلامة الحالية لنماذج VLM تفشل في التعميم عبر اللغات والوسائط، مما يتطلب أبحاثًا إضافية لتحسين الأمان وضمان استقرار التطبيقات الذكية. للمزيد من التفاصيل، يمكنكم زيارة رابط GitHub. ما رأيكم في هذه الفجوات الأمنية؟ شاركونا آرائكم في التعليقات.