تعد اختراقات (Jailbreaking) نماذج الذكاء الاصطناعي (Artificial Intelligence) من التحديات الكبيرة التي تواجه نماذج اللغات الضخمة (Large Language Models) ونماذج اللغة المرئية (Vision Language Models). تعد هذه النماذج أكثر عرضة للخطر خاصةً لأنها تعالج كل من النصوص والصور، مما يوسع من مساحة الهجوم المحتملة. لذا، تأتي مجموعة بيانات FENCE كمصدر قيّم في هذا السياق.

FENCE هي مجموعة بيانات ثنائية اللغة (الكورية والإنجليزية) متعددة الوسائط تم تصميمها خصيصًا لتدريب وتقييم أدوات الكشف عن الاختراقات في التطبيقات المالية. تبرز هذه المجموعة أهمية واقعية المجال من خلال استعلامات مالية مرتبطة مع تهديدات مصورة.

أظهرت التجارب التي أُجريت باستخدام نماذج VLM التجارية والمفتوحة المصدر وجود نقاط ضعف ثابتة، حيث أظهرت نماذج مثل GPT-4o معدلات نجاح عالية في الحملات الهجومية، بينما أظهرت النماذج المفتوحة المصدر مزيداً من التعرض لهذه الهجمات. ومع ذلك، فقد تحقق نموذج كشف الأساس المدرب على FENCE دقة تصل إلى 99% في البيانات المدخلة، مما يعكس متانة المجموعة في تدريب نماذج كشف موثوقة.

تُعتبر FENCE موردًا محوريًا للتقدم في كشف اختراقات الذكاء الاصطناعي المتعددة الوسائط في القطاع المالي، وتهدف إلى دعم أنظمة الذكاء الاصطناعي الأكثر أمانًا وموثوقية في المجالات الحساسة.