في عالم الذكاء الاصطناعي، حيث تتقدم [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) [متعددة الوسائط](/tag/متعددة-الوسائط) ([MLLMs](/tag/mllms)) بسرعة مذهلة، تم الكشف عن جانب مظلم يعتمد عليه الكثيرون، وهو القابلية للاختراق. قدم الباحثون مؤخرًا إطارًا مبتكرًا يُعرف بإطار DMN، يستهدف ضعفيات هذه [النماذج](/tag/النماذج) من خلال [استغلال](/tag/استغلال) إدخالات متعددة من [الصور](/tag/الصور).
تعتبر [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) [متعددة الوسائط](/tag/متعددة-الوسائط) عرضة للهجمات التي تسعى لإخراج استجابات ضارة، ويتجلى ذلك بشكل خاص فييتها [الوسائط المتعددة](/tag/الوسائط-المتعددة) التي تدعم استجابات متعددة [الصور](/tag/الصور). في السابق، كانت طرق [اختراق](/tag/اختراق) [MLLM](/tag/mllm) تعتمد على [صورة](/tag/صورة) واحدة فقط، مما قيّد نطاق الهجمات وقلل من الأثر.
لكن مع ظهور إطار DMN، يتحقق [تحول](/tag/تحول) جذري حيث يستخدم (D) [التعليمات](/tag/التعليمات) الموزعة، (M) [الأدلة](/tag/الأدلة) متعددة الوسائط، و(N) مهمة سلسلة الأرقام لتعزيز [الأداء](/tag/الأداء) في [اختراق](/tag/اختراق) هذه [النماذج](/tag/النماذج) بشكل كبير. [نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) أظهرت أن DMN تُحقق معدلات [نجاح](/tag/نجاح) تجاوزت 90% في [اختراق](/tag/اختراق) [نماذج](/tag/نماذج) مثل [GPT-4o](/tag/gpt-[4o](/tag/4o)) وGemini-2.5-pro وClaude [Sonnet](/tag/sonnet) 4، مما يفوق [الأداء](/tag/الأداء) الحالي بشكل ملحوظ.
هذه الاستراتيجية المبتكرة لنموذج DMN تكشف عن [نقاط ضعف](/tag/نقاط-ضعف) أساسية في [آليات](/tag/آليات) [الأمان](/tag/الأمان) الخاصة بالنماذج وتفتح بابًا للاستكشافات المستقبلية في [أمن](/tag/أمن) [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي). إن [فهم](/tag/فهم) هذه الخلل يمكن أن يقودنا إلى تعزيز تدابير [الأمان](/tag/الأمان) وزيادة [موثوقية](/tag/موثوقية) [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) [متعددة الوسائط](/tag/متعددة-الوسائط) في [التطبيقات](/tag/التطبيقات) الحياتية والعملية.
ما رأيكم في هذا التطور؟ شاركونا آراءكم في [التعليقات](/tag/التعليقات)!
إطلاق العنان للذكاء الاصطناعي: إطار مبتكر لاختراق نماذج اللغة متعددة الوسائط باستخدام صور متعددة!
تقدم دراسة جديدة إطار DMN المبتكر لاختراق نماذج اللغة متعددة الوسائط (MLLMs) باستخدام إدخالات متعددة من الصور، مما يكشف عن نقاط ضعف جديدة في أنظمة الأمان. النتائج تمهد الطريق لفهم أعمق لآليات الأمان في هذه النماذج المتطورة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
