في عالم الذكاء الاصطناعي، بدأت [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) الكبيرة (Large [Vision-Language Models](/tag/vision-language-models)) تحتل مكانة بارزة في [التطبيقات](/tag/التطبيقات) المختلفة، من [التعرف](/tag/التعرف) على [الصور](/tag/الصور) إلى [تحسين](/tag/تحسين) [التجارب](/tag/التجارب) التفاعلية. ومع ذلك، فإن قضايا [الأمان](/tag/الأمان) تبقى محور اهتمام كبير. مؤخرًا، تم [نشر](/tag/نشر) [دراسة](/tag/دراسة) تسلط الضوء على أهمية [تقييم](/tag/تقييم) [قوة](/tag/قوة) هذه [النماذج](/tag/النماذج) ضد الهجمات، خصوصًا في سياق [ضغط الرموز](/tag/ضغط-الرموز) البصرية.

يتم استخدام [ضغط الرموز](/tag/ضغط-الرموز) البصرية على نطاق واسع لتحسين [أداء](/tag/أداء) [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) من خلال تقليل [عدد](/tag/عدد) الرموز المستخدمة، مما يسمح بتسريع المعالجة وتقليل استهلاك الموارد. لكنه يناقش أيضًا قضية هامة وهي ضعف هذه [النماذج](/tag/النماذج) أمام الهجمات التي تستهدف جوانب معينة من بنائها.

بينما كانت الهجمات التقليدية التي تعتمد على [نموذج](/tag/نموذج) [التشفير](/tag/التشفير) (encoder-based attacks) فعالة، أظهرت [الأبحاث](/tag/الأبحاث) أن هذه الهجمات لا تكشف عن جميع [نقاط الضعف](/tag/نقاط-الضعف) نظرًا لوجود فجوة في [التوافق](/tag/التوافق) بين [تحسين](/tag/تحسين) الاضطرابات (perturbations) وعمليات الضغط. فعلى سبيل المثال، يتم [تحسين](/tag/تحسين) الاضطرابات على تمثيل كامل للرموز، بينما يتم [تنفيذ](/tag/تنفيذ) [الاستدلال](/tag/الاستدلال) من خلال نقطة ضغط، مما يخلق تعارضًا.

لمعالجة هذه الثغرة، تم تقديم [هجوم](/tag/هجوم) [جديد](/tag/جديد) يُعرف باسم Compression-AliGnEd attack (CAGE) حيث يعرف بتوافقه مع الضغوطات من دون الحاجة للوصول إلى [آليات](/tag/آليات) الضغط المنشورة أو [ميزانية](/tag/ميزانية) الرموز. يقوم CAGE بدمج مفهومين رئيسيين: disruption المتوقع للميزات، الذي يركز الاضطرابات على الرموز المرشحة للبقاء، وrank distortion alignment، الذي يضمن تماشي تشويهات الرموز مع النتائج المرتبطة بها لترقية [التوثيق](/tag/التوثيق).

وقد أظهرت [نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) أن CAGE يحقق [دقة](/tag/دقة) أقل ضد الهجمات مقارنةً بالأسس السابقة، مما يُبرز ضرورة اعتماد [تقييمات](/tag/تقييمات) [الأمان](/tag/الأمان) التي تأخذ حالات الضغط في الاعتبار. فالنتائج تدعو لبذل المزيد من الجهد لتطوير [الدفاعات](/tag/الدفاعات) والحلول الأمنية الملائمة لنماذج [الرؤية واللغة](/tag/[الرؤية](/tag/الرؤية)-واللغة) الكبيرة، لضمان فعالية العمليات على المدى الطويل.

ما رأيكم في أهمية هذه [الدراسة](/tag/الدراسة) وتأثيرها على [مستقبل](/tag/مستقبل) [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة)؟ شاركونا أفكاركم في [التعليقات](/tag/التعليقات).