تُعد [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) ([Vision-Language Models](/tag/vision-language-models) - [VLMs](/tag/vlms)) من أبرز [إنجازات](/tag/إنجازات) الذكاء الاصطناعي، حيث أثبتت كفاءتها في [معالجة الصور](/tag/معالجة-[الصور](/tag/الصور)) والنصوص بشكل مذهل. لكن وراء هذا النجاح تكمن [مخاطر](/tag/مخاطر) أمنية خطيرة، نظرًا لاعتماد هذه [النماذج](/tag/النماذج) على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) ضخمة وتعرضها لمشاكل في حفظ [المعلومات](/tag/المعلومات) غير المقصودة.
تستهدف [هجمات عضوية](/tag/[هجمات](/tag/هجمات)-عضوية) [الاستدلال](/tag/الاستدلال) ([Membership Inference](/tag/membership-inference) Attacks - MIAs) الكشف عن إذا ما كانت [بيانات](/tag/بيانات) معينة ضمن مجموعة [التدريب](/tag/التدريب) الخاصة بالنموذج. ومع ذلك، تواجه الأساليب الحالية عدة عقبات، حيث أن الأساليب التقليدية تعتمد على [إجراءات](/tag/إجراءات) قد تكون محصورة في [واجهات](/tag/واجهات) [تطبيقات البرمجة](/tag/[تطبيقات](/tag/تطبيقات)-[البرمجة](/tag/البرمجة)) ([APIs](/tag/apis)) أو تحتاج إلى [تحليل](/tag/تحليل) احصائي كبير، مما يعيق إمكانية تنفيذها في سيناريوهات [البيانات](/tag/البيانات) الفردية.
استنادًا إلى [التحليل](/tag/التحليل) بين الموديلات المختلفة، قامت [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) بالتحقيق في MIAs من منظور [تنسيق](/tag/تنسيق) دلالات متعددة الحواس. حيث لوحظ أن [الصور](/tag/الصور) التي تنتمي إلى أعضاء (Members) تتمتع بتنسيق أكبر مع الشروح النصية من غير الأعضاء، مما يعزى إلى حفظ [المعلومات](/tag/المعلومات) أثناء [التدريب](/tag/التدريب). وهذا الاكتشاف أدى إلى [اقتراح](/tag/اقتراح) إطار [عمل](/tag/عمل) مبتكر لهجمات العضوية قادر على [التكيف](/tag/التكيف) مع حالات البلاك بوكس (Black-box) والعينات الفردية.
تظهر النتائج من [التجارب](/tag/التجارب) التي أُجريت على ثلاثة [نماذج مفتوحة المصدر](/tag/[نماذج](/tag/نماذج)-مفتوحة-المصدر) ونموذجين مغلقين أن هذا المستوى العالي من [التكيف](/tag/التكيف) والتخصص يعزز من الدقة، حيث حققت الطريقة الجديدة معدل AUC يبلغ 0.821 ضد النموذج LLaVA-1.5، متفوقة بذلك بشكل ملحوظ على المستويات الأساسية الحالية. كما تُظهر الطريقة [مرونة](/tag/مرونة) كبيرة في ظل اضطرابات [الصور](/tag/الصور) المتنوعة، مما يعزز من إمكانية تطبيقها.
هجوم عضوية بلاك بوكس ضد نماذج الرؤية واللغة: كيف تُسخر الذكاء الاصطناعي للتهديدات الأمنية!
تكشف الأبحاث الجديدة عن ثغرات خطيرة في نماذج الرؤية واللغة (VLMs) وكيف يمكن استغلالها في هجمات عضوية. تم اقتراح إطار عمل مبتكر لتحليل هذه التهديدات بنجاح.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
