تُعد [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) ([Vision-Language Models](/tag/vision-language-models) - [VLMs](/tag/vlms)) من أبرز [إنجازات](/tag/إنجازات) الذكاء الاصطناعي، حيث أثبتت كفاءتها في [معالجة الصور](/tag/معالجة-[الصور](/tag/الصور)) والنصوص بشكل مذهل. لكن وراء هذا النجاح تكمن [مخاطر](/tag/مخاطر) أمنية خطيرة، نظرًا لاعتماد هذه [النماذج](/tag/النماذج) على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) ضخمة وتعرضها لمشاكل في حفظ [المعلومات](/tag/المعلومات) غير المقصودة.

تستهدف [هجمات عضوية](/tag/[هجمات](/tag/هجمات)-عضوية) [الاستدلال](/tag/الاستدلال) ([Membership Inference](/tag/membership-inference) Attacks - MIAs) الكشف عن إذا ما كانت [بيانات](/tag/بيانات) معينة ضمن مجموعة [التدريب](/tag/التدريب) الخاصة بالنموذج. ومع ذلك، تواجه الأساليب الحالية عدة عقبات، حيث أن الأساليب التقليدية تعتمد على [إجراءات](/tag/إجراءات) قد تكون محصورة في [واجهات](/tag/واجهات) [تطبيقات البرمجة](/tag/[تطبيقات](/tag/تطبيقات)-[البرمجة](/tag/البرمجة)) ([APIs](/tag/apis)) أو تحتاج إلى [تحليل](/tag/تحليل) احصائي كبير، مما يعيق إمكانية تنفيذها في سيناريوهات [البيانات](/tag/البيانات) الفردية.

استنادًا إلى [التحليل](/tag/التحليل) بين الموديلات المختلفة، قامت [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) بالتحقيق في MIAs من منظور [تنسيق](/tag/تنسيق) دلالات متعددة الحواس. حيث لوحظ أن [الصور](/tag/الصور) التي تنتمي إلى أعضاء (Members) تتمتع بتنسيق أكبر مع الشروح النصية من غير الأعضاء، مما يعزى إلى حفظ [المعلومات](/tag/المعلومات) أثناء [التدريب](/tag/التدريب). وهذا الاكتشاف أدى إلى [اقتراح](/tag/اقتراح) إطار [عمل](/tag/عمل) مبتكر لهجمات العضوية قادر على [التكيف](/tag/التكيف) مع حالات البلاك بوكس (Black-box) والعينات الفردية.

تظهر النتائج من [التجارب](/tag/التجارب) التي أُجريت على ثلاثة [نماذج مفتوحة المصدر](/tag/[نماذج](/tag/نماذج)-مفتوحة-المصدر) ونموذجين مغلقين أن هذا المستوى العالي من [التكيف](/tag/التكيف) والتخصص يعزز من الدقة، حيث حققت الطريقة الجديدة معدل AUC يبلغ 0.821 ضد النموذج LLaVA-1.5، متفوقة بذلك بشكل ملحوظ على المستويات الأساسية الحالية. كما تُظهر الطريقة [مرونة](/tag/مرونة) كبيرة في ظل اضطرابات [الصور](/tag/الصور) المتنوعة، مما يعزز من إمكانية تطبيقها.