تُعد نماذج الرؤية واللغة (Vision-Language Models - VLMs) من أبرز إنجازات الذكاء الاصطناعي، حيث أثبتت كفاءتها في معالجة الصور والنصوص بشكل مذهل. لكن وراء هذا النجاح تكمن مخاطر أمنية خطيرة، نظرًا لاعتماد هذه النماذج على مجموعات بيانات ضخمة وتعرضها لمشاكل في حفظ المعلومات غير المقصودة.
تستهدف هجمات عضوية الاستدلال (Membership Inference Attacks - MIAs) الكشف عن إذا ما كانت بيانات معينة ضمن مجموعة التدريب الخاصة بالنموذج. ومع ذلك، تواجه الأساليب الحالية عدة عقبات، حيث أن الأساليب التقليدية تعتمد على إجراءات قد تكون محصورة في واجهات تطبيقات البرمجة (APIs) أو تحتاج إلى تحليل احصائي كبير، مما يعيق إمكانية تنفيذها في سيناريوهات البيانات الفردية.
استنادًا إلى التحليل بين الموديلات المختلفة، قامت دراسة جديدة بالتحقيق في MIAs من منظور تنسيق دلالات متعددة الحواس. حيث لوحظ أن الصور التي تنتمي إلى أعضاء (Members) تتمتع بتنسيق أكبر مع الشروح النصية من غير الأعضاء، مما يعزى إلى حفظ المعلومات أثناء التدريب. وهذا الاكتشاف أدى إلى اقتراح إطار عمل مبتكر لهجمات العضوية قادر على التكيف مع حالات البلاك بوكس (Black-box) والعينات الفردية.
تظهر النتائج من التجارب التي أُجريت على ثلاثة نماذج مفتوحة المصدر ونموذجين مغلقين أن هذا المستوى العالي من التكيف والتخصص يعزز من الدقة، حيث حققت الطريقة الجديدة معدل AUC يبلغ 0.821 ضد النموذج LLaVA-1.5، متفوقة بذلك بشكل ملحوظ على المستويات الأساسية الحالية. كما تُظهر الطريقة مرونة كبيرة في ظل اضطرابات الصور المتنوعة، مما يعزز من إمكانية تطبيقها.
هجوم عضوية بلاك بوكس ضد نماذج الرؤية واللغة: كيف تُسخر الذكاء الاصطناعي للتهديدات الأمنية!
تكشف الأبحاث الجديدة عن ثغرات خطيرة في نماذج الرؤية واللغة (VLMs) وكيف يمكن استغلالها في هجمات عضوية. تم اقتراح إطار عمل مبتكر لتحليل هذه التهديدات بنجاح.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
