في عصر التكنولوجيا المتقدمة، يزداد استخدام نماذج الرؤية واللغة الكبيرة (LVLMs) بشكل ملحوظ، ولكن مع هذا التقدم، يثار القلق حول انتهاكات حقوق النشر والخصوصية. فمع تزايد عمليات التدريب غير المصرح بها على بيانات الويب متعددة النماذج، يتطلب الأمر أدوات مبتكرة لحماية حقوق المالكين.

في ضوء هذه التحديات، تم تقديم أداة MMGuard، التي تهدف إلى دعم أصحاب البيانات في حماية معلوماتهم من التعديل غير المصرح به. تعتمد MMGuard على إنشاء أمثلة غير قابلة للتعلم عن طريق إدخال تداخلات لا يمكن للبشر إدراكها، مما يستغل الديناميات التعليمية لنماذج الرؤية واللغة. تعمل هذه التداخلات على تقليل خسارة التدريب، مما يؤدي إلى جعل النموذج يتكيف بشكل زائف مع الضجيج، ما يؤدي إلى تدهور الأداء عند غياب تلك التداخلات خلال مراحل الاستدلال.

كما تقدم MMGuard تحسناً إضافياً من خلال تنفيذ تعطيل الربط بين النماذج، مما يضمن توجيه انتباه LVLM بشكل استراتيجي نحو تحقيق علاقة مزيفة بين الضوضاء وهدف التدريب.

تُقيّم MMGuard بمواجهة تسعة نماذج LVLM مفتوحة المصدر عبر ست مجموعات بيانات، مما يظهر فعاليتها في الدفاع ضد استغلال التعديل غير المصرح به بطرق متعددة. هذه الأداة ليست مجرد استجابة لهجمات موجودة، بل تمثل خطوة استباقية لحماية البيانات، مما يضمن بيئة أكثر أمانًا لأصحاب الحقوق.