في عالم الذكاء الاصطناعي، يشهد استخدام نماذج اللغات المتعددة الأنماط (MLLMs) تزايدًا ملحوظًا، نظرًا لقوتها في معالجة الصور والنصوص على حد سواء. ومع ذلك، فإن تشغيل نموذج قوي لكل استعلام يعد أمرًا مكلفًا من الناحية الحوسبية. لحل هذه المشكلة، تستخدم الأنظمة المتنوعة النماذج الضعيفة أولاً، ثم تنتقل إلى النموذج الأقوى فقط عند وجود شك في النتائج. ولكن، انطلاقًا من هذه الثغرة، تم اقتراح مفهوم جديد يُعرف باسم "الهجوم القسري" (Forced Deferral Attack - FDA).

هذا الهجوم يمثل صورة جديدة من التهديدات، حيث يمكن لمهاجم ما تقليل ثقة النموذج الضعيف بشكل مصطنع، مما يجعله يحيل الاستعلامات إلى النموذج الأقوى. قد يبدو الأمر معقدًا، ولكن مفهوم الهجوم الأساسي يتضمن استخدام "محفزات حدودية"، تُساعد في تحسين توزيع الرموز داخل النموذج الضعيف نحو أهداف أقل تركيزًا، مما يعزز من إرجاع النتائج إلى النموذج القوي.

أظهرت نتائج الدراسات عبر مجموعات بيانات مختلفة أن الهجوم القسري يسهم في زيادة توجيه الاستعلامات نحو النموذج الأقوى بفعالية أكبر مقارنة بأساليب التلاعب التقليدية. هذا يسلط الضوء على ضعف نماذج الMLLMs أمام الهجمات التي تستهدف تخصيص الحوسبة، مما يفرض استخدامات غير متوقعة للنموذج القوي دون التركيز على دقة الإجابات.

هذه النتائج تدفع نحو إعادة التفكير في كيفية بناء نماذج الذكاء الاصطناعي، وتفتح المجال للنقاش حول قضايا الأمان والخصوصية في هذا المجال المتطور. ما رأيكم في تأثيرات هذا النوع من الهجمات على مستقبل الذكاء الاصطناعي؟ شاركونا في التعليقات.