تُعَد نماذج الرؤية الأساس الفعّال في العديد من المهام الحديثة، ولكنها تواجه مخاطر كبيرة في حالة التعرض لهجمات عدائية. في هذا السياق، تبرز دراسة حديثة تناقش كيفية تحسين مقاومة هذه النماذج باستخدام تقنية جديدة تُعرف باسم "التوزيع بالخطأ متعدد المستويات" (Multi-Level Floyd-Steinberg Dithering).

تعتمد هذه التقنية على تحويل مدخلات البيانات بشكل ذكي، حيث تقوم بتشويش التلاعبات العدائية مع الحفاظ على المحتوى الدلالي. وهو ما يجعلها خيارًا خفيف الوزن وغير مرتبط بنموذج معين، مما يتيح استخدامها في مجموعة واسعة من التطبيقات.

على عكس الدراسات السابقة التي اقتصرت على ديثيرينغ ثنائي اللون ومجموعة بيانات CIFAR-10 ونموذج صغير واحد، هذه الدراسة توسعت لتشمل ست مهام مختلفة وهي: التصنيف، تقسيم الصورة، تقدير العمق، الاسترجاع، التسمية، والإجابة على الأسئلة البصرية. كما شملت عائلتين من النماذج (DINOv2 وPaliGemma) وثلاثة أنواع من الهجمات ذات القوة المتزايدة (PGD وMI-FGSM وSIA).

لقد أظهرت النتائج أن استخدام تقنية ديذرينغ بالخطأ عند مستويات التكميم المتوسطة، خصوصًا عند دمجها مع معالجة ما بعد الصورة، يمكن أن تتجاوز أو تتساوى مع جميع المعايير السابقة المختبرة، بما في ذلك تقنيات إزالة الضوضاء المستندة إلى التشتت، مع تقليل الخسائر عند المدخلات النظيفة.

تأتي هذه النتائج لتعزز من أهمية الأبحاث المستمرة في مجال الذكاء الاصطناعي وتطبيقاته، وتفتح آفاقًا جديدة في كيفية التصدي للهجمات العدائية على نماذج الرؤية.

ما رأيكم في هذه الاستراتيجية الجديدة؟ هل تعتقدون أنها ستحدث تغييرًا كبيرًا في مجال الذكاء الاصطناعي؟ شاركونا أرائكم في التعليقات.