في عالم الذكاء الاصطناعي، يعد نموذج CLIP (Contrastive Language-Image Pretraining) أحد الإنجازات البارزة، إذ يُظهر قدرة هائلة في التصنيف بدون تدريب مسبق (zero-shot classification). ولكن، على الرغم من هذه القوة، يُعاني النموذج من ضعف كبير أمام الهجمات المعادية التي تهدف إلى خداعه وإسقاط دقته.
الساحة السابقة للأبحاث ركزت بشكل أساسي على مطابقة نتائج التنبؤ بين الأمثلة النظيفة والأخرى المعادية، الأمر الذي أغفل أهمية موثوقية عدم اليقين (uncertainty calibration). هذا الانحراف قد يؤدي إلى تدهور في القدرة على التعميم، وهو ما يعد نقطة ضعف حرجة في موثوقية النموذج.
في هذا السياق، يُظهر الباحثون أن زيادة عدم اليقين التنبؤي يُعتبر أمرًا شائعًا عند تعرض النموذج لتحديات جديدة أو حينما تنزلق المدخلات بعيدًا عن نطاق التدريب. لكن المفارقة تكمن في أنه في بيئة الهجمات المعادية، غالبًا ما تنخفض موثوقية عدم اليقين مع زيادة التشويش، مما يؤدي إلى خسارة دقة النموذج بالإضافة إلى عدم ثقة في النتائج.
لمعالجة هذه الثغرة، اقترح الباحثون هدفًا جديدًا يسعى لتحسين نموذج CLIP من خلال دمج دقة الأداء وعدم اليقين. عبر إعادة صياغة مخرجات CLIP كمعاملات تركيز في توزيع Dirichlet، توصلوا إلى تمثيل موحد يعكس الهيكل الدلالي النسبي ودرجة الثقة. هذا يسمح بإجراء محاذاة شاملة تحت حالات التشويش، مما يتجاوز الأنماط التقليدية المُعتمدة على نتيجة واحدة.
تجاربهم على عدة نماذج اختبار بدون تدريب مسبق أظهرت أن هذه الطريقة تُحسن بشكل كبير من موثوقية عدم اليقين، وتحقق توازنًا معقولاً بين مقاومة الهجمات المعادية والحفاظ على دقة النتائج النظيفة. هذا يفتح الأفق أمام مزيد من الابتكارات في التطبيقات العملية لنموذج CLIP ونماذج الذكاء الاصطناعي بصورة عامة.
ثورة في الذكاء الاصطناعي: تحسين موثوقية CLIP ضد هجمات الخصوم!
باحثون يحققون تقدمًا كبيرًا في تحسين نموذج CLIP لمواجهة هجمات الخصوم مع الحفاظ على دقة التصنيف. استخدامهم لمبدأ تعيين عدم اليقين يعد خطوة مهمة في عالم الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
