في عالم يتزايد فيه استخدام أنظمة التعرف على الوجه، تظل الحماية من الهجمات الاحتيالية مثل الصور المطبوعة، والفيديوهات المعاد تشغيلها، والأقنعة ثلاثية الأبعاد أمراً ضرورياً. ورغم التقدم الملحوظ في تقنيات الكشف عن الهجمات المقدمة (Presentation Attack Detection - PAD)، لا تزال النماذج الحالية تعاني من صعوبة في التعميم عبر المجالات غير المرئية، نتيجة للتباين في أجهزة الاستشعار، والإضاءة، ومواد الهجوم.
تأتي أهمية تقنية CPG-PAD (Concept-Informed Prompts Guided Presentation Attack Detection) لتغير هذه المعطيات، حيث تقدم إطار عمل مبتكر يستخدم توجيهات مفهوم مرئي لتعزيز عملية تعلم النماذج عند العمل على الهجمات. وتعتمد هذه التقنية على وحدة تعزيز مدفوعة بالمفهوم المرئي (Visual Concept-driven Enhancement - VCE)، والتي تطبق تقنيات الذكاء الاصطناعي القابل للتفسير (eXplainable AI - XAI) لاكتشاف المفاهيم البصرية المرتبطة بالهجمات وتوليد خرائط حرارية تعطي توجيهات دقيقة.
من خلال هذه الخرائط، يتم استخدام آلية إدخال المفهوم المستندة إلى الموجهات (Prompt-based Concept Injection - PCI) لدمج هذه المفاهيم في فضاء الموجهات عبر وحدة فك تشفير الموجهات المرئية (Visual-Prompt Decoder - VPD) وخسارة رسم الخرائط المفهومية، مما يمكن الموجهات من التوافق مع مفهوم النموذج الداخلي. وتمنح هذه التصميمات CPG-PAD القدرة على التقاط مؤشرات هجوم قابلة للتعميم وغير مرتبطة بمجموعة بيانات معينة، مما يقلل من التحيزات الخاصة بالمجموعات.
قد أظهرت التجارب الواسعة عبر تسعة مجموعات بيانات مرجعية أن CPG-PAD تحقق أداءً متفوقاً عبر المجالات المختلفة، مما يجعلها واحدة من الحلول الرائدة في هذا المجال.
CPG-PAD: تقنية جديدة تكشف الهجمات على أنظمة التعرف على الوجه بذكاء
تقدم تقنية CPG-PAD الجديدة وسيلة مبتكرة للكشف عن الهجمات على أنظمة التعرف على الوجه. ويعزز هذا النظام التعلم من خلال مفاهيم مرئية تتوافق مع الهجمات المختلفة، مما يضمن أداءً متفوقاً عبر المجالات المختلفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
