تأخرت التطورات في عالم الذكاء الاصطناعي حتى باتت هجمات استنتاج العضوية المستهدفة (Membership Inference Attacks - MIAs) تتفوق بشكل كبير على الطرق غير المستهدفة. في أحدث الأبحاث، يبرز السؤال حول إمكانية تقييم نقاط ضعف الخصوصية لبيانات التدريب الفردية بدون الحاجة لتدريب نماذج ظل (Shadow Models) معقدة.
تشير النتائج إلى أن التعرض لهجمات MIAs ليس محكومًا فقط بخسارة النقطة، بل يعتمد أيضًا على مقياس هندسي يرتبط بالبيانات. في الإعدادات الخطية، تم تطوير طريقة لإعادة التعبير عن نقاط ضعف MIAs لكل عينة، والتي تتضمن تقديرًا يعتمد على توزيع مجموعة بيانات معينة.
بما أن الطبقة النهائية في معظم النماذج الحديثة تكون خطية، تم توسيع هذا الإطار ليشمل الشبكات العميقة، وتقديم مقياس بديل يعتمد فقط على تمثيلات الطبقة الأخيرة، متطلبًا نموذجًا تدرب مرة واحدة فقط ودون الحاجة لنماذج ظل.
أظهرت التقييمات التجريبية عبر مجموعات بيانات وهياكل متنوعة أن هذا المقياس يتفوق على الأسس التقليدية مثل خسارة النقطة ومعايير تدرج المعتدلة، مما يوفر أداة فعالة من الناحية الحاسوبية ومدعومة نظريًا لتقييم مخاطر الخصوصية لكل عينة.
هل يمكن قياس نقاط ضعف الخصوصية في الذكاء الاصطناعي دون إعادة تدريب النماذج؟
تكشف الأبحاث الأخيرة أهمية قياس نقاط ضعف الخصوصية في الذكاء الاصطناعي تجاه هجمات استنتاج العضوية المستهدفة. البحث الجديد يوفر طريقة جديدة لتقييم هذا الضعف بدون الحاجة لنماذج ظل معقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
