أصبح نسب البيانات (Data Attribution) جزءًا حيويًا من آليات التسعير والمراجعة والحوكمة في أنظمة التعلم الآلي (Machine Learning Pipelines). لكن المفاجأة أن معظم طرق النسبة تفترض بطريقة غير صحيحة أن قيم النسب تعكس بدقة مساهمات المشاركين.
لقد أظهرنا من خلال دراساتنا أن هذه الفرضية يمكن أن تفشل، حيث يمكن لمشارك واحد في سير العمل التقليدي للتدريب الموزع أن يزيد بشكل كبير من قيمة نسبته المقاسة، مع الحفاظ على الفائدة العامة للنموذج. من خلال هجومنا المعتمد على النسبة، نستخدم تحسينات محتملة لإدخال دفعات صغيرة مصطنعة تبقي على الفائدة وتجعل الاستفادة من تغطية العلامات غير المستقلة (Non-IID Label Coverage) وحساسيات المقيمين أكثر فعالية.
عبر مجموعة متنوعة من البيانات والنماذج ومع العديد من المقيمين الخاصين بالفائدة، أصبح الهجوم يؤدي بشكل مستمر إلى زيادة قيمة نسب المعتدي وإعادة تشكيل الهيكل النسبي للنسب بين العملاء السلميين دون التأثير على الدقة أو تفعيل الدفاعات المعتمدة على الهندسة.
تظهر هذه النتائج أن نسب البيانات نفسها تشكل سطح هجوم جديد، مما يحث على تطوير آليات تسجيل قوية وقابلة للتحفيز تتناسب مع مفاهيم الحماية والثقة.
تعزيز المعلومات: كيف يمكن أن تؤثر اختلالات النسب على النظام البياني في التعلم الآلي؟
تعتبر نسب البيانات جزءاً أساسياً في التسعير والمراجعة في أنظمة التعلم الآلي، ولكن هل يمكن أن تتعرض هذه النسب للاختلال بسبب سلوك بعض المشاركين؟ اكتشف كيف يمكن لاعتبارات جديدة أن تعيد تشكيل فهمنا لهذه الأنظمة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
