أصبح نسب البيانات (Data Attribution) جزءًا حيويًا من آليات التسعير والمراجعة والحوكمة في أنظمة التعلم الآلي (Machine Learning Pipelines). لكن المفاجأة أن معظم طرق النسبة تفترض بطريقة غير صحيحة أن قيم النسب تعكس بدقة مساهمات المشاركين.

لقد أظهرنا من خلال دراساتنا أن هذه الفرضية يمكن أن تفشل، حيث يمكن لمشارك واحد في سير العمل التقليدي للتدريب الموزع أن يزيد بشكل كبير من قيمة نسبته المقاسة، مع الحفاظ على الفائدة العامة للنموذج. من خلال هجومنا المعتمد على النسبة، نستخدم تحسينات محتملة لإدخال دفعات صغيرة مصطنعة تبقي على الفائدة وتجعل الاستفادة من تغطية العلامات غير المستقلة (Non-IID Label Coverage) وحساسيات المقيمين أكثر فعالية.

عبر مجموعة متنوعة من البيانات والنماذج ومع العديد من المقيمين الخاصين بالفائدة، أصبح الهجوم يؤدي بشكل مستمر إلى زيادة قيمة نسب المعتدي وإعادة تشكيل الهيكل النسبي للنسب بين العملاء السلميين دون التأثير على الدقة أو تفعيل الدفاعات المعتمدة على الهندسة.

تظهر هذه النتائج أن نسب البيانات نفسها تشكل سطح هجوم جديد، مما يحث على تطوير آليات تسجيل قوية وقابلة للتحفيز تتناسب مع مفاهيم الحماية والثقة.