في عالم الذكاء الاصطناعي، يُعتبر التقدير القائم على التدرجات (Gradient-based attribution) ركيزة أساسية لفهم كيفية عمل نماذج الذكاء الاصطناعي. ومع ذلك، برزت تساؤلات حول مدى موثوقية هذا التقدير في تتبع الأهمية السببية على مستوى المكونات. في دراسة جديدة، تم تقييم هذه الفرضية من خلال تجربتين مختلفتين باستخدام عشرة أعداد عشوائية، وكُشف عن فشل مصطلح منهجي يتحقق على مستوى الطبقات.

يكتشف الباحثون أن التقدير القائم على التدرجات يضخم قيمة الطبقات المبكرة (Gradient Bloats) ويقلل من أهمية الطبقات المتأخرة (Hidden Heroes). فمع تدهور العلاقة بين التقديرات في المهام المختلفة، انخفض انحدار الرتبة من 0.72 في عكس تسلسل البيانات إلى 0.27 في فرز هذه البيانات، ليصل إلى -0.18 في بعض الحالات الفردية.

يعود هذا الفشل إلى عدم قدرة التقدير القائم على التدرجات من الدرجة الأولى على اكتشاف التكرار الجماعي، حيث يُظهر إسقاط النماذج المبكرة أضرارًا تتجاوز 14 ضعف ما تتوقعه النتائج الفردية. بينما تهيمن خواص الطبقات المبكرة على التصنيفات، تؤدي إغفالات الطبقات المتأخرة إلى تدمير دقة البيانات خارجة التوزيع بمعدل -36.4% ± 22.8%.

تتطلب هذه النتائج إعادة تقييم فهمنا لآلية استخراج الميزات في الطبقات المبكرة والحساب في الطبقات المتأخرة، مما يشجع على توثيق الأسباب كأساس لمطالبتنا بما يسمى بآليات النماذج في الذكاء الاصطناعي.