في عالم الذكاء الاصطناعي، تظل السعي لفهم الآليات البصرية (visual mechanistic interpretability) مهمة صعبة. تعتمد النماذج الحالية غالبًا على طرق ج heuristic لاستنتاج نتائجها، مثل استرجاع التفعيل الأقصى (top-$K$ activation retrieval) أو التحسين من خلال التقييد (regularization).

لكن البحث الجديد يقدم منظورًا توزيعياً مبتكرًا لهذه المشكلة. يقدم هذا النموذج تأثير تفعيل الخواص على توزيع الصور الطبيعية، ويطرح مشكلة تحسين تتعلق بحدود كولباك-لايبير (Kullback-Leibler minimal optimization problem) لفهم الآلية.

وكجزء من هذا الإطار، يكشف الباحثون عن انحيازات إحصائية في النماذج السابقة. والنتيجة؟ علينا أن نكون حذرين، حيث تظهر هذه النماذج إما بصريًا غير قابلة للتفسير (أي تنحرف عن توزيع الصور الطبيعية)، أو أنها غير وفية لآليات نماذج الرؤية.

لحل هذه الانحيازات، يقترح الباحثون نموذجًا يعتمد على مبدأ القيود اللينة الأدنى من نوع KL لتحقيق توازن مثالي بين القابلية للتفسير والأمانة. ولتطبيق هذا المبدأ، استخدموا تقنية أخذ العينات من التوزيع البعدي المستند إلى الطاقة (energy-guided diffusion posterior sampling).

أظهرت التجارب الواسعة صحة هذا المفهوم النظري وفاعلية النموذج الجديد على نموذج DINOv3 للرؤية. في ظل هذه التطورات، يمكن أن تتغير وجهات نظرنا حول كيفية تفسير آليات النماذج البصرية.