في عالم الذكاء الاصطناعي، تظل السعي لفهم الآليات البصرية (visual mechanistic interpretability) مهمة صعبة. تعتمد [النماذج](/tag/النماذج) الحالية غالبًا على طرق ج heuristic لاستنتاج نتائجها، مثل استرجاع التفعيل الأقصى (top-$K$ activation retrieval) أو [التحسين](/tag/التحسين) من خلال التقييد (regularization).

لكن [البحث](/tag/البحث) الجديد يقدم منظورًا توزيعياً مبتكرًا لهذه المشكلة. يقدم هذا النموذج تأثير تفعيل الخواص على توزيع [الصور](/tag/الصور) الطبيعية، ويطرح مشكلة [تحسين](/tag/تحسين) تتعلق بحدود كولباك-لايبير ([Kullback-Leibler](/tag/kullback-leibler) minimal optimization problem) لفهم الآلية.

وكجزء من هذا الإطار، يكشف الباحثون عن [انحيازات](/tag/انحيازات) إحصائية في [النماذج](/tag/النماذج) السابقة. والنتيجة؟ علينا أن نكون حذرين، حيث تظهر هذه [النماذج](/tag/النماذج) إما بصريًا غير قابلة للتفسير (أي تنحرف عن توزيع [الصور](/tag/الصور) الطبيعية)، أو أنها غير وفية لآليات [نماذج الرؤية](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)).

لحل هذه الانحيازات، يقترح الباحثون نموذجًا يعتمد على مبدأ [القيود](/tag/القيود) اللينة الأدنى من نوع [KL](/tag/kl) لتحقيق توازن مثالي بين القابلية للتفسير والأمانة. ولتطبيق هذا المبدأ، استخدموا [تقنية](/tag/تقنية) [أخذ العينات](/tag/أخذ-العينات) من التوزيع البعدي المستند إلى [الطاقة](/tag/الطاقة) (energy-guided diffusion posterior sampling).

أظهرت [التجارب](/tag/التجارب) الواسعة [صحة](/tag/صحة) هذا المفهوم النظري وفاعلية النموذج الجديد على [نموذج](/tag/نموذج) [DINOv3](/tag/dinov3) للرؤية. في ظل هذه التطورات، يمكن أن تتغير وجهات نظرنا حول كيفية [تفسير](/tag/تفسير) [آليات](/tag/آليات) [النماذج البصرية](/tag/[النماذج](/tag/النماذج)-البصرية).