في عالم الفهم البشري للرؤية، يظل احد الأهداف الرئيسية هو تحديد الميزات البصرية التي تدفع نشاط الأعصاب في الدماغ. مع تنامي الأبحاث، استخدمت نماذج الشبكات العصبية الاصطناعية (Artificial Neural Networks) كنماذج ترميز (Encoding Models) لتوقع استجابة القشرة البصرية للصور الطبيعية، مما أظهر المحتوى البصري الذي ينشط مناطق معينة. ومع ذلك، كانت الأساليب الحالية تعتمد بشكل كبير على التحليل الارتباطي وتعامل مع نموذج الترميز كمربع أسود، مما يترك تساؤلات حول الميزات التي تحفز استجابة كل عنصر من عناصر القشرة (Voxels).

نقدم لكم الآن MINE - إطار العمل الذي يسعى لتجاوز هذه العقبات. من خلال أدوات التحليل الآلي، يمكن لـ MINE أن يحدد الميزات داخل الصور الطبيعية التي تدفع النشاط على مستوى المليمتر (Voxel-level). يقوم هذا الإطار بالتنبؤ باستجابة كل عنصر من عناصر القشرة باستخدام تمثيلات صور متوافقة لغويًا، وينتج أوصافًا تفسيرية دلاليًا للميزات الحيوية اللازمة لتنشيط العنصر.

بالإضافة إلى ذلك، نعمل على تعميم هذه الميزات للصورة الواحدة إلى ملفات تعريف وظيفية لكل عنصر، مما يجعل النتائج أكثر دقة. وقد قمنا بت validation الأوصاف المتعلقة بالصورة الواحدة، حيث أثبتنا أنها قادرة على توليد صور تُحدث استجابات مطابقة لتلك الخاصة بالصور الأصلية، وبشكل أدق من الصور الناتجة عن تحكمات عشوائية.

علاوة على ذلك، فإن التعديلات المدروسة التي تُدخل أو تُحذف الميزات المتوقعة من الصور تُظهر انزياحًا في النشاط في الاتجاه المتوقع، مما يوفر دليلًا سببيًا. تعتبر هذه التعديلات، المدعومة بملفات تعريف النشاط الخاصة بكل عنصر، ذات تأثير أقوى، مما يدل على أن الملفات تلتقط بدقة تفضيلات كل عنصر.

أخيرًا، قمنا بتطبيق MINE على مناطق الدماغ المعروفة باختيارها لفئات معينة، ونجحنا في استرداد تفضيلات فئوية معروفة بينما كشفنا في الوقت نفسه عن هيكل فريد ومتخصص لكل منطقة. تعد النتائج التي توصلنا إليها خطوة نحو تحديد الفرضيات الدقيقة حول وظائف الأعصاب واختبارها بشكل سببي.