في عالم علوم الحوسبة العصبية، يبقى فهم العلاقة بين التمثيلات البصرية العميقة (Deep Visual Representations) والنظام البصري البشري تحديًا كبيرًا. على الرغم من أن النماذج الحديثة للرؤية تحقق أداءً قويًا في التعرف على الصور، إلا أن توافقها مع التنظيم الهرمي للقشرة البصرية البشرية لا يزال موضوعًا مفتوحًا للبحث.

في هذا السياق، قدم الباحثون دراسة مبتكرة تحت عنوان CHASMBrain، والتي تُعتبر إطار عمل هيراركي جديد من مرحلتين لتحويل الصور إلى بيانات التصوير بالرنين المغناطيسي الوظيفي (fMRI). يعتمد هذا التصميم الفريد على نظام تدفق مزدوج (Dual-stream Mamba) يفصل بوضوح بين معالجة الرموز الدلالية العالمية والشرائح المكانية المحلية، مستندًا إلى التنظيم الوظيفي للقشرة البصرية.

يعتمد الإطار على استراتيجية من الخشن إلى الدقيق (Coarse-to-Fine): حيث تتنبأ المرحلة الأولى بتنشيطات الهيئة المستهدفة المعدلة من الضوضاء، بينما تصقل المرحلة الثانية هذه الاستجابات الخشنة إلى توقعات دقيقة على مستوى الفوكسل باستخدام نموذج Mamba-VAE.

أظهرت التجارب التي أجريت على مجموعة بيانات المشاهد الطبيعية (Natural Scenes Dataset) أن هذه الطريقة حققت ارتباط بيرسون (Pearson correlation) بلغ 0.429 وخطأ متوسط تربيعي (MSE) بلغ 0.261، متفوقة على جميع المعايير التقييمية الأخرى بما في ذلك الانحدار الشديد (Ridge Regression) واستكشافات DINOv2.

علاوة على الأداء التنبؤي، كشفت تجارب إزالة الفرع السببية عن تخصص غير متماثل: حيث يرتبط تدفق الشرائح مباشرة بالقشرة البصرية المبكرة (المناطق الرتينوتوبية)، بينما يساهم تدفق CLS في تقديم سياق دلالي أوسع إلى المناطق العليا - وهي مطابقة تحتفظ بعلاقة سببية، وليست فقط ارتباطية.

كما أظهرت تجارب نقل المعلومات عبر الأفراد أن العمود الفقري الذي تم تعلمه يعمم عبر الأفراد مع حد أدنى من التكيف الفردي، مما يشير إلى أن النموذج يلتقط تمثيلاً بصريًا مشتركًا وغير مرتبط بالموضوع.