في عالم يتلاقى فيه علم الأعصاب (Neuroscience) وتكنولوجيا التعلم الآلي (Machine Learning)، نجد أن فهم كيفية معالجة البشر وأنظمة الذكاء الاصطناعي للفيديوهات السردية المعقدة يمثل تحديًا كبيرًا. في دراسة جديدة، تم التحقيق في تأثير مدة مقاطع الفيديو (3-24 ثانية) والسياق الزمني على توافق الدماغ مع نماذج الذكاء الاصطناعي خلال مشاهدة الأفلام.

استخدم الباحثون تقنية الفحص باستخدام الرنين المغناطيسي الوظيفي (fMRI) لقياس النشاط الدماغي للمشاركين أثناء مشاهدتهم لأفلام طويلة. وقد أظهرت النتائج أن زيادة مدة مقاطع الفيديو تؤدي إلى تحسن ملحوظ في توافق الدماغ مع نماذج اللغة الكبيرة متعددة الوسائط (Multimodal Large Language Models - MLLMs)، بينما لم تظهر النماذج الأحادية الوسائط (Unimodal Models) أي فوائد كبيرة.

كما توصلت الدراسة إلى أن النوافذ الزمنية القصيرة تتماشى مع مناطق الإدراك المبكر، بينما تُفضل النوافذ الزمنية الأطول الارتباط بمناطق الدماغ المسؤولة عن الدمج العالي المستوى. وقد أُجريت تجارب باستخدام أربع مهام سردية، وأظهرت النتائج أنه تم استدعاء أنماط توافق دماغية محددة تعتمد على المهمة والسياق.

يعد هذا البحث بمثابة اختبار مدروس لدراسة تكامل الزمن الطويل في نماذج MLLMs وعلاقته بالاستجابات القشرية خلال فهم السرد. فكيف يمكن أن تتطور تطبيقات هذه النتائج في مجالات مثل التعليم والترفيه والفنون؟