في دراسة حديثة نشرت في arXiv، اكتشف الباحثون أن توافق دماغ الإنسان مع نماذج اللغات الضخمة (Large Language Models) ليس مجرد ظاهرة محصورة باللغة الإنجليزية، بل يمتد ليشمل لغات أخرى مثل الصينية والفرنسية. وأظهرت البيانات المستمدة من تقنية تصوير الرنين المغناطيسي الوظيفي (fMRI) على 112 مشاركاً، أن العوامل التي تؤثر على هذا التوافق لا تقتصر على الخصائص المشتركة بين اللغات، بل تتأثر بشكل رئيسي بنوع بيانات التدريب المستخدمة في نماذج اللغات.
أحد النتائج الرئيسية للدراسة هو أن نموذجاً لغوياً مهيمنًا على اللغة الصينية (Baichuan2-7B) أظهر توافقاً أفضل مع أدمغة المتحدثين باللغة الصينية، على الرغم من أنه يتشارك مع نموذج آخر معروف (LLaMA-2-7B) في الهيكلية. وهذا يوفر دليلاً قوياً على أن ميول البيانات المستخدمة في التدريب تلعب الدور الأهم في تحديد نمط التوافق بين الدماغ والنموذج اللغوي.
علاوة على ذلك، أظهرت الدراسة أن الفجوة النمطية (typological distance) تؤثر بشكل ملحوظ على عمليات التوافق، حيث تبيّن أن المنطقة الدماغية المرتبطة بالنحو (IFG) تظهر تراجعًا أكبر بخمس مرات مقارنة بالمناطق المرتبطة بالمعاني اللغوية (PTL).
يسلط هذا البحث الضوء على أن ما يُعرف بـ "ميزة اللغة الإنجليزية" ليس سمة جوهرية، بل هو نتيجة لتكوين بيانات التدريب، مما يفتح الأفق أمام علماء اللغة لتفهم الفروقات الأساسية في معالجة اللغات عبر الثقافات.
توافق الدماغ ونماذج اللغات الضخمة: رحلة بيانات التدريب عبر اللغات!
تظهر دراسة جديدة أن التوافق بين دماغ الإنسان ونماذج اللغات الضخمة يعتمد بشكل كبير على لغة التدريب، وليس فقط على خصائص اللغة نفسها. النتائج تكشف عن تأثير بعيد المدى لبيانات التدريب على هذا التوافق عبر الثقافات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
