تعتبر النماذج اللغوية الضخمة (Large Language Models) أدوات قوية في العديد من المهام اللغوية، مثل الترجمة والإجابة على الأسئلة. ومع ذلك، لا يزال هناك جانب مهم لم يتم الكشف عنه بشكل كافٍ: قدرة هذه النماذج على التعامل مع النوع الاجتماعي والتوافق الصرفي. في اللغات ذات البنية اللغوية الغنية، تلعب الجوانب المتعلقة بالنوع الاجتماعي دورًا محوريًا في صياغة الأفعال، الضمائر، وحتى بناء الجمل من منظور المتحدث الأول.

ولتعزيز الفهم في هذا المجال، تم تقديم مؤشر MORPHOGEN، وهو مجموعة بيانات جديدة تهدف إلى تقييم جيل الكلمات مع مراعاة النوع الاجتماعي في ثلاث لغات قواعدها لغوية نوعية متنوعة: الفرنسية، العربية، والهندية. يتمحور العمل الأساسي في هذه الدراسة حول مهمة تُعرف باسم GENFORM، والتي تتطلب من النماذج إعادة صياغة جملة من المتحدث الأول إلى الجنس المعاكس، مع الحفاظ على المعنى والبنية.

تتضمن مجموعة البيانات العالية الجودة تمثيلاً شمولياً للغات الثلاث، وتم إجراء اختبارات على 15 نموذجًا من النماذج اللغوية الضخمة التي تتراوح سعتها ما بين 2 مليار إلى 70 مليار معلمة. تكشف النتائج عن فجوات ملحوظة ورؤى مثيرة حول كيفية تعامل النماذج الحالية مع النوع الاجتماعي الصرفي. تعتبر MORPHOGEN أداة تشخيصية مركزية لنماذج اللغة المدركة للنوع الاجتماعي، وتضع الأسس للبحوث المستقبلية في مجال معالجة اللغة الطبيعية الشاملة والحساسة للبنية الصرفية.