في دراسة جديدة نشرت على منصة arXiv، تم تناول موضوع مثير للاهتمام يتعلق بنماذج اللغة المتطورة، حيث يمكن لنماذج اللغة المدربة (Instruction-tuned language models) أن تجيب عن نفس السؤال المتعلق بالتفكير السببي بشكل مختلف بناءً على تغييرات بسيطة في الأسماء المتغيرة المستخدمة. هذا الأمر يثير تساؤلات حول مدى تأثير الفجوات اللغوية (lexical gaps) على عملية التفكير لدى هذه النماذج.

تسعى الدراسة إلى فهم ما إذا كان الفجوات اللغوية تعكس فقداناً للمعلومات في رؤية الأسماء المتغيرة، أم أنها تعكس عدم توافق في استخدام الممثلات الأساسية للنموذج. استخدمت الدراسة أداة تحديث وزن رؤية مزدوجة (paired-view weight update) لفحص الآلية المتبقية بعد إغلاق الفجوة اللغوية.

في الأوضاع الميدانية، تشير الأدلة إلى أن عدم التوافق في التمثيل يعدّ السبب الأساسي لهذه الظاهرة. إذ أصبحت دقة الاستفسارات التي تعتمد على الأسماء المتغيرة أكثر دقة مع استخدام رؤية الأسماء البديلة. ومن خلال تجربة على نماذج مثل Qwen-7B وQwen-14B وLlama-3.1-8B، لوحظ أن تمثيل القرار يمكنه نقل هوية الإجابة بين الرؤى المختلفة.

تنجح عملية التحديث في تحقيق التوافق بين الرؤى من خلال تعزيزات مضادة للحقائق (counterfactual augmentation) باستخدام الطلبات الأصلية والبديلة، بينما يساهم توافق اعتقاد الإجابات في تحسين الاتفاقية حول الإجابات المبدئية. ومع ذلك، لا تزال هذه النجاحات مرتبطة بنوع النموذج وحجمه وطبيعة المهمة. على سبيل المثال، يتمتع انتقال CRASS بموثوقية عبر جميع مقاييس Qwen ونموذج Llama، بينما تظهر نماذج e-CARE ضعفاً مستمراً، وتظهر المهام الأولية لإعادة التسمية غير السببية نمطاً مماثلاً في النتائج.

هذه الدراسة تُسلّط الضوء على تعقيدات نماذج الذكاء الاصطناعي وكيف يمكن لفهم الفجوات اللغوية أن يسهم في تحسين أدائها في التفكير السببي. كيف تعتقد أن تأثير الأسماء المتغيرة يمكن أن يؤثر على تطبيقات الذكاء الاصطناعي في المستقبل؟ شاركونا آرائكم في التعليقات.