تعتبر نماذج اللغة (Language Models) أداةً قوية في معالجة اللغة الطبيعية، لكنها قد تعاني من تحيزات نظامية تجاه المتحدثين بناءً على تنوع لهجاتهم. في دراسة جديدة، تم تسليط الضوء على مفهوم يُعرف بالتحيز اللفظي الخفي (covert dialect bias)، والذي يظهر عندما ترتبط السمات النمطية لمجموعات معينة بنمط معين من التعبير اللغوي، حتى دون وجود تصنيف واضح للهجة.

في إطار هذه الدراسة، قام الباحثون بتقييم كيف تتفاعل نماذج اللغة مع التغريدات المماثلة من حيث المعنى، ولكن بتعبيرات مختلفة: الإنجليزية الأمريكية القياسية (Standard American English) واللهجة الإنجليزية الإفريقية الأمريكية (African-American Vernacular English). وبينما أظهرت الدراسات السابقة أن نماذج اللغة ترتبط بشكل أكبر بالسمات السلبية مع تغريدات اللهجة الافريقية الأمريكية عند تقييم تغريدة منفردة، فقد كانت النتائج في هذه الدراسة مفاجئة. فقد وجد الباحثون أن التحيز يصبح أكثر وضوحًا بشكل كبير عند مقارنة التغريدات باللهجتين جنبًا إلى جنب، وهو ما يعكس واقع اتخاذ القرارات في سياقات عالية التأثير، حيث تُستخدم هذه النماذج لتقييم المرشحين.

المثير للاهتمام أن التحيز يزداد سوءًا عندما يتم تحديد تصنيفات اللهجات بشكل صريح. برغم الجهود المستمرة من مطوري النماذج التجارية للحد من هذه التحيزات، عرضت الدراسة نتائج تدعو للتفكير.

لكن هناك أمل؛ فقد أظهرت الدراسة أن تقنيات التعديل من حيث العدالة يمكن أن تقلل من التحيز اللفظي الخفي لبعض السمات، مما يقلل من الفجوات عند تقييم التغريدات بشكل منفرد. ولكن، هذه التحسينات لم تكن مستقرة عند تقييم التغريدات باللهجتين جنبًا إلى جنب.

توصلت هذه الدراسة إلى أن البيئات المستخدمة حالياً لتقييم التحيز اللفظي الخفي قد تقلل من تقدير شدته، خصوصًا في السياقات المقارنة. بالإضافة إلى ذلك، كان التحيز اللفظي الظاهر (overt dialect bias) واضحاً حتى بعد تطبيق عمليات التحسين المرتبطة بالسلامة، مما يشير إلى أن هذه الظاهرة لا تزال تمثل مشكلة غير محسومة، وتدعو الحاجة إلى تطوير أطر تقييم أكثر صلابة وتخفيفاً.

كيف ترى تأثير اللهجات على نماذج الذكاء الاصطناعي؟ شاركنا برأيك!