في عالم تتزايد فيه الشكاوى بشأن المحتوى الضار، تُعتبر عملية اعتدال المحتوى (Content Moderation) عنصرًا أساسيًا تستند عليه الكثير من منصات التواصل الاجتماعي. لكن ماذا يحدث عندما يتداخل استخدام لغات متعددة في نفس المحتوى؟

درس الباحثون هذا السؤال من خلال إجراء دراسة مكثفة فحصوا فيها كيفية تعرض الأنظمة للمدخلات المختلطة (Code-Mixed Inputs)، التي تدمج بين الإنجليزية والتاميلية. ووفقًا للنتائج، فقد واجهت الأنظمة مشكلات كبيرة في قرارات الاعتدال، مما أدى إلى زيادة في عبء المراجعة وتضخيم نسبة الإشارات الخاطئة للمحتوى غير الضار. يُظهر البحث أن معدل التغييرات في القرارات بين المدخلات النظيفة (Clean Inputs) والمدخلات المختلطة يمكن أن يصل إلى 26.5%، مما يعني أن واحدًا من كل أربعة قرارات يمكن أن يكون غير صحيح بناءً على اختلاف اللغة.

لم تتوقف المشكلات عند هذا الحد. كذلك، ارتفعت نسبة المحتوى المُعلم بشكل خاطئ من 6.9% إلى 10.4%، مما يعكس قيدًا أكبر في قدرة النظام على التعامل مع محتوى بلغات مختلفة. وهذا يسلط الضوء على ضرورة تحسين الأنظمة لتكون أكثر قدرة على رصد وفهم التنويعات اللغوية.

عندما تم استخدام مدخلات تاميلية فقط، تفاقمت هذه المشكلات، مما يشير إلى حاجة ملحة للتوسع في نطاق تغطية اللغات. وبالرغم من أن الباحثين قد اقترحوا قاعدة جديدة لتقليل الأخطاء عن طريق تأجيل بعض القرارات، إلا أن هذا النهج زاد من عبء المراجعة على المحررين.

تُظهر هذه النتائج أهمية تقييم عمليات الاعتدال على مستوى العمل، حيث يمكن أن تُخفي تلخيصات التقييم التقليدية الكثير من الفشل. إنّ عدم استقرار أنظمة الاعتدال عند التعامل مع محتوى متعدد اللغات يعد تحديًا يستدعي اهتمامًا جادًا من قبل مطوري الأنظمة، لضمان أنها تتعامل بشكل عادل وشامل مع جميع المستخدمين.