تُعتبر اللغة أداةً قوية، تعمل على تشكيل الهويات وتعزيزها، ولها دور مزدوج يتمثل في الهامشية والمقاومة، خاصة عندما تتعلق بالمجتمعات الأقلية التي تواجه خطابات غير حساسة ومؤذية على الإنترنت. مع تزايد الاعتماد على نماذج اللغة الكبيرة (LLMs) في عمليات مُراقبة المحتوى، تبرز المخاوف بشأن قدرة هذه الأنظمة على التعرف على الخطابات الثقافية غير الحساسة، التي تتجاهل أو تهمش الثقافات ووجهات النظر الدينية للمجتمعات التي تعاني من نقص التمثيل، غالبًا من خلال إقصاء ضمني أو تشويه للحقائق.

تسجل باكستان، وبالأخص مجتمعَي الهندوس والشاكما، أكبر الطوائف الدينية والأقليات العرقية الأصلية في البلاد، دراسة رائعة تهدف إلى استكشاف حدود نماذج (LLMs) في مُراقبة المحتوى. قامت دراسة حديثة بتطوير مجموعة بيانات تعبر عن الخطاب المسيء بالتعاون مع أفراد المجتمع، بحيث تم دمج رواياتهم في أنظمة مُراقبة المحتوى باستخدام تقنية تمزج بين الاسترجاع والتوليد (RAG).

يُتيح لنا الأداة 'Mod-Guide' تحسين حساسية نماذج اللغة الكبيرة تجاه وجهات نظر الأقليات من خلال استغلال المؤشرات السياقية المستمدة من التجارب الحياتية. كما أظهرت التقييمات متعددة الأساليب، التي شملت مشاركين من كلا المجتمعين، أن الردود المعززة بتقنية (RAG) كانت أكثر دقة في السياق وتم تلقيها بشكل مختلف عبر خطوط عرقية.

تعزز هذه الدراسة تقدم البحث في مجالات تفاعل الإنسان مع الحاسوب، وأخلاقيات الذكاء الاصطناعي، والحوسبة الاجتماعية، حيث تركز على تعزيز العدالة التصالحية والشمولية التأويلية في تصميم أنظمة مُراقبة المحتوى. هل أنتم مستعدون لاستكشاف المزيد حول تأثيرات هذه التكنولوجيا المتقدمة؟ شاركونا أفكاركم!