في عالم تتطور فيه وسائل التواصل الاجتماعي باستمرار، أصبحت الحاجة إلى وجود أنظمة فعّالة للكشف عن خطاب الكراهية أكثر إلحاحًا من أي وقت مضى. يعاني المجتمع الرقمي من تصاعد مختلف أشكال خطاب الكراهية، مما يتطلب أدوات متقدمة للكشف عنها.

التحدي الأكبر الذي نواجهه حاليًا هو الانتقال من النصوص البسيطة إلى التعبيرات المتعددة الأبعاد المعقدة. يشير خطاب الكراهية المتعدد الأبعاد إلى تركيبة المحتوى الذي يتم فيه دمج النص مع الصور والفيديو، مما يجعل من الصعب تحديد النوايا الضمنية المهاجمة. فالنماذج الحالية غالبًا ما تفشل في التعرف على هذه الحالات الدقيقة حيث تتجاوز المعاني الناشئة الجمع البسيط للوسائط الفردية.

لمواجهة هذا التحدي، تم تقديم نموذج جديد يُعرف بـ "تفاعل الصورة-اللغة للكشف عن الكراهية" (Hate via Vision-Language Interplay - H-VLI). يعتمد هذا النموذج على فهم العمق في التفاعل بين الوسائط المختلفة، حيث يركز على المعاني الخفية التي قد تكون موجودة في المحتوى.

بالإضافة إلى ذلك، تم اقتراح إطار "التفكير غير المتناظر عبر مناظرة وكيل غرفة المحكمة" (Asymmetric Reasoning via Courtroom Agent DEbate - ARCADE). حيث يعمل هذا الإطار على محاكاة عملية قضائية تُجبر النموذج على تحليل الإشارات السيميائية المعقدة، مما يعزز من القدرة على التمييز بين النوايا الضمنية ويساعد في الوصول إلى نتائج دقيقة.

تظهر التجارب أن ARCADE يتفوق بشكل ملحوظ على النماذج الحالية في أداءه على معيار H-VLI، وخاصة في الحالات التحديّة، مع الحفاظ على أداء تنافسي على المعايير الأخرى.

مع تزايد التعقيدات في أشكال خطاب الكراهية، يبقى السؤال: كيف يمكننا تحسين أدوات الكشف لنواجه هذه التحديات بشكل أكثر فعالية؟ شاركونا آرائكم في التعليقات!