تكشف دراسة جديدة عن تعقيدات كشف "الميمات الكارهة" (Hateful Memes) باستخدام نماذج اللغة والرؤية (Vision-Language Models)، حيث يتمثل التحدي في أن المعايير الحالية للإنتاجية تعتمد بشكل تدقيقي على مشاهدات سابقة، مما يخلط آليات الكراهية البلاغية (Rhetorical Hate Mechanisms) مع خصائص المجتمعات المستهدفة. وهذا يؤثر على تقييم نقاط الضعف في النماذج بطريقة موضوعية.

لذا، تم تقديم معيار FBHM، والذي يُعتبر مجموعة معايير مهنية تم تنظيمها بعناية للكشف عن الميمات الكارهة، حيث تم تصميمه وفقًا لمحاور مزدوجة: 25 وظيفة بلاغية متميزة و10 مجتمعات مستهدفة، تشمل 5000 ميم في المجموع.

تظهر النتائج أن النماذج المتقدمة في كشف الميمات تواجه فجوة كبيرة في التعميم: حيث تتفوق في دقة الأداء على مجموعات البيانات القياسية، ولكنها تسقط إلى مستوى أداء قريب من العشوائية عند اختبارها على FBHM، وهو ما يدل على أنها تعتمد على استراتيجيات محددة للبيانات بدلاً من التفكير المتعدد الوسائط القائم على التحليل العميق.

ولسد هذه الفجوة، تم اقتراح تقنيات جديدة تُعرف باسم "متجهات التوجيه القابلة للتعلم" (Learnable Steering Vectors)، وهي استراتيجية تعتمد على مقدار بيانات منخفض للغاية، حيث تحتاج فقط إلى 500 عينة توجيه (50 ميم أساسي فريد)، مما يؤدي إلى تحسين أداء FBHM بنسبة حوالي 30 نقطة في مؤشر Macro-F1، متفوقة في ذلك على تقنيات التعلم السياقي (In-Context Learning) وPEFT، دون التأثير سلبًا على الأداء في نطاق المصدر.

إن الاعتماد على استراتيجية مثل LSV قد يفتح آفاقًا جديدة في تكامل الذكاء الاصطناعي مع مستوى أكبر من الفهم العميق للكراهية في النصوص، مما يعني أن نماذج الذكاء الاصطناعي ستصبح أكثر قوة وفعالية في التعرف على المحتوى الضار. كيف ترون تأثير هذا التطور على مستقبل الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!