في عصر الإعلام الرقمي، أصبحت الميمات (memes) وسيلة شائعة للتعبير عن الآراء والتفاعلات الثقافية. ومع تزايد استخدامها، برزت مشكلة كراهية الخطاب (hate speech) بشكل لافت، مما يتطلب تقنيات جديدة وفعالة للكشف عنها.
إن كشف كراهية الخطاب في الميمات ليس بالمهمة السهلة، فهي تتسم بطبيعة متعددة الوسائط (multimodal) وباستخدام تلميحات ثقافية وتعبيرات دقيقة مثل السخرية والسياق. بينما توفر النماذج اللغوية للرؤية (vision-language models - VLMs) الربط بين النصوص والصور، إلا أن العملية الكاملة قد تكون هشة، حيث يتطلب الأمر إنشاء تقديرات واحدة معقدة تشمل الهدف والموقف والإيحاء والسخرية.
في الدراسة الجديدة المقدمة في LT-EDI 2026، اقترح الباحثون نهجًا مبتكرًا يُسمى الإشراف الضعيف المدفوع بالأسئلة (prompted weak supervision - PWS)، والذي يقوم بتجزئة فهم الميمات إلى وظائف تصنيف مستندة إلى الأسئلة مع خيارات إجابة محددة، تركّز بشكل خاص على الكشف عن كراهية المثليين (homophobia) وكراهية المتحولين (transphobia).
باستخدام نموذج Qwen3-VLM المعقد لاستخراج الميزات من خلال الإجابة على أسئلة محددة، أظهرت هذه الطريقة تفوقًا ملحوظًا بالمقارنة مع تصنيف VLM المباشر. وبرزت النتائج بوضوح، حيث تصدرت الدراسة في التصنيف باللغة الإنجليزية، وحلت في المرتبة الثانية بالصينية، والثالثة بالهندية.
بالإضافة إلى ذلك، ساعدت عمليات تحسين متكررة من خلال توسيع وظائف التصنيف مدفوعة بالأخطاء وتقليل الميزات في تقليل التكرار وتحسين التعميم. تكشف هذه النتائج عن فعالية الإشراف الضعيف المدفوع بالأسئلة في الكشف عن كراهية الخطاب متعددة اللغات ومتعددة الوسائط.
الكشف عن كراهية الخطاب في الميمات: كيف تساهم تقنيات الذكاء الاصطناعي في فهم الرسائل المعقدة؟
تحديات الكشف عن كراهية الخطاب في الميمات تزداد تعقيدًا بسبب طبيعتها متعددة الوسائط. ومع ذلك، فإن تقنيات الإشراف الضعيف المدفوعة بالأسئلة قد تكون الحل الثوري لهذه المشكلة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
