في عالم الذكاء الاصطناعي، تعتبر أنظمة تصنيف خطاب الكراهية من الأدوات الحساسة التي تتطلب دقة عالية. ولكن، ماذا يحدث عندما تتجاهل هذه الأنظمة الاختلافات بين المعلقين وتلجأ إلى تصويت الأغلبية؟ تكشف دراسة جديدة منشورة في arXiv (2606.28772v1) عن نمط مثير للقلق؛ إذ يتسبب تصنيف الأغلبية في عدم تمثيل حقيقي لقيم قليل من المعلقين، مما يؤدي إلى تآكل موثوقية النتائج.
تشير البيانات إلى أن 42.6% من عدم الاتفاق بين المعلقين يحدث تحديدًا عند النقاط الحدودية بين خطاب الكراهية والإساءة. ووجد الباحثون أن نماذج الذكاء الاصطناعي مثل نموذج BERT القائم على العلامات الصعبة (Model A) ونموذج العلامات المرنة (Model B) تفقد دقة تصل إلى 22 نقطة مئوية عند التعامل مع المنشورات المعرضة للاختلاف.
تعتبر هذه الفجوة أكثر وضوحًا في نموذج متعدد الرؤوس للمعلقين (Model C)، حيث ترتفع الفجوة إلى 28 نقطة، مما يعكس مدى تأثير اختلافات المعلقين. والأكثر إثارة للقلق هو أن نموذج A يظهر ثقة أكبر في الأخطاء عند الحدود مقارنةً بنموذج C.
النتيجة هنا هي أن تصويت الأغلبية يقدم حكماً متنافساً كحقيقة ثابتة، مما يجعل النماذج ترث هذه الثقة المزيفة. للدفاع عن فعالية هذه الأنظمة، يجب أن تكون التدخلات مصممة بعناية على مستوى عملية التعليق ككل، وليس فقط مع التركيز على النماذج نفسها. هذا يسلط الضوء على الحاجة إلى تغييرات هيكلية في كيفية تقييم وتحليل خطاب الكراهية.
ماذا تعتقد في هذه القضية المعقدة؟ شاركنا برأيك في التعليقات!
تصويت الأغلبية يسكت قيم الأقلية: حالة عدم توافق المعلقين عند حدود الكراهية والإساءة
يكشف دراسة جديدة أن تصويت الأغلبية في أنظمة تصنيف خطاب الكراهية لا يعكس الحقيقية، حيث يركز 42.6% من عدم الاتفاق بين المعلقين عند حدود الإساءة. وهذا يؤثر سلبًا على دقة نماذج الذكاء الاصطناعي، مما يستدعي تغييرات هيكلية في تصميم عمليات التوصيف.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
