في ظل التحديات المتزايدة التي تواجه الاتصال الآمن [عبر](/tag/عبر) الإنترنت، أصبحت ظاهرة [خطاب الكراهية](/tag/خطاب-الكراهية) موضوعًا ملحًا يتطلب [البحث](/tag/البحث) الدؤوب عن [حلول](/tag/حلول) فعالة. وكون [كشف](/tag/كشف) الخطاب السام (Toxic Speech) يمثل تحديًا كبيرًا، يتمحور التركيز التقليدي حول النصوص فقط، مما يفوت الفرصة لاستخدام الإشارات باراللغوية (Paralinguistic Cues) مثل [العواطف](/tag/العواطف) ونبرة [الصوت](/tag/الصوت) وسرعة الحديث، التي تعتبر جوانب أساسية لفهم سمية الخطاب.
للتغلب على هذه التحديات، تم تقديم [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) جديدة تُدعى ToxiAlert-Bench، التي تحتوي على أكثر من 30,000 مقطع صوتي مُعنون بأكثر من سبعة فئات رئيسية من السمية وعشرين تصنيفًا دقيقًا. تعتبر هذه المجموعة فريدة من نوعها حيث تُميز بين المصادر النصية والجوانب باراللغوية، مما يسمح بتحليل شامل لخطاب الكراهية.
بالإضافة إلى ذلك، تم [اقتراح](/tag/اقتراح) [نموذج](/tag/نموذج) شبكة [عصبية](/tag/عصبية) مزدوجة الرؤوس بتقنية [تدريب](/tag/تدريب) متعددة المراحل، مصممة خصيصًا لكشف الخطاب السام. يتضمن هذا النموذج رأسين تصنيفيين: أحدهما لتحديد مصدر الحساسية (نصّي أو باراللغوي)، والآخر لتصنيف النوع المحدد للسمية. تتضمن عملية [التدريب](/tag/التدريب) تدريبًا مستقلًا للرؤوس، يليه [تحسين](/tag/تحسين) مشترك لضمان تقليل التداخل بين المهام. وللتعامل مع عدم توازن البيانات، تم استخدام [تقنيات](/tag/تقنيات) أخذ عينات متوازنة وعوامل خسارة مرجحة.
تشير [نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) إلى أن الاستفادة من الميزات الباراللغوية تعزز [الأداء](/tag/الأداء) بشكل ملحوظ. حيث أظهرت المنهجية الجديدة تحسنًا نسبيًا بنسبة 21.1% في درجة Macro-F1 و13.0% في [الدقة](/tag/الدقة) مقارنةً بأقوى [نماذج](/tag/نماذج) الأساس، مما يبرز فعالية الطريقة وملاءمتها التطبيقية في الواقع.
تحدي الكشف عن خطاب الكراهية: بيانات شاملة وإطار عمل مبتكر يربط بين الكلمات والإحساس!
تمثل مجموعة بيانات ToxiAlert-Bench ثورة في الكشف عن خطاب الكراهية من خلال دمج الإشارات الباراللغوية. باستخدام شبكة عصبية مبتكرة، يمكننا تحسين دقة الكشف عن الخطاب السيء بشكل غير مسبوق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
