في عصر تزايد استخدام نماذج اللغة الضخمة (Large Language Models) على الإنترنت، تتزايد الحاجة إلى تقنيات فعالة للكشف عن التعابير السامة والتخلص منها. الدراسات الحالية تركز بشكل كبير على النصوص الواضحة، مما يمثل قيدًا في القدرة على كشف التعابير السامة عندما يقوم المستخدمون بتخفيها عمدًا.

تعتبر التعابير السامة باللغة الكورية تحديًا فريدًا، حيث يمكن بسهولة إخفاؤها عبر المورفولوجيا المجمعة (Agglutinative Morphology) وتنوع الكتابة الخاصة بالهانيغول. على الرغم من ذلك، لا تزال ظاهرة التستر باللغة الكورية غير مستكشفة بشكل كافٍ، مما أدى إلى الحاجة الماسة لتطوير مجموعة بيانات جديدة.

تقدم مجموعة بيانات KOTOX، التي تمثل إنجازًا هامًا في هذا الصدد، نموذجًا شاملًا يهدف إلى كشف هذه التعابير المموهة وتطبيق تقنيات إزالة السمية. لقد تم تصنيف أنماط التستر باللغة الكورية إلى فئات لغوية معروفة، وتحديد قواعد التحويل المستمدة من أمثلة واقعية. كما تم تزويد المجتمع بأداة مفتوحة تحتوي على إطار العمل التكتلي.

بفضل هذه القواعد، تقدم مجموعة KOTOX أمثلة على جمل محايدة وسامة جنبًا إلى جنب مع نظيراتها المموهة. التحليلات أظهرت أن النماذج المدربة باستخدام هذه المجموعة تستطيع التعامل بشكل أفضل مع النصوص المموهة دون التأثير على أدائها في النصوص الواضحة. تُعتبر هذه المجموعة الأولى من نوعها التي تدعم بشكل متزامن فك التستر والتخلص من السمية في اللغة الكورية.

نتطلع إلى أن تحقق مجموعة البيانات هذه فهمًا أفضل للمحتوى السام المموه وتعزيز التخفيف منه في التطبيقات المختلفة لنماذج اللغة. يمكنكم الاطلاع على الشيفرة والبيانات عبر الرابط KOTOX.