تعتبر [دراسة](/tag/دراسة) [انحياز](/tag/انحياز) الجنس الخارجي في [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) البنغالية (Bangla pretrained language models) خطوة مهمة [نحو](/tag/نحو) [فهم](/tag/فهم) كيفية تأثير [التحيزات الاجتماعية](/tag/[التحيزات](/tag/التحيزات)-الاجتماعية) في [تقنيات](/tag/تقنيات) الذكاء الاصطناعي، وهو مجال لم يُكتشف بعد بشكل كامل في [اللغات](/tag/اللغات) ذات الموارد المحدودة. في هذا السياق، قام الباحثون بإنشاء أربع [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) معيارية محددة المهام تشمل [تحليل](/tag/تحليل) المشاعر، [اكتشاف](/tag/اكتشاف) السمية، [رصد](/tag/رصد) خطاب الكراهية، واكتشاف السخرية، حيث تم وسمها يدوياً.
في خطوة مبتكرة، تم تعزيز كل [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) من خلال تبديل الأسماء والمصطلحات المرتبطة بالجنس بشكل دقيق، مما أتاح تقييمًا شاملاً حول كيفية تأثير الاختلافات الجندرية في [تنبؤات](/tag/تنبؤات) [النماذج](/tag/النماذج). يعكس ذلك الحاجة الملحة للنظر في العوامل العميقة التي تؤثر على [أداء](/tag/أداء) [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)).
بالإضافة إلى ذلك، قدمت [الدراسة](/tag/الدراسة) [استراتيجية جديدة](/tag/[استراتيجية](/tag/استراتيجية)-جديدة) تُعرف باسم RandSymKL، وهي طريقة عشوائية لتخفيف التحيز، تكاملت مع [تقنيات](/tag/تقنيات) مثل تباين [KL](/tag/kl) المتماثل وخسارة [الانتروبيا](/tag/الانتروبيا) المتقاطعة (cross-entropy loss) للحد من [التحيز](/tag/التحيز) في [نماذج](/tag/نماذج) معينة تستهدف مهام [التصنيف](/tag/التصنيف).
تم [تقييم](/tag/تقييم) هذه المقاربة الجديدة مقارنة بأساليب تخفيف [التحيز](/tag/التحيز) الحالية، ولعل ما يميزها ليس فقط قدرتها على تقليل التحيز، بل أيضًا على الحفاظ على [دقة](/tag/دقة) تنافسية مشابهة لأساليب الأساس الأخرى. في مسعى لتشجيع المزيد من [الأبحاث](/tag/الأبحاث) في هذا المجال، تم إتاحة الأساليب والمجموعات البيانية للعامة، مما يعكس [التزام](/tag/التزام) [الباحثين](/tag/الباحثين) بتطوير [نماذج](/tag/نماذج) أكثر عدلاً وشمولية.
كيف نواجه انحياز الجنس في نماذج اللغة البنغالية؟ استراتيجيات مبتكرة لمكافحة التحيز في تحليل البيانات!
تسلط هذه الدراسة الضوء على مشكلة انحياز الجنس الخارجي في نماذج اللغة البنغالية، وتقدم استراتيجيات جديدة لمكافحته. استخدمت الدراسة مجموعات بيانات متخصصة لتحقيق نتائج دقيقة مع الحفاظ على دقة البيانات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
