في عالمٍ يتزايد فيه الاعتماد على نماذج اللغات الكبيرة (LLMs) في بيئات متعددة اللغات، تأتي الحاجة لفهم سلوك هذه النماذج في اللغات ذات الموارد المنخفضة والمتنوعة ثقافيًا. وقد أطلق باحثون دراسة رائدة تحت مسمى "IndicSafe"، التي تمثل أول تقييم منهجي لسلامة 10 من أبرز نماذج اللغات الكبيرة عبر 12 لغة هندية تُستخدم من قِبل أكثر من 1.2 مليار شخص، لكن تُعاني من نقص في البيانات التدريبية.
اعتمدت الدراسة على مجموعة بيانات تضم 6000 سيناريو ثقافي، تتناول مواضيع حساسة تشمل الطبقات الاجتماعية والدين والجنس والصحة والسياسة، لتقييم مدى استجابة النماذج لهذه القضايا. وقد أظهرت النتائج أن هناك تباينًا كبيرًا في سلامة النماذج: حيث بلغت نسبة الاتفاق عبر اللغات 12.8% فقط، وبلغ تباين معدل "SAFE" أكثر من 17% بين اللغات المختلفة.
تتجلى بعض المشكلات في هذه النماذج، مثل رفض بعضها للمحتويات غير الضارة في النصوص المكتوبة بخطوط عابرة، أو الإشارة إلى مواضيع ذات حساسية سياسية بشكل مفرط، بينما تفشل نماذج أخرى في توضيح المحتويات غير الآمنة. استخدم الباحثون أساليب مبتكرة مثل قياس فوضى مستوى السيناريو، ونقاط انحياز الفئات، ومؤشرات توافقية متعددة اللغات لتقييم هذه الفجوات.
تسلط هذه النتائج الضوء على الفجوات الحرجة في سلامة النماذج متعددة اللغات، وتبرز أهمية اعتماد استراتيجيات موائمة للسلامة تأخذ بعين الاعتبار الخصوصيات الثقافية والأضرار المحلية، مما يجعل "IndicSafe" خطوة محورية نحو التقييم الواعي ثقافيًا لسلامة النماذج المستقبلية.
IndicSafe: معيار جديد لضمان سلامة نماذج اللغات متعددة اللغات في جنوب آسيا
تقديم معيار "IndicSafe" كأول دراسة منهجية لتقييم سلامة نماذج اللغات الكبيرة في 12 لغة هندية يتحدث بها مليار ونصف شخص. تكشف الدراسة عن وجود فجوات ملحوظة في سلامة النماذج عبر اللغات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
