في عالمٍ يتزايد فيه الاعتماد على [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) ([LLMs](/tag/llms)) في بيئات متعددة اللغات، تأتي الحاجة لفهم [سلوك](/tag/سلوك) هذه [النماذج](/tag/النماذج) في [اللغات](/tag/اللغات) ذات الموارد المنخفضة والمتنوعة ثقافيًا. وقد أطلق [باحثون](/tag/باحثون) [دراسة](/tag/دراسة) رائدة تحت مسمى "IndicSafe"، التي تمثل أول [تقييم](/tag/تقييم) منهجي لسلامة 10 من أبرز [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) [عبر](/tag/عبر) 12 [لغة](/tag/لغة) هندية تُستخدم من قِبل أكثر من 1.2 مليار شخص، لكن تُعاني من نقص في [البيانات](/tag/البيانات) التدريبية.
اعتمدت [الدراسة](/tag/الدراسة) على [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) تضم 6000 سيناريو ثقافي، تتناول مواضيع [حساسة](/tag/حساسة) تشمل الطبقات الاجتماعية والدين والجنس والصحة والسياسة، لتقييم مدى استجابة [النماذج](/tag/النماذج) لهذه القضايا. وقد أظهرت النتائج أن هناك تباينًا كبيرًا في [سلامة النماذج](/tag/[سلامة](/tag/سلامة)-[النماذج](/tag/النماذج)): حيث بلغت نسبة الاتفاق [عبر](/tag/عبر) [اللغات](/tag/اللغات) 12.8% فقط، وبلغ تباين معدل "SAFE" أكثر من 17% بين [اللغات](/tag/اللغات) المختلفة.
تتجلى بعض المشكلات في هذه النماذج، مثل [رفض](/tag/رفض) بعضها للمحتويات غير الضارة في النصوص المكتوبة بخطوط عابرة، أو الإشارة إلى مواضيع ذات [حساسية](/tag/حساسية) سياسية بشكل مفرط، بينما تفشل [نماذج](/tag/نماذج) أخرى في توضيح المحتويات غير الآمنة. استخدم الباحثون [أساليب](/tag/أساليب) مبتكرة مثل [قياس](/tag/قياس) [فوضى](/tag/فوضى) مستوى السيناريو، ونقاط [انحياز](/tag/انحياز) الفئات، ومؤشرات توافقية متعددة [اللغات](/tag/اللغات) لتقييم هذه الفجوات.
تسلط هذه النتائج الضوء على الفجوات الحرجة في [سلامة النماذج](/tag/[سلامة](/tag/سلامة)-[النماذج](/tag/النماذج)) متعددة اللغات، وتبرز أهمية اعتماد [استراتيجيات](/tag/استراتيجيات) موائمة للسلامة تأخذ بعين الاعتبار الخصوصيات الثقافية والأضرار المحلية، مما يجعل "IndicSafe" خطوة محورية [نحو](/tag/نحو) [التقييم](/tag/التقييم) الواعي ثقافيًا لسلامة [النماذج](/tag/النماذج) المستقبلية.
IndicSafe: معيار جديد لضمان سلامة نماذج اللغات متعددة اللغات في جنوب آسيا
تقديم معيار "IndicSafe" كأول دراسة منهجية لتقييم سلامة نماذج اللغات الكبيرة في 12 لغة هندية يتحدث بها مليار ونصف شخص. تكشف الدراسة عن وجود فجوات ملحوظة في سلامة النماذج عبر اللغات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
