في عالمٍ يتزايد فيه الاعتماد على [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) ([LLMs](/tag/llms)) في بيئات متعددة اللغات، تأتي الحاجة لفهم [سلوك](/tag/سلوك) هذه [النماذج](/tag/النماذج) في [اللغات](/tag/اللغات) ذات الموارد المنخفضة والمتنوعة ثقافيًا. وقد أطلق [باحثون](/tag/باحثون) [دراسة](/tag/دراسة) رائدة تحت مسمى "IndicSafe"، التي تمثل أول [تقييم](/tag/تقييم) منهجي لسلامة 10 من أبرز [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) [عبر](/tag/عبر) 12 [لغة](/tag/لغة) هندية تُستخدم من قِبل أكثر من 1.2 مليار شخص، لكن تُعاني من نقص في [البيانات](/tag/البيانات) التدريبية.

اعتمدت [الدراسة](/tag/الدراسة) على [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) تضم 6000 سيناريو ثقافي، تتناول مواضيع [حساسة](/tag/حساسة) تشمل الطبقات الاجتماعية والدين والجنس والصحة والسياسة، لتقييم مدى استجابة [النماذج](/tag/النماذج) لهذه القضايا. وقد أظهرت النتائج أن هناك تباينًا كبيرًا في [سلامة النماذج](/tag/[سلامة](/tag/سلامة)-[النماذج](/tag/النماذج)): حيث بلغت نسبة الاتفاق [عبر](/tag/عبر) [اللغات](/tag/اللغات) 12.8% فقط، وبلغ تباين معدل "SAFE" أكثر من 17% بين [اللغات](/tag/اللغات) المختلفة.

تتجلى بعض المشكلات في هذه النماذج، مثل [رفض](/tag/رفض) بعضها للمحتويات غير الضارة في النصوص المكتوبة بخطوط عابرة، أو الإشارة إلى مواضيع ذات [حساسية](/tag/حساسية) سياسية بشكل مفرط، بينما تفشل [نماذج](/tag/نماذج) أخرى في توضيح المحتويات غير الآمنة. استخدم الباحثون [أساليب](/tag/أساليب) مبتكرة مثل [قياس](/tag/قياس) [فوضى](/tag/فوضى) مستوى السيناريو، ونقاط [انحياز](/tag/انحياز) الفئات، ومؤشرات توافقية متعددة [اللغات](/tag/اللغات) لتقييم هذه الفجوات.

تسلط هذه النتائج الضوء على الفجوات الحرجة في [سلامة النماذج](/tag/[سلامة](/tag/سلامة)-[النماذج](/tag/النماذج)) متعددة اللغات، وتبرز أهمية اعتماد [استراتيجيات](/tag/استراتيجيات) موائمة للسلامة تأخذ بعين الاعتبار الخصوصيات الثقافية والأضرار المحلية، مما يجعل "IndicSafe" خطوة محورية [نحو](/tag/نحو) [التقييم](/tag/التقييم) الواعي ثقافيًا لسلامة [النماذج](/tag/النماذج) المستقبلية.