في عالمٍ يتزايد فيه الاعتماد على نماذج الذكاء الاصطناعي مثل نماذج اللغات الضخمة (Large Language Models)، تُظهر دراسة جديدة ضرورة ملحة في التكييف الثقافي لتقييم الأمن اللغوي. فقد أظهرت الأبحاث أن معظم التقييمات تعتمد على الترجمة المباشرة من اللغة الإنجليزية إلى اللغات المستهدفة، مما يحصر تلك النماذج في شكل لغوي سطحي دون احتساب السياقات الثقافية المعقدة.

تمت دراسة أربع لغات وهي الكورية (KO) واليابانية (JA) والتايلندية (TH) والكمبودية (KM)، حيث تم تطوير مجموعات بيانات مُعدّلة ثقافياً مقارنةً بمجموعات البيانات المُترجمة مباشرة. النتائج أظهرت أن تعاون الثقافات في إعداد التقييمات يؤدي إلى تحقيق نتائج أفضل بشكل كبير، بزيادة في معدل نجاح الهجمات (Attack Success Rate) بمعدل 9.3 نقطة.

الأرقام تدل على أن الاعتماد على الترجمة المباشرة يمكن أن يؤدي إلى تقليل التفكير في المخاطر بنسبة 44% عبر 48 نموذجاً ولغوياً، مما يبرز ان التشكيلات التهديدية تتوزع بطريقة غير متكافئة عبر اللغات. بالإضافة إلى ذلك، عُمق ثقافة الترجمة المباشرة ظل تحت المعدل المطلوب من 1.0 في الأربع لغات، بينما وصلت التقييمات المُعَدّلة ثقافياً إلى 2.51.

تظهر هذه النتائج بوضوح أن مجرد ترجمة المحتوى لن يكون كافياً لفهم التهديدات في بيئات متعددة الثقافات. يتطلب الأمر استراتيجيات تُكيّف التقييمات وفقاً للسياقات الثقافية الخاصة بكل لغة، مما يعزز الدقة في تقييم سلامة نماذج اللغات الكبيرة.