تستمر نماذج اللغات الضخمة (LLMs) في اجتذاب انتباه الباحثين والمستخدمين على حد سواء، لكن رغم تقدمها الملحوظ، لا تزال تعاني من نقاط ضعف تجعلها عرضة لمشاكل جدية. في دراسة حديثة، تم استكشاف كيف يمكن للغات أفريقية ذات موارد منخفضة مثل الأفريكانية (Afrikaans) والسواحلية (Kiswahili) والـ isiXhosa وisiZulu، أن تؤثر على قدرة هذه النماذج على الحفاظ على سلامتها.

ركز الباحثون على محاولة تجاوز الحواجز الأمنية لنماذج مثل ChatGPT وClaude وDeepSeek وGemini وGrok عبر استخدام محادثات متعددة الأطراف. تم ترجمة تحفيزات من مجموعات بيانات موجودة، وتم تقييم استجابة هذه الأنظمة باستخدام اختبارات آلية ومجموعات مختبرة بشرية من متحدثي هذه اللغات.

أظهرت النتائج أن الهجمات ذات الدور الواحد لم تكن فعالة، بينما أظهرت المحادثات متعددة الأطراف معدلات استجابة ضارة بالإنجليزية تراوحت من 52.7% (Claude 3.5 Haiku) إلى 83.6% (GPT-4o-mini)، في حين كانت النسبة في الأفريكانية من 60.0% (Claude 3.5 Haiku) إلى 78.2% (GPT-4o-mini)، وفي السواحيلية من 41.8% (Claude 3.5 Haiku) إلى 70.9% (DeepSeek).

حيث زادت معدلات الاختراق بمشاركة المتحدثين الأصليين، مقارنة بالأساليب الآلية، مما يبرز أهمية الجودة الفائقة للترجمة لتحقيق النجاح في هذه المهمات. في النهاية، أظهرت الدراسة أن جودة الترجمة تلعب دورًا حاسمًا في النجاح في اختراق نماذج اللغات الضخمة، مما يعطي دلالة واضحة على أن الثغرات الأمنية لا تزال موجودة في سياقات متعددة اللغات.

ما رأيكم في هذه التطورات المحيرة؟ شاركونا في التعليقات.