في خطوة رائدة تعكس التطورات المستمرة في مجال الذكاء الاصطناعي، تم إطلاق TukaBench، معيار جديد يهدف إلى تقييم أمان نماذج اللغات الضخمة (LLMs) في سبع لغات أفريقية. يُعتبر هذا المشروع استجابة لتحديات تقييم الأمان التي تركز غالباً على اللغة الإنجليزية، مما يترك العديد من اللغات ذات الموارد القليلة (Low-Resource Languages - LRLs) في حالة تهميش.

يتضمن معيار TukaBench أربعة إعدادات رئيسية، وهي:
1. ترجمة بشرية لأوامر معيار JailbreakBench (JBB).
2. تكيف باللغة الإنجليزية لتناسب السياقات الأفريقية، ثم الترجمة البشرية.
3. أوامر تم تنسيقها بواسطة البشر وتم التحقق من صحتها من خلال تفاعلات مع GPT-5.2.
4. أوامر مختلطة تجمع بين الإنجليزية واللغات الأفريقية.

تتمثل الأهداف الأساسية لتقييم TukaBench في دراسة أثر اللغة والسياق الثقافي على أمان النموذج، حيث أظهرت النتائج أن استخدام اللغات الأفريقية في الأوامر يقلل من الرفض مقارنةً بالإنجليزية، مما يعكس أهمية السياق الثقافي في تحسين استجابة النماذج.

على الرغم من التقدم، إلا أن الدراسة كشفت أيضاً عن وجود قيود هيكلية، منها فشل النموذج في فهم بعض المكونات، وانخفاض موثوقية نماذج LLMs عند استخدامها في لغات ذات موارد قليلة. وفي هذا السياق، تم تقديم مُصطلح جديد يُعرف باسم 'Deflection' ليكون إضافة جديدة لتصنيفات الدراسة.

إن إدخال TukaBench يمثل خطوة هامة نحو تحقيق فهم أعمق لكيفية تفاعل نماذج الذكاء الاصطناعي مع التنوع الثقافي واللغوي، مما يمهد الطريق لتطوير حلول أكثر شمولية وفعالية في المستقبل.

ما رأيكم في أهمية هذا التوجه نحو اللغات الأفريقية؟ شاركونا في التعليقات.