في دراسة جديدة مثيرة، تم تسليط الضوء على أهمية تحليل التوكنرز (Tokenizer Fertility) واختبار الأداء في النماذج الأساسية (Foundation Models) عند التعامل مع النصوص القانونية في أوكرانيا. هذه المقارنة تثير تساؤلات جديدة حول كيفية تحسين فعالية النماذج المستخدمة في معالجة الأمور القانونية، خصوصًا في ظل تزايد التعقيدات الناتجة عن النزاعات.

تضمنت الدراسة تقييم سبعة نماذج مختلفة من خمسة مزودين، يتم فيها قياس أداء التوكنرز والأداء بدون تدريب (Zero-Shot Performance) على ثلاثة مهام محددة، مستندةً إلى 273 حكمًا قضائيًا موثقًا من السجل الحكومي الأوكراني.

#### أبرز النتائج:
1. **استهلاك التوكنرز**: تبين أن نماذج Qwen 3 تستخدم 60% من التوكنرز أكثر من نماذج Llama، مما يجعل تحليل التوكنرز خطوة أساسية في تحقيق الكفاءة الاقتصادية.
2. **نموذج NVIDIA Nemotron Super 3**: حقق النموذج أعلى درجة تركيبة بلغت 83.1، متفوقًا على نموذج Mistral Large 3، رغم أن عدد معلماته يزيد بمقدار 5.6 مرة، مما يدل على أن حجم النموذج ليس مؤشراً دقيقاً على الأداء في مجاله.
3. **أداء القليل من التدريب**: تبين أن أداء النماذج ينخفض بمعدل يصل إلى 26 نقطة مئوية عند الاعتماد على تقنيات التحفيز القليل (Few-Shot Prompting)، وهو ما يُظهر أنه لا يرتبط بنمط الاختيار بل بمسائل داخلية تتعلق باللغة الأوكرانية.
4. **تغير الزمن وتأثيراته**: كشفت التجارب أن النماذج التي تم تدريبها على قرارات محاكم ما قبل الحرب (2008-2013) تخسر 27.9 نقطة مئوية عند تطبيقها على قرارات زمن الغزو الكامل (2022-2026)، مما يبرز الصعوبة الكبيرة للنماذج القديمة في التعامل مع اللغة القانونية في أوقات الحرب.

ختامًا، توضح هذه الدراسة أنه يجب على المختصين في هذا المجال التركيز على تحليل التوكنرز كخطوة سابقة لاختيار النماذج، بينما يعتبر الأداء بدون تدريب خيارًا أكثر موثوقية للغات الغنية بصريًا. ولتعزيز قابلية التكرار ومواجهة نقص المعلومات الأوكرانية في مؤشرات معالجة اللغة الطبيعية القانونية، تم إصدار مجموعة بيانات عامة تضم 14,452 قرارًا قضائيًا تمتد من 2008 إلى 2026، مع تصنيفها لمجموعة من النتائج عبر ثلاثة أزمنة زمنية.

ما رأيكم في أهمية تحليل التوكنرز في مجالات الذكاء الاصطناعي واللغة؟ شاركونا آرائكم في التعليقات!