في عالم الذكاء الاصطناعي القانوني، يمثل توليد مشاهد المحاكم (Court View Generation) تحديًا كبيرًا يتطلب دقة عالية وفهمًا عميقًا للأدلة القانونية. في دراسة جديدة، تم استكشاف الدور الحيوي الذي تلعبه نماذج اللغة الخفيفة (Lightweight Large Language Models) التي يقل حجمها عن 2 مليار معلمة في هذه المهمة الحيوية.

تتضمن هذه الدراسة تحليلًا منهجيًا لقدرات هذه النماذج وتأثيرها على توقع التهم القانونية. تم طرح أربعة أسئلة رئيسية:
1. كيف يؤثر هيكل نموذج اللغة على جودة توليد المشاهد وتوقع التهم؟
2. ما هو دور حجم النموذج في الأداء؟
3. كيف تقارن نماذج اللغة الخفيفة بنماذج الشبكات العصبية العميقة (Deep Neural Networks) في هذه المهام؟
4. كيف تختلف توقعات التهم عبر توليد مشاهد المحاكم مقارنة بتوقعات مباشرة؟

كما تم تطوير إطار تقييم جديد تحت اسم CVGEvalKit، والذي يشمل ثلاث مجموعات بيانات متاحة للجمهور لمهام توليد مشاهد المحاكم بالإضافة إلى توقع التهم.

أظهرت التجارب الشاملة في هذا الإطار نتائج مذهلة، حيث تم تدريب النماذج على مجموعة تدريب مختلطة وتم تقييمها على مجموعات اختبار من كل Dataset. تكشف هذه النتائج الجديدة عن تفاوتات مثيرة بين هيكل النموذج وحجمه، مما يبرز الإمكانيات الكبيرة لنماذج اللغة الخفيفة في تطبيقات الذكاء الاصطناعي القانونية. لمزيد من التفاصيل، يتوفر الشيفرة المصدرية بشكل مجهول عبر الرابط.