في خطوة رائدة نحو تعزيز الذكاء الاصطناعي في مجال القانون، تم إطلاق ViLegalNLI، أول مجموعة بيانات (Dataset) من نوعها لفهم اللغة الطبيعية (Natural Language Inference) مخصصة للنصوص القانونية الفيتنامية. تحتوي هذه المجموعة على 42,012 زوجًا من العبارات القانونية، تم جمعها من مستندات قانونية رسمية وتقييمها باستخدام علامات استنتاج ثنائية (Entailment و Non-entailment).
تتناول هذه المجموعة العديد من المجالات القانونية، مما يعكس سيناريوهات التفكير القانوني الواقعي المميزة بالمنطق الهيكلي، والجمل الشرطية، والمصطلحات الخاصة بالمجال. لضمان موثوقية البيانات، تم اعتماد إطار عمل شبه تلقائي لتوليد البيانات، حيث يتم دمج نماذج اللغات الضخمة (Large Language Models) لتوليد الفرضيات بشكل منظم مع إجراءات تحقق الجودة.
كما تتضمن الاستراتيجيات المعتمدة لتقليل الأخطاء والتحقق العابر للنماذج لتحسين موثوقية التقدير وضمان الاتساق القانوني. ومن خلال التجارب التي أُجريت على مجموعة بيانات ViLegalNLI، تم استخدام نماذج متعددة اللغات، ونماذج لغوية مخصصة للفيناميين، ونماذج لغوية كبيرة تم ضبطها وفقًا للتعليمات.
أظهرت النتائج أن تكوينات (Few-shot LLM) تحقق أداءً متميزًا باستمرار، في حين يتأثر الأداء بشكل ملحوظ بطول الفرضيات، وتداخل الألفاظ، وتعقيد التفكير. كما كشفت التقييمات بين المجالات المختلفة عن تحديات تعميم الاستنتاج القانوني عبر مجالات قانونية متميزة.
بهذا الشكل، يضع ViLegalNLI مرجعًا أساسيًا لفهم اللغة الطبيعية في النصوص القانونية الفيتنامية، ويساهم في دعم الأبحاث المستقبلية في مجال التفكير القانوني وفهم النصوص القانونية وتطوير أنظمة ذكاء اصطناعي موثوقة.
ViLegalNLI: المرجع الأول لفهم اللغة الطبيعية في النصوص القانونية الفيتنامية!
اكتشف كيف يسهم ViLegalNLI في تطوير أداء الأنظمة القانونية الذكية عبر مجموعة بيانات مخصصة للنصوص القانونية الفيتنامية. بفضل 42,012 زوجًا من القضايا القانونية، يعزز هذا الابتكار من فهم الذكاء الاصطناعي للمسائل القانونية!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
