في عصر تتسارع فيه تطورات النماذج اللغوية الكبيرة (Large Language Models)، أصبح من الممكن تعزيز تطبيقات الذكاء الاصطناعي في مجالات جديدة، بما في ذلك القوانين. ومع ذلك، يواجه الباحثون تحديات كبيرة بسبب التعقيد والتنظيم الهرمي والتغييرات المستمرة في التشريعات الفيتنامية.

لذا، تم تقديم معيار VLegal-Bench، وهو أول معيار شامل يهدف إلى تقييم النماذج اللغوية الكبيرة في المهام القانونية الفيتنامية بشكل منهجي. يعتمد هذا المعيار على تصنيف بلوم المعرفي ويشمل مستويات متعددة من الفهم القانوني من خلال مجموعة من المهام المصممة لتعكس السيناريوهات العملية.

يتضمن VLegal-Bench 10,450 عينة تم توليدها عبر عملية دقيقة من التقييم من قبل خبراء قانونيين. يقوم هؤلاء الخبراء بتسمية البيانات والتحقق منها باستخدام نظامنا للتأكد من أن كل عينة مستندة إلى مستندات قانونية موثوقة وتعكس تدفقات العمل الحقيقية لمساعدي القانون، بما في ذلك الأسئلة والأجوبة القانونية العامة، وتوليد المعلومات المعزز بالاسترجاع، والتفكير متعدد الخطوات، وحل المشكلات القائم على سيناريوهات تتعلق بالقانون الفيتنامي.

هدف VLegal-Bench هو توفير إطار تقييم معيارى، شفاف، ومدعوم بالمعرفة، مما يتيح لنا تقييم أداء النماذج اللغوية الكبيرة في السياقات القانونية الفيتنامية. كما يدعم تطوير أنظمة قانونية موثوقة، وقابلة للفهم، ومتوافقة بشكل أخلاقي مع متطلبات الذكاء الاصطناعي.

لضمان سهولة الوصول وإمكانية إعادة الإنتاج، تم إنشاء صفحة هبوط عامة لهذا المعيار على الإنترنت هنا.