في ظل التقدم السريع الذي يشهده الذكاء الاصطناعي، وخاصةً [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models))، بدأ التحول في طريقة [البحث](/tag/البحث) عن [المعلومات](/tag/المعلومات) [نحو](/tag/نحو) [نموذج](/tag/نموذج) الأسئلة والأجوبة. حيث يطرح المستخدمون أسئلتهم وتقوم هذه [النماذج](/tag/النماذج) بتوليد الإجابات بطريقة تلقائية. في المجالات الحساسة مثل القانون، تُستخدم [تقنيات](/tag/تقنيات) [التوليد](/tag/التوليد) المعزز بالاسترجاع ([Retrieval-Augmented Generation](/tag/retrieval-augmented-generation) - [RAG](/tag/rag)) للحد من [الأخطاء](/tag/الأخطاء) والمعلومات الغير صحيحة (Hallucinations) في الردود المولدة.
ومع ذلك، أظهرت [الأبحاث](/tag/الأبحاث) السابقة أن [أنظمة](/tag/أنظمة) RAG، سواء كانت عامة أو متخصصة في المجال القانوني، لا تزال تخطئ بمعدلات متفاوتة، مما يستدعي الحاجة إلى [تقييم دقيق](/tag/[تقييم](/tag/تقييم)-دقيق). لكن الإطارات الحالية لتقييم [أنظمة RAG](/tag/[أنظمة](/tag/أنظمة)-rag) [القانونية](/tag/القانونية) تفتقر إلى [الدقة](/tag/الدقة) اللازمة لتقديم [تحليلات](/tag/تحليلات) مفصلة لآداء الاسترجاع والتوليد بشكل منفصل. علاوة على ذلك، فإن معظم [المعايير](/tag/المعايير) الحالية تركز بشكل كبير على [اللغة الإنجليزية](/tag/[اللغة](/tag/اللغة)-الإنجليزية) وتتعلق باستفسارات الخبراء القانونيين، مما يهمل احتياجات غير الخبراء.
لذا، نقدم لكم ClaimRAG-LAW، [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) شاملة تدعم اللغتين الفرنسية والإنجليزية، وتستهدف كلاً من الخبراء وغير الخبراء، كما تتضمن أنواعاً متنوعة من الأسئلة التي تعكس السيناريوهات [الواقعية](/tag/الواقعية). نطبق كذلك إطار [تقييم دقيق](/tag/[تقييم](/tag/تقييم)-دقيق) لأنظمة [RAG](/tag/rag) [القانونية](/tag/القانونية) الرائدة، مما يكشف عن [قيود](/tag/قيود) في [الأداء](/tag/الأداء) سواء في [استرجاع](/tag/استرجاع) [المعلومات](/tag/المعلومات) أو في [التحليل](/tag/التحليل) على مستوى المطالبات داخل المجال القانوني. هذه المبادرة ليست مجرد [تطور](/tag/تطور) تقني، بل هي خطوة مهمة [نحو](/tag/نحو) تقديم [خدمات](/tag/خدمات) [قانونية](/tag/قانونية) أكثر [دقة](/tag/دقة) وموضوعية تلبي احتياجات جميع المستخدمين.
تقييم دقيق لمستوى المطالبات في الذكاء الاصطناعي: نقلة نوعية في القانون
يقدم بحث جديد مجموعة بيانات شاملة لتحسين أداء أنظمة الذكاء الاصطناعي في المجال القانوني. هذه المبادرة تقود إلى تقييم أدق يساعد في سد فجوات المعلومات في هذا القطاع الحساس.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
