في عالم الذكاء الاصطناعي (Artificial Intelligence)، يظهر نموذج قضاة الذكاء الاصطناعي (LLM-as-a-Judge) كأداة مبتكرة للإجابة عن الأسئلة القانونية التي قد تتسم بالتعقيد. ولكن ماذا يحدث عند تصميم الطلبات (Prompts) واختيار القضاة في هذه التقييمات؟ تبحث دراسة جديدة في تأثير تحسين الطلبات على فعالية نماذج الذكاء الاصطناعي في مجال قضايا القانون.
تقوم هذه الدراسة على اختبار فعالية تحسين الطلبات من خلال مقارنة التصميمات الآلية مع التصاميم التقليدية التي يقودها البشر. وقد استُخدمت طريقة ProTeGi في تحسين الطلبات وتم تقييمها من قبل قاضيين مختلفين: Qwen3-32B وDeepSeek-V3 عبر أربعة نماذج للمهام المختلفة.
أظهرت النتائج أن التحسين الآلي يتفوق بشكل ملحوظ على الأساليب التقليدية، وأن تغذية القضاة بآراءٍ لينة كانت لها نتائج أفضل وأكثر اتساقًا مقارنة بتغذيات القضاة الصارمة. وهذا يعني أن الطلبات المحسّنة وفقًا لتعليقات القضاة اللينين كانت أكثر ملاءمة للنماذج الصارمة.
تكشف التحليلات أن القضاة اللينين يميلون إلى تقديم ملاحظات مرنة، مما يؤدي إلى تطوير طلبات بغرض إشراك أوسع نطاقًا. بينما القضاة الصارمون ينتجون ملاحظات قاسية، مما يؤدي إلى التخصيص الزائد للنموذج، وبالتالي قد يقلل من قابليته للتطبيق في سياقات مختلفة.
باختصار، تشير هذه الدراسة إلى أهمية تحسين الطلبات بناءً على البيانات التدريبية، حيث يمكن أن يتفوق هذا الأسلوب على التقنيات التقليدية القائمة على المراجعات البشرية. إذا كنت مهتمًا باستكشاف هذا البحث، يمكنك الحصول على الكود والطلبات المحسّنة من خلال الرابط: https://github.com/TUMLegalTech/icail2026-llm-judge-gaming.
كيف يمكن لنموذج الذكاء الاصطناعي أن يصبح قاضياً؟ اكتشف دور تحسين الطلبات في إجابات الأسئلة القانونية!
تتناول هذه الدراسة كيفية تحسين الطلبات واختيار القضاة في تقييمات نماذج الذكاء الاصطناعي في مجالات القانون. النتائج تشير إلى أن تحسين الطلبات الآلي يتفوق على التصميم البشري في فعاليته.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
