في عالم سريع التطور للذكاء الاصطناعي، ظهرت نماذج اللغات الكبيرة (LLMs) كأداة فعالة قادرة على حل مجموعة واسعة من الاختبارات المهنية بمستوى يتجاوز أحياناً مستوى البشر. ورغم ذلك، حين يتعلق الأمر بالمجالات المتخصصة مثل القانون، تظل هذه النماذج عرضة للأخطاء بسبب الفجوات في المعرفة العالمية والتمييز الدقيق بين الأدلة.

في هذا السياق، تم تسليط الضوء على مشكلة تدهور دقة مخرجات نماذج اللغات الكبيرة بسبب الاعتماد على طرق تجميع بسيطة مثل التصويت بالأغلبية، حيث تتحكم الإجابة الأكثر شيوعاً دون اعتبار لجودتها. للحل، تم تقديم نهج جديد يجعل من اختيار مقاطع التفكير (CoT) بمثابة مشكلة تحسين تركيبي صريحة، مما يتيح للفرضيات المدعومة بشكل جيد أن تتفوق على الأغلبية الضوضائية.

تقدم هذه الدراسة الجديدة تقنية EP-HUBO (إدارة الأدلة عبر التكامل الثنائي عالي الترتيب)، وهي طريقة مبتكرة تعمل على إنشاء مسارات تفكير متعددة بواسطة نموذج محلي صغير، ثم تقوم بفرز المقاطع إلى تجمعات دليل لكل فرضية. يستند النظام إلى خوارزمية تحسين غير مقيدة تعتمد على جودة الأدلة (الصلة، التخصص، والتميز) ويتم التحكم في القرار النهائي بواسطة نموذج متقدم واحد.

قد تم اختبار EP-HUBO على معيارين قانونيين يعتمدون على الأدلة، باستخدام تقنيات مثل التلدين المحاكي على الأجهزة الكلاسيكية وأجهزة الكوانتم المتطورة مثل Dirac-3. تتيح أساليب التحسين من نوع HUBO طريقة منطقية لتجميع مقاطع التفكير مع الحفاظ على الفرضيات الأقل شيوعاً، مما يجعلها قيمة للغاية في المجالات التي لم تقم النماذج المتقدمة بعرض المواد المرجعية مسبقًا.