في عالم الذكاء الاصطناعي، كانت نماذج اللغات الضخمة (Large Language Models) تواجه تحديات كبيرة في مجالات البحث والذكاء. ومن بين هذه التحديات، القدرة على تقديم إجابات صحيحة تستند إلى أدلة منطقية قوية، وخاصة في بيئات الاستدلال متعدد الخطوات. لذلك، تم تقديم إطار العمل الجديد SAFE، الذي يعد بنقلة نوعية في هذا المجال.

SAFE، وهو اختصار لـ "LLM-as-Verifier Framework"، يهدف إلى تحسين دقة نماذج اللغات الضخمة من خلال تقديم طبقة تحقق من الاستدلال. بدلاً من الاكتفاء بتقييم الإجابة النهائية بعد التوليد، يقوم SAFE بالتحقق من الخطوات الوسيطة أثناء عملية التوليد. يتم ذلك عن طريق فحص هذه الخطوات بناءً على النصوص المقدمة والمسار السابق الذي اتخذته الأنموذج.

أكثر ما يميز SAFE هو تحليل التفكير إلى وحدات مبنية على الأدلة، يتم تمثيلها بواسطة ثلاثيات الشبكة المعرفية (Knowledge Graph triples)، مما يجعل المراجعة أسهل وأكثر دقة. أثناء مرحلة التدريب، يتحقق SAFE من بيانات الإشراف وفقًا للاعتبارات المستندة إلى الشبكة المعرفية، ويقوم بإنشاء بيانات تدريب موثوقة للتحقق.

عند مرحلة الاستنتاج، يعمل مُحقق خارجي على مراجعة كل خطوة تم توليدها، تحديد الأخطاء المنطقية، وتقديم ملاحظات تصحيحية قبل أن تنتشر الأخطاء. النتائج الأولية عبر ثلاثة مجموعات بيانات متعددة الخطوات أظهرت أن SAFE يحسن دقة الإجابات بمعدل 8.8 نقطة مئوية.

تظهر هذه النتائج أهمية تغيير طريقة تقييم نماذج اللغات الضخمة، حيث يساهم الانتقال من الحكم على الإجابات فقط إلى التحقق التدريجي من الاستدلال في تحقيق نتائج أفضل في الإجابات المستندة إلى الأدلة. لذلك، يُعتبر SAFE خطوة مهمة نحو تحسين جودة ودقة أدوات الذكاء الاصطناعي في المستقبل.

ما رأيكم في قدرة SAFE على تغيير مشهد الاستدلال باستخدام الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات!