تُعتبر نماذج اللغة الضخمة (Large Language Models) حجر الزاوية في عالم الذكاء الاصطناعي، حيث تمكنت من تحقيق نتائج مبهرة في مهام الاستدلال المعقدة. ومع ذلك، تبقى مشكلة تمييز الأخطاء في سلسلة الاستدلال المتعدد الخطوات تحدياً مستمراً. في دراسة حديثة، تم اقتراح إطار عمل جديد يُعرف باسم "نظام قياس الثقة بالخطوات" (Stepwise Confidence Attribution - SCA) لتحقيق ذلك.

يعتمد هذا النظام على مبدأ اختناق المعلومات (Information Bottleneck) لقياس ثقة كل خطوة من خطوات الاستدلال بناءً على الأثر الناتج عن الحلول المتولدة. تشمل نتائج الإطار إسناد ثقة عالية للخطوات التي تتوافق مع الهياكل المتفقة عبر الحلول الصحيحة، بينما يتم تمييز الانحرافات كأخطاء محتملة.

تتضمن الطرق المستخدمة في هذا النظام:
1. **NIBS**: نهج غير باراميتري يقيس التناسق دون الحاجة لبنى رسوم بيانية.
2. **GIBS**: نموذج مبني على الرسوم البيانية يتعلم المجموعات الفرعية من خلال قناع قابل للاشتقاق لالتقاط التنوع المنطقي.

من خلال إجراء تجارب مكثفة على مهام الاستدلال الرياضي والإجابة على أسئلة متعددة المستويات، أثبت نظام SCA فعاليته في تحديد الخطوات ذات الثقة المنخفضة، والتي ترتبط بشكل قوي بأخطاء الاستدلال. علاوة على ذلك، استخدمت الثقة على مستوى الخطوات لتوجيه عملية التصحيح الذاتي، مما زاد من معدل نجاح التصحيح بنسبة تصل إلى 13.5% مقارنة بالتغذية الراجعة على مستوى الإجابة.

باختصار، يقدم هذا البحث إضافة جديدة ومهمة في مجال تحسين دقة نماذج الاستدلال عبر الذكاء الاصطناعي، مما يفتح الأبواب لتطبيقات مستقبلية أكثر ذكاءً ودقةً.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات!