تُعتبر [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) (Large Language [Models](/tag/models)) حجر الزاوية في عالم الذكاء الاصطناعي، حيث تمكنت من [تحقيق](/tag/تحقيق) نتائج مبهرة في مهام [الاستدلال](/tag/الاستدلال) المعقدة. ومع ذلك، تبقى مشكلة تمييز [الأخطاء](/tag/الأخطاء) في سلسلة [الاستدلال المتعدد الخطوات](/tag/[الاستدلال](/tag/الاستدلال)-المتعدد-الخطوات) تحدياً مستمراً. في [دراسة](/tag/دراسة) حديثة، تم [اقتراح](/tag/اقتراح) إطار [عمل](/tag/عمل) [جديد](/tag/جديد) يُعرف باسم "نظام [قياس](/tag/قياس) [الثقة](/tag/الثقة) بالخطوات" (Stepwise Confidence [Attribution](/tag/attribution) - SCA) لتحقيق ذلك.

يعتمد هذا النظام على مبدأ اختناق [المعلومات](/tag/المعلومات) (Information Bottleneck) لقياس [ثقة](/tag/ثقة) كل خطوة من خطوات [الاستدلال](/tag/الاستدلال) بناءً على الأثر الناتج عن الحلول المتولدة. تشمل نتائج الإطار إسناد [ثقة](/tag/ثقة) عالية للخطوات التي تتوافق مع الهياكل المتفقة [عبر](/tag/عبر) الحلول الصحيحة، بينما يتم تمييز [الانحرافات](/tag/الانحرافات) كأخطاء محتملة.

تتضمن الطرق المستخدمة في هذا النظام:
1. **NIBS**: نهج غير باراميتري يقيس [التناسق](/tag/التناسق) دون الحاجة لبنى [رسوم بيانية](/tag/رسوم-بيانية).
2. **GIBS**: [نموذج](/tag/نموذج) مبني على [الرسوم البيانية](/tag/الرسوم-البيانية) يتعلم [المجموعات](/tag/المجموعات) الفرعية من خلال قناع قابل للاشتقاق لالتقاط [التنوع](/tag/التنوع) المنطقي.

من خلال إجراء [تجارب](/tag/تجارب) مكثفة على مهام [الاستدلال الرياضي](/tag/[الاستدلال](/tag/الاستدلال)-الرياضي) والإجابة على أسئلة متعددة المستويات، أثبت نظام SCA فعاليته في تحديد الخطوات ذات [الثقة](/tag/الثقة) المنخفضة، والتي ترتبط بشكل قوي بأخطاء [الاستدلال](/tag/الاستدلال). علاوة على ذلك، استخدمت [الثقة](/tag/الثقة) على مستوى الخطوات لتوجيه عملية التصحيح الذاتي، مما زاد من معدل [نجاح](/tag/نجاح) التصحيح بنسبة تصل إلى 13.5% مقارنة بالتغذية الراجعة على مستوى الإجابة.

باختصار، يقدم هذا [البحث](/tag/البحث) إضافة جديدة ومهمة في مجال [تحسين](/tag/تحسين) [دقة](/tag/دقة) [نماذج](/tag/نماذج) [الاستدلال](/tag/الاستدلال) [عبر](/tag/عبر) الذكاء الاصطناعي، مما يفتح الأبواب لتطبيقات مستقبلية أكثر ذكاءً ودقةً.

ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات)!