تُعتبر [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) (Large Language [Models](/tag/models)) حجر الزاوية في عالم الذكاء الاصطناعي، حيث تمكنت من [تحقيق](/tag/تحقيق) نتائج مبهرة في مهام [الاستدلال](/tag/الاستدلال) المعقدة. ومع ذلك، تبقى مشكلة تمييز [الأخطاء](/tag/الأخطاء) في سلسلة [الاستدلال المتعدد الخطوات](/tag/[الاستدلال](/tag/الاستدلال)-المتعدد-الخطوات) تحدياً مستمراً. في [دراسة](/tag/دراسة) حديثة، تم [اقتراح](/tag/اقتراح) إطار [عمل](/tag/عمل) [جديد](/tag/جديد) يُعرف باسم "نظام [قياس](/tag/قياس) [الثقة](/tag/الثقة) بالخطوات" (Stepwise Confidence [Attribution](/tag/attribution) - SCA) لتحقيق ذلك.
يعتمد هذا النظام على مبدأ اختناق [المعلومات](/tag/المعلومات) (Information Bottleneck) لقياس [ثقة](/tag/ثقة) كل خطوة من خطوات [الاستدلال](/tag/الاستدلال) بناءً على الأثر الناتج عن الحلول المتولدة. تشمل نتائج الإطار إسناد [ثقة](/tag/ثقة) عالية للخطوات التي تتوافق مع الهياكل المتفقة [عبر](/tag/عبر) الحلول الصحيحة، بينما يتم تمييز [الانحرافات](/tag/الانحرافات) كأخطاء محتملة.
تتضمن الطرق المستخدمة في هذا النظام:
1. **NIBS**: نهج غير باراميتري يقيس [التناسق](/tag/التناسق) دون الحاجة لبنى [رسوم بيانية](/tag/رسوم-بيانية).
2. **GIBS**: [نموذج](/tag/نموذج) مبني على [الرسوم البيانية](/tag/الرسوم-البيانية) يتعلم [المجموعات](/tag/المجموعات) الفرعية من خلال قناع قابل للاشتقاق لالتقاط [التنوع](/tag/التنوع) المنطقي.
من خلال إجراء [تجارب](/tag/تجارب) مكثفة على مهام [الاستدلال الرياضي](/tag/[الاستدلال](/tag/الاستدلال)-الرياضي) والإجابة على أسئلة متعددة المستويات، أثبت نظام SCA فعاليته في تحديد الخطوات ذات [الثقة](/tag/الثقة) المنخفضة، والتي ترتبط بشكل قوي بأخطاء [الاستدلال](/tag/الاستدلال). علاوة على ذلك، استخدمت [الثقة](/tag/الثقة) على مستوى الخطوات لتوجيه عملية التصحيح الذاتي، مما زاد من معدل [نجاح](/tag/نجاح) التصحيح بنسبة تصل إلى 13.5% مقارنة بالتغذية الراجعة على مستوى الإجابة.
باختصار، يقدم هذا [البحث](/tag/البحث) إضافة جديدة ومهمة في مجال [تحسين](/tag/تحسين) [دقة](/tag/دقة) [نماذج](/tag/نماذج) [الاستدلال](/tag/الاستدلال) [عبر](/tag/عبر) الذكاء الاصطناعي، مما يفتح الأبواب لتطبيقات مستقبلية أكثر ذكاءً ودقةً.
ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات)!
كشف أسرار الفشل في الاستدلال المتعدد الخطوات باستخدام نظام موثوق لقياس الثقة في نماذج اللغة السوداء
في عالم النماذج اللغوية الضخمة، يمثل الفشل في الاستدلال المتعدد الخطوات تحدياً كبيراً. نقدم لك نظاماً مبتكراً لقياس الثقة بالخطوات يكشف كيفية تحسين الأداء بدقة عالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
