في عالم الذكاء الاصطناعي، يواجه مختصو النماذج اللغوية تحديات كبيرة عند التعامل مع المعلومات المتناقضة. يُعتبر النموذج الذكي كائنًا يتطلب اتخاذ قرارات مهمة: هل يتبع حقيقة معينة أو يعتمد على معرفته السابقة؟
سابقًا، أثبتت الأبحاث أن هذا القرار يعتمد على شهرة المعلومات المعنية. وفي هذا السياق، أُجريت دراسة جديدة تبحث في ما إذا كانت سلسلة التفكير (Chain-of-Thought) للنماذج تعكس هذه الآلية بشكل موثوق.
تم إجراء اختبار شامل يتضمن 200 سؤالًا و8 نماذج و4 ظروف مختلفة، ولقد أثبتت النتائج أن التفكير ضمن السلسلة لديه استقرار ملحوظ حتى في ظل اتخاذ قرارات متناقضة، حيث احتفظت أزواج الإجابات المتناقضة بنسبة 96% من التشابه في الإجابات. ومع ذلك، لوحظ أن الثقة الذاتية قوية ولكنها تتسم بضعف الإشارة الحقيقية، بمعنى أنه في حالات المعلومات الغامضة، تبقى الثقة مؤشرًا على القرارات.
يمثل نموذج GPT-4o الاستثناء الوحيد الذي يحمل علاقة موثوقة بين اتخاذ القرار والتفكير. بينما تكشف دراسة Claude Sonnet 4.6 عن نطاق ثقة واسع مع علاقة متناقضة بين الثقة والقرارات.
تشير النتائج إلى أن سلسلة التفكير تتكون من عرض معرفي ثابت وجزء ضئيل من الثقة ذات الإشارة الضعيفة. لذا، فإن قراءة مستوى الثقة قد تعطي إشارات أفضل عن الآلية وراء اتخاذ القرار بدلاً من التركيز على الحجة نفسها.
لذا، في عصر تتنامى فيه التحديات المرتبطة بفهم الذكاء الاصطناعي، يبقى السؤال: ما مدى موثوقية هذه السلاسل في توفير تفسيرات يمكن الاعتماد عليها؟ هل يمكن تحسين نماذج جديدة لجعلها أكثر قدرة على معالجة المعلومات المتناقضة؟ شاركونا آراءكم وتجاربكم في التعليقات!
هل تعي النماذج لماذا غيرت رأيها؟ استكشاف تفسيرية وثقة سلسلة التفكير أثناء تناقض المعرفة
تتناول الدراسة الجديدة كيفية تعامل نماذج اللغة مع المعلومات المتناقضة. تكشف النتائج أن سلسلة التفكير (CoT) لديها استقرار كبير في اتخاذ القرارات، لكن الثقة الذاتية للنموذج قد تشير إلى آلية اتخاذ القرارات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
