في عالم الذكاء الاصطناعي ونماذج اللغة الضخمة (Large Language Models)، يظل السؤال مطروحًا: هل تُفيد خطوات التفكير الطويلة (Chain-of-Thought) في تحسين دقة الإجابات، أم أن الأمر يتعلق بالمحتوى الحامل لهذه الخطوات؟

أجابت دراسة جديدة نشرت في arXiv عن هذا السؤال من خلال تقديم أدلة متناقضة. فقد أظهرت النتائج أن مجرد زيادة عدد الرموز أو الكلمات المستخدمة لا تعزز الدقة بشكل ملحوظ. وأكدت الدراسة على أن الفرق الرئيسي يكمن في ما يتضمنه المحتوى من معلومات ومعالجة.

تم إجراء التجربة على 25 نموذجًا مختلفًا، حيث تم مقارنة نتائج الإجابة على نفس الأسئلة باستخدام نصوص قصيرة وأخرى أطول من النماذج ذاتها، مع الحفاظ على نفس خطة التفكير. كانت النتيجة مثيرة، حيث لم تختلف الدقة كثيرًا بحسب الطول، بل اعتمدت بشكل أكبر على محتوى الرموز الزائدة.

علاوة على ذلك، ركزت الدراسة على مقارنة أثر خطوات التفكير المطولة التي تتضمن نفس المحتوى الدلالي وبيانات العمليات. ثبت أن الخطوات الطويلة تحمل تأثيرات إيجابية في بعض الحالات، بيد أن التحسن في الدقة كان متواضعًا، حيث تراوحت الزيادة بين 1 إلى 4 نقاط.

تحت الظروف المثالية مع تقليل الأرقام إلى الحد الأدنى، لوحظ تضاعف التأثير (بمعدل 3.24 مرة عبر أربعة معايير حسابية). في نهاية المطاف، تشير الأدلة جمعاء إلى أن ما يهم حقًا هو فعالية المحتوى الذي تحمله تلك الخطوات، وليس طولها فحسب.

تفتح هذه النتائج بابًا جديدًا من النقاش في عالم الذكاء الاصطناعي، حيث يتساءل الباحثون عن كيفية تحسين أداء النماذج مع التركيز أكثر على المحتوى القيم بدلاً من الكم فقط. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.