في وقت نعيش فيه ثورة تقنية، تساءل علماء الذكاء الاصطناعي إذا كانت نماذج اللغة الكبيرة (Large Language Models) مثل DeepSeek-R1 تمتلك القدرة على التفكير، أم أنها مجرد انعكاسات ظاهرة لسلوكيات عقلانية. في دراسة جديدة، أجرى الباحثون مقارنة شاملة بين الطريقة التي يفكر بها البشر والآلات، مع التركيز على 30 مسألة من مسابقة AIME 2025. وقد تم تحليل 10,247 خطوة reasoning، ووجدوا خمس فئات تحليلية رئيسية: تحليل، استنتاج، تشعب، عودة، وتأمل.
أظهرت النتائج وجود فرق هيكلي واضح. حيث حافظت الحلول البشرية على تبادل مضغوط بين التحليل والاستنتاج، بينما كانت معظم خطوات DeepSeek-R1 تعيد زيارة النتائج الوسيطة، وتقوم بالتحقق السطحي وغير الضروري، وتدور حول فحوصات محلية دون تحقيق تقدم منطقي حقيقي. وصف الباحثون هذه العملية بأنها "محاكاة طوبولوجية"، أي أنها تعيد إنتاج الشكل الظاهري للتفكير دون تحقيق الدور الوظيفي الحقيقي له.
ومع ذلك، حدد الباحثون إشارتين لوجود تفكير حقيقي. أولاً، تظهر المسارات الناجحة استخداما مستقرا للتشعب والعودة، بينما المسارات الفاشلة إما تستخدم هذه الأساليب بشكل قليل أو مفرط. ثانياً، يكون التأمل فعّالاً فقط عند تقديمه ضمن الاستنتاجات الاستدلالية؛ حيث يتركز التأمل المحبوس في حلقات التحليل على التفاصيل العددية المحلية، مما يفوت الأخطاء المنطقية العالمية.
تشير هذه الاكتشافات إلى أن نماذج CoT الطويلة قد تُكافأ أكثر على المظاهر الظاهرة للتفكير بدلاً من التقدم الاستنباطي الحقيقي. في النهاية، تعتمد جودة التفكير ليس فقط على مقدار التأمل الذي يحدث، ولكن أيضًا على ما إذا كان التأمل يظهر باستمرار في السياق المنطقي المناسب.
هل تعقل الذكاء الاصطناعي؟ اكتشاف مثير حول التفكير الرياضي في DeepSeek-R1
تشير دراسة حديثة إلى أن نماذج الذكاء الاصطناعي، مثل DeepSeek-R1، قد تبدو وكأنها تفكر، لكنها تفتقر إلى القدرة الحقيقية على الاستدلال. يسلط هذا البحث الضوء على الفروق الجذرية بين طريقة تفكير الإنسان والآلات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
