في عالم الذكاء الاصطناعي، تساهم التطورات الأخيرة في تحسين التفكير الرياضي بشكل ملحوظ. استُخدمت نماذج اللغات الضخمة (Large Language Models) لاختبار وقياس التفكير الرياضي، ولكن غالباً ما تعجز طرق مثل البحث القائم على شجرة قرار مونت كارلو (MCTS) عن تحديد المفاهيم التي تؤثر حقًا على الإجابات الصحيحة، حيث قد تكون الارتباطات observed خاطئة وتقودها عوامل مثل صعوبة السؤال.

هنا يأتي دور الإطار الجديد الذي أطلق عليه اسم CIKA (التدخل السببي لتنشيط المعرفة)، والذي يستخدم النموذج اللغوي ذاته كأداة محاكاة تتدخل في المفاهيم. من خلال تغيير حالة المفهوم إلى "مسيطر عليه"، يمكننا تقدير تأثير ذلك التدخل على صحة الإجابة. وتعرف هذه الكمية باسم استقصاء القدرات التدخلية (Interventional Capability Probe - ICP)، الذي يحدد ما إذا كان بإمكان النموذج استخدام مفهوم معين وليس مجرد امتلاكه.

بفضل التدخل الذي يضبط حالة المفهوم بشكل مستقل عن صعوبات الأسئلة، يتمكن ICP من فصل التداخل الذي لا يمكن للطرق التقليدية ملاحظته. أظهرت الدراسات على 67 مسألة تم فحصها أن ICP للمفهوم الأعلى تصنيفًا كان أكبر بكثير من ذلك الخاص بالمجموعة السلبية، مما يؤكد قدرة الاستقصاء على التمييز بين المفاهيم ذات الأهمية السببية وتلك غير ذات الصلة.

علاوة على ذلك، أظهرت تحليلًا لـ 601 مسألة في Omni-MATH أن الأسئلة المحلولة لديها قدرة أعلى بـ 6.1 مرات مقارنة بتلك غير المحلولة، مما يعني أن ICP يمكنه التنبؤ بنجاح حل المشكلات. ومع استخدام نموذج LLM يحتوي على 7 مليارات معامل مع تثبيت الأوزان، حقق CIKA دقة 69.7% على معيار Omni-MATH-Rule خالي من التلوث، ما يثير استفهام حول فهم الذكاء الاصطناعي لمفاهيم بهذه الدقة.

هل أصبح من الممكن اليوم تعزيز مهارات الذكاء الاصطناعي في التفكير الرياضي بطريقة تتغير فيها نتائج الحلول بإعادة تنشيط المعرفة المُضاربة؟ فكيف تعتقد أن هذه التقنيات ستؤثر على مستقبل التعليم والذكاء الاصطناعي؟ شاركونا آرائكم!