في عالم الذكاء الاصطناعي، تسعى نماذج اللغات الضخمة (Large Language Models) لتحقيق دقة عالية في معظم المهام، لكن ماذا يحدث عندما نتحدث عن المسائل الرياضية؟ أظهرت دراسة جديدة نتائج مثيرة، حيث تم تقييم أداء ثلاث استراتيجيات مختلفة على مجموعة من 1000 مسألة رياضية من قاعدة بيانات GSM-Symbolic.
استُخدمت هذه الاستراتيجيات لتحديد مدى فعالية كل منها عند تعديل مسائل بسيطة، مثل تغيير الأسماء أو الأرقام. تمثل الطريقة الأولى استخدام أكثر أساليب التفكير المنطقي التقليدية المعروفة بـ chain-of-thought (CoT)، بينما تشمل الأخرى تنفيذ كود برمجي باستخدام نماذج لغة مدعومة بالبرامج (Program-Aided Language models - PAL)، وأخيرًا، التنفيذ التدريجي للكود عبر خطوة بخطوة (Step-by-Step Coding - SBSC).
نتائج البحث بينت أن طريقة CoT تُظهر أعلى معدلات القوة الثابتة، حيث انخفضت دقتها بمعدل 1.3 نقطة مئوية وواجهت 1.8% من المسائل مشاكل عند التعديل. بالمقابل، كانت طريقة PAL الأقل قوة حيث انخفضت دقتها بمعدل 1.7 نقطة مئوية وظهرت 3.1% من المسائل معطلة. بينما وقعت طريقة SBSC في المنتصف.
وعلى الرغم من عدم وجود فروق إحصائية دالة، إلا أن الاتجاه العام كان ثابتًا، مما يوحي بأن طرق تنفيذ الكود، سواء كانت لمرة واحدة أو بشكل تدريجي، لم تُحسن من قوة التفكير المنطقي عند مواجهة تغييرات بسيطة في مسائل تعليمية.
إلى أي مدى يمكن الاعتماد على الذكاء الاصطناعي في حل المسائل الرياضية؟ دعونا نشارك آراءنا حول هذه النتائج في التعليقات!
هل تحل نماذج اللغات الضخمة المسائل الرياضية بفعالية؟ دراسة تكشف الحقيقة!
تكشف دراسة حديثة أن نماذج اللغات الضخمة قد تحقق دقة عالية في حل المسائل الرياضية، لكنها تواجه تحديات عند التعديل على المعطيات. استكشفوا كيفية تأثير تنفيذ الكود على قوة التفكير المنطقي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
