في عالم التعليم الحديث، تبرز نظم التصحيح الآلي كأداة قوية لتسهيل وتوسيع نطاق التقييمات المختلفة. ومع ذلك، يظل تصحيح الرياضيات المكتوبة باليد تحديًا معقدًا نظرًا لتعقيد الحلول متعددة الخطوات. لكن، ماذا لو كان لدينا نماذج لغة كبيرة (Large Language Models) قادرة على رؤية النصوص المكتوبة وتقييمها بدقة؟

في دراسة حديثة، تم تقديم تقييم تجريبي لنظام تصحيح رياضيات يعتمد على نموذج لغة كبير، مبني على معايير تم تحديدها من قبل المعلم. قام الباحثون بتطوير نظام متكامل يدمج بين النسخ الرقمي والتقييم القائم على المعايير ليمكن من تحليل الأعمال الرياضية المكتوبة يدويًا، وذلك باستخدام صورة واحدة تم التقاطها.

تضمنت الدراسة تقييم أعمال طلاب من دورات STEM في جامعتين مختلفتين، حيث تم مقارنة قرارات التصحيح التي اتخذها الذكاء الاصطناعي مع التقييمات البشرية على مستوى العناصر في المعايير. وظهرت نتائج تشير إلى دقة عالية بشكل عام، حيث تمثل 87% من الأخطاء في أفضل نموذج تُعزى إلى فشل النسخ وليس إلى سوء تطبيق المعايير.

بالمثل، تم تصنيف أوضاع الخطأ الشائعة، مثل مشاكل جودة الصورة، والمحتوى المتخيل، والتعامل غير الصحيح مع التعابير المكافئة. هذه النتائج تسلط الضوء على الوعود والقيود في استغلال نماذج اللغة الكبيرة في تصحيح الرياضيات المكتوبة، مما يوفر توجيهات حول تصميم الأنظمة، وتحسينات المخاطر، ونشر هذه الحلول في الأوساط التعليمية.

هل تتخيل مستقبلًا يمكن فيه للذكاء الاصطناعي تغيير كيفية تقييم الطلاب في الرياضيات؟ شاركونا آرائكم في التعليقات!