تعتبر الأسئلة الاختيارية (Multiple-Choice Questions, MCQs) عنصراً أساسياً في تقييم الفهم الدراسي، إلا أن الطرق التقليدية لتقدير صعوبتها تعتمد على افتراضات محدودة حول قدرات الطلاب. وفي خطوة رائدة، تم تقديم إطار عمل يعتمد على تحليل سلوكيات الطلاب لتوقع صعوبة هذه الأسئلة بدقة أكبر.

تمكّن الباحثون من تطوير نموذج يعتمد على بيانات سلوكية للطلاب من مجموعة بيانات EEDI. بدلاً من استخدام نماذج القدرة النظرية، تم استخدام طريقة تسمى تحليل الفئات الكامنة (Latent Class Analysis, LCA) لتعريف تصنيفات سلوكية مختلفة، تُعرف بالـ "شخصيات". هذه الشخصيات تساعد في فهم التفاوت في تصورات وفهم الطلاب.

ثم تم تدريب نموذج لغوي كبير (Large Language Model, LLM) لمحاكاة توزيع الاستجابات حسب كل شخصية، مما شمل معالجة هذه البيانات جنبا إلى جنب مع سياق الموضوع. تُستخدم هذه الإشارات في نموذج انحدار Ridge لتوقع معلمة صعوبة الأسئلة بناءً على نظرية استجابة العنصر (Item Response Theory, IRT).

اثبتت نتائج اختبار الاعتماد المتبادل (Cross-Validation) أن النموذج الجديد يتفوق على الطرق التقليدية، حيث انخفض خطأ التقدير من 0.367 إلى 0.274، وزاد معامل التحديد من 0.525 إلى 0.686.

تتميز هذه الشخصيات بأنها قابلة للتفسير، مما يتيح لنا الحصول على رؤى حول أسباب صعوبة الأسئلة. تتجاوز هذه الابتكارات مجرد تحسين التقييم، فهي تحمل إمكانات كبيرة لتصميم اختبارات تشخيصية أكثر دقة وفعالية. من الواضح أن الذكاء الاصطناعي يلعب دوراً متزايد الأهمية في تصميم نظم التعليم والتقييم.

هل تعتقد أن مثل هذه النماذج يمكن أن تغير مستقبل التعليم؟ شاركونا آراءكم في التعليقات!