تعتبر الأسئلة الاختيارية (Multiple-Choice Questions, MCQs) عنصراً أساسياً في [تقييم](/tag/تقييم) الفهم الدراسي، إلا أن الطرق التقليدية لتقدير صعوبتها تعتمد على افتراضات محدودة حول قدرات الطلاب. وفي خطوة رائدة، تم تقديم إطار [عمل](/tag/عمل) يعتمد على [تحليل](/tag/تحليل) [سلوكيات](/tag/سلوكيات) الطلاب لتوقع صعوبة هذه الأسئلة بدقة أكبر.

تمكّن الباحثون من [تطوير](/tag/تطوير) [نموذج](/tag/نموذج) يعتمد على [بيانات](/tag/بيانات) سلوكية للطلاب من [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) EEDI. بدلاً من استخدام [نماذج](/tag/نماذج) القدرة النظرية، تم استخدام طريقة تسمى [تحليل](/tag/تحليل) الفئات الكامنة (Latent Class Analysis, LCA) لتعريف تصنيفات سلوكية مختلفة، تُعرف بالـ "[شخصيات](/tag/شخصيات)". هذه الشخصيات تساعد في [فهم](/tag/فهم) التفاوت في [تصورات](/tag/تصورات) وفهم الطلاب.

ثم تم [تدريب](/tag/تدريب) [نموذج لغوي كبير](/tag/[نموذج](/tag/نموذج)-لغوي-كبير) (Large Language [Model](/tag/model), [LLM](/tag/llm)) لمحاكاة توزيع الاستجابات حسب كل شخصية، مما شمل معالجة هذه [البيانات](/tag/البيانات) جنبا إلى جنب مع سياق الموضوع. تُستخدم هذه الإشارات في [نموذج](/tag/نموذج) انحدار Ridge لتوقع معلمة صعوبة الأسئلة بناءً على [نظرية](/tag/نظرية) استجابة العنصر (Item Response Theory, IRT).

اثبتت نتائج اختبار الاعتماد المتبادل (Cross-Validation) أن النموذج الجديد يتفوق على الطرق التقليدية، حيث انخفض [خطأ](/tag/خطأ) التقدير من 0.367 إلى 0.274، وزاد معامل التحديد من 0.525 إلى 0.686.

تتميز هذه الشخصيات بأنها قابلة للتفسير، مما يتيح لنا الحصول على [رؤى](/tag/رؤى) حول أسباب صعوبة الأسئلة. تتجاوز هذه [الابتكارات](/tag/الابتكارات) مجرد [تحسين](/tag/تحسين) التقييم، فهي تحمل إمكانات كبيرة لتصميم [اختبارات](/tag/اختبارات) تشخيصية أكثر [دقة](/tag/دقة) وفعالية. من الواضح أن [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) يلعب دوراً متزايد الأهمية في [تصميم](/tag/تصميم) [نظم التعليم](/tag/نظم-[التعليم](/tag/التعليم)) والتقييم.

هل تعتقد أن مثل هذه [النماذج](/tag/النماذج) يمكن أن تغير [مستقبل](/tag/مستقبل) [التعليم](/tag/التعليم)؟ شاركونا آراءكم في [التعليقات](/tag/التعليقات)!