في عالم تدريب نماذج اللغات الضخمة (Large Language Models)، تُعتبر إشراف المعلمين العنصر الأساسي في عملية تطوير الأنظمة الذكية. وغالبًا ما يميل الباحثون إلى اختيار المعلم الأكثر أداءً لجمع بيانات تدريب الطلاب، مبنيين أحكامهم على أداء المعلم أثناء الاختبار.

ومع ذلك، تُظهر الأبحاث الحديثة أن هذه الافتراضات قد تكون مضللة. فقد أظهرت دراساتنا أن القوة الفائقة للمعلم في تقديم الإجابات الصحيحة لا تعني بالضرورة أنه يوفر أفضل إشراف للطالب. هنا يأتي دور الابتكار المتمثل في استراتيجية "اختيار الإجابات المركزية للطلاب" (Student-Centric Answer Sampling - SCAS).

تعمل هذه الاستراتيجية على تحسين جودة التعليم عن طريق اختيار الإجابات من بين تلك المُنتَجة بواسطة المعلمين الموثوقين، حسب التكلفة التعليمية المتوقعة للطالب. تم استنباط هذه المنهجية من تفكيك تدرجات الرموز (token-wise gradient decomposition) من أجل الحصول على نموذج كفء يُسهم في توجيه عملية اختيار الإجابات أثناء التدريب.

أظهرت التجارب التي أجريت على 30 نموذج معلم، و6 نماذج أساسية للطلاب، و8 مهام مختلفة، أن SCAS يُحسن أداء الطلاب بشكل ملحوظ. وهذا يشير إلى ضرورة الانتباه إلى نوعية الإشراف الذي يتماشى مع احتياجات الطلاب، بدلاً من مجرد التركيز على قوة المعلم.

إن هذه الخطوة تمثل تقدمًا مهمًا في العالم التعليمي المدعوم بالذكاء الاصطناعي، مما يعكس التحول نحو استراتيجيات أكثر تطورًا ومواءمة لرغبات واحتياجات الطلاب الفردية.