استراتيجيات جديدة لتعزيز أداء نماذج الذكاء الاصطناعي في تصنيف الشروحات العلمية
تتضمن دراسة حديثة استراتيجيات مبتكرة لتحسين تصنيف ردود الطلاب العلمية باستخدام نماذج التعلم العميق. التركيز على معالجة عدم توازن الفئات يعكس إمكانيات تقدم مهمة في التعليم العلمي.
في عصرنا الحديث، أصبحت تقييمات الشروحات العلمية للطلاب آلية تهدف إلى تقديم تغذية راجعة دقيقة وفورية. ومع ذلك، يظل مواجهة عدم توازن الفئات في معايير التقييم تحدياً كبيراً، خاصةً في مجالات التفكير المتقدم. تهدف هذه الدراسة إلى استكشاف استراتيجيات تعزيز البيانات لتحسين تصنيف النصوص باستخدام نماذج "Transformers".
تشمل قاعدة بيانات الدراسة 1,466 استجابة من طلاب المدارس الثانوية تم تقييمها بناءً على 11 فئة تحليلة مشفرة ثنائياً. تتضمن معايير التقييم ستة مكونات أساسية تشمل الأفكار العلمية اللازمة لتقديم شرح كامل، بالإضافة إلى خمسة أفكار شائعة غير مكتملة أو غير دقيقة.
استخدم الباحثون نموذج "SciBERT" كقاعدة، وتطبيقوا فنيات تحسين متعددة. من بين هذه الفنيات: أولاً، تم توليد ردود صناعية باستخدام GPT-4، وثانياً استخدام طريقة "EASE"، القائمة على استخراج الكلمات وتنقيتها، وأخيراً "ALP" (تعزيز باستخدام القواعد السياقية الاحتمالية المعجمية) لاستخراج الجمل.
أظهرت النتائج أن تحسين نموذج "SciBERT" عزز التذكير بشكل ملحوظ، ولكن استراتيجيات التعزيز زادت بشكل كبير من الأداء، حيث كان لبيانات "GPT" تأثير إيجابي على الدقة والتذكير. كما حققت "ALP" درجات كاملة من الدقة والتذكير عبر معظم الفئات الأكثر عدم توازن.
عبر جميع فئات المعايير، أثبتت تعزيرات "EASE" أنها زادت من توافق النتائج مع تقييمات البشر للأفكار العلمية والأفكار غير الدقيقة. وأجري مقارنة بين استراتيجيات التعزيز هذه وطريقة المعاينة التقليدية (SMOTE) للتقليل من مشكلة الفائض والحفاظ على بيانات المرونة الأساسية اللازمة للتوافق مع تقدم التعلم.
تظهر هذه النتائج أن التعزيز المستهدف يمكن أن يعالج عدم التوازن الشديد أثناء الحفاظ على شمولية المفاهيم، مما يقدم حلاً قابلاً للتوسع لتقييم التعلم المتوافق مع المناهج التعليمية في العلوم.
تشمل قاعدة بيانات الدراسة 1,466 استجابة من طلاب المدارس الثانوية تم تقييمها بناءً على 11 فئة تحليلة مشفرة ثنائياً. تتضمن معايير التقييم ستة مكونات أساسية تشمل الأفكار العلمية اللازمة لتقديم شرح كامل، بالإضافة إلى خمسة أفكار شائعة غير مكتملة أو غير دقيقة.
استخدم الباحثون نموذج "SciBERT" كقاعدة، وتطبيقوا فنيات تحسين متعددة. من بين هذه الفنيات: أولاً، تم توليد ردود صناعية باستخدام GPT-4، وثانياً استخدام طريقة "EASE"، القائمة على استخراج الكلمات وتنقيتها، وأخيراً "ALP" (تعزيز باستخدام القواعد السياقية الاحتمالية المعجمية) لاستخراج الجمل.
أظهرت النتائج أن تحسين نموذج "SciBERT" عزز التذكير بشكل ملحوظ، ولكن استراتيجيات التعزيز زادت بشكل كبير من الأداء، حيث كان لبيانات "GPT" تأثير إيجابي على الدقة والتذكير. كما حققت "ALP" درجات كاملة من الدقة والتذكير عبر معظم الفئات الأكثر عدم توازن.
عبر جميع فئات المعايير، أثبتت تعزيرات "EASE" أنها زادت من توافق النتائج مع تقييمات البشر للأفكار العلمية والأفكار غير الدقيقة. وأجري مقارنة بين استراتيجيات التعزيز هذه وطريقة المعاينة التقليدية (SMOTE) للتقليل من مشكلة الفائض والحفاظ على بيانات المرونة الأساسية اللازمة للتوافق مع تقدم التعلم.
تظهر هذه النتائج أن التعزيز المستهدف يمكن أن يعالج عدم التوازن الشديد أثناء الحفاظ على شمولية المفاهيم، مما يقدم حلاً قابلاً للتوسع لتقييم التعلم المتوافق مع المناهج التعليمية في العلوم.
📰 أخبار ذات صلة
أبحاث
هل تؤدي أدوات الذكاء الاصطناعي إلى الإفراط في الاستخدام؟ اكتشاف ظاهرة جديدة في نماذج اللغات الضخمة!
أركايف للذكاءمنذ 4 ساعة
أبحاث
نموذج حوكمة مبتكر لتحسين استخدام الذكاء الاصطناعي في مجال التعليم
أركايف للذكاءمنذ 4 ساعة
أبحاث
اختيار الخوارزميات دون الحاجة إلى معرفة المجال: التقنية الجديدة التي تحدث ثورة في الذكاء الاصطناعي
أركايف للذكاءمنذ 4 ساعة