انهيار تنوع المخرجات: كيف يؤثر التدريب على نماذج اللغة المتقدمة؟
🧠 نماذج لغوية2 دقائق للقراءة👁 0 مشاهدة

انهيار تنوع المخرجات: كيف يؤثر التدريب على نماذج اللغة المتقدمة؟

تكشف الدراسات أن نماذج اللغة المدربة مسبقاً تنتج مخرجات أقل تنوعاً مقارنة بنسخها الأساسية، مما يؤثر سلباً على مهام الإبداع. نحن نحلل كيف يرتبط انهيار التنوع بتكوين بيانات التدريب خلال مراحل ما بعد التدريب.

في عالم الذكاء الاصطناعي، تبرز نماذج اللغة المدربة مسبقاً كأدوات قوية قادرة على إنتاج نصوص متميزة، ومع ذلك، يواجه الباحثون قضية "انهيار تنوع المخرجات" (output diversity collapse). تشير الأبحاث إلى أن هذه النماذج تنتج مخرجات أقل تنوعاً، مما يعوق أساليب التحجيم التي تعتمد على تنوع العينات.

درس الباحثون ثلاثة خطوط متوازية من ما بعد التدريب: نموذج Olmo 3، وThink (الذي يعتمد على تقنيات التنقيح السلس)، وInstruct (المعتمد على بيانات واسعة ومتنوعة). وقد تم تحليل هذه النماذج عبر 15 مهمة و4 مقاييس لتنويع النصوص، حيث تم اكتشاف أن انهيار التنوع يتفاوت وفقاً لتكوين البيانات.

تظهر النتائج أن نموذج Think يفقد معظم التنوع الدلالي عند التوجيهات الدقيقة، بينما يكون تأثير أساليب التحجيم أكبر في نموذج Instruct مقارنةً بـ Think. كما لوحظ أن كتم التفكير المتسلسل (chain-of-thought reasoning) في نماذج Think يقلل من الدقة في المهام الصعبة، في حين يبقى تنوع الإجابات عند مستوى معين، مما يدل على أن انهيار التنوع يتجذر في هيكل النموذج وليس في تنسيق التوليد.

تم تقسيم فقدان التنوع إلى مكونات تتعلق بمراقبة الجودة وإزالة المخرجات غير الصحيحة، بينما تظهر مهمات معينة اختلافات متفاوتة في هذا السياق. على الرغم من انهيار تنوع المخرجات، فإن نماذج Think تحتفظ بمزيد من تنوع الإجابات الصحيحة مقارنةً بـ Instruct.

تشير هذه النتائج إلى أن معالجة انهيار التنوع يجب أن تبدأ خلال مراحل التدريب، لأن تنسيق البيانات يلعب دوراً محورياً لا يمكن التغاضي عنه.
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة