في عالم الذكاء الاصطناعي اليوم، تبرز أهمية تطوير نماذج قادرة على فهم القيم الإنسانية مثل التعاطف. ولكن، هل يمكن لعمليات التدريب بعد التعليم (Post-Training) أن تؤثر سلبًا على هذه القيم؟
أظهرت دراسة حديثة حول نموذج Llama 3.1 8B أن استخدام بيانات تدريبية معينة بعد فترة التدريب الأولى قد يؤدي إلى تدهور قيم التعاطف الحيوانية.
تطبيق عمليات مثل (Supervised Fine-Tuning) SFT و( reinforcement learning) RL بهدف تعزيز فائدة النموذج في تقديم المساعدة، قد تأتي مع تكاليف غير مرئية، حيث تم تقييم النموذج على مجموعة بيانات جديدة تعرف باسم (Animal Harm Benchmark) AHB 2.2.
أظهرت النتائج أن التدريب على فائدة النموذج خفض قيم التعاطف بنسبة ملحوظة بالمقارنة مع التدريب على البرمجة. علاوة على ذلك، لوحظ أن هذا الانخفاض يؤثر أيضًا على المهارات العامة للأخلاقيات؛ حيث انخفضت القدرة على التفكير الأخلاقي بنسبة 25.5 نقطة مئوية عند التعامل مع عناصر MORU باللغة الإنجليزية.
المثير للاهتمام هو أن هذه الآثار لم تظهر عند استخدام المعايير متعددة اللغات، مما يعني أن قيم التعاطف التي تم ترسيخها في النموذج تتجاوز الحدود اللغوية بينما يظل تأثير التعليمات مربكًا.
إن هذه النتائج تدعو المختبرات التي تعمل على تعزيز القيم من خلال التعليم الوسيط إلى إعادة النظر في استخدام تدريبات ما بعد التعليم لتعزيز القيم دون التأثير السلبي على قدرات التفكير العام.
تتطلب هذه الاكتشافات الجديدة تفكيرًا عميقًا في كيفية تعليم الذكاء الاصطناعي ليكون أكثر انسجامًا مع القيم الإنسانية الأساسية.
مفاجآت صادمة: تأثير التدريب بعد التعليم على قيم التعاطف في نماذج الذكاء الاصطناعي!
تكشف دراسة جديدة أن عمليات التدريب بعد التعليم قد تؤثر سلبًا على قيم التعاطف في نماذج الذكاء الاصطناعي. نتائج مثيرة تشير إلى ضرورة إعادة النظر في استراتيجيات التعليم لتعزيز التعاطف بدلاً من تقليله.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
