تتطور نماذج اللغة الضخمة (LLMs) بشكل مستمر لتعمل في سياقات اجتماعية، مما يؤكد ضرورة فهم كيف تعبر هذه النماذج عن الأخلاقيات وكيف تؤثر الأدوار الشخصية على استجابتها. في دراسة جديدة، استكشف الباحثون الاستجابة الأخلاقية لنماذج اللغة الضخمة عندما تتقمص شخصية معينة، مستخدمين استبيان الأسس الأخلاقية (MFQ) كأداة قياس.
تم تقديم معايير جديدة لتقييم خاصيتين رئيسيتين في هذا المجال: القابلية الأخلاقية والصلابة الأخلاقية. القابلية الأخلاقية هي مدى تأثر النموذج بالأدوار المختلفة، بينما تغطي الصلابة الأخلاقية استقرار استجابة النموذج مقابل الضغوط المختلفة. يتم حساب هاتين الخاصيتين من خلال تحليل تنوع نتائج استبيان الأسس الأخلاقية عبر الأدوار المختلفة.
تضمن التحليل تقييم 15 نموذجًا عبر ست عائلات، بما في ذلك Claude وDeepSeek وGemini وGPT وGrok وLlama. أظهرت النتائج وجود أنماط مختلفة تمامًا بين القابلية والصلابة الأخلاقية. في حين تختلف صلابة الاستجابة الأخلاقية بمقدار كبير، مع معامل تباين يصل إلى 152%، وتتصدر عائلة Claude القائمة كالأكثر صلابة، فإن القابلية الأخلاقية كانت أقل تنوعًا، حيث لا تتجاوز نسبة التباين فيها 13%.
تظهر هذه النتائج أهمية العائلة الخاصة بالنموذج في تحديد استجابتها الأخلاقية، حيث يعتمد مستوى الصلابة بشكل رئيسي على التجريب بعد التدريب، بينما تتشكل القابلية الأخلاقية بشكل أساسي خلال التدريب الأول. تعزز هذه التحليلات فهمنا لكيفية تأثير الأدوار الشخصية على سلوك النماذج ويسلط الضوء على الظواهر الداخلية التي تستخدمها لتجسيد تلك الشخصيات.
تحليل مثير: كيفية تأثير الأدوار الشخصية على أخلاقيات نماذج اللغة الضخمة
تستكشف الدراسة العلاقة بين الأدوار الشخصية وأخلاقيات نماذج اللغة الضخمة (LLMs)، حيث تبين كيف يمكن لهذه النماذج تغيير استجابتها الأخلاقية بناءً على الشخصية التي تتقمصها. يكشف البحث عن اختلافات كبيرة في مرونة الاستجابة الأخلاقية بين العائلات المختلفة للنماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
