في عصر الذكاء الاصطناعي المتسارع، يسعى الباحثون لفهم كيفية إدراك نماذج اللغات الضخمة (Large Language Models) للأخلاق. في هذا السياق، أُدخل مفهوم جديد يُعرف بـ 'ميدان الأخلاق' (Moral Trolley Arena)، والذي يعمل على قياس قدرة هذه النماذج على تجميع أدلة أخلاقية في قراراتها.

يغطي هذا الإطار الجديد نهجاً فريداً يتكون من مرحلتين؛ حيث يقوم في المرحلة الأولى بمعايرة أعمال أخلاقية فردية محاطة بـ 229 سيناريو، تتبع خمس أساسات نظرية أخلاقية. ثم تنتقل المرحلة الثانية لتجمع تلك الأعمال المدروسة ضمن خيارات متعددة، مُنظمة على شبكة تحكمية لتعكس شدة الفعل.

واحدة من أهم النتائج التي توصل إليها الباحثون هي أن الأحكام المركبة تُظهر قوة أكبر من مجموع الأفعال الفردية، حيث يتم تصور العلاقة بين القوة الأخلاقية والتفضيلات المركبة على أنها مضغوطة، وليست ببساطة مجموعة خطية من الأعمال.

كما أظهرت النماذج درجات مختلفة من التوازن بين الأساسات الأخلاقية والنتائج المترتبة على كل خيار، مما يشير إلى أن التقييم الأخلاقي يجب أن يتجاوز مجرد تصنيف الأفعال المنفردة. هذه الاكتشافات تدفعنا للتفكير بشكل أعمق في كيفية تقييمنا للأخلاق في الذكاء الاصطناعي.

فما رأيكم في هذا التطور المثير؟ شاركونا في التعليقات.