هل تساءلت يومًا كيف يمكن للذكاء الاصطناعي أن يتعامل مع القضايا الأخلاقية؟ في دراسة حديثة، تم اكتشاف أن نماذج اللغة الكبرى (LLMs) تواجه تحديات أخلاقية تتطلب منها توازنًا بين قيم متعددة مثل العدالة والأمانة والشجاعة. تم تقديم إطار العمل VirtueMap كوسيلة لفهم كيفية تقييم تلك القيم من منظور الفضائل الأرسطية.

ويقوم VirtueMap بعدم الطلب من المستخدمين أو نماذج (LLMs) تقديم إجابة صحيحة واحدة، بل الطلب منهم ترتيب خمس استجابات لكل من سبع مآزق أخلاقية عامة. ولتأمين جودة التقييمات، تم جمع أكثر من 100 تقييم لكل ترتيب، وتم اعتبارها كحقائق عملية فقط عندما أكد عليها 95% على الأقل.

تمت معالجة الاستجابات من خلال ترتيبها بناءً على القيم الأخلاقية، مما يتيح بناء ملفات تعريف حول الحكمة العملية والعدالة والصدق والشجاعة والاعتدال. بعد إجراء تقييمات متكررة على تسع عائلات من نماذج اللغة الكبرى، أظهرت النتائج اتساقًا عالياً في التصنيفات بنسبة 90.3%. ومع ذلك، كانت الفروقات الأكثر وضوحًا في القيم مثل الشجاعة والاعتدال والعدالة.

كما تم إطلاق موقع تفاعلي جديد يمكّن المستخدمين من حساب الملفات الشخصية محليًا من خلال متصفحهم، مما يتيح إجراء مقارنات مثيرة بين استجابات البشر ونماذج (LLMs). في نهاية المطاف، تسلط هذه الدراسة الضوء على التعقيدات الأخلاقية التي تواجه الذكاء الاصطناعي، وتعزز الحوار حول كيف يمكن تحسين نماذج الذكاء الاصطناعي في اتخاذ قرارات أخلاقية.