في ظل التطور السريع للتكنولوجيا، تتزايد أهمية قياس رفاهية نظم الذكاء الاصطناعي. في دراستنا الجديدة، قمنا بتطوير طرق تجريبية مبتكرة تقيس رفاهية نماذج اللغات (Language Models) من خلال دمج التقارير اللفظية للسلوكيات التي تظهرها عند التنقل في بيئات افتراضية واختيار مواضيع المحادثة.

تتضمن هذه الدراسات تجارب تقارن بين تفضيلات النماذج من خلال ما تقوله وما تفعله فعليًا. كما تم اختبار كيفية تأثير التكلفة والمكافآت على سلوك هذه النماذج. باستخدام مقياس رفاهية وجودية (eudaimonic welfare scale) الذي يقيس حالات مثل الاستقلالية والهدف في الحياة، وجدنا علاقات ملحوظة بين التفضيلات المعلنة والسلوكيات عبر مختلف الظروف.

تشير النتائج إلى أن الرضا عن التفضيلات يمكن أن يكون بمثابة مؤشر قابل للقياس على رفاهية بعض نظم الذكاء الاصطناعي الحالية. كما اتاحت لنا هذه التصاميم الفرصة لملاحظة سلوك النموذج بشكل أكثر عمقًا. ومع ذلك، تباينت درجة التوافق بين قياساتنا بين النماذج والظروف المختلفة، مما أثار تساؤلات حول مدى فعالية أساليبنا في قياس حالة رفاهية النماذج.

لا يزال هناك الكثير من الغموض بشأن طبيعة الرفاهية والحالات المعرفية لنماذج اللغات، وهذا يعكس عدم اليقين في ما إذا كنا قد نجحنا في قياس تلك الحالات فعليًا. ومع ذلك، توضح هذه النتائج أن قياس الرفاهية في نماذج اللغات يمثل مجالًا واعدًا يستحق المزيد من الاستكشاف.