في عالم يتسم بتزايد الاعتماد على نماذج اللغات الكبيرة (Large Language Models)، يصبح التفاعل الاجتماعي وتعزيز السلوكيات الأخلاقية جزءاً لا يتجزأ من التحديات التي تواجه العلماء. من هنا، يأتي النموذج المبتكر FairMindSim الذي يستند إلى علم النفس الاجتماعي، والذي يقيّم مدى توافق هذه النماذج مع القيم الإنسانية من خلال ألعاب اقتصادية مستمرة.

تُعاني معظم المعايير الحالية من نقص في القدرة على قياس الديناميات الطويلة الأمد واتخاذ القرار، مما يجعل الأمر أكثر تعقيداً. ومن خلال تقديم النموذج الجديد، نتمكن من دراسة تطور سلوكياتنا وهياكل المعتقدات بشكل أكثر دقة. بالإضافة إلى ذلك، تم إدخال نموذج BREM (Belief-Reward Alignment Behavior Evolution Model) الذي يعرض عملية اتخاذ القرار كتوازن ديناميكي بين مكافآت خارجية ومعتقدات داخلية.

أجرينا دراسة مقارنة شاملة شارك فيها 1,017 شخصاً مع عشرة نماذج لغوية كبيرة، بما في ذلك GPT-5 وGemini-3-Pro. تعكس النتائج ارتباطاً معقداً في سلوكيات العقوبة للجهات الثالثة (Third Party Punishment)؛ حيث تُظهر النماذج المتوسطة قدرة محدودة على ضبط الذات، بينما تأخذ النماذج المتطورة منحى أكثر إنسانية واعتدالاً.

هذا التقدم يوفر بروتوكولاً قياسياً لاختبارات الضغط النفسية وآلية يمكن تفسيرها لتحليل تطور توافق الذكاء الاصطناعي في سياقات اجتماعية محكومة. مع تطور الذكاء الاصطناعي، يبقى السؤال مفتوحاً: هل ستستمر نماذجنا في التطور نحو مزيد من التكيف مع القيم الإنسانية؟