في عالم يتسم بتعقيدات التفاعلات الاجتماعية، يواجه الأفراد كثيرًا ما يسمى بالصراعات الدوروية، وهو ما يعني تناقض توقعات الأدوار المتعددة التي يصعب الوفاء بها في ذات الوقت. ومع تزايد دور نماذج اللغة الكبيرة (Large Language Models) في فهم تلك الديناميات الاجتماعية، يطرح سؤال مبني على البحوث ضرورة فحص كيفية استجابة هذه النماذج لتلك التحديات.

في هذا السياق، تم تقديم RoleConflictBench، وهو معيار جديد صُمم خصيصًا لقياس حساسية السياقات في السيناريوهات الطافرة للصراعات الدوروية. وللتقييم الموضوعي ضمن هذا المجال الذاتي، يتم اعتماد مبدأ الحتمية الموقفية كقيود في عملية اتخاذ القرار.

تقوم هذه المبادرة ببناء مجموعة بيانات من خلال عملية من ثلاث مراحل، مما يتيح توليد أكثر من 13,000 سيناريو واقعي يغطي 65 دورًا مختلفًا في خمسة مجالات اجتماعية، مع تغيير مستويات الحدة للمواقف المتنافسة بشكل منهجي.

هذه الإعدادات المنظمة تتيح قياس حساسية النماذج أمام السياقات، مما يعكس ما إذا كانت اتخاذات النماذج تتماشى مع البيئات الموقفية أم أنها تُستبدل بتفضيلات الأدوار المتعلمة. من خلال تحليل عشرة نماذج من نماذج اللغة الكبيرة، تبيّن أن هذه النماذج تنحرف بشكل كبير عن المعايير الموضوعية. بدلاً من الاستجابة للإشارات السياقية الديناميكية، تتحدد قراراتها بشكل رئيسي بتوجهاتها نحو أدوار اجتماعية معينة.