في الأعوام الأخيرة، برز استخدام نماذج اللغات الضخمة (LLMs) في مجالات عديدة، خاصة الدعم النفسي. ومع ذلك، تشير الحوادث الأخيرة إلى وجود فجوة خطيرة في تقييم سلوك هذه النماذج، حيث لا تعكس درجات الأمان السطحية كيفية تصرف النماذج في تفاعلات عاطفية عبر الوقت.

تسعى دراسة حديثة إلى تسليط الضوء على الفكرة المهمة المعروفة باسم "الضمور الإدراكي"، وهي مقياس سلوكي يركز على كيفية تأثير التفاعل مع نماذج الذكاء الاصطناعي على قدرة المستخدمين على التفكير والتأمل واتخاذ القرارات بأنفسهم.

لتطوير مفهوم الضمور الإدراكي، ابتكر الباحثون مقياس "COGNITIVE ATROPHY BENCH"، الذي يعتمد على 1576 محادثة استشارية تم إنشاؤها بالكامل من قِبل البشر، مع 15680 دورًا و42230 ردًا من خمس نماذج لسانية. تم تطوير مخطط يتكون من 20 سمة من قبل ثلاثة خبراء في علم النفس السريري لقياس سلوك المستخدم، إدارة الردود، وعلامات المخاطر العامة.

تظهر النتائج أن النماذج تعاني من مستوى معتدل إلى مرتفع من السلوك المتماشي مع الضمور الإدراكي، حيث تُظهر ردودها أنماطًا متكررة مثل النصائح الموجهة، وحل المشكلات، واستجابات التوصيات، مما قد يؤدي إلى تعزيز الاعتماد بدلاً من التشجيع على التفكير الذاتي.

من خلال قياس الضمور الإدراكي، يوفر هذا العمل أساسًا للاعتماد على سلوك النماذج في محادثات حساسة، مما يفتح المجال لتحسين دعم الصحة النفسية ومساعدة المستخدمين في فهم مشاعرهم بعمق.