تعتبر القدرة على التحكم في الحالات العاطفية ومحاور الشخصية للنماذج اللغوية الكبيرة (LLMs) خطوة أساسية لتفعيل تفاعلات غنية ومركزّة على الإنسان في سياقات اجتماعية تفاعلية. في دراسة حديثة، تم تقديم إطار PsySET كمعيار نفسي لتقييم فعالية التحكم وثقة النماذج في مجالات العواطف والشخصيات.

تضم الدراسة أربعة نماذج من عائلات مختلفة من النماذج اللغوية، مصاحبة لاستراتيجيات تحكم متنوعة تشمل: التنبيه (prompting)، والتخصيص الدقيق (fine-tuning)، وهندسة التمثيل (representation engineering). أظهرت النتائج أن التنبيه فعال باستمرار إلا أنه محدود من حيث التحكم في الشدة، بينما توفر حقن المتجهات (vector injections) تحكمًا أدق ولكنه يقلل قليلاً من جودة المخرجات.

علاوة على ذلك، تستكشف الدراسة موثوقية النماذج المدارة عن طريق تقييم جوانب السلامة، والصحة، والعدالة، والأخلاق، مسلطة الضوء على الآثار الجانبية المحتملة وتحولات السلوك. من بين الاكتشافات الجديرة بالاهتمام، تم ملاحظة آثار فردية؛ فعلى سبيل المثال، يمكن أن يؤدي حتى شعور إيجابي مثل الفرح إلى تقليل القدرة على التحمل ضد الحقائق المعادية، وتقليل الوعي بالخصوصية وزيادة التحامل التفضيلي. بينما يُتوقع أن يُعزز الغضب السُمّية، إلا أنه يقوي مقاومة التسريب.

إن هذا الإطار يؤسس لتقييم شامل لأهمية التحكم في العواطف والشخصيات، مما يقدم رؤى حول قابليتها للتفسير وموثوقيتها للاستخدامات الاجتماعية التفاعلية. هل تعتقد أن السيطرة العاطفية ستغير الطريقة التي نتفاعل بها مع الأنظمة الذكية؟ شاركونا في التعليقات!