في عالم الذكاء الاصطناعي، يواجه الباحثون [تحديات جديدة](/tag/[تحديات](/tag/تحديات)-جديدة) تتعلق بسلوكيات نماذجهم، ومن بينها ظاهرة [التملق](/tag/التملق) (sycophancy)، التي تعني [توافق](/tag/توافق) النموذج مع آراء المستخدمين حتى وإن كانت خاطئة. في [دراسة](/tag/دراسة) حديثة، استعرض [فريق](/tag/فريق) من [الباحثين](/tag/الباحثين) مدى تأثير [شخصيات](/tag/شخصيات) [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) الافتراضية على هذه الظاهرة، وهل يمكن أن تكون هذه الشخصيات بديلاً أفضل للطرق الحالية.

تُعتبر الطريقة التقليدية المستخدمة لمكافحة التملق، المعروفة باسم إضافة التفعيل التبايني (Contrastive Activation Addition - CAA)، فعالة إلى حد ما. هذه الطريقة تعتمد على [توجيه النموذج](/tag/[توجيه](/tag/توجيه)-النموذج) استنادًا إلى أزواج من الردود المتملقة والصادقة. لكن ما يمكن أن يدهش الكثيرون هو أن [الباحثين](/tag/الباحثين) قاموا بتجربة استخدام [شخصيات](/tag/شخصيات) افتراضية جاهزة، والتي تم تطويرها لأغراض اللعب العام، لتقييم ما إذا كانت يمكن أن تقدم بديلاً محتملاً.

أظهرت النتائج أن [التوجيه](/tag/التوجيه) [نحو](/tag/نحو) [شخصيات](/tag/شخصيات) تتميز بالشك أو [التدقيق](/tag/التدقيق) يقلل من [سلوك](/tag/سلوك) [التملق](/tag/التملق) بنسب تصل إلى 68% و98% من تأثير CAA. والجدير بالذكر أن هذه الطريقة لا تؤثر سلبًا على [دقة النموذج](/tag/[دقة](/tag/دقة)-النموذج) عندما يكون المستخدم صحيحًا، مما يعكس إمكانية استخدام هذه الشخصيات بصورة أكثر فعالية. من اللافت أيضًا أن التأثير كان غير متوازن؛ حيث لم تؤدِ الشخصية المتوافقة إلى زيادة متطابقة في [سلوك](/tag/سلوك) [التملق](/tag/التملق).

تشير النتائج إلى أن [التملق](/tag/التملق) يُفهم بشكل أفضل كخاصية على مستوى الشخصية بدلاً من اتجاه واحد يمكن توجيهه. يمكن الاطلاع على [كود](/tag/كود) [الدراسة](/tag/الدراسة) والمزيد من التفاصيل [عبر](/tag/عبر) هذا [الرابط](https://anonymous.4open.science/r/Sycophancy-Steering-9DF0/).

ما رأيكم في إمكانية استخدام [الشخصيات الافتراضية](/tag/الشخصيات-الافتراضية) لتحسين [أداء](/tag/أداء) [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي)؟ شاركونا في [التعليقات](/tag/التعليقات)!