في الآونة الأخيرة، أظهرت نماذج اللغات الضخمة (Large Language Models) قدرتها على محاكاة سمات الشخصية الإنسانية وفقًا لنموذج OCEAN، حيث تم التركيز سابقًا على تقنيات مثل الهندسة الترويجية أو الضبط الدقيق. لكن في هذه الدراسة المثيرة، نقترح نهجًا جديدًا يعتمد على التفسير الميكانيكي يتدخل مباشرة في الخصائص الكامنة لنماذج اللغة.

تستند طريقتنا إلى تحديد الاتجاهات الكامنة في التدفق المتبقي الذي يتوافق مع سمة شخصية معينة من سمات OCEAN باستخدام الأكواد التلقائية النادرة (Sparse Autoencoders) وتحليل التنشيط المقارن (Contrastive Activation Analysis). لقد قمنا بصياغة متجه توجيهي إضافي في مساحة التنشيط يُظهر كيفية إضافة تغيير صغير إلى الحالات المخفية لتعزيز السمة المستهدفة مع الحفاظ على الأداء العام لنمذجة اللغة.

من أجل تحديد المجموعة المثلى من تحولات الخصائص، استكشفنا منهجية وزن خطي مع تحسين الشبكة لتنسيق التعبير عن الشخصية مع أداء المهمة. تقدم طريقتنا واعد لتوجيه سمات الشخصية بشكل ملحوظ على المستوى الميكانيكي، مما يحافظ أيضًا على أداء عالٍ على المعايير القياسية.

في ظل هذه الأبحاث المتقدمة، تبرز الحاجة إلى المزيد من الابتكارات في مجال الذكاء الاصطناعي للتحكم في سمات الشخصية بصورة دقيقة. هذا التوجه الجديد يساعد الباحثين والمطورين في بناء نماذج أكثر تعبيرًا وملاءمة للاحتياجات الإنسانية، مما يفتح آفاقاً جديدة في استخدامات الذكاء الاصطناعي.