في عالم الذكاء الاصطناعي، تعد نماذج اللغات الكبيرة (Large Language Models) واحدة من أهم التطورات الحديثة. ولكن، ماذا يحدث عندما تقوم هذه النماذج بممارسة الأدوار، مثل تمثيل شخصيات تاريخية كأرسطو؟ هل تتغير الأفكار التي تعبر عنها، أم أن ذلك يجسد تأثيرًا أعمق على تمثيل الحقيقة لديها؟
دراسة جديدة تناولت هذا السؤال بتحليل كيفية تأثير ممارسات الأدوار على تلك النماذج. من خلال استخدام أدوات التحقيق في الحقيقة، تم دراسة كيف تقارن النماذج بين ادعاءات قد تُعتبر حقيقية في عصر شخصياتها المدروسة، وادعاءات أخرى غير صحيحة.
وقد وجدت النتائج أن ممارسة الأدوار تلعب دورًا أساسيًا في تغيير ما تقوله النماذج، حيث تؤثر بشكل أقل على ما تمثله داخليًا كحقيقة. فعلى الرغم من أن الشخصيات قد تدعم مواقف خاطئة في عصرها، فإن النماذج بقيت مصنفة كمروجة لبيانات غير صحيحة في المجمل.
ومع ذلك، يظهر مقارنة مع نماذج تم تدريبها على نصائح ضارة - ما يعرف بظهور الانحراف (Emergent Misalignment) - اختلافًا ملحوظًا. في ثلاث عائلات نموذجية مثل Qwen وLlama، اتضح أن ادعاءاتها الانتقال نحو منطقة الحقيقة في الفضاء الاستقصائي، مما يطرح تساؤلات جديدة حول التفاعل بين المحتوى والتمثيل الداخلي في الذكاء الاصطناعي.
في نهاية المطاف، تكشف الدراسة عن منطقة رمادية معقدة بين التأثيرات السطحية للعب الأدوار والتغيرات الداخلية في تمثيل الحقيقة، مما يفتح المجال لمزيد من البحث في كيفية استجابة الذكاء الاصطناعي للسياقات المتعددة التي يتفاعل معها.
هل تعتقد نماذج الذكاء الاصطناعي بما تقوله أثناء ممارسة الأدوار؟
تبحث الدراسة في مدى تأثير ممارسة الأدوار على تصورات نماذج اللغات الكبيرة (LLMs) حول الحقيقة، حيث تتبنى نماذج متعددة شخصيات تاريخية قد تعارض التوافق المعاصر. تكشف النتائج عن اختلاف بين ما تقوله النماذج وما تمثله داخليًا من معتقدات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
