في عصر يصعب فيه تجاهل تأثير الذكاء الاصطناعي (AI)، تبرز أهمية فهم سلوكيات النماذج اللغوية الكبيرة متعددة الوسائط (MLLMs) خاصةً في ظل التفاعل الاجتماعي. دراسة جديدة تقدم رؤية فريدة حول كيفية التحكم في هذه النماذج تحت ظروف شخصيات معقدة.

تقوم الدراسة بتقديم مفهوم جديد لشرط الشخصية (Personality Conditioning) وتحدد إطار تقييم منهجي يشمل إدخال شخصية واحدة، إدخال شخصيات متعددة، وتبديل الشخصيات.

أظهرت التجارب أن إدخال شخصية إلى النماذج يحسن من أداء التسمية التلقائية للصور، بينما يمكن أن يؤثر سلباً على المهام التي تتطلب دقة في التفكير، مثل الإجابة على الأسئلة البصرية (Visual Question Answering - VQA).

تم ملاحظة تأثيرات متوازنة ومتبقية أثناء التأليف متعدد الخصائص والتبديل الديناميكي، مما يشير إلى أن سلوك النموذج يتفاعل بشكل معقد بين شروط الشخصية السابقة والحالية. ومع ذلك، تبين أن الطرق الحالية القائمة على الاستدلال في إدخال الشخصية تظهر قدرة محدودة على النقل إلى الإعدادات متعددة الوسائط.

تسلط هذه الدراسة الضوء على الطبيعة الديناميكية والمعقدة لنمذجة الشخصية في MLLMs، مما يبرز الحاجة إلى طرق موثوقة ومخصصة لإدخال وتقييم الشخصيات. سيتم إصدار كود التجارب في حال قبول الورقة.