في عالم الذكاء الاصطناعي، تلعب النماذج اللغوية الضخمة (Large Language Models) دورًا متزايد الأهمية كمحاكيات سلوكية تعكس أنماط التفكير البشرية. ولكن، تظل هناك تساؤلات حول متى يمكن أن تعكس مخرجاتها آليات إدراكية مماثلة للبشر بدلاً من أنماط سطحية حساسة للمحفزات.

تقدم دراسة جديدة تحليلاً عميقًا حول ما يعرف بتأثير التحقق، وهو مفهوم مأخوذ من العلوم السلوكية حيث يظهر أن اتخاذ المخاطر يختلف بشكل منهجي بين المكاسب الورقية والمكاسب المحققة. من خلال دراسة سلوك النماذج اللغوية، يتم تقييمها على ثلاثة مستويات مهمة:
1. **حساسية السلوك بناءً على المحفزات** فقط.
2. **الاستخراج الخطي** للممثلين الداخليين.
3. **التحكم السببي** عبر توجيه التنشيط.

تظهر نتائج المستوى الأول وجود حساسية منهجية تجاه الشروط، ولكن الأنماط الاتجاهية لا تعكس توقعات البشر حول تأثير التحقق. كما أظهرت البيانات أن دفق Gemma المتبقي يحتوي على إشارة حالة تحققية يمكن فك تشفيرها خطيًا في الطبقة 18، وهذه الإشارة تتعمق لتشمل محفزات مخفية. ومع ذلك، فإن التوجيه في هذا الاتجاه لم يؤدي بشكل موثوق إلى تغيير خيارات المخاطر في المستويات السفلية، مما يشير إلى نتيجة غير حاسمة تتكرر عبر مقاييس إيجابية وأيضًا في تجارب ذات تناظر سالب.

يُظهر التحليل أن حساسية السلوك وقراءة الممثلين الكامنة والتحكم السببي هي خصائص ثلاثية متميزة لا تتواجد دائمًا معًا. وفي النهاية، فإن إثبات القراءة الكامنة الناجحة لا يعتبر دليلاً كافيًا على أن النموذج يعتمد سلوكيًا على تمثيل ما أثناء اتخاذ القرارات في المستويات السفلية.

هل تعتقد أن النماذج اللغوية الضخمة قادرة على محاكاة السلوك الإنساني بفعالية؟ شاركونا آراءكم في التعليقات!