في عالم الذكاء الاصطناعي، يبقى فهم أهداف الأنظمة والوكيل (Agent) أمرًا محوريًا لتفسير سلوكها وتوقعه. ولكن حتى الآن، لم يكن هناك إطار عمل موحد يمكن من نسب الأهداف بموثوقية لهذه الأنظمة. لذا، نقدم هنا دراسة جديدة تعتمد على إطار تقييم توجيه الأهداف، والذي يمزج بين التقييم السلوكي والتحليلات المستندة إلى القابلية للتفسير لممثلات النماذج الداخلية.

كجزء من هذا البحث، أجرينا دراسة حالة لوكيل نموذج لغوي كبير (LLM) يتنقل في عالم ثنائي الأبعاد (2D Grid World) نحو حالة هدف محددة. ومن خلال التقييم السلوكي، قارنّا أداء الوكيل بمقاييس مثالية عبر أحجام مختلفة من الشبكة وكثافة العقبات وبناء الأهداف، ووجدنا أن أدائه يتناسب مع صعوبة المهام بينما يظل قويًا أمام التحولات التي تحافظ على صعوبة المهمة والهياكل متعددة الأهداف.

كما استخدمنا أساليب الاستقصاء (Probing Methods) لفك شفرة التمثيلات الداخلية للبيئة وخطط العمل متعددة الخطوات. وأظهرنا أن الوكيل (LLM) يقوم بشكل غير خطي بتشفير خريطة فضائية تقريبية، حيث يحافظ على إشارات ذات صلة بالمهمة about موقعه وموقع الهدف. وأن أفعاله تتسق بشكل واسع مع هذه التمثيلات الداخلية، بالإضافة إلى أن عملية التفكير تعيد تنظيم هذه التمثيلات، حيث تتحول من إشارة مكانية إلى اختيار فوري للعمل.

تعزز نتائجنا الرأي القائل إن الفحص الباطني (Introspective Examination) مطلوب إلى جانب التقييمات السلوكية لتوصيف كيفية تمثيل الوكلاء لأهدافهم والسعي لتحقيقها. إن التعمق في الإدراك الذاتي يُعد خطوة ضرورية لفهم أعمق لكيفية تفكير وكالات الذكاء الاصطناعي والسلوك الناتج عنها.