في مجالات الذكاء الاصطناعي، تتناول دراسات جديدة الطرق التي تستخدمها نماذج اللغات الضخمة (Large Language Models) للتفكير الزمني وفهم المدخلات الزمنية. يظهر البحث الأخير أن القياسات المستخدمة لفهم كيف تفكر النماذج قد تكون مضللة للغاية.

تمتلك نماذج اللغة قدرة مدهشة على فهم المعلومات، لكن ماذا يحدث عندما يتم اختبارها في سياق الزمن؟ توضح النتائج أن "أداة القارئ"، التي تقيس الزمن، قد لا تعكس في بعض الأحيان كيفية معالجة النماذج لمعلومات الوقت. على سبيل المثال، استخدام أداة تعتمد على دوال جيب التمام (sin/cos) يمكن أن يستخرج معلومات عن يوم السنة، لكن عند تعديل هذا الاتجاه، لا تتأثر الإجابات التي تقدمها النماذج.

الأكثر إثارة هو اكتشاف ما يسمى بـ"زاوية الوسيط القارئ"، التي تظهر أن البيانات المستخرجة عن طريق الأدوات قد تكون في اتجاه عمودي على كيفية معالجة النموذج للمعلومات الأساسية. وهذا يعني أن أدوات القياس قد تكون تعلمت شيئًا يختلف تمامًا عن ما يفكر فيه النموذج بالفعل.

تظهر الدراسة أن هناك انفصالًا بين الميزات المستخرجة من الأداة والميزات المستندة إلى ترتيب التوزيع (DAS)، مما يشير إلى عدم وجود تداخل سببي بين المفاهيم التي تعالجها. هذه النتائج تشير إلى أن مشكلة "عمودية الوسيط القارئ" قد تكون نمطاً عاماً من الفشل في تفسير الذكاء الاصطناعي، مما يهدد أثر مقترحات نشر أدوات القارئ كمراقبات لأمان التشغيل.

إن هذا الاكتشاف يسلط الضوء على أهمية فهم كيف تعمل النماذج بالفعل وليس مجرد ما تُظهره أدوات القياس. إن النجاح في التعامل مع هذه التحديات يعني بناء فهم أعمق لكيفية استخدام الذكاء الاصطناعي في مواقف الحياة اليومية.