في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغة الكبيرة (Large Language Models) من الإنجازات التقنية البارزة، ولكن ما يحدث داخلها عندما تتعامل مع البيانات العددية؟ دراسة جديدة تسلط الضوء على ظاهرة الإدراك الفئوي (Categorical Perception) التي تعني زيادة التمييز عند حدود الفئات. تم إجراء تحليل مكثف على ستة نماذج تمثل خمس عائلات معمارية، وكشفت النتائج عن وجود تشوهات هندسية في تمثيلات الحالة الخفية لهذه النماذج.

تتجلى الظاهرة بشكل واضح عند الانتقال بين الأعداد لدى حدود عددية معينة مثل 10 و100، بينما لا تُظهر النماذج نفس التأثير عند مواقع تحكم أخرى. يشير البحث إلى أن نموذج إدراك فئوي مضاف (CP-additive model) يلائم الجيومتري التمثيلي بشكل أفضل من نموذج مستمر بحت، مما يعكس تعقيد كيفية استجابة العناصر العددية وتحليلها من قبل النماذج.

تظهر الدراسة أيضًا نوعين متميزين: "الإدراك الفئوي الكلاسيكي"، حيث تقوم النماذج بتصنيف البيانات وإظهار تشوهات هندسية، و"الإدراك الفئوي الهيكلي"، حيث تنحرف الهندسة عند الحدود لكن النماذج لا تستطيع الإبلاغ عن تمييز الفئات. هذه النتائج تثير تساؤلات مهمة حول كيف تتفاعل نماذج اللغة الكبيرة مع المعلومات العددية، وكيف يمكن لمكونات معينة من المعمارية أن تؤثر على الابتكار في مجال الذكاء الاصطناعي.