في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغة الكبيرة (Large Language Models) من الإنجازات التقنية البارزة، ولكن ما يحدث داخلها عندما تتعامل مع البيانات العددية؟ دراسة جديدة تسلط الضوء على ظاهرة الإدراك الفئوي (Categorical Perception) التي تعني زيادة التمييز عند حدود الفئات. تم إجراء تحليل مكثف على ستة نماذج تمثل خمس عائلات معمارية، وكشفت النتائج عن وجود تشوهات هندسية في تمثيلات الحالة الخفية لهذه النماذج.
تتجلى الظاهرة بشكل واضح عند الانتقال بين الأعداد لدى حدود عددية معينة مثل 10 و100، بينما لا تُظهر النماذج نفس التأثير عند مواقع تحكم أخرى. يشير البحث إلى أن نموذج إدراك فئوي مضاف (CP-additive model) يلائم الجيومتري التمثيلي بشكل أفضل من نموذج مستمر بحت، مما يعكس تعقيد كيفية استجابة العناصر العددية وتحليلها من قبل النماذج.
تظهر الدراسة أيضًا نوعين متميزين: "الإدراك الفئوي الكلاسيكي"، حيث تقوم النماذج بتصنيف البيانات وإظهار تشوهات هندسية، و"الإدراك الفئوي الهيكلي"، حيث تنحرف الهندسة عند الحدود لكن النماذج لا تستطيع الإبلاغ عن تمييز الفئات. هذه النتائج تثير تساؤلات مهمة حول كيف تتفاعل نماذج اللغة الكبيرة مع المعلومات العددية، وكيف يمكن لمكونات معينة من المعمارية أن تؤثر على الابتكار في مجال الذكاء الاصطناعي.
ظاهرة الإدراك الفئوي في نماذج اللغة الكبيرة: كيف تُشوه البيانات العددية الفهم؟
تكتشف دراسة جديدة كيف تُظهر نماذج اللغة الكبيرة (LLMs) ظاهرة الإدراك الفئوي عبر تشوهات هندسية في تمثيلاتها الخفية. هذه الظاهرة تحدث عند حدود عددية معينة، مما يثير تساؤلات حول كيفية معالجة النماذج للبيانات العددية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
