في عالم الذكاء الاصطناعي، تمثل نماذج اللغات الضخمة (Large Language Models) أحد أبرز التطورات التقنية، لكن هل فكرتم يومًا في كيفية تعاطيها مع العمليات الحسابية البسيطة؟ دراسة جديدة نشرت في arXiv تسلط الضوء على تأثير الهياكل الهندسية في فهم هذه النماذج لعمليات الإضافة المتعددة.
تشير الدراسة إلى وجود نقطة ضعف غريبة في هذه النماذج عندما يتعلق الأمر بالحساب. يظهر ذلك بشكل واضح في الفرق بين حسابها الداخلي وإخراجها النهائي. عبر تحليل الجيوميتري الخاص بتدفق البقايا أثناء عمليات الإضافة المتعددة، تم التعرف على مسار الزيادة الخام الإيزو (Iso-Raw-Sum Trajectory)؛ وهو شكل هندسي حيث ترتبط التمثيلات بالأرقام الدلالية ويتم تعديلها بواسطة ألياف الحمل المستمرة.
بالإضافة إلى ذلك، يقدم الباحثون نموذج التحويل المشوش (Noisy Quantization Model) لتفسير هذه الهندسة. حيث يعرضون الأخطاء الحسابية كتحولات هندسية تتسبب فيها الضوضاء الداخلية للشبكة العصبية، مما يدفع بإمكانيات الحمل اللاتيني عبر عتبات التحويل.
تضيف هذه الإطار الهندسي المزيد من الوضوح لفهم تنوع البروبي (Probe Versatility)، حيث يمكن استخدام البروبي الخفيفة لتفكيك الإشارات الكامنة المتداخلة، مثل الحقيقة مقابل الهلاوس، من مجرد ناقل تنشيط واحد.
وفي نهاية الدراسة، تم التحقق من هذه الرؤى بواسطة طريقة تحقق من الاتساق الهندسي التي تكتشف وتصحح هذه الإخفاقات في التحويل أثناء الاستدلال. لمزيد من التفاصيل، يمكنكم الوصول إلى الكود المقدم عبر GitHub: رابط الكود.
ما رأيكم في هذا التطور المثير؟ هل تعتقدون أن الهياكل الهندسية ستغير كيفية تطوير النماذج اللغوية في المستقبل؟ شاركونا في التعليقات.
العمليات الحسابية في نماذج اللغات الضخمة: كيف تتشكل الهياكل الهندسية للإضافة؟
توضح دراسة جديدة كيفية ظهور الهياكل الهندسية في نماذج اللغات الضخمة خلال العمليات الحسابية. يتناول البحث قضايا دقة العمليات ويقترح نماذج جديدة تشرح الأخطاء الحسابية كتحولات هندسية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
