في عالم الذكاء الاصطناعي، يعد فهم سلوك النماذج ذات المعلمات المفرطة (Over-parameterized Models) أمراً أساسياً. دراسة جديدة تتناول الحالة المثيرة للتعايش بين التذكر والتعميم تحت ظروف صعبة، حيث يتم التعامل مع مهام حسابية تتضمن ضوضاء في التسمية.

خلال التجارب المكثفة على الشبكات العصبية الثنائية الطبقات، تبين أن النماذج الأكبر حجماً تميل إلى تحقيق نتائج عامة أفضل عند اعتماد تكوينات وتحسينات ملائمة. وعلى الرغم من الفوضى التي تسببت بها التسمية الملوثة، فإن النماذج تسجل تذكراً أسرع لهذه البيانات مقارنة بالبيانات النظيفة.

تشير النتائج إلى أن النماذج ذات المعلمات المفرطة تُشكل هيكلة داخلية للتعميم، لكن التعبير عن هذه الهيكلية في المخرجات يقيّد بفعل الحاجة لتناسب البيانات الملوثة. لافتة للانتباه، حتى مع وجود 80% من الضوضاء في التسمية، يمكن الوصول إلى دقة اختبار قريبة من الكمال من خلال استخدام أساليب قائمة على التكرار لاستخراج الهيكل الداخلي.

علاوة على ذلك، اقترح الباحثون طريقة مستقلة عن المهمة لتقسيم الشبكات إلى مكونات التعميم والتذكر. ومع أن هذا الهيكل الفرعي يحسن التعميم، إلا أنه يظل محدوداً مقارنة باستخراج البيانات المعتمد على التكرار. مما يسلط الضوء على أن بنية التعميم موزعة عبر الخلايا العصبية، مما يحفز الحاجة إلى تطوير أدوات جديدة لاسترجاع المعرفة القابلة للتعميم من الشبكات ذات المعلمات المفرطة.