في العقد الأخير، باتت الفهم العميق لقوانين التعميم (Generalization Laws) في مجال تعلم الآلة (Machine Learning) مسألة محورية، خاصة مع زيادة تعقيد النماذج واستخدام كميات ضخمة من البيانات. تناولت دراسة جديدة نُشرت في arXiv كيفية تأثير عرض النموذج (Model Width) وعدد المعلمات القابلة للتدريب، وكذلك عدد العينات، على أداء الشبكات العصبية التربيعية (Quadratic Neural Networks).

تعتبر قوانين التعميم وسيلة لقياس مدى قدرة النموذج على الأداء الجيد عند تطبيقه على بيانات جديدة، وقد ركزت الدراسات السابقة غالبًا على العلاقة بين التعميم وكمية البيانات أو القوة الحسابية في ظروف ثابتة. في هذه الدراسة، انطلق الباحثون من فرضية جديدة تدرس التعميم كمستخدمات لعدد المعلمات المتاحة وعدد العينات المُستخدمة.

انطلقت تحليلات الباحثين من نموذج شبكة عصبية ذات طبقتين، حيث تم استخدام تقنيات تنظيم (Regularization) لمنع التعلم المفرط (Overfitting). ووجدوا أن خطأ الاختبار لهذا النموذج يمكن توضيحه بشكل مباشر كمؤشر على عدد العينات وعرض النموذج.

تكشف النتائج عن وجود مخطط مراحل مع أنظمة قياس مختلفة تظهر تطورات في خطأ التعميم حسب عدد المعلمات. كما تظهر الدراسة أن أخطاء التعميم تتبع قوانين قوة تعتمد على البيانات، مما يشير إلى تأثير الهيكل الطيفي (Spectral Structure) للهدف على نتائج التعميم. وأيضًا، تم استكشاف الانتقالات بين الأنظمة وكيف تؤثر على الأداء العام للنماذج.

في نهاية المطاف، تعزز هذه الدراسة فهمنا الأعمق لآليات التعليم في نماذج الشبكات العصبية وتحرض على مزيد من الأبحاث لتطوير نماذج أكثر كفاءة واستجابة.