في عالم الذكاء الاصطناعي، تعتبر الشبكات العصبية من الأدوات الرئيسية لتعلم الأنماط وتحقيق التعميم. ومع ذلك، تظهر أحيانًا ظاهرة مثيرة تُعرف باسم "التجذر" (Grokking)، والتي تمثل تأخرًا في القدرة على تعميم المعرفة المكتسبة حتى بعد التوافق مع بيانات التدريب.

تناولت دراسة جديدة تم نشرها على منصة arXiv، والتي حملت الرقم arXiv:2606.13753v1، مسألة جدلية حول ما إذا كان وزن المعايير (Weight Norm) هو الذي يتسبب في هذا التأخير. حيث أظهرت بعض الأبحاث وجود معيار حرج في هذه النقطة الانتقالية، بينما لاحظت دراسات أخرى وجود التجذر دون الحاجة إلى معيار محدد.

من خلال التدخل في وزن المعايير أثناء عملية التدريب، بدلاً من مشاهدته فقط، توصل الباحثون إلى نتائج مدهشة. فبينما يتعلم الشبكات بشكل حر مع تقليل الوزن، فإنها تصل لمرحلة التجذر عندما يبلغ وزن المعايير قيمة معينة تدعى Wc، والتي تتباين قليلاً عبر التجارب ومعدلات التعلم. ويؤكد الباحثون أن هذه القيمة تنمو وفقًا لقانون قوي معتمد على الأس الأساس المودولي.

وعندما يتم تثبيت الوزن عند مضاعف ثابت لـ Wc، تستمر الشبكة في التجذر، ولكن التأخير يصبح متناسباً مع دالة أسية تعتمد على قيمة معينة. وقد أظهرت النتائج أن هناك علاقة قوية بين هذه الأسس ورموز R^2 المعروفة، مما يفتح المجال لفهم أعمق للعلاقة بين وزن المعايير وبقية الوظائف في الشبكات.

تتوج هذه الاكتشافات بفهم جديد يوضح كيف يمكن لعمل وزن معين أن يؤثر بشكل كبير على زمن التجذر، مما يساهم في تطوير أساليب تدريب أكثر فعالية. إن فهم هذه الظواهر يمكن أن يؤدي إلى تحسينات كبيرة في أداء الشبكات العصبية في المستقبل.