🏷️ #Grokking
3 مقال
أبحاث
فهم التأثير البنيوي: كيف تحتاج نماذج المحولات (Transformers) إلى تذاكر بايزي (Bayesian Lottery Tickets) لتحقيق العمومية؟
أركايف للذكاءمنذ 18 يوم
أبحاث
اكتشاف قوانين التأخير في التعلم: نظرية جديدة لفهم ظاهرة الجروكينج!
أركايف للذكاءمنذ 1 شهر
أبحاث
اكتشاف زعزعة الانتروبيا الطيفية: سر التأخير في الاستيعاب في نماذج الذكاء الاصطناعي
أركايف للذكاءمنذ 1 شهر
