🏷️ #محسنات

9 مقال

جيفن: محسن عشوائي مبتكر يوفر الذاكرة بمعدل مذهل!

جيفن: محسن عشوائي مبتكر يوفر الذاكرة بمعدل مذهل!

أركايف للذكاءمنذ 5 يوم

ثورة جديدة في الذكاء الاصطناعي: LoRA-Muon يُغيِّر قواعد الأداء في النماذج التعليمية

نماذج لغوية

ثورة جديدة في الذكاء الاصطناعي: LoRA-Muon يُغيِّر قواعد الأداء في النماذج التعليمية

أركايف للذكاءمنذ 8 يوم

FOGO: المحسن الذكي الذي يحارب النسيان في الذكاء الاصطناعي!

FOGO: المحسن الذكي الذي يحارب النسيان في الذكاء الاصطناعي!

أركايف للذكاءمنذ 10 يوم

تصحيح الانحياز العشوائي في محسنات نماذج اللغة: ثورة في تدريب الذكاء الاصطناعي!

تصحيح الانحياز العشوائي في محسنات نماذج اللغة: ثورة في تدريب الذكاء الاصطناعي!

أركايف للذكاءمنذ 29 يوم

تحكم رائد في سرعة التعلم: كيف يحقق Muon ثورة في تحسين الشبكات العصبية!

تحكم رائد في سرعة التعلم: كيف يحقق Muon ثورة في تحسين الشبكات العصبية!

أركايف للذكاءمنذ 1 شهر

استكشاف وادي النماذج اللغوية: من AdamW إلى المحسنات الفعّالة ذاكراتياً والمعتمدة على المصفوفات!

استكشاف وادي النماذج اللغوية: من AdamW إلى المحسنات الفعّالة ذاكراتياً والمعتمدة على المصفوفات!

أركايف للذكاءمنذ 1 شهر

لماذا يعمل أدم بشكل أفضل عندما يكون $eta_1 = eta_2$: المبدأ الغامض لثبات مقاييس التدرجات

لماذا يعمل أدم بشكل أفضل عندما يكون $eta_1 = eta_2$: المبدأ الغامض لثبات مقاييس التدرجات

أركايف للذكاءمنذ 1 شهر

تحسين النموذج: لماذا استخدام نفس المحسّن في التدريب يحقق نتائج أفضل؟

تحسين النموذج: لماذا استخدام نفس المحسّن في التدريب يحقق نتائج أفضل؟

أركايف للذكاءمنذ 1 شهر

ابتكار من نوع جديد: Anon يعيد رسم معالم تحسين الأداء في الذكاء الاصطناعي!

ابتكار من نوع جديد: Anon يعيد رسم معالم تحسين الأداء في الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر