Ailoxa Logo

🏷️ #محسنات

9 مقال

جيفن: محسن عشوائي مبتكر يوفر الذاكرة بمعدل مذهل!
أدوات

جيفن: محسن عشوائي مبتكر يوفر الذاكرة بمعدل مذهل!

أركايف للذكاءمنذ 5 يوم
ثورة جديدة في الذكاء الاصطناعي: LoRA-Muon يُغيِّر قواعد الأداء في النماذج التعليمية
نماذج لغوية

ثورة جديدة في الذكاء الاصطناعي: LoRA-Muon يُغيِّر قواعد الأداء في النماذج التعليمية

أركايف للذكاءمنذ 8 يوم
FOGO: المحسن الذكي الذي يحارب النسيان في الذكاء الاصطناعي!
أبحاث

FOGO: المحسن الذكي الذي يحارب النسيان في الذكاء الاصطناعي!

أركايف للذكاءمنذ 10 يوم
تصحيح الانحياز العشوائي في محسنات نماذج اللغة: ثورة في تدريب الذكاء الاصطناعي!
أبحاث

تصحيح الانحياز العشوائي في محسنات نماذج اللغة: ثورة في تدريب الذكاء الاصطناعي!

أركايف للذكاءمنذ 29 يوم
تحكم رائد في سرعة التعلم: كيف يحقق Muon ثورة في تحسين الشبكات العصبية!
أبحاث

تحكم رائد في سرعة التعلم: كيف يحقق Muon ثورة في تحسين الشبكات العصبية!

أركايف للذكاءمنذ 1 شهر
استكشاف وادي النماذج اللغوية: من AdamW إلى المحسنات الفعّالة ذاكراتياً والمعتمدة على المصفوفات!
أبحاث

استكشاف وادي النماذج اللغوية: من AdamW إلى المحسنات الفعّالة ذاكراتياً والمعتمدة على المصفوفات!

أركايف للذكاءمنذ 1 شهر
لماذا يعمل أدم بشكل أفضل عندما يكون $eta_1 = eta_2$: المبدأ الغامض لثبات مقاييس التدرجات
أبحاث

لماذا يعمل أدم بشكل أفضل عندما يكون $eta_1 = eta_2$: المبدأ الغامض لثبات مقاييس التدرجات

أركايف للذكاءمنذ 1 شهر
👁 1
تحسين النموذج: لماذا استخدام نفس المحسّن في التدريب يحقق نتائج أفضل؟
أبحاث

تحسين النموذج: لماذا استخدام نفس المحسّن في التدريب يحقق نتائج أفضل؟

أركايف للذكاءمنذ 1 شهر
ابتكار من نوع جديد: Anon يعيد رسم معالم تحسين الأداء في الذكاء الاصطناعي!
أبحاث

ابتكار من نوع جديد: Anon يعيد رسم معالم تحسين الأداء في الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر