Ailoxa Logo

🏷️ #تدريب النماذج

36 مقال

ثورة هندسة معدل التعلم: كيف تطورت الاستراتيجيات من البساطة إلى التكامل المعقد!
أبحاث

ثورة هندسة معدل التعلم: كيف تطورت الاستراتيجيات من البساطة إلى التكامل المعقد!

أركايف للذكاءمنذ 1 شهر
هل يؤدي تقليم الأوزان الصغيرة إلى تدهور مهارات الذكاء الاصطناعي؟ اكتشافات جديدة مثيرة حول نموذجنا اللغوي!
أبحاث

هل يؤدي تقليم الأوزان الصغيرة إلى تدهور مهارات الذكاء الاصطناعي؟ اكتشافات جديدة مثيرة حول نموذجنا اللغوي!

أركايف للذكاءمنذ 1 شهر
إيلون ماسك يكشف السر: كيف قامت xAI بتدريب Grok باستخدام نماذج OpenAI!
أبحاث

إيلون ماسك يكشف السر: كيف قامت xAI بتدريب Grok باستخدام نماذج OpenAI!

تيك كرانشمنذ 1 شهر
تحويل الأمواج: تقنية GWT لتعزيز أداء نماذج اللغة الكبيرة بكفاءة مذهلة!
نماذج لغوية

تحويل الأمواج: تقنية GWT لتعزيز أداء نماذج اللغة الكبيرة بكفاءة مذهلة!

أركايف للذكاءمنذ 1 شهر
كيف يؤثر انخفاض معدل التعلم على جودة بيانات التدريب في نماذج اللغات الكبيرة!
أبحاث

كيف يؤثر انخفاض معدل التعلم على جودة بيانات التدريب في نماذج اللغات الكبيرة!

أركايف للذكاءمنذ 1 شهر
تقنية veScale-FSDP: ثورة في تدريب النماذج الكبيرة بكفاءة عالية ومرونة مذهلة!
أبحاث

تقنية veScale-FSDP: ثورة في تدريب النماذج الكبيرة بكفاءة عالية ومرونة مذهلة!

أركايف للذكاءمنذ 1 شهر
تحسين نماذج الذكاء الاصطناعي: تقنيات جديدة للتقليل من آثار البيانات المشوهة
أبحاث

تحسين نماذج الذكاء الاصطناعي: تقنيات جديدة للتقليل من آثار البيانات المشوهة

أركايف للذكاءمنذ 1 شهر
تحديث TRL v1.0: مكتبة مبتكرة لإدارة نتائج تدريب الذكاء الاصطناعي!
أبحاث

تحديث TRL v1.0: مكتبة مبتكرة لإدارة نتائج تدريب الذكاء الاصطناعي!

هاجينج فيسمنذ 2 شهر
هل يُمكن لتقنية NVFP4 تحسين أداء نماذج الذكاء الاصطناعي دون التضحية بالدقة؟
أبحاث

هل يُمكن لتقنية NVFP4 تحسين أداء نماذج الذكاء الاصطناعي دون التضحية بالدقة؟

مدونة إنفيديا للذكاءمنذ 3 شهر
ثلاث طرق مدهشة لتعجيل تدريب واستدلال الذكاء الاصطناعي باستخدام NVFP4
أبحاث

ثلاث طرق مدهشة لتعجيل تدريب واستدلال الذكاء الاصطناعي باستخدام NVFP4

مدونة إنفيديا للذكاءمنذ 3 شهر
ثورة نماذج اللغة: تسريع تدريبات النماذج ذات السياقات الطويلة باستخدام JAX وXLA
أبحاث

ثورة نماذج اللغة: تسريع تدريبات النماذج ذات السياقات الطويلة باستخدام JAX وXLA

مدونة إنفيديا للذكاءمنذ 4 شهر
تعرف على Accelerate ND-Parallel: دليلك لتسريع التدريب المتعدد على معالجات الرسوميات!
أبحاث

تعرف على Accelerate ND-Parallel: دليلك لتسريع التدريب المتعدد على معالجات الرسوميات!

هاجينج فيسمنذ 10 شهر
زيادة كفاءة تدريب نماذج هاجينج فيس باستخدام تقنية التعبئة مع فلاش أتينشن 2
أبحاث

زيادة كفاءة تدريب نماذج هاجينج فيس باستخدام تقنية التعبئة مع فلاش أتينشن 2

هاجينج فيسمنذ 21 شهر
كيف تدرب وتعدل نماذج التضمين باستخدام التحولات الجملية (Sentence Transformers) الإصدار الثالث؟
أبحاث

كيف تدرب وتعدل نماذج التضمين باستخدام التحولات الجملية (Sentence Transformers) الإصدار الثالث؟

هاجينج فيسمنذ 24 شهر
استكشف أسرار التكنولوجيا وراء تدريب نموذج BLOOM المتقدم!
نماذج لغوية

استكشف أسرار التكنولوجيا وراء تدريب نموذج BLOOM المتقدم!

هاجينج فيسمنذ 47 شهر
سريعاً وبسهولة: تسريع تدريب النماذج الكبيرة باستخدام DeepSpeed!
أدوات

سريعاً وبسهولة: تسريع تدريب النماذج الكبيرة باستخدام DeepSpeed!

هاجينج فيسمنذ 47 شهر