Ailoxa Logo

🏷️ #تعلم معزز

278 مقال

ثورة التحكم بالإشارات المرورية: تعرف على ReasonLight، نموذج التعلم المعزز متعدد الاستخدامات!
أبحاث

ثورة التحكم بالإشارات المرورية: تعرف على ReasonLight، نموذج التعلم المعزز متعدد الاستخدامات!

أركايف للذكاءمنذ 7 يوم
متى يجب على النماذج تغيير آرائها؟ إدارة المعتقدات السياقية في نماذج اللغات الضخمة
نماذج لغوية

متى يجب على النماذج تغيير آرائها؟ إدارة المعتقدات السياقية في نماذج اللغات الضخمة

أركايف للذكاءمنذ 7 يوم
اكتشف عالم البيئات الإجرائية لتعزيز الكفاءة في نظام Unix من خلال التعلم المعزز!
أبحاث

اكتشف عالم البيئات الإجرائية لتعزيز الكفاءة في نظام Unix من خلال التعلم المعزز!

أركايف للذكاءمنذ 7 يوم
ثورة الذكاء الاصطناعي: نموذج مراقبة متقدمة مع تسريع CUDA يعزز الأداء والكفاءة!
أبحاث

ثورة الذكاء الاصطناعي: نموذج مراقبة متقدمة مع تسريع CUDA يعزز الأداء والكفاءة!

أركايف للذكاءمنذ 7 يوم
استكشاف التعلم المعزز القائم على المصادر لتحسين توليد اللغات ذات الموارد المحدودة!
أبحاث

استكشاف التعلم المعزز القائم على المصادر لتحسين توليد اللغات ذات الموارد المحدودة!

أركايف للذكاءمنذ 7 يوم
ثورة جديدة في تعلم الآلة: تحسين سياسة التفاؤل الهستيري لتحسين التدريب بجوائز نادرة!
أبحاث

ثورة جديدة في تعلم الآلة: تحسين سياسة التفاؤل الهستيري لتحسين التدريب بجوائز نادرة!

أركايف للذكاءمنذ 7 يوم
هل يمكن نماذج المكافأة العملية تحسين أداء الذكاء الاصطناعي؟ اكتشفوا المفاجأة وراء GRPO!
أبحاث

هل يمكن نماذج المكافأة العملية تحسين أداء الذكاء الاصطناعي؟ اكتشفوا المفاجأة وراء GRPO!

أركايف للذكاءمنذ 7 يوم
ثورة جديدة في التعلم المعزز: السياسات الجيلية التوليدية تُغير قواعد اللعبة!
أبحاث

ثورة جديدة في التعلم المعزز: السياسات الجيلية التوليدية تُغير قواعد اللعبة!

أركايف للذكاءمنذ 7 يوم
اكتشاف الطبقات السلوكية المستمرة في نماذج اللغة الكبيرة من خلال التفاعل البشري المستدام
أبحاث

اكتشاف الطبقات السلوكية المستمرة في نماذج اللغة الكبيرة من خلال التفاعل البشري المستدام

أركايف للذكاءمنذ 8 يوم
كيف تؤثر صعوبة العينة على أداء نماذج اللغات الضخمة؟ اكتشافات جديدة في التعلم المعزز!
أبحاث

كيف تؤثر صعوبة العينة على أداء نماذج اللغات الضخمة؟ اكتشافات جديدة في التعلم المعزز!

أركايف للذكاءمنذ 8 يوم
تعزيز الأداء: استخدام التعلم المعزز غير المتصل لتحسين نماذج البرمجة الذكية!
أبحاث

تعزيز الأداء: استخدام التعلم المعزز غير المتصل لتحسين نماذج البرمجة الذكية!

أركايف للذكاءمنذ 8 يوم
تكنولوجيا TRACER: إعادة تصور التعاون بين نماذج اللغات الكبيرة بأسلوب مبتكر!
نماذج لغوية

تكنولوجيا TRACER: إعادة تصور التعاون بين نماذج اللغات الكبيرة بأسلوب مبتكر!

أركايف للذكاءمنذ 8 يوم
VCap: مكافآت هايبرgeometrics لتعزيز قوة التسمية البصرية!
أبحاث

VCap: مكافآت هايبرgeometrics لتعزيز قوة التسمية البصرية!

أركايف للذكاءمنذ 8 يوم
OmniVerifier-M1: الثورة في التحقق متعدد الوسائط بتقنيات جديدة تضمن دقة أعلى!
نماذج لغوية

OmniVerifier-M1: الثورة في التحقق متعدد الوسائط بتقنيات جديدة تضمن دقة أعلى!

أركايف للذكاءمنذ 8 يوم
إطلاق InfiMed-ORBIT: ثورة في تدريب نماذج اللغة على المهام الطبية المفتوحة!
أبحاث

إطلاق InfiMed-ORBIT: ثورة في تدريب نماذج اللغة على المهام الطبية المفتوحة!

أركايف للذكاءمنذ 8 يوم
استخدام الديناميات المحلية لتحسين مهارات التعلم المعزز الهرمي
أبحاث

استخدام الديناميات المحلية لتحسين مهارات التعلم المعزز الهرمي

أركايف للذكاءمنذ 9 يوم
تحويل الحوار الثابت إلى تجربة تفاعلية: كيف تعالج خوارزمية جديدة مشكلات التحول في التوزيع!
نماذج لغوية

تحويل الحوار الثابت إلى تجربة تفاعلية: كيف تعالج خوارزمية جديدة مشكلات التحول في التوزيع!

أركايف للذكاءمنذ 9 يوم
ثورة في التعلم المعزز: تقنية جديدة لتوزيع الائتمان باستخدام الرسوم البيانية!
أبحاث

ثورة في التعلم المعزز: تقنية جديدة لتوزيع الائتمان باستخدام الرسوم البيانية!

أركايف للذكاءمنذ 9 يوم
عمق التفكير وتعقيد البيئة: دراسة جديدة حول تخصيص بيانات RLVR في مهام الاستدلال المنطقي!
أبحاث

عمق التفكير وتعقيد البيئة: دراسة جديدة حول تخصيص بيانات RLVR في مهام الاستدلال المنطقي!

أركايف للذكاءمنذ 9 يوم
إعادة هندسة بيانات ما بعد التدريب للذكاء الاصطناعي: كيف يمكن لنماذج اللغة الكبيرة تحسين أدائها باستخدام المعلومة الداخلية!
أبحاث

إعادة هندسة بيانات ما بعد التدريب للذكاء الاصطناعي: كيف يمكن لنماذج اللغة الكبيرة تحسين أدائها باستخدام المعلومة الداخلية!

أركايف للذكاءمنذ 9 يوم