Ailoxa Logo

🏷️ #تعلم المعزز

10 مقال

CARE-RL: ثورة في تعزيز التعلم المتعدد المجالات لمواجهة التحديات بشكل ذكي!
أبحاث

CARE-RL: ثورة في تعزيز التعلم المتعدد المجالات لمواجهة التحديات بشكل ذكي!

أركايف للذكاءمنذ 3 يوم
ثورة التحكم: التعلم المعزز متعدد الوكلاء في قرارات الطائرات الرباعية!
أبحاث

ثورة التحكم: التعلم المعزز متعدد الوكلاء في قرارات الطائرات الرباعية!

أركايف للذكاءمنذ 3 يوم
ثورة في التعلّم المعزز: تحسين ثنائي المستويات عبر نقاط Saddle في ألعاب ماركوف صفرية المجموع
أبحاث

ثورة في التعلّم المعزز: تحسين ثنائي المستويات عبر نقاط Saddle في ألعاب ماركوف صفرية المجموع

أركايف للذكاءمنذ 9 يوم
هيرا: تنسيق ذكي بين الأجهزة والسحاب للوكيل اللغوي طويل الأمد
نماذج لغوية

هيرا: تنسيق ذكي بين الأجهزة والسحاب للوكيل اللغوي طويل الأمد

أركايف للذكاءمنذ 10 يوم
اكتشافات مثيرة حول تنوع الاستنتاج في إثباتات النظرية المدربة باستخدام التعزيز
أبحاث

اكتشافات مثيرة حول تنوع الاستنتاج في إثباتات النظرية المدربة باستخدام التعزيز

أركايف للذكاءمنذ 17 يوم
ثورة الذكاء الاصطناعي: تعلم النماذج اللغوية باستخدام التعزيز لفهم نوايا المستخدمين!
نماذج لغوية

ثورة الذكاء الاصطناعي: تعلم النماذج اللغوية باستخدام التعزيز لفهم نوايا المستخدمين!

أركايف للذكاءمنذ 22 يوم
تعلم المعزز مع تجميع الإجراءات: خطوة نحو تحسين الأداء في المهام الصعبة!
أبحاث

تعلم المعزز مع تجميع الإجراءات: خطوة نحو تحسين الأداء في المهام الصعبة!

أركايف للذكاءمنذ 24 يوم
استراتيجيات مختلطة لتعزيز التعلم المعزز بعد التدريب: كيف يدعم الترتيب الكنسي الأداء!
أبحاث

استراتيجيات مختلطة لتعزيز التعلم المعزز بعد التدريب: كيف يدعم الترتيب الكنسي الأداء!

أركايف للذكاءمنذ 29 يوم
CropVLM: ثورة جديدة في فهم الصور بفضل تقنية الزوم الديناميكي!
أبحاث

CropVLM: ثورة جديدة في فهم الصور بفضل تقنية الزوم الديناميكي!

أركايف للذكاءمنذ 1 شهر
تجربة جديدة مع Mini-R1: إعادة إنتاج لحظة الإلهام في التدريب على التعزيز
أبحاث

تجربة جديدة مع Mini-R1: إعادة إنتاج لحظة الإلهام في التدريب على التعزيز

هاجينج فيسمنذ 16 شهر