Ailoxa Logo

🏷️ #تعلم تعزيز

37 مقال

ثورة الذكاء الاصطناعي: تعلم تعزيز ذاتي للرحلات الجوية غير المأهولة
أبحاث

ثورة الذكاء الاصطناعي: تعلم تعزيز ذاتي للرحلات الجوية غير المأهولة

أركايف للذكاءمنذ 2 يوم
تعلم التعزيز المتين: ثورة في تفكيك صراعات الطائرات بدون طيار في بيئات عدائية
أبحاث

تعلم التعزيز المتين: ثورة في تفكيك صراعات الطائرات بدون طيار في بيئات عدائية

أركايف للذكاءمنذ 2 يوم
كيف تستطيع نماذج اللغات الضخمة تقييم قدراتها؟ اكتشاف جديد يثير الدهشة!
أبحاث

كيف تستطيع نماذج اللغات الضخمة تقييم قدراتها؟ اكتشاف جديد يثير الدهشة!

أركايف للذكاءمنذ 3 يوم
تعلم تعزيز عميق قابل للتفسير: ثورة إدارة الطاقة في المباني الذكية!
أبحاث

تعلم تعزيز عميق قابل للتفسير: ثورة إدارة الطاقة في المباني الذكية!

أركايف للذكاءمنذ 3 يوم
اكتشف منصة MobileGym: بيئة محاكية مبتكرة للبحث في واجهات المستخدم المحمولة!
أبحاث

اكتشف منصة MobileGym: بيئة محاكية مبتكرة للبحث في واجهات المستخدم المحمولة!

أركايف للذكاءمنذ 10 يوم
تحولات مثيرة في تعلم التعزيز: ثغرات عمودية لتقليل الأبعاد
أبحاث

تحولات مثيرة في تعلم التعزيز: ثغرات عمودية لتقليل الأبعاد

أركايف للذكاءمنذ 10 يوم
نموذج عالم الوكيل: بيئات صناعية بلا حدود لتعلم التعزيز الوكلي
أبحاث

نموذج عالم الوكيل: بيئات صناعية بلا حدود لتعلم التعزيز الوكلي

أركايف للذكاءمنذ 10 يوم
فهم تعميم الأهداف في تعلم التعزيز التسلسلي: خطوة نحو تطوير الذكاء الاصطناعي
أبحاث

فهم تعميم الأهداف في تعلم التعزيز التسلسلي: خطوة نحو تطوير الذكاء الاصطناعي

أركايف للذكاءمنذ 11 يوم
ثورة القيادة الذاتية: تعلم تعزيز متعدد الوكلاء لضمان الأمان في مواجهة سلوكيات المشاة الغامضة
أبحاث

ثورة القيادة الذاتية: تعلم تعزيز متعدد الوكلاء لضمان الأمان في مواجهة سلوكيات المشاة الغامضة

أركايف للذكاءمنذ 14 يوم
إعادة تعريف التواصل في تعلم التعزيز متعدد الوكيل: تحقيق الأداء العالي تحت قيود النطاق الترددي
أبحاث

إعادة تعريف التواصل في تعلم التعزيز متعدد الوكيل: تحقيق الأداء العالي تحت قيود النطاق الترددي

أركايف للذكاءمنذ 14 يوم
اكتشاف PREFINE: ثورة في تكييف سياسات التعزيز لضمان الأمان!
نماذج لغوية

اكتشاف PREFINE: ثورة في تكييف سياسات التعزيز لضمان الأمان!

أركايف للذكاءمنذ 14 يوم
ثورة في التعلم الآلي: TimeRewarder يحقق مكافآت كثيفة من الفيديوهات السلبية!
أبحاث

ثورة في التعلم الآلي: TimeRewarder يحقق مكافآت كثيفة من الفيديوهات السلبية!

أركايف للذكاءمنذ 14 يوم
اكتشف كيف يمكن استخدام التعلم الانتقائي لتعزيز أداء الروبوتات متعددة الأدوار!
أبحاث

اكتشف كيف يمكن استخدام التعلم الانتقائي لتعزيز أداء الروبوتات متعددة الأدوار!

أركايف للذكاءمنذ 16 يوم
GeoX: استحواذ العقل الجغرافي من خلال اللعب الذاتي والمكافآت القابلة للتحقق!
أبحاث

GeoX: استحواذ العقل الجغرافي من خلال اللعب الذاتي والمكافآت القابلة للتحقق!

أركايف للذكاءمنذ 16 يوم
ARC-RL: ملعب لتعلم التعزيز مستوحى من عالم ARC Raiders!
روبوتات

ARC-RL: ملعب لتعلم التعزيز مستوحى من عالم ARC Raiders!

أركايف للذكاءمنذ 16 يوم
اكتشف OPERA: ثورة جديدة في ذكاء الاسترجاع متعدد الخطوات من خلال التعلم المعزز!
أبحاث

اكتشف OPERA: ثورة جديدة في ذكاء الاسترجاع متعدد الخطوات من خلال التعلم المعزز!

أركايف للذكاءمنذ 17 يوم
إعادة تعريف ذكاء الشبكات العصبية: كيف يغير RNN-ProVe قواعد اللعبة في تعلم التعزيز
أبحاث

إعادة تعريف ذكاء الشبكات العصبية: كيف يغير RNN-ProVe قواعد اللعبة في تعلم التعزيز

أركايف للذكاءمنذ 21 يوم
ثورة في تعلم التعزيز: تحسين السياسات في فضاءات العمل الهجينة
أبحاث

ثورة في تعلم التعزيز: تحسين السياسات في فضاءات العمل الهجينة

أركايف للذكاءمنذ 21 يوم
استبدال العمل القريب: ثورة في تعلم التعزيز غير المتصل باستخدام استنساخ السلوك!
أبحاث

استبدال العمل القريب: ثورة في تعلم التعزيز غير المتصل باستخدام استنساخ السلوك!

أركايف للذكاءمنذ 21 يوم
ODRPO: الحل الثوري لزيادة كفاءة نماذج الذكاء الاصطناعي في تقييم المكافآت
أبحاث

ODRPO: الحل الثوري لزيادة كفاءة نماذج الذكاء الاصطناعي في تقييم المكافآت

أركايف للذكاءمنذ 22 يوم