🏷️ #تعلم تعزيز

58 مقال

ثورة الذكاء الاصطناعي: تعلم تعزيز ذاتي للرحلات الجوية غير المأهولة

ثورة الذكاء الاصطناعي: تعلم تعزيز ذاتي للرحلات الجوية غير المأهولة

أركايف للذكاءمنذ 1 شهر

تعلم التعزيز المتين: ثورة في تفكيك صراعات الطائرات بدون طيار في بيئات عدائية

تعلم التعزيز المتين: ثورة في تفكيك صراعات الطائرات بدون طيار في بيئات عدائية

أركايف للذكاءمنذ 1 شهر

تعلم تعزيز عميق قابل للتفسير: ثورة إدارة الطاقة في المباني الذكية!

تعلم تعزيز عميق قابل للتفسير: ثورة إدارة الطاقة في المباني الذكية!

أركايف للذكاءمنذ 1 شهر

اكتشف الأسرار: نماذج اللغات تضبط حالات المفاتيح لاستكشاف متعدد الوكلاء بكفاءة!

اكتشف الأسرار: نماذج اللغات تضبط حالات المفاتيح لاستكشاف متعدد الوكلاء بكفاءة!

أركايف للذكاءمنذ 1 شهر

كيف تستطيع نماذج اللغات الضخمة تقييم قدراتها؟ اكتشاف جديد يثير الدهشة!

كيف تستطيع نماذج اللغات الضخمة تقييم قدراتها؟ اكتشاف جديد يثير الدهشة!

أركايف للذكاءمنذ 1 شهر

تحولات مثيرة في تعلم التعزيز: ثغرات عمودية لتقليل الأبعاد

تحولات مثيرة في تعلم التعزيز: ثغرات عمودية لتقليل الأبعاد

أركايف للذكاءمنذ 1 شهر

نموذج عالم الوكيل: بيئات صناعية بلا حدود لتعلم التعزيز الوكلي

نموذج عالم الوكيل: بيئات صناعية بلا حدود لتعلم التعزيز الوكلي

أركايف للذكاءمنذ 1 شهر

اكتشف منصة MobileGym: بيئة محاكية مبتكرة للبحث في واجهات المستخدم المحمولة!

اكتشف منصة MobileGym: بيئة محاكية مبتكرة للبحث في واجهات المستخدم المحمولة!

أركايف للذكاءمنذ 1 شهر

فهم تعميم الأهداف في تعلم التعزيز التسلسلي: خطوة نحو تطوير الذكاء الاصطناعي

فهم تعميم الأهداف في تعلم التعزيز التسلسلي: خطوة نحو تطوير الذكاء الاصطناعي

أركايف للذكاءمنذ 1 شهر

ثورة القيادة الذاتية: تعلم تعزيز متعدد الوكلاء لضمان الأمان في مواجهة سلوكيات المشاة الغامضة

ثورة القيادة الذاتية: تعلم تعزيز متعدد الوكلاء لضمان الأمان في مواجهة سلوكيات المشاة الغامضة

أركايف للذكاءمنذ 1 شهر

ثورة في التعلم الآلي: TimeRewarder يحقق مكافآت كثيفة من الفيديوهات السلبية!

ثورة في التعلم الآلي: TimeRewarder يحقق مكافآت كثيفة من الفيديوهات السلبية!

أركايف للذكاءمنذ 1 شهر

اكتشاف PREFINE: ثورة في تكييف سياسات التعزيز لضمان الأمان!

نماذج لغوية

اكتشاف PREFINE: ثورة في تكييف سياسات التعزيز لضمان الأمان!

أركايف للذكاءمنذ 1 شهر

إعادة تعريف التواصل في تعلم التعزيز متعدد الوكيل: تحقيق الأداء العالي تحت قيود النطاق الترددي

إعادة تعريف التواصل في تعلم التعزيز متعدد الوكيل: تحقيق الأداء العالي تحت قيود النطاق الترددي

أركايف للذكاءمنذ 1 شهر

GeoX: استحواذ العقل الجغرافي من خلال اللعب الذاتي والمكافآت القابلة للتحقق!

GeoX: استحواذ العقل الجغرافي من خلال اللعب الذاتي والمكافآت القابلة للتحقق!

أركايف للذكاءمنذ 2 شهر

اكتشف كيف يمكن استخدام التعلم الانتقائي لتعزيز أداء الروبوتات متعددة الأدوار!

اكتشف كيف يمكن استخدام التعلم الانتقائي لتعزيز أداء الروبوتات متعددة الأدوار!

أركايف للذكاءمنذ 2 شهر

ARC-RL: ملعب لتعلم التعزيز مستوحى من عالم ARC Raiders!

ARC-RL: ملعب لتعلم التعزيز مستوحى من عالم ARC Raiders!

أركايف للذكاءمنذ 2 شهر

اكتشف OPERA: ثورة جديدة في ذكاء الاسترجاع متعدد الخطوات من خلال التعلم المعزز!

اكتشف OPERA: ثورة جديدة في ذكاء الاسترجاع متعدد الخطوات من خلال التعلم المعزز!

أركايف للذكاءمنذ 2 شهر

استبدال العمل القريب: ثورة في تعلم التعزيز غير المتصل باستخدام استنساخ السلوك!

استبدال العمل القريب: ثورة في تعلم التعزيز غير المتصل باستخدام استنساخ السلوك!

أركايف للذكاءمنذ 2 شهر

إعادة تعريف ذكاء الشبكات العصبية: كيف يغير RNN-ProVe قواعد اللعبة في تعلم التعزيز

إعادة تعريف ذكاء الشبكات العصبية: كيف يغير RNN-ProVe قواعد اللعبة في تعلم التعزيز

أركايف للذكاءمنذ 2 شهر

ثورة في تعلم التعزيز: تحسين السياسات في فضاءات العمل الهجينة

ثورة في تعلم التعزيز: تحسين السياسات في فضاءات العمل الهجينة

أركايف للذكاءمنذ 2 شهر

← السابق2 / 3التالي →