🏷️ #تعلم معزز
283 مقال
أبحاث
تحفيز الأداء: لماذا تعتبر مكافآت المهام محوراً أساسياً في تطوير الذكاء الاصطناعي؟
أركايف للذكاءمنذ 1 شهر
أبحاث
مستقبل الذكاء الاصطناعي: تعزيز موثوقية نماذج اللغة الكبيرة مع Deliberative Searcher
أركايف للذكاءمنذ 1 شهر
أدوات
انفجار الابتكار: أدوات جديدة تجعل الذكاء الاصطناعي يتفاعل بشكل أفضل في بيئات فعّالة
أركايف للذكاءمنذ 1 شهر
أبحاث
تعلم السياسات المتفائلة في مواجهة خصوم متشائمين: ضمانات عدم الندم والخرق
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في التحكم بالشبكات الكهربائية: التعلم المعزز الهيراركي مع درع السلامة في الوقت الحقيقي!
أركايف للذكاءمنذ 1 شهر
أبحاث
القيود الذهبية: كيف تجعل وكلاء الذكاء الاصطناعي أكثر أماناً؟
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة جديد في التعلم المعزز: تقنية Soft Q(λ) تفتح آفاقاً جديدة في الذكاء الاصطناعي!
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟
أركايف للذكاءمنذ 1 شهر
نماذج لغوية
تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي
أركايف للذكاءمنذ 1 شهر
أبحاث
WOMBET: ثورة في نقل الخبرات لتعزيز التعلم المعزز بكفاءة عالية
أركايف للذكاءمنذ 1 شهر
أبحاث
قفزة مذهلة في الذكاء الاصطناعي: إطار KnowRL لتعزيز التفكير في نماذج اللغات الكبيرة!
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في تدريب وكلاء البحث: تقنية Cycle-Consistent Search تقدم بديلاً مبتكرًا!
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في المراقبة البحرية: التعلم العميق متعدد المهام لمراقبة الشعاب المرجانية بشكل مستقل
أركايف للذكاءمنذ 1 شهر
نماذج لغوية
قفزة مذهلة: هل تُوسِّع RLVR حدود التفكير في نماذج الرؤية-اللغة؟
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة التعلم الذاتي: نموذج ECHO الذي يغير قواعد اللعبة في الذكاء الاصطناعي
أركايف للذكاءمنذ 1 شهر
أبحاث
كل ما تحتاج لمعرفته حول التنفيذ الثوري لـ RLHF باستخدام PPO!
هاجينج فيسمنذ 31 شهر
أبحاث
استكشف Q-Learning: المفتاح لفهم التعلم المعزز!
هاجينج فيسمنذ 49 شهر
أبحاث
سلامة الذكاء الاصطناعي: إطلاق "Safety Gym" لتدريب الوكلاء بشكل آمن!
مدونة أوبن إيه آيمنذ 79 شهر
أبحاث
اكتشاف الخيارات المتغيرة: كيف تفتح خوارزميات جديدة آفاقاً غير مسبوقة في الذكاء الاصطناعي!
مدونة أوبن إيه آيمنذ 95 شهر
أبحاث
تعلم بسرعة: معيار جديد في التعميم في التعلم المعزز!
مدونة أوبن إيه آيمنذ 99 شهر
