Ailoxa Logo

🏷️ #تعلم معزز

283 مقال

تحفيز الأداء: لماذا تعتبر مكافآت المهام محوراً أساسياً في تطوير الذكاء الاصطناعي؟
أبحاث

تحفيز الأداء: لماذا تعتبر مكافآت المهام محوراً أساسياً في تطوير الذكاء الاصطناعي؟

أركايف للذكاءمنذ 1 شهر
مستقبل الذكاء الاصطناعي: تعزيز موثوقية نماذج اللغة الكبيرة مع Deliberative Searcher
أبحاث

مستقبل الذكاء الاصطناعي: تعزيز موثوقية نماذج اللغة الكبيرة مع Deliberative Searcher

أركايف للذكاءمنذ 1 شهر
انفجار الابتكار: أدوات جديدة تجعل الذكاء الاصطناعي يتفاعل بشكل أفضل في بيئات فعّالة
أدوات

انفجار الابتكار: أدوات جديدة تجعل الذكاء الاصطناعي يتفاعل بشكل أفضل في بيئات فعّالة

أركايف للذكاءمنذ 1 شهر
تعلم السياسات المتفائلة في مواجهة خصوم متشائمين: ضمانات عدم الندم والخرق
أبحاث

تعلم السياسات المتفائلة في مواجهة خصوم متشائمين: ضمانات عدم الندم والخرق

أركايف للذكاءمنذ 1 شهر
ثورة في التحكم بالشبكات الكهربائية: التعلم المعزز الهيراركي مع درع السلامة في الوقت الحقيقي!
أبحاث

ثورة في التحكم بالشبكات الكهربائية: التعلم المعزز الهيراركي مع درع السلامة في الوقت الحقيقي!

أركايف للذكاءمنذ 1 شهر
القيود الذهبية: كيف تجعل وكلاء الذكاء الاصطناعي أكثر أماناً؟
أبحاث

القيود الذهبية: كيف تجعل وكلاء الذكاء الاصطناعي أكثر أماناً؟

أركايف للذكاءمنذ 1 شهر
ثورة جديد في التعلم المعزز: تقنية Soft Q(λ) تفتح آفاقاً جديدة في الذكاء الاصطناعي!
أبحاث

ثورة جديد في التعلم المعزز: تقنية Soft Q(λ) تفتح آفاقاً جديدة في الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر
ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟
أبحاث

ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟

أركايف للذكاءمنذ 1 شهر
تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي
نماذج لغوية

تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي

أركايف للذكاءمنذ 1 شهر
WOMBET: ثورة في نقل الخبرات لتعزيز التعلم المعزز بكفاءة عالية
أبحاث

WOMBET: ثورة في نقل الخبرات لتعزيز التعلم المعزز بكفاءة عالية

أركايف للذكاءمنذ 1 شهر
قفزة مذهلة في الذكاء الاصطناعي: إطار KnowRL لتعزيز التفكير في نماذج اللغات الكبيرة!
أبحاث

قفزة مذهلة في الذكاء الاصطناعي: إطار KnowRL لتعزيز التفكير في نماذج اللغات الكبيرة!

أركايف للذكاءمنذ 1 شهر
ثورة في تدريب وكلاء البحث: تقنية Cycle-Consistent Search تقدم بديلاً مبتكرًا!
أبحاث

ثورة في تدريب وكلاء البحث: تقنية Cycle-Consistent Search تقدم بديلاً مبتكرًا!

أركايف للذكاءمنذ 1 شهر
ثورة في المراقبة البحرية: التعلم العميق متعدد المهام لمراقبة الشعاب المرجانية بشكل مستقل
أبحاث

ثورة في المراقبة البحرية: التعلم العميق متعدد المهام لمراقبة الشعاب المرجانية بشكل مستقل

أركايف للذكاءمنذ 1 شهر
قفزة مذهلة: هل تُوسِّع RLVR حدود التفكير في نماذج الرؤية-اللغة؟
نماذج لغوية

قفزة مذهلة: هل تُوسِّع RLVR حدود التفكير في نماذج الرؤية-اللغة؟

أركايف للذكاءمنذ 1 شهر
ثورة التعلم الذاتي: نموذج ECHO الذي يغير قواعد اللعبة في الذكاء الاصطناعي
أبحاث

ثورة التعلم الذاتي: نموذج ECHO الذي يغير قواعد اللعبة في الذكاء الاصطناعي

أركايف للذكاءمنذ 1 شهر
كل ما تحتاج لمعرفته حول التنفيذ الثوري لـ RLHF باستخدام PPO!
أبحاث

كل ما تحتاج لمعرفته حول التنفيذ الثوري لـ RLHF باستخدام PPO!

هاجينج فيسمنذ 31 شهر
استكشف Q-Learning: المفتاح لفهم التعلم المعزز!
أبحاث

استكشف Q-Learning: المفتاح لفهم التعلم المعزز!

هاجينج فيسمنذ 49 شهر
سلامة الذكاء الاصطناعي: إطلاق "Safety Gym" لتدريب الوكلاء بشكل آمن!
أبحاث

سلامة الذكاء الاصطناعي: إطلاق "Safety Gym" لتدريب الوكلاء بشكل آمن!

مدونة أوبن إيه آيمنذ 79 شهر
اكتشاف الخيارات المتغيرة: كيف تفتح خوارزميات جديدة آفاقاً غير مسبوقة في الذكاء الاصطناعي!
أبحاث

اكتشاف الخيارات المتغيرة: كيف تفتح خوارزميات جديدة آفاقاً غير مسبوقة في الذكاء الاصطناعي!

مدونة أوبن إيه آيمنذ 95 شهر
تعلم بسرعة: معيار جديد في التعميم في التعلم المعزز!
أبحاث

تعلم بسرعة: معيار جديد في التعميم في التعلم المعزز!

مدونة أوبن إيه آيمنذ 99 شهر