Ailoxa Logo

🏷️ #تعلم معزز

278 مقال

ضباب الحب: كيفية تعزيز سلوكيات الذكاء الاصطناعي النبيل من خلال التعلم المعزز القائم على الألفة
أبحاث

ضباب الحب: كيفية تعزيز سلوكيات الذكاء الاصطناعي النبيل من خلال التعلم المعزز القائم على الألفة

أركايف للذكاءمنذ 1 يوم
كيف تعيد التعلم المعزز تشكيل مستقبل الذكاء الاصطناعي: التحديات والفرص!
أبحاث

كيف تعيد التعلم المعزز تشكيل مستقبل الذكاء الاصطناعي: التحديات والفرص!

أركايف للذكاءمنذ 1 يوم
RUBAS: إطار تعليمي جديد لضمان سلامة الوكلاء في عالم الذكاء الاصطناعي
أبحاث

RUBAS: إطار تعليمي جديد لضمان سلامة الوكلاء في عالم الذكاء الاصطناعي

أركايف للذكاءمنذ 1 يوم
نقل ذكي بلا أعصاب: توسع عادل في شبكة المترو باستخدام التعلم المعزز الجدولي!
أبحاث

نقل ذكي بلا أعصاب: توسع عادل في شبكة المترو باستخدام التعلم المعزز الجدولي!

أركايف للذكاءمنذ 1 يوم
إعادة تعلم البيانات: الابتكار الجديد في التعلم المعزز
أبحاث

إعادة تعلم البيانات: الابتكار الجديد في التعلم المعزز

أركايف للذكاءمنذ 1 يوم
اكتشاف مجالات المزايا المزدوجة: خطوة جديدة نحو تعزيز التعلم المعزز القائم على الأهداف
أبحاث

اكتشاف مجالات المزايا المزدوجة: خطوة جديدة نحو تعزيز التعلم المعزز القائم على الأهداف

أركايف للذكاءمنذ 1 يوم
ثغرة جديدة في الذكاء الاصطناعي: كيف تؤثر التجارب القوية على التعلم العميق؟
أبحاث

ثغرة جديدة في الذكاء الاصطناعي: كيف تؤثر التجارب القوية على التعلم العميق؟

أركايف للذكاءمنذ 1 يوم
تقنية جديدة تكشف عن حيل المكافآت في التعلم المعزز القائم على المعايير!
أبحاث

تقنية جديدة تكشف عن حيل المكافآت في التعلم المعزز القائم على المعايير!

أركايف للذكاءمنذ 1 يوم
كيفية تعزيز التعلم العميق من خلال التغذية الراجعة الغنية: اكتشاف نظام DAgger المتطور
أبحاث

كيفية تعزيز التعلم العميق من خلال التغذية الراجعة الغنية: اكتشاف نظام DAgger المتطور

أركايف للذكاءمنذ 1 يوم
هل يمكن للتعلم المعزز أن يجعل الروبوتات تفكر؟ اكتشافات مثيرة حول نماذج المحولات!
أبحاث

هل يمكن للتعلم المعزز أن يجعل الروبوتات تفكر؟ اكتشافات مثيرة حول نماذج المحولات!

أركايف للذكاءمنذ 1 يوم
استكشاف متقدم: ContactExplorer ي revolutionizes تكيف التحكم الدقيق
روبوتات

استكشاف متقدم: ContactExplorer ي revolutionizes تكيف التحكم الدقيق

أركايف للذكاءمنذ 1 يوم
Traj-Evolve: نظام متعدد الوكلاء يتطور ذاتياً لاكتشاف سرطان الرئة مبكراً!
أبحاث

Traj-Evolve: نظام متعدد الوكلاء يتطور ذاتياً لاكتشاف سرطان الرئة مبكراً!

أركايف للذكاءمنذ 2 يوم
تحديثات الهدف قد تثبت Q-Learning الخطي: استراتيجيات فعالة للتميز
أبحاث

تحديثات الهدف قد تثبت Q-Learning الخطي: استراتيجيات فعالة للتميز

أركايف للذكاءمنذ 2 يوم
نموذج ماركوف التوليدي: ثورة في أنظمة الحوسبة الموزعة!
أبحاث

نموذج ماركوف التوليدي: ثورة في أنظمة الحوسبة الموزعة!

أركايف للذكاءمنذ 2 يوم
ASymPO: ثورة في تعزيز نماذج اللغة بتقنيات التعلم غير المتزامن!
نماذج لغوية

ASymPO: ثورة في تعزيز نماذج اللغة بتقنيات التعلم غير المتزامن!

أركايف للذكاءمنذ 2 يوم
Libra: حل مبتكر لإدارة الموارد في التعلم المعزز بعد التدريب
أبحاث

Libra: حل مبتكر لإدارة الموارد في التعلم المعزز بعد التدريب

أركايف للذكاءمنذ 2 يوم
تحسين التعلم المعزز باستخدام توجيه الانتروبيا: كيف يغير TAO-RL مستقبل الذكاء الاصطناعي؟
أبحاث

تحسين التعلم المعزز باستخدام توجيه الانتروبيا: كيف يغير TAO-RL مستقبل الذكاء الاصطناعي؟

أركايف للذكاءمنذ 2 يوم
ثورة الذكاء الاصطناعي: استبدال الإشراف البشري بتعزيزات صناعية في نماذج RLVR!
أبحاث

ثورة الذكاء الاصطناعي: استبدال الإشراف البشري بتعزيزات صناعية في نماذج RLVR!

أركايف للذكاءمنذ 2 يوم
ثورة في الذكاء الاصطناعي: استخدام التعلم المعزز لتنفيذ أدوات متعددة الخطوات في بيئات حقيقية!
أبحاث

ثورة في الذكاء الاصطناعي: استخدام التعلم المعزز لتنفيذ أدوات متعددة الخطوات في بيئات حقيقية!

أركايف للذكاءمنذ 2 يوم
استكشاف حوافز عدم اليقين: كيف تعزز تنوع السلوك في التعلم المعزز؟
أبحاث

استكشاف حوافز عدم اليقين: كيف تعزز تنوع السلوك في التعلم المعزز؟

أركايف للذكاءمنذ 2 يوم