🏷️ #تعلم تعزيز

58 مقال

اكتشاف تقنية SLAC: تعلم تعزيزي آمن وفعال للروبوتات الحقيقية من خلال محاكاة غير إشرافية!

اكتشاف تقنية SLAC: تعلم تعزيزي آمن وفعال للروبوتات الحقيقية من خلال محاكاة غير إشرافية!

أركايف للذكاءمنذ 1 يوم

استكشاف تعلم التعزيز المدعوم بإشارات الدماغ: ثورة في سلوك الروبوتات!

استكشاف تعلم التعزيز المدعوم بإشارات الدماغ: ثورة في سلوك الروبوتات!

أركايف للذكاءمنذ 4 يوم

اكتشاف Robo-ValueRL: ثورة جديدة في تقدير القيم في تعلم التعزيز من offline إلى online

اكتشاف Robo-ValueRL: ثورة جديدة في تقدير القيم في تعلم التعزيز من offline إلى online

أركايف للذكاءمنذ 7 يوم

تعلم التعزيز من غير اتصال إلى اتصال: مستقبل الذكاء الاصطناعي في البيئات الديناميكية

تعلم التعزيز من غير اتصال إلى اتصال: مستقبل الذكاء الاصطناعي في البيئات الديناميكية

أركايف للذكاءمنذ 7 يوم

التخطيط السريع لمسارات الحركة: ثورة في تعلم التعزيز غير المتصل!

التخطيط السريع لمسارات الحركة: ثورة في تعلم التعزيز غير المتصل!

أركايف للذكاءمنذ 8 يوم

استكشاف مدفوع بالمحفزات: ثورة في تعلم الآلة والتحكم الذكي!

استكشاف مدفوع بالمحفزات: ثورة في تعلم الآلة والتحكم الذكي!

أركايف للذكاءمنذ 8 يوم

تعزيز جدولة التصنيع الذكي: نموذج جديد لتعلم التعزيز يحل تحديات توقيت توصيل المنتجات المتعددة

تعزيز جدولة التصنيع الذكي: نموذج جديد لتعلم التعزيز يحل تحديات توقيت توصيل المنتجات المتعددة

أركايف للذكاءمنذ 14 يوم

تطوير إطار تعلم تعزيز موجه: كيف يغير TaoSR-AGRL تجربة التسوق الإلكترونية!

تطوير إطار تعلم تعزيز موجه: كيف يغير TaoSR-AGRL تجربة التسوق الإلكترونية!

أركايف للذكاءمنذ 14 يوم

ابتكار ذكي: تعلم تعزيز متعدد الوكلاء لتطوير مراكز البيانات الذكية والموفرة للطاقة

ابتكار ذكي: تعلم تعزيز متعدد الوكلاء لتطوير مراكز البيانات الذكية والموفرة للطاقة

أركايف للذكاءمنذ 14 يوم

ما هو نموذج Maven؟ ثورة في مكافآت السياقات الطويلة في الذكاء الاصطناعي!

ما هو نموذج Maven؟ ثورة في مكافآت السياقات الطويلة في الذكاء الاصطناعي!

أركايف للذكاءمنذ 18 يوم

ابتكار ثوري في نماذج الانتشار: التحكم بالوقت والتعلم من خلال سياسة الممثل-الناقد

ابتكار ثوري في نماذج الانتشار: التحكم بالوقت والتعلم من خلال سياسة الممثل-الناقد

أركايف للذكاءمنذ 18 يوم

KAGE-Bench: ثورة في تقييم التعميم البصري للذكاء الاصطناعي في بيئات التعلم المعزز!

KAGE-Bench: ثورة في تقييم التعميم البصري للذكاء الاصطناعي في بيئات التعلم المعزز!

أركايف للذكاءمنذ 19 يوم

ابتكارات مذهلة في شحن المركبات الكهربائية: تعلم تعزيز متعدد الوكلاء لتحقيق الكفاءة!

ابتكارات مذهلة في شحن المركبات الكهربائية: تعلم تعزيز متعدد الوكلاء لتحقيق الكفاءة!

أركايف للذكاءمنذ 20 يوم

تحسين استراتيجيات التعلم التعزيزي لنماذج اللغات الضخمة: انطلاقة جديدة عن طريق تقنية Trust Region Masking!

نماذج لغوية

تحسين استراتيجيات التعلم التعزيزي لنماذج اللغات الضخمة: انطلاقة جديدة عن طريق تقنية Trust Region Masking!

أركايف للذكاءمنذ 22 يوم

تطوير نموذج ATOD: ثورة في تدريب الوكلاء الذكيين لتحقيق أداء متفوق!

تطوير نموذج ATOD: ثورة في تدريب الوكلاء الذكيين لتحقيق أداء متفوق!

أركايف للذكاءمنذ 22 يوم

ثورة في الروبوتات: إطار تعلم تعزيز نمائي لتوجيه فعال في أنظمة الالتزام المتنقلة

ثورة في الروبوتات: إطار تعلم تعزيز نمائي لتوجيه فعال في أنظمة الالتزام المتنقلة

أركايف للذكاءمنذ 1 شهر

StarOR: ثورة في نمذجة التحسين عبر دمج البحث الشجري وتعلم التعزيز في وقت الاختبار!

StarOR: ثورة في نمذجة التحسين عبر دمج البحث الشجري وتعلم التعزيز في وقت الاختبار!

أركايف للذكاءمنذ 1 شهر

ستubborn: إطار عمل متكامل لتعزيز تعلم الذكاء الاصطناعي في تتبع الحركات وعمليات التعافي من السقوط للروبوتات البشرية

ستubborn: إطار عمل متكامل لتعزيز تعلم الذكاء الاصطناعي في تتبع الحركات وعمليات التعافي من السقوط للروبوتات البشرية

أركايف للذكاءمنذ 1 شهر

اكتشاف قوة AliyunConsoleAgent: أداة رائدة للتحقق من وثائق السحابة باستخدام الذكاء الاصطناعي!

اكتشاف قوة AliyunConsoleAgent: أداة رائدة للتحقق من وثائق السحابة باستخدام الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر

تعلم التعزيز في الوقت المناسب: كيف يعيد الذكاء الاصطناعي التكيف بدون تحديثات تدرجية!

تعلم التعزيز في الوقت المناسب: كيف يعيد الذكاء الاصطناعي التكيف بدون تحديثات تدرجية!

أركايف للذكاءمنذ 1 شهر

1 / 3التالي →