Ailoxa Logo

🏷️ #التعلم المعزز

358 مقال

فهم جديد لتكوين المهام في جبر المهام البولياني: كيف يمكنك تحسين التعلم في الذكاء الاصطناعي؟
أبحاث

فهم جديد لتكوين المهام في جبر المهام البولياني: كيف يمكنك تحسين التعلم في الذكاء الاصطناعي؟

أركايف للذكاءمنذ 1 يوم
ثورة في التنقل: كيف يُمكن لروبوتات الهيومانويد التكيف مع التضاريس المتنوعة باستخدام CoRe-MoE؟
روبوتات

ثورة في التنقل: كيف يُمكن لروبوتات الهيومانويد التكيف مع التضاريس المتنوعة باستخدام CoRe-MoE؟

أركايف للذكاءمنذ 1 يوم
تعلم أثناء العمل: إطار جديد لتطوير المهارات في وكلاء التعلم المستمر
أبحاث

تعلم أثناء العمل: إطار جديد لتطوير المهارات في وكلاء التعلم المستمر

أركايف للذكاءمنذ 1 يوم
تحسين كفاءة العينات في الوكلاء من خلال استخدام الأبعاد السيمبلية!
أبحاث

تحسين كفاءة العينات في الوكلاء من خلال استخدام الأبعاد السيمبلية!

أركايف للذكاءمنذ 1 يوم
ثورة جديدة في التعلم المعزز: دمج الكفاءة النموذجية مع القيم التمثيلية عبر الديناميكيات الكامنة!
أبحاث

ثورة جديدة في التعلم المعزز: دمج الكفاءة النموذجية مع القيم التمثيلية عبر الديناميكيات الكامنة!

أركايف للذكاءمنذ 1 يوم
تشابك الكم: سر التفوق في الألعاب التنافسية!
أبحاث

تشابك الكم: سر التفوق في الألعاب التنافسية!

أركايف للذكاءمنذ 1 يوم
EvoTrainer: نقلة ثورية في تدريب نماذج الذكاء الاصطناعي من خلال التطور المشترك!
أبحاث

EvoTrainer: نقلة ثورية في تدريب نماذج الذكاء الاصطناعي من خلال التطور المشترك!

أركايف للذكاءمنذ 2 يوم
Margin Play: نظام متعدد العوامل لتحليل السياسات العامة في حدود البرازيل الاستوائية
أبحاث

Margin Play: نظام متعدد العوامل لتحليل السياسات العامة في حدود البرازيل الاستوائية

أركايف للذكاءمنذ 2 يوم
ثورة جديدة في تعلم الآلة: نظام ConTraIRL لنقل المكافآت بفاعلية!
أبحاث

ثورة جديدة في تعلم الآلة: نظام ConTraIRL لنقل المكافآت بفاعلية!

أركايف للذكاءمنذ 2 يوم
فتح آفاق جديدة في التعلم المعزز: نموذج XIPER لتوقع الفيديوهات عبر المجالات
أبحاث

فتح آفاق جديدة في التعلم المعزز: نموذج XIPER لتوقع الفيديوهات عبر المجالات

أركايف للذكاءمنذ 2 يوم
عندما تفشل تقنيات التعلم المعزز من تقييم الإنسان: تصنيف ميكانيكي لاختراق المكافآت والانهيار والألعاب التقييمية
أبحاث

عندما تفشل تقنيات التعلم المعزز من تقييم الإنسان: تصنيف ميكانيكي لاختراق المكافآت والانهيار والألعاب التقييمية

أركايف للذكاءمنذ 2 يوم
نحو أداء أفضل: تقنية تصميم المنطقة الثقة المعاد تشكيلها باستخدام Gaussian تعزز التحولات السلوكية
أبحاث

نحو أداء أفضل: تقنية تصميم المنطقة الثقة المعاد تشكيلها باستخدام Gaussian تعزز التحولات السلوكية

أركايف للذكاءمنذ 2 يوم
تعزيز قوة الذكاء الاصطناعي: طريقة جديدة لتدريب العوامل تحت ظروف معاكسة!
أبحاث

تعزيز قوة الذكاء الاصطناعي: طريقة جديدة لتدريب العوامل تحت ظروف معاكسة!

أركايف للذكاءمنذ 2 يوم
نظام QUBRIC: إعادة تصميم استعلامات التعلم المعزز لتعزيز المكافآت القابلة للتحقق
أبحاث

نظام QUBRIC: إعادة تصميم استعلامات التعلم المعزز لتعزيز المكافآت القابلة للتحقق

أركايف للذكاءمنذ 2 يوم
من يستحق المكافأة؟ SHARP: ثورة في تحسين أنظمة التعلم المعزز متعددة الوكلاء
أبحاث

من يستحق المكافأة؟ SHARP: ثورة في تحسين أنظمة التعلم المعزز متعددة الوكلاء

أركايف للذكاءمنذ 2 يوم
ثورة الذكاء الاصطناعي: نموذج WFDiffuser لتحسين التعلم المعزز عبر فهم الترددات!
أبحاث

ثورة الذكاء الاصطناعي: نموذج WFDiffuser لتحسين التعلم المعزز عبر فهم الترددات!

أركايف للذكاءمنذ 2 يوم
اكتشاف أعداد القبلات: كيف تفتح التعلم المعزز أبواب جديدة في الرياضيات!
أبحاث

اكتشاف أعداد القبلات: كيف تفتح التعلم المعزز أبواب جديدة في الرياضيات!

أركايف للذكاءمنذ 2 يوم
نموذجين عالميين ومحليين لتعزيز كفاءة التعلم المعزز (RL)!
أبحاث

نموذجين عالميين ومحليين لتعزيز كفاءة التعلم المعزز (RL)!

أركايف للذكاءمنذ 2 يوم
InftyThink+: ثورة في التفكير اللانهائي عبر التعلم المعزز!
أبحاث

InftyThink+: ثورة في التفكير اللانهائي عبر التعلم المعزز!

أركايف للذكاءمنذ 2 يوم
درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!
أبحاث

درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!

أركايف للذكاءمنذ 3 يوم