Ailoxa Logo

🏷️ #التعلم المعزز

356 مقال

فهم جديد لتكوين المهام في جبر المهام البولياني: كيف يمكنك تحسين التعلم في الذكاء الاصطناعي؟
أبحاث

فهم جديد لتكوين المهام في جبر المهام البولياني: كيف يمكنك تحسين التعلم في الذكاء الاصطناعي؟

أركايف للذكاءمنذ 23 ساعة
ثورة في التنقل: كيف يُمكن لروبوتات الهيومانويد التكيف مع التضاريس المتنوعة باستخدام CoRe-MoE؟
روبوتات

ثورة في التنقل: كيف يُمكن لروبوتات الهيومانويد التكيف مع التضاريس المتنوعة باستخدام CoRe-MoE؟

أركايف للذكاءمنذ 23 ساعة
تعلم أثناء العمل: إطار جديد لتطوير المهارات في وكلاء التعلم المستمر
أبحاث

تعلم أثناء العمل: إطار جديد لتطوير المهارات في وكلاء التعلم المستمر

أركايف للذكاءمنذ 23 ساعة
تحسين كفاءة العينات في الوكلاء من خلال استخدام الأبعاد السيمبلية!
أبحاث

تحسين كفاءة العينات في الوكلاء من خلال استخدام الأبعاد السيمبلية!

أركايف للذكاءمنذ 23 ساعة
ثورة جديدة في التعلم المعزز: دمج الكفاءة النموذجية مع القيم التمثيلية عبر الديناميكيات الكامنة!
أبحاث

ثورة جديدة في التعلم المعزز: دمج الكفاءة النموذجية مع القيم التمثيلية عبر الديناميكيات الكامنة!

أركايف للذكاءمنذ 23 ساعة
تشابك الكم: سر التفوق في الألعاب التنافسية!
أبحاث

تشابك الكم: سر التفوق في الألعاب التنافسية!

أركايف للذكاءمنذ 23 ساعة
EvoTrainer: نقلة ثورية في تدريب نماذج الذكاء الاصطناعي من خلال التطور المشترك!
أبحاث

EvoTrainer: نقلة ثورية في تدريب نماذج الذكاء الاصطناعي من خلال التطور المشترك!

أركايف للذكاءمنذ 1 يوم
Margin Play: نظام متعدد العوامل لتحليل السياسات العامة في حدود البرازيل الاستوائية
أبحاث

Margin Play: نظام متعدد العوامل لتحليل السياسات العامة في حدود البرازيل الاستوائية

أركايف للذكاءمنذ 1 يوم
ثورة جديدة في تعلم الآلة: نظام ConTraIRL لنقل المكافآت بفاعلية!
أبحاث

ثورة جديدة في تعلم الآلة: نظام ConTraIRL لنقل المكافآت بفاعلية!

أركايف للذكاءمنذ 1 يوم
فتح آفاق جديدة في التعلم المعزز: نموذج XIPER لتوقع الفيديوهات عبر المجالات
أبحاث

فتح آفاق جديدة في التعلم المعزز: نموذج XIPER لتوقع الفيديوهات عبر المجالات

أركايف للذكاءمنذ 1 يوم
عندما تفشل تقنيات التعلم المعزز من تقييم الإنسان: تصنيف ميكانيكي لاختراق المكافآت والانهيار والألعاب التقييمية
أبحاث

عندما تفشل تقنيات التعلم المعزز من تقييم الإنسان: تصنيف ميكانيكي لاختراق المكافآت والانهيار والألعاب التقييمية

أركايف للذكاءمنذ 1 يوم
نحو أداء أفضل: تقنية تصميم المنطقة الثقة المعاد تشكيلها باستخدام Gaussian تعزز التحولات السلوكية
أبحاث

نحو أداء أفضل: تقنية تصميم المنطقة الثقة المعاد تشكيلها باستخدام Gaussian تعزز التحولات السلوكية

أركايف للذكاءمنذ 1 يوم
تعزيز قوة الذكاء الاصطناعي: طريقة جديدة لتدريب العوامل تحت ظروف معاكسة!
أبحاث

تعزيز قوة الذكاء الاصطناعي: طريقة جديدة لتدريب العوامل تحت ظروف معاكسة!

أركايف للذكاءمنذ 1 يوم
نظام QUBRIC: إعادة تصميم استعلامات التعلم المعزز لتعزيز المكافآت القابلة للتحقق
أبحاث

نظام QUBRIC: إعادة تصميم استعلامات التعلم المعزز لتعزيز المكافآت القابلة للتحقق

أركايف للذكاءمنذ 1 يوم
من يستحق المكافأة؟ SHARP: ثورة في تحسين أنظمة التعلم المعزز متعددة الوكلاء
أبحاث

من يستحق المكافأة؟ SHARP: ثورة في تحسين أنظمة التعلم المعزز متعددة الوكلاء

أركايف للذكاءمنذ 1 يوم
ثورة الذكاء الاصطناعي: نموذج WFDiffuser لتحسين التعلم المعزز عبر فهم الترددات!
أبحاث

ثورة الذكاء الاصطناعي: نموذج WFDiffuser لتحسين التعلم المعزز عبر فهم الترددات!

أركايف للذكاءمنذ 1 يوم
اكتشاف أعداد القبلات: كيف تفتح التعلم المعزز أبواب جديدة في الرياضيات!
أبحاث

اكتشاف أعداد القبلات: كيف تفتح التعلم المعزز أبواب جديدة في الرياضيات!

أركايف للذكاءمنذ 1 يوم
نموذجين عالميين ومحليين لتعزيز كفاءة التعلم المعزز (RL)!
أبحاث

نموذجين عالميين ومحليين لتعزيز كفاءة التعلم المعزز (RL)!

أركايف للذكاءمنذ 1 يوم
InftyThink+: ثورة في التفكير اللانهائي عبر التعلم المعزز!
أبحاث

InftyThink+: ثورة في التفكير اللانهائي عبر التعلم المعزز!

أركايف للذكاءمنذ 1 يوم
درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!
أبحاث

درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!

أركايف للذكاءمنذ 2 يوم