Ailoxa Logo

🏷️ #تعلم التعزيز

77 مقال

تعلم التعزيز الواعي بالتأخير: ثورة في دمج المركبات على الطرق السريعة
أبحاث

تعلم التعزيز الواعي بالتأخير: ثورة في دمج المركبات على الطرق السريعة

أركايف للذكاءمنذ 8 يوم
اكتشف قوة StepOPSD: إعادة توزيع التفضيلات في تعلم التعزيز للذكاء الاصطناعي!
أبحاث

اكتشف قوة StepOPSD: إعادة توزيع التفضيلات في تعلم التعزيز للذكاء الاصطناعي!

أركايف للذكاءمنذ 9 يوم
ثورة في تعلم التعزيز: تعرف على خوارزمية TRQAM الجديدة!
أبحاث

ثورة في تعلم التعزيز: تعرف على خوارزمية TRQAM الجديدة!

أركايف للذكاءمنذ 9 يوم
تخطيط ثم تنفيذ: تعزيز التخطيط العالي باستخدام تعلم التعزيز لنماذج اللغة الكبيرة
نماذج لغوية

تخطيط ثم تنفيذ: تعزيز التخطيط العالي باستخدام تعلم التعزيز لنماذج اللغة الكبيرة

أركايف للذكاءمنذ 9 يوم
إعادة تشكيل تعلم التعزيز لتحسين الملاحة الذكية باستخدام نماذج المشهد الدلالي
أبحاث

إعادة تشكيل تعلم التعزيز لتحسين الملاحة الذكية باستخدام نماذج المشهد الدلالي

أركايف للذكاءمنذ 9 يوم
تعزيز التواصل وتقليل التأخير: ثورة في تعلم التعزيز التعاوني متعدد الوكلاء!
أبحاث

تعزيز التواصل وتقليل التأخير: ثورة في تعلم التعزيز التعاوني متعدد الوكلاء!

أركايف للذكاءمنذ 9 يوم
اختراقات مذهلة في الذكاء الاصطناعي: استكشاف القواعد الضمنية عبر التفكير العميق!
أبحاث

اختراقات مذهلة في الذكاء الاصطناعي: استكشاف القواعد الضمنية عبر التفكير العميق!

أركايف للذكاءمنذ 10 يوم
CUA-Gym: ثورة في بيئات التدريب القابلة للتحقق للوكالات الحاسوبية!
أبحاث

CUA-Gym: ثورة في بيئات التدريب القابلة للتحقق للوكالات الحاسوبية!

أركايف للذكاءمنذ 10 يوم
استراتيجية متعددة: تعزيز التفكير الاستراتيجي لنماذج اللغات الضخمة في الألعاب متعددة الوكلاء!
أبحاث

استراتيجية متعددة: تعزيز التفكير الاستراتيجي لنماذج اللغات الضخمة في الألعاب متعددة الوكلاء!

أركايف للذكاءمنذ 10 يوم
ثورة في تعلم التعزيز: كيف يتجنب F-GRPO النسيان في التعلم العميق
أبحاث

ثورة في تعلم التعزيز: كيف يتجنب F-GRPO النسيان في التعلم العميق

أركايف للذكاءمنذ 10 يوم
تعلم التعزيز يُحدث ثورة في تكوين الرسوم البيانية: الأساليب الدقيقة في تحقيق التوازن الهيكلي
أبحاث

تعلم التعزيز يُحدث ثورة في تكوين الرسوم البيانية: الأساليب الدقيقة في تحقيق التوازن الهيكلي

أركايف للذكاءمنذ 11 يوم
تعلم تعزيز مكثف مع مكافآت قابلة للتحقق رغم التسربات تحت تحقيقات غير مثالية!
أبحاث

تعلم تعزيز مكثف مع مكافآت قابلة للتحقق رغم التسربات تحت تحقيقات غير مثالية!

أركايف للذكاءمنذ 11 يوم
تحديات مفاجئة في البحث ضمن تعلم التعزيز المبني على النماذج!
أبحاث

تحديات مفاجئة في البحث ضمن تعلم التعزيز المبني على النماذج!

أركايف للذكاءمنذ 11 يوم
تطوير نظام ClaimDiff-RL: كيف يعزز تعلم التعزيز من نوع الهشاشة في التعليقات البصرية
أبحاث

تطوير نظام ClaimDiff-RL: كيف يعزز تعلم التعزيز من نوع الهشاشة في التعليقات البصرية

أركايف للذكاءمنذ 14 يوم
ثورة في تحسين الرسم البياني: أساليب تعلم التعزيز تتجاوز التحديات التقليدية!
أبحاث

ثورة في تحسين الرسم البياني: أساليب تعلم التعزيز تتجاوز التحديات التقليدية!

أركايف للذكاءمنذ 16 يوم
كيف يؤثر التصويت الخاطئ على تعلم التعزيز في وقت الاختبار؟ اكتشف الصندوق السري لتعلم الآلة
أبحاث

كيف يؤثر التصويت الخاطئ على تعلم التعزيز في وقت الاختبار؟ اكتشف الصندوق السري لتعلم الآلة

أركايف للذكاءمنذ 16 يوم
ARC-RL: ملعب لتعلم التعزيز مستوحى من عالم ARC Raiders!
روبوتات

ARC-RL: ملعب لتعلم التعزيز مستوحى من عالم ARC Raiders!

أركايف للذكاءمنذ 16 يوم
ثورة الذكاء الاصطناعي: مزيج الخبراء المدرك للمرحلة في تعلم التعزيز!
أبحاث

ثورة الذكاء الاصطناعي: مزيج الخبراء المدرك للمرحلة في تعلم التعزيز!

أركايف للذكاءمنذ 16 يوم
ثورة في النماذج اللغوية: CoLD يكافح انحياز الطول في نماذج مكافآت العمليات!
أبحاث

ثورة في النماذج اللغوية: CoLD يكافح انحياز الطول في نماذج مكافآت العمليات!

أركايف للذكاءمنذ 16 يوم
تعلم التعزيز المتناغم: ثورة جديدة في استقرار الأنظمة الذكية!
أبحاث

تعلم التعزيز المتناغم: ثورة جديدة في استقرار الأنظمة الذكية!

أركايف للذكاءمنذ 16 يوم