في عالم الذكاء الاصطناعي، تعتبر عملية الاستكشاف من العناصر الأساسية في أساليب التعلم المعزز العميق (Deep Reinforcement Learning). غالبًا ما يتم تنفيذ هذه العملية باستخدام ضجيج أبيض غير مرتبط زمنياً، لكن الدراسات الحديثة أثبتت أن استخدام ضجيج ملون مرتبط زمنياً يمكن أن يعزز من كفاءة الاستكشاف، حيث ينتج مسارات سلسة مع تغطية أفضل لمجال الحالة.
في بحثنا الأخير، ألقينا الضوء على تأثير الضجيج المستوحى من حركات الرضع العفوية على علم التعلم المعزز. وقد وجدنا أن الكثافات الطيفية لقوة سرعات الحركات النهائية لدى الأطفال تتبع عملية ضجيج ملون حيث يزداد الأس الناتج مع تقدم العمر.
استلهمنا من هذا النمط التطوري وأدخلنا آلية تزيد بشكل تدريجي من الارتباط الذاتي الزمني لضجيج الاستكشاف أثناء تدريب النموذج، بما يتماشى مع إحصائيات الأطفال.
أظهرت التجارب التي أجريناها في مجموعة متنوعة من بيئات التعلم المعزز أن الضجيج المستوحى من الرضع أنتج سلوكًا استكشافيًا منظمًا وساهم في تحسين كفاءة التعلم مقارنةً بإستراتيجيات الاستكشاف التقليدية.
تشير هذه النتائج إلى أن التطور الحركي والمعرفي عند البشر يمكن أن يوفر توجيهًا مهمًا لتصميم آليات التعلم في الوكلاء الاصطناعيين. يمكنكم الاطلاع على الكود التفصيلي لتنفيذ هذا النظام على GitHub عبر الرابط: https://github.com/trieschlab/baby-noise-rl.
استكشاف الذكاء الاصطناعي: كيف تعزز أصوات حركة الرضيع تحفيز التعلم في التعلم المعزز العميق؟
يظهر بحث جديد أن الأصوات المستمدة من حركات الرضع العفوية تحسن من كفاءة الاستكشاف في مناهج التعلم المعزز العميق. هذا الاكتشاف يوفر رؤية جديدة حول كيفية تعزيز آليات التعلم في الوكلاء الاصطناعيين.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
