في عالم الذكاء الاصطناعي، تعتبر عملية الاستكشاف من العناصر الأساسية في أساليب التعلم المعزز العميق (Deep Reinforcement Learning). غالبًا ما يتم تنفيذ هذه العملية باستخدام ضجيج أبيض غير مرتبط زمنياً، لكن الدراسات الحديثة أثبتت أن استخدام ضجيج ملون مرتبط زمنياً يمكن أن يعزز من كفاءة الاستكشاف، حيث ينتج مسارات سلسة مع تغطية أفضل لمجال الحالة.

في بحثنا الأخير، ألقينا الضوء على تأثير الضجيج المستوحى من حركات الرضع العفوية على علم التعلم المعزز. وقد وجدنا أن الكثافات الطيفية لقوة سرعات الحركات النهائية لدى الأطفال تتبع عملية ضجيج ملون حيث يزداد الأس الناتج مع تقدم العمر.

استلهمنا من هذا النمط التطوري وأدخلنا آلية تزيد بشكل تدريجي من الارتباط الذاتي الزمني لضجيج الاستكشاف أثناء تدريب النموذج، بما يتماشى مع إحصائيات الأطفال.

أظهرت التجارب التي أجريناها في مجموعة متنوعة من بيئات التعلم المعزز أن الضجيج المستوحى من الرضع أنتج سلوكًا استكشافيًا منظمًا وساهم في تحسين كفاءة التعلم مقارنةً بإستراتيجيات الاستكشاف التقليدية.

تشير هذه النتائج إلى أن التطور الحركي والمعرفي عند البشر يمكن أن يوفر توجيهًا مهمًا لتصميم آليات التعلم في الوكلاء الاصطناعيين. يمكنكم الاطلاع على الكود التفصيلي لتنفيذ هذا النظام على GitHub عبر الرابط: https://github.com/trieschlab/baby-noise-rl.