في عالم الذكاء الاصطناعي، يظل [التخطيط](/tag/التخطيط) [عبر](/tag/عبر) الفضاءات المستمرة للتو intern القضايا الكبيرة التي تواجه النظم الذاتية. بالرغم من فعالية [خوارزمية](/tag/خوارزمية) [Monte Carlo Tree Search](/tag/monte-carlo-tree-search) ([MCTS](/tag/mcts)) من حيث [قابلية التوسع](/tag/قابلية-[التوسع](/tag/التوسع)) [عبر](/tag/عبر) العينات، إلا أن معظم [حلول](/tag/حلول) (PO)MDP المستمرة لا تستفيد من [تحسين](/tag/تحسين) الأفعال القائم على [التدرجات](/tag/التدرجات).

لذلك، جاء الباحثون بخوارزمية جديدة تدعى Action-Gradient [Monte Carlo Tree Search](/tag/monte-carlo-tree-search) (AGMCTS) التي تمثل إطاراً يجمع بين [البحث](/tag/البحث) الشجري العالمي والتعديل المحلي على الأفعال بواسطة التدرجات، مع الحفاظ على تقديرات [قيمة](/tag/قيمة) متسقة.

تتضمن هذه الخوارزمية ثلاثة إسهامات [نظرية](/tag/نظرية) رئيسية:
1. **نظرية تدرج نطاق الأفعال**: تسمح بتحليل حالة الاعتقاد القائم على الجسيمات.
2. **شجرة [الانحدار](/tag/الانحدار) متعددة الأهمية**: تدعم [التحديثات](/tag/التحديثات) المتكررة لفرعي الأفعال من خلال إعادة استخدام العينات السابقة دون إدخال [انحرافات](/tag/انحرافات) على المقدرات.
3. **التدرجات القابلة للحساب لنطاق الأفعال**: تدعم [النماذج التوليدية](/tag/[النماذج](/tag/النماذج)-التوليدية) السلسة باستخدام صيغة المساحة.

تشير النتائج التجريبية إلى أن AGMCTS تتفوق على الحلول التي تعتمد على العينات في مقياس (MDP) و( [POMDP](/tag/pomdp)) المستندة إلى التحديات المتمثلة في بيئات مستمرة متعددة.

ما رأيكم في هذه الخوارزمية الجديدة؟ هل تتوقعون أن تُحدث فرقاً في [مستقبل الذكاء الاصطناعي](/tag/[مستقبل](/tag/مستقبل)-الذكاء-الاصطناعي)؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات)!