في عالم الذكاء الاصطناعي، يظهر تكامل التعلم المعزز (Reinforcement Learning) مع السيطرة التنبؤية (Model Predictive Control) كنهج ثوري في تحسين عملية اتخاذ القرارات خاصةً في الأنظمة الخطية. تقدم هذه المراجعة الشاملة لمجموعة كبيرة من الأبحاث التي تسلط الضوء على هذا التكامل، مما يمنح الباحثين والممارسين الأدوات والرؤى التي يحتاجونها في تصميم نماذج فعالة.

تبين البحوث أن MPC توفر نهجاً منظمًا يستخدم أدوات استقرار معترف بها، بينما يقدم RL إمكانية التكيف القائم على البيانات وتحسين الأداء في ظل عدم اليقين. رغم النمو السريع في هذا المجال، إلا أن الأدبيات لا تزال مجزأة، مما يتطلب توحيد المعلومات لتسهيل الفهم والتطبيق.

تتناول الدراسة المتعددة الأبعاد التي تم إعدادها في البحث تكاملات RL-MPC، مع تصنيفها وفقًا لأدوار الوظائف المختلفة وخصائص هياكل دالة التكلفة. كما تسلط الضوء على الاتجاهات المنهجية والاستراتيجيات الشائعة وتحديات التنفيذ التي تشمل العبء الحاسوبي وكفاءة العينة.

النتائج توفر مرجعاً موحداً للباحثين والممارسين الذين يسعون لتصميم أو تحليل الأنظمة التي تعتمد على التحكم التنبؤي، مما يعزز فرص الابتكار في هذا المجال.