تحظى الألعاب الاستراتيجية بأهمية كبيرة في مجالات متعددة، خاصةً حينما يتعلق الأمر بالألعاب متعددة اللاعبين التي تنطوي على معلومات غير كاملة. تمثل طرق حساب توازن ناش (Nash Equilibrium) تحديًا كبيرًا، حيث تفتقر معظم الأساليب الحالية إلى قابلية التوسع أو تعاني من ضعف الأداء. هنا يأتي دور الخوارزمية الجديدة المسماة انحدار قابلية الاستغلال المُعَلم (Projected Exploitability Descent - PED).

تعمل هذه الخوارزمية على الحد من قابلية الاستغلال باستخدام تقنية انحدار فرعي مُعَلم، حيث تستهدف تقليل دالة قابليّة الاستغلال العامة للألعاب متعددة اللاعبين. ورغم أن الهدف هو دالة غير محدبة وغير سلسة، يمكن التعبير عنها على أنها مجموع القيم العظمى لدوال خطية، مما يسهل حساب فرع يتماشى مع استراتيجيات التسلسل المتاحة.

تمت تجربة خوارزمية PED على نسخة موسعة من لعبة البوكر الكهاني ثلاثية اللاعبين، والتي تُعد من أبرز الألعاب التي تمت دراستها. بينما لا يمكن للطرق الدقيقة السابقة التكيف مع أحجام الأوراق الأكبر من 4، تظهر نتائج التجارب أن PED تحقق تحسنًا مستمرًا طوال التشغيل. على الرغم من الأداء الأفضل للبعض مثل خوارزمية اللعب الوهمي (Fictitious Play - FP) وتقليل الندم العكسي (Counterfactual Regret Minimization - CFR) في البداية، فإن خوارزمية FP-PED المُركبة، التي تجمع بين تقنيتي FP وPED، تمثل خطوة مثيرة للإعجاب نحو تحسين الأداء في المدى الطويل.

في النهاية، تفتح هذه الخوارزمية آفاق جديدة للاعبين والباحثين على حد سواء، مما يعزز من فهمنا لنظرية الألعاب وسلوكها في حالات المعلومات غير الكاملة.