تعتبر لعبة 20 سؤال (20 Questions) واحدة من الألعاب الشهيرة التي تعزز التفكير الاستنتاجي والإبداع. في هذه اللعبة، يبدأ الشخص الذي يعرف الجواب بتخيل شيء معين، مثل شخصية مشهورة أو حيوان، ثم يحاول الشخص الآخر تخمين هذا الشيء من خلال طرح 20 سؤالاً. لكن ماذا لو كانت اللعبة تدور بينك وبين نظام ذكي؟

في هذه الحالة، يكون المستخدم هو المجيب بينما يقوم النظام بدور السائل، ويتطلب ذلك استراتيجية جيدة لاختيار الأسئلة الصحيحة لاكتشاف الشيء الصحيح والفوز باللعبة. لكن معقدات اللعبة تجعل من الصعب معرفة الاستراتيجية المثلى لاختيار الأسئلة.

في دراسة حديثة، تم تقديم طريقة جديدة مبنية على التعلم المعزز (Reinforcement Learning) والتي تمكّن الوكيل السائل من تعلم السياسات المثلى لاختيار الأسئلة من خلال التفاعلات المستمرة مع المستخدمين. لمساعدة التدريب، تم أيضًا اقتراح شبكة مكافآت لتقدير المكافآت الأكثر إفادة.

أظهرت النتائج التجريبية أن هذه الطريقة الجديدة تفوقت بوضوح على الأنظمة الهندسية التقليدية القائمة على الانتروبيا، وحققت أداءً تنافسياً في بيئات محاكاة خالية من الضوضاء.

هذا التطور في التعلم المعزز يعد بمساعدتك في تحسين تجربتك في التواصل مع الأنظمة الذكية وتعزيز فرص الفوز في مثل هذه الألعاب المثيرة.