في عالم الألعاب الاستراتيجية، يتمتع اللاعبون البشريون بالقدرة على تعلم الاستراتيجيات بفعالية وسرعة بعد عدد قليل من الجولات. ولكن، كيف يمكن للوكالات المستقلة (autonomous agents) أن تكتسب مثل هذه القدرات في بيئات تفاعلية واقعية؟ هنا يأتي دور PTCG-Bench، اختبار جديد يُصمم خصيصًا لتقييم قدرة وكالات الذكاء الاصطناعي في لعبة بطاقات بوكيمون (Pokémon Trading Card Game - PTCG).
يقدم PTCG-Bench تقييمًا لوكالات التعلم اللغوي الكبير (Large Language Models - LLM) على مستويين متكاملين. الأول هو قياس أدائها في اتخاذ القرارات ضمن بيئة واحدة معقدة، والثاني هو قدرتها على التطور الذاتي من خلال خبرات تراكمية. كما يضيف الاختبار تصميمًا مرنًا لتحليل الأداء دون الخلط بينه وبين قدرات النموذج.
أظهرت التجارب أن وكالات الذكاء الاصطناعي يمكن أن تحقق أداءً جيدًا في اللعبة، ولكنها تواجه تحديات عند محاولة التطور الذاتي المستدام والثابت. هذا الأداء يتأثر بشدة بتصميم الإعدادات المستخدمة.
نأمل أن يُعزز PTCG-Bench الأبحاث المستقبلية حول الوكالات القابلة للتطور والواعية بالبيئات التفاعلية، مما يمهد الطريق لفهم أعمق لاستراتيجيات الألعاب المعقدة وكيفية تجاوز التحديات التي تواجه هذه الوكالات.
اختبار PTCG-Bench: هل تستطيع وكالات الذكاء الاصطناعي اتقان لعبة بطاقات بوكيمون؟
تم تصميم PTCG-Bench لتقييم قدرة وكالات الذكاء الاصطناعي على اتخاذ القرارات الاستراتيجية في لعبة بطاقات بوكيمون. رغم تحقيقها لنتائج جيدة، إلا أن تطورها الذاتي يظل تحديًا ضمن بيئات الألعاب التفاعلية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
