في عالم الذكاء الاصطناعي (Artificial Intelligence)، تعتبر تقنية تعلم التقليد (Imitation Learning) إحدى الأدوات الفعالة في تدريب الوكلاء (Agents) عندما تتوفر عروض من خبراء. ولكن، رغم ذلك، جمع هذه العروض من أجل كل مهمة معقدة قد يكون مكلفاً. لذا، تناولت الأبحاث الحديثة دراسة الحالة التي تتطلب قدراً طويلاً من الأفق، حيث يحتوي مجموعة بيانات العروض الثابتة على سلوك مفيد، لكنها ليست أمثلة كاملة لكل مهمة يتوجب على الوكيل حلها.

تعتبر الأساليب الحالية في تعلم التقليد قادرة على تعلم سياسات قوية من العروض، لكن عند مواجهة مهام طويلة الأمد، تتجمع الأخطاء الصغيرة على طول مسارات الإجراءات الأولية، مما يجعل التكيف بدون سابق تجربة مع المهام الجديدة غير موثوق به. لذلك، قمنا بتقديم مفهوم "الوكلاء بدون سابق تجربة من خلال خرائط الطوبولوجيا الكامنة" (Zero-shot Agents from Latent Topologies - ZALT)، وهي طريقة جديدة في تعلم التقليد تستطيع حل المهام غير المرئية التي لم يتم عرضها خلال التدريب.

تتعرف ZALT على حالات مركزية كامنة، حيث تتقارب أو تتباعد المسارات، وتتعلم السياسات ونموذج الديناميكا خلال الانتقالات بين هذه الحالات المركزية، وتخطط عبر الطوبولوجيا المركزية لإكمال المهام الجديدة. هذه الطوبولوجيا تجعل السلوكيات المعروضة قابلة للتكوين بشكل صريح، بينما تضغط المهام الطويلة إلى تسلسلات أقصر من الانتقالات المجردة. ونتيجة لذلك، يمكن لـ ZALT التكيف بدون سابق تجربة بفعالية.

في بيئة متاهة ثلاثية الأبعاد معقدة، حقق نظام ZALT نسبة نجاح تقدر بـ 55% في المهام الجديدة غير المعروفة، مقارنةً بـ 6% لأقوى نماذج المقارنة.