في عالم الذكاء الاصطناعي، يزداد الاعتماد على الوكلاء متعددّي الوسائط بشكل ملحوظ، مما يدفع نحو التفكير في كيفية تحسين كفاءتها. في دراسة حديثة، تم تقديم PANDO، وهو إطار عمل جديد يقوم بتقنيات التكرار المهاري (Skill Distillation) عبر الإنترنت، مما يوفر حلاً فعالاً لمشاكل الكفاءة التي تتزايد يوماً بعد يوم.

تُظهر الأبحاث أن العديد من هذه الوكالات تتطلب زيادة في تكاليف الاستدلال (Inference) بسبب استخدام عمليات بحث معقدة ونماذج متخصصة، مما يثير تساؤلاً هامًا: هل يمكن لوكيل الويب أن يصبح أكثر كفاءة مع تراكم الخبرات بدلاً من زيادة التكاليف؟

تبدأ الدراسات بتحليل العمليات في VisualWebArena وتحديد ثلاث مصادر رئيسية لعدم الكفاءة وهي: حلقات التنفيذ المتكررة، تكاليف الاكتشاف المخفية، وانخفاض إعادة استخدام الذاكرة المؤقتة للمطالبات. من هنا جاء PANDO، الذي يعتمد على إطار عمل استخراج المهارات عبر تعديل الإجراءات.

يحتوي PANDO على مكتبة مهارات منظمة، ويجمع بين أساليب متعددة مثل تقييم التقدم، وتقليل المهارات بناءً على الثقة، والتوجيه الهيكلي، والضغط البصري، والتحفيز المدرك للاستخدام.

عند تقييمه عبر 910 مهمة في VisualWebArena، حقق PANDO معدل نجاح بلغ 58.3%، متفوقًا على نموذج SGV الذي حقق 54.0% ونموذج WALT الذي حقق 45.2%، مع استخدام 58% عدد أقل من التوكنات (tokens) مقارنة بـ SGV و61% أقل مقارنة بـ WALT، دون الحاجة إلى ميزانية اكتشاف مسبقة.

تؤكد الدراسة أيضًا على دور القواعد والروتينات كعوامل رئيسية في تحقيق هذه النجاحات، حيث أن الطرق والتخزين المؤقت يستخدمان لتحويل المكتبة الأكبر للمهارات إلى تكاليف متدنية جدًا.

كما تم تقديم ثلاثة مقاييس جديدة لتقييم الكفاءة على مستوى المسار: معدل تكرار الإجراءات، نسبة مصروف الخطوات، واستخدام الذاكرة المؤقتة للمطالبات - لجعل الكفاءة مرئية وعدم الاكتفاء بالنجاح النهائي.