تُعتبر مساعدات التسوق الحواري (Conversational Shopping Assistants - CSAs) تطبيقاً مثيراً للذكاء الاصطناعي الوكيني، ولكن الانتقال من النموذج الأولي إلى الإنتاج يكشف عن تحديين مهمين لم يتم استكشافهما بشكل كافٍ: كيفية تقييم التفاعلات متعددة الأدوار وكيفية تحسين أنظمة الوكلاء المتعددة المترابطة بشكل وثيق.تزداد صعوبة هذه الأمور عند الحديث عن التسوق من متاجر البقالة، إذ غالباً ما تكون طلبات المستخدمين غير محددة بشكل كافٍ وتكون حساسة تجاه التفضيلات، فضلاً عن قيود مثل الميزانية والمخزون المتاح.

تناولت الأبحاث الجديدة خارطة طريق عملية لتقييم وتحسين مساعدات التسوق الحواري، مع تقديم دراسة حالة لمساعد ذكاء صناعي مصمم لتلبية احتياجات تسوق البقالة. حيث قدم الباحثون مجموعة تقييم متعددة الأبعاد تُحلل جودة التسوق من البداية إلى النهاية، مشيرة إلى معايير منظمة.

كما تم تطوير خط أنابيب تم ضبطه ليتوافق مع التقييمات البشرية، والذي يعمل كنموذج للحكم (LLM-as-judge). انطلاقاً من هذا الأساس التقييمي، تم استكشاف استراتيجيتين لتفاؤل الأوامر، مبنيتين على خوارزمية تحسين الأوامر من الجيل الأخير المعروفة باسم GEPA (Shao et al., 2025).

حيث تركز الاستراتيجية الأولى على تحسين الأداء الفردي لعقد الوكلاء بناءً على مقاييس محلية، بينما تتناول الاستراتيجية الثانية، المعروفة باسم MAMuT (Multi-Agent Multi-Turn) GEPA (Herrera et al., 2026)، مقاربة جديدة لتحسين الأوامر بشكل مشترك عبر الوكلاء باستخدام محاكاة متعددة الأدوار وتقييم على مستوى المسار.

كما يعتزم الباحثون إطلاق قوالب تقييم وإرشادات تصميم لدعم الممارسين في بناء مساعدات تسوق حوارية عملية، مما يجعل هذه الدراسة مورداً قيماً لمن يسعى لتحسين تجربة التسوق باستخدام تقنيات الذكاء الاصطناعي المتقدمة.