في عصر الذكاء الاصطناعي، تزداد الحاجة إلى وكلاء التخطيط السياحي الذكي القادرين على التعامل مع تعقيدات المعلومات المتوفرة على الإنترنت. ومع تقدم قدرات الوكلاء الذاتيين، من الضروري تحديث طرق تقييمهم لتكون أكثر دقة ومواءمة مع الواقع. في هذا السياق، تمثل فيريتريب (VeriTrip) معيارًا مبتكرًا يهدف إلى معالجة الثغرات التي تعاني منها المعايير الحالية التي تركز على واجهات برمجية محددة.

تعاني المعايير التقليدية من عدم قدرتها على معالجة الضوضاء المعلوماتية، والتناقضات الواقعية المتعددة المصادر، فضلاً عن تجاهلها لضرورة تأصيل الإدراك البصري ضمن خطط منطقية. لذا، تم تطوير معيار فيريتريب ليكون أكثر فاعلية، حيث يركز على التفكير المدعوم بالأدلة عبر مجموعات غير هيكلية من البيانات الملتقطة من الويب.

يستند فيريتريب إلى قاعدة استرجاع متعددة الوسائط (Multimodal Retrieval Base - MRB) تم إنشاؤها من مصادر حقيقية، مما يجبر الوكلاء على تنظيم استفساراتهم باستقلالية عبر بيانات متنوعة. ويوفر أيضًا قاعدة معرفية قابلة للتحقق (Verifiable Knowledge Base - VKB) تسمح بتنفيذ عملية تحقق دقيقة تقيم موثوقية المعلومات بشكل فعّال، مما يساهم في التمييز بين فشل الأسباب النظامية والهلوسات الإحصائية.

تظهر التقييمات التي تم إجراؤها على نماذج اللغات الضخمة (Large Language Models - MLLMs) وجود تعارض حرج بين الاسترجاع والتفكير، حيث أن العبء الإدراكي للاسترجاع الذاتي يؤثر سلبًا على قدرة الاحتفاظ بالتعليمات. يمثل فيريتريب الأساس الصلب الضروري لجيل جديد من الوكلاء القادرين على العمل في بيئات متعددة الوسائط وغير مقيدة.