أحدثت [نماذج [اللغة](/tag/اللغة) الكبرى](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبرى) ([LLMs](/tag/llms)) تطوراً ملحوظًا في كيفية إجراء عمليات [البحث](/tag/البحث) على الويب، حيث انتقلت من [تصنيف](/tag/تصنيف) الوثائق إلى صياغة إجابات مستندة إلى معرفتها. تتزايد شعبية هذه [النماذج](/tag/النماذج) كأنظمة [بحث](/tag/بحث) ذكية تعمل بشكل مستقل، حيث تقوم بالتفاعل بشكل دوري مع مصادر [المعرفة](/tag/المعرفة) الخارجية. لكن لا تزال هناك [تحديات](/tag/تحديات) كبيرة في [بناء](/tag/بناء) [وكلاء بحث](/tag/[وكلاء](/tag/وكلاء)-[بحث](/tag/بحث)) فعالين، بسبب صعوبة إنتاج خطوات [بحث](/tag/بحث) عالية الجودة.

تعتمد الأساليب التقليدية في هذا المجال على الإشراف الناتج، حيث يتم [تحفيز](/tag/تحفيز) [الوكلاء](/tag/الوكلاء) فقط لإنتاج إجابات صحيحة نهائية. هذه الاستراتيجية قد تؤدي في كثير من الأحيان إلى مشاكل مثل "تلاعب [المكافآت](/tag/المكافآت)" ولجوء [الوكلاء](/tag/الوكلاء) إلى [ذاكرة](/tag/ذاكرة) معتمدة على المعلمات بشكل مفرط، مما يحد من قدرتهم على [التعميم](/tag/التعميم) في مهام غير مألوفة.

لذلك، تم تقديم [إطار العمل](/tag/إطار-العمل) [RAG](/tag/rag)-Gym الذي يركز على الإشراف على عملية [البحث](/tag/البحث) نفسها بدلاً من الإجابات النهائية فقط. يسعى هذا الإطار إلى [دراسة](/tag/دراسة) [تصميم](/tag/تصميم) الهيكل، وتحسين المعلمات، وتقييم الإجراءات بشكل منظم، حيث تم تحديد أهمية "التأمل في [التفكير](/tag/التفكير)" كقدرة [حساسة](/tag/حساسة) لوكلاء [البحث](/tag/البحث).

استنادًا إلى هذه الرؤية، تم تقديم [نموذج](/tag/نموذج) Re²Search++، وهو [وكيل](/tag/وكيل) معتمد على الإشراف على العملية، والذي يحقق [تحسينات](/tag/تحسينات) كبيرة في [معايير](/tag/معايير) [البحث](/tag/البحث) متعدد الخطوات، وخاصة في الإعدادات غير المعتادة. تعتمد مكاسب [الأداء](/tag/الأداء) بشكل رئيسي على جودة [استعلامات](/tag/استعلامات) [البحث](/tag/البحث) بدلاً من مجرد [تحسين](/tag/تحسين) الإجابات. كما أن النقاط المرجعية المستفادة من [البحث](/tag/البحث) تنتقل [عبر](/tag/عبر) النماذج، بما في ذلك [النماذج](/tag/النماذج) الكبرى المحمية.

تشير نتائج هذه [الأبحاث](/tag/الأبحاث) إلى أن الإشراف على عملية [البحث](/tag/البحث) يمكن أن يُنتج [وكلاء بحث](/tag/[وكلاء](/tag/وكلاء)-[بحث](/tag/بحث)) أكثر [موثوقية](/tag/موثوقية) وقابلية للتعميم.