تعتبر الوكلاء البحثيين العميقين (Deep Research Agents - DRAs) من التطورات المذهلة في عالم الذكاء الاصطناعي، ولكن هل يمكن لهذه الوكلاء تحسين تقاريرها بناءً على التغذية الراجعة؟ في دراسة جديدة، تم إجراء تقييم متعدد الدورات على DRAs تحت اثنين من إعدادات التغذية الراجعة: الأول هو التأمل الذاتي حيث يقوم الوكيل بمراجعة تقاريره بدون أي إشارات تشخيصية خارجية، والثاني هو التغذية الراجعة على مستوى العملية التي توفر توجيهات تستهدف الفجوات في استراتيجيات البحث.

لتفعيل التغذية الراجعة على مستوى العملية، تم تصميم طريقة تُعرف باسم استنتاج الفجوات البحثية (Research Gap Inference - RGI)، والتي تحلل الأنماط الخاصة بمعايير الفحص المستوفاة وغير المستوفاة لاستنتاج الفجوات في عملية البحث.

لقد كشفت التحليلات عن ثلاث نتائج رئيسية:
1. تحت التأمل الذاتي، أظهر الوكلاء تحسينًا طفيفًا، مستفيدين وغير مستفيدين من معايير الفحص بمعدل متساوي، مما أدى إلى تحسين بسيط.
2. جولة واحدة من التغذية الراجعة على مستوى العملية أظهرت تحسنًا كبيرًا، حيث ارتفعت النقاط الموحدة بحوالي 8-15 نقطة، بمعدل إدماج قدره 35-40%.
3. رغم ذلك، فإن هذه التحسينات لم تتضاعف في الدورات اللاحقة، حيث انخفضت نسبة الفقرات المستوفاة حتى 24% عند إعادة كتابة التقرير الكامل.

تظهر النتائج أن تحسين أداء الوكلاء البحثيين العميقين من خلال التغذية الراجعة المستهدفة لا يزال تحديًا في التصميم الحالي لهياكل DRAs. يتواجد الكود والنتائج المتاحة للجمهور على المنصة التالية: رابط الكود. هل تعتقد أن تغذية الوكلاء البحثيين بالرجوع المثالي قد تساهم في تحسين أدائهم؟ شاركونا آراءكم في التعليقات!