تعد عملية استرجاع الأدوات (Tool Retrieval) أحد التحديات الأساسية التي تواجه الوكلاء المدعومين بنماذج اللغات الضخمة (Large Language Models)، حيث تصل استفسارات المستخدمين باللهجة العامية وغالباً ما تكون غير محددة، بينما تستخدم كتالوجات API مصطلحات تقنية يصعب على أي مشفر ثابت تجاوزها بمفرده.

قدمت الطرق التدريبية السائدة، مثل تحسين المشفرات التباينية (Contrastive Encoder Fine-tuning) وتوسيع الاستفسارات بأسلوب HyDE مع نموذج LLM مجمد، حلولًا من طرفين مختلفين ولكنها لم تُعالج المشكلة بشكل كامل. فالمشفر المحسن يتفوق عندما يتطابق شكل الاستفسار مع الكتالوج، لكنه يفشل عندما لا يتطابق. بينما HyDE في الوضع صفر (Zero-shot HyDE) أكثر تحملاً للاستفسارات غير المحددة، إلا أنه ينتج أوصاف افتراضية تفتقر إلى معلومات الكتالوج وتؤدي إلى تدهور عملية الاسترجاع عند وجود استفسارات واضحة.

اليوم، نقدم لكم CoHyDE، إجراءً تكرارياً يُدرّب المشفر الكثيف (Dense Encoder) وإعادة الكتابة للنماذج اللغوية كمنظومة متطورة تتعاون بشكل متزامن. يتم إعادة تدريب المشفر باستخدام InfoNCE على أوصاف افتراضية تم إنتاجها بواسطة المُعيد، وذو تفضيلات متوافقة عبر DPO وفقًا لنتائج استرجاع المشفر. حيث يتم بدء العملية في كتالوج الأدوات قبل البدء في الدورة.

عبر استخدام مجموعة أدوات تحتوي على حوالي 10,000 أداة من كتالوج ToolBench، أظهرت ثلاثة جولات من CoHyDE تحسينًا كبيرًا على أقوى قاعدة بيانات سابقة بمعدل +2.5 نقطة في NDCG@5 للاستفسارات العادية وزيادة تصل إلى +6.3 نقطة للاستفسارات الغامضة، مع تحسن يصل إلى +8 نقاط في أصعب استفسارات الغموض.

تؤكد التحليلات أن التدريب المشترك (Co-training) هو العامل الأساسي في هذه التحسينات، حيث أن استخدام أي مكون بمفرده لم يُحقق نتائج CoHyDE على كليهما، مع خسائر تصل إلى -8 نقاط في الاستفسارات الغامضة.

في الختام، يعكس CoHyDE قفزة نوعية في تحسين طرق استرجاع الأدوات من خلال دمج قوة الذكاء الاصطناعي والدقة التكنولوجية، وهو ما يسهم في تعزيز تجربة المستخدم بشكل غير مسبوق. ما رأيكم في هذا التطور الجديد في عالم الذكاء الاصطناعي؟ شاركونا في التعليقات.