في عالم الذكاء الاصطناعي، يعتبر قرار اختيار عدد الأدوات التي يجب أن تكون متاحة لوكلاء نماذج اللغات الضخمة (Large Language Models) من الأمور الحيوية التي تشغل العديد من الباحثين والمطورين. فقبل استخدام أي أداة، يجب على نظام الاسترجاع (retrieval system) تحديد الأدوات المرشحة التي يتم عرضها على الوكيل، والسؤال هنا: ما هو العدد المثالي لهذه الأدوات؟

إذا تم عرض عدد كبير جداً من الأدوات، قد يجد النموذج صعوبة في اتخاذ القرار الصحيح. أما إذا اقتصر العدد على أدوات قليلة، فقد يفوت عليه الأداة المناسبة. معظم الأنظمة الحالية تعتمد على حجم ثابت لقائمة الأدوات الموصى بها مع كل استعلام، ولكن لا يوجد معيار موحد لتقييم ما إذا كان هذا الحجم مناسبًا أم لا.

في هذا البحث، تم معالجة عدد الأدوات المعروضة كنقطة تقييم، واستخدمت تقنية Bits-over-Random (BoR) كمقياس مصحح للفرص، تسأل ما إذا كانت النجاحات التي تتحقق على عمق معين أفضل من تلك الناتجة عن الاختيار العشوائي في نفس العمق. تم تقييم BoR عبر ثلاثة معايير لاختيار الأدوات، مما أدى إلى نتائج مشوقة حيث أظهرت التطورات أن اختيار قائمة أدوات قصيرة ومرنة يزيد من فرص نجاح النموذج في العثور على الأداة الصحيحة.

على سبيل المثال، عندما تمت تجربة أدوات متعددة في BFCL (370 أداة)، تقريباً تطابقت سياسة التعلم المعتمدة مع تغطية عرض 50 أداة. بينما في ToolBench (3,251 أداة)، أثبتت القوائم الثابتة لنموذج BoR أنه يمكن أن نجد الأداة الصحيحة فيما بعد، مما يزيد من الكفاءة ويقلل من التكاليف المرتبطة باستخدام موارد أكبر. هذه التجارب تؤكد أن القوائم القصيرة التكيفية تُحسن من قدرة نماذج اللغات الضخمة على اختيار الأداة الصحيحة بشكل ملحوظ، حيث تسجل 93.1% من النجاح مقابل 87.1% مع القائمة الثابتة من 5 أدوات.

هذه الابتكارات لا تقتصر على تحسين أداء الوكلاء فحسب، بل تُظهر أيضاً التأثير الكبير الذي يمكن أن يحدث عند تخصيص العمق والاختيار بعناية. هل تتفقون مع أهمية تحديد عدد الأدوات بشكل دقيق؟ شاركونا آراءكم في التعليقات.