في عصر الذكاء الاصطناعي المتقدم، أصبحت نماذج اللغات الضخمة (Large Language Models) تلعب دورًا حيويًا في تعزيز قدرات الأداء عبر الأدوات الخارجية. ومع ذلك، لا يكون استخدام هذه الأدوات دائمًا مجديًا؛ إذ قد تكون بعض الاستدعاءات زائدة أو حتى ضارة. لذلك، يعتمد الاستخدام الفعال للأدوات على قرار أساسي يواجه النموذج: هل يجب عليه استدعاء الأداة أم لا؟
يعتبر هذا القرار صعبًا بشكل خاص عند استخدام أدوات البحث على الإنترنت، حيث تعتمد فوائد المعلومات الخارجية على المعرفة الداخلية للنموذج وقدرته على دمج الردود المحتملة غير الدقيقة. لذلك، نعرض إطار عمل مستند إلى نظرية اتخاذ القرار لتقييم قرارات استخدام أدوات البحث عبر ثلاثة عوامل رئيسية: الحاجة، المنفعة، والقدرة على تحمل التكاليف.
يتضمن تحليلنا عدستين تكميليتين: منظور معياري يستنتج الحاجة الحقيقية والمنفعة من تخصيص مثالي لاستدعاء الأدوات، ومنظور وصفي يستنتج الحاجة الذاتية والنفع من سلوكيات النماذج المرصودة. وجدنا أن حاجة النماذج المدركة ومنفعتها من استدعاء الأدوات غالبًا ما تكون غير متطابقة مع الحاجة الحقيقية والمنفعة. بناءً على هذا الإطار، نقوم بتدريب مقدرات خفيفة للحاجة والمنفعة استنادًا إلى الحالات الخفية للنماذج. تمكن هذه المقدرات المتحكمات البسيطة، مما يحسن من جودة القرار ويؤدي إلى أداء أفضل في المهام عن الإعداد المدرك ذاتيًا عبر ثلاث مهام وستة نماذج.
هل يجب علينا استخدام أدوات الذكاء الاصطناعي؟ إطار عمل لتقييم وتعزيز استدعاء نماذج اللغات الضخمة
تقدم بنية الذكاء الاصطناعي المعزز أدوات قوية، لكن الاستخدام غير المدروس قد يكون له عواقب سلبية. نقدم إطار عمل يركز على قرار استخدام أو عدم استخدام هذه الأدوات أثناء أداء المهام.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
