تعتبر أنظمة إجابة الأسئلة متعددة الخطوات (Multi-hop Question Answering Systems) من بين أكثر الأنظمة تطلبًا في مجال الذكاء الاصطناعي، حيث تتطلب عمليات استرجاع معقدة لكل سؤال. تتضمن هذه العمليات تقسيم السؤال، وتنفيذ عدة جولات لاسترجاع المعلومات، والبحث عبر كائنات جسرية قبل الوصول إلى الإجابة النهائية. لكن المشكلة تكمن في أن جميع هذه الاستراتيجيات تعتمد على عمليات استدعاء متكررة لنماذج اللغة الضخمة (Large Language Models)، مما يؤدي إلى زيادة تكاليف الاستهلاك من حيث التوكنات، الأمر الذي يصبح أزمة حقيقية عندما يكون الميزانية محدودة.
لكن مع التحليل الدقيق، تبين أن العديد من الأسئلة متعددة الخطوات يمكن الإجابة عليها بدقة بواسطة استرجاع واحد فقط (one-shot retrieval)، مما يجعل الجولات الإضافية مضيعة للموارد.
اليوم، نقدم لكم RASER (Recoverability-Aware Selective Escalation Router)، مجموعة من أجهزة التوجيه الاقتصادية التي تعتمد على استرجاع واحد وتتميز بستة ميزات رئيسية. يعمل RASER-2 على تحديد ما إذا كان يجب التوقف أو التصعيد لعملية الاسترجاع الإضافية المعروفة باسم PRUNE. بينما يختار RASER-3 بين الاسترجاع الواحد، وPRUNE، واسترجاع تكراري يسمي IRCoT، مستفيدًا من نفس الميزات ولكن مع إضافة توازن صريح بين التكلفة والدقة. ومن المثير للاهتمام أن أيًا من جهازي التوجيه لا يحتاج لإجراء مكالمة إضافية للنموذج.
عملية الاختبار عبر ستة نماذج لغة ضخمة وثلاثة معايير لإجابة الأسئلة متعددة الخطوات، أظهرت أن كلا جهازي التوجيه يبقيان تنافسيين مع غيرها من المعايير الحديثة (SOTA)، بينما ينفقان فقط من 41% إلى 49% من توكنات دائمًا-prune وأيضًا أقل من معايير الاسترجاع التكراري والتجزئة.
تعتبر هذه الابتكارات خطوة مهنية نحو تحسين أنظمة الذكاء الاصطناعي، مما يتيح لنا تحقيق توازن مثير بين الدقة والكفاءة في العمليات.
تنظيم ثوري في أنظمة الأسئلة المتعددة: تعرف على RASER!
في عالم أنظمة الأسئلة المتعددة، يأتي RASER كنظام مبتكر يقلل التكاليف ويحسن الكفاءة. يعتمد هذا النظام على ميزات فعالة لتحسين دقة الإجابات وتقليل استهلاك الموارد.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
