في عالم الذكاء الاصطناعي، تتميز النماذج اللغوية الحديثة (Modern Language Agents) بأدائها العالي في معالجة الأسئلة المعرفة. لكن، غالباً ما تواجه هذه النماذج تحديات كبيرة، حيث تتداخل عمليات الحصول على الأدلة وتوليد الإجابات في سياسة واحدة، مما يسبب تعقيداً غير ضروري في خوارزمية العمل.
تعتبر تقنية DAC (Divide and Cooperate) إبتكاراً مهماً يهدف إلى تحسين هذه العمليات. حيث يُقسم التدريب إلى مهمتين تعاونية تتطلب كل واحدة منهما وكيلًا متخصصًا. وبالتالي، يُمكن لكل وكيل أن يركز على جزء معين من المهمة، مما يسهل اكتشاف الأدلة وصياغة الإجابات دون حدوث تعارضات.
عنصر التعزيز في هذا النظام الثوري يشمل استخدام إشارات تعلم محددة للدور. على سبيل المثال، يعمل وكيل المولد كمنتج للإجابات ومدقق لمدى كفاية الأدلة المسترجعة، مما يتيح له التوقف عن العمل إذا كانت الأدلة غير كافية. كما يتم دمج إشارة التوقف هذه في مكافآت وكيل البحث، مما يعزز من تحسين عمليات التعلم المتبادل بين الوكلاء.
تظهر الاختبارات على معايير معالجة الأسئلة العامة والمتعددة الخطوات أن تقنية DAC، المنفذة عبر وحدات LoRA الفعالة من حيث المعلمات على قاعدة مشتركة، تحقق أداءً متفوقًا مقارنةً بالأسس السابقة التي تعتمد على ضبط شامل للنماذج الأحادية.
باختصار، يمثل هذا الإطار تطورًا ملحوظًا في كيفية تدريب نماذج اللغة، حيث يعزز من قدرة وكفاءة التعلم من خلال التعاون وتوزيع الأدوار بين الوكلاء. فهل ستتمكن هذه التقنية من تغيير مفاهيم الذكاء الاصطناعي مستقبلاً؟
تقسيم وتعاون: ثورة في تدريب نماذج اللغة متعددة الوكلاء لتعزيز التعلم والتفاعل
تقدم تقنية DAC إطاراً مبتكراً لتدريب نماذج اللغة متعددة الوكلاء، مما يحسن من أدائها في معالجة الأسئلة المعقدة. تعتمد هذه التقنية على تقسيم الأدوار بين الوكلاء لتعزيز التعلم وتفادي الازدواجية في السياسات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
