تحقيق أقصى أداء في التعاون بين الوكلاء: استراتيجية جديدة لزيادة الكفاءة!
تقدم WORC، إطار تحسين نقاط الضعف، نهجاً مبتكراً لتحسين الأداء في أنظمة الوكلاء المتعددة. من خلال تعزيز التعاون وتقليل الأخطاء، تحقق WORC استقراراً أكبر ودقة محسنة تصل إلى 82.2%.
تسعى أنظمة الوكلاء المتعددة المدعومة بنماذج اللغة الكبيرة (Large Language Models) إلى معالجة المهام التي تتطلب تفكيرًا معمقًا، من خلال التعاون بين عدة أدوار. ومع ذلك، فإن النهج التقليدي غالبًا ما يفتقر إلى الاستقرار في عمليات التفكير، حيث يتم تضخيم الأخطاء الفردية للوكلاء عند التعاون، مما يؤثر سلبًا على الأداء الكلي.
توجه البحوث الحالية بشكل رئيسي نحو تحسين القدرات العالية للوكلاء أو كبت المخرجات غير الموثوقة لتعزيز فعالية الإطار. لكن التحديد المنهجي وتعزيز الوكلاء ذوي الأداء الضعيف لا يحظى بالكثير من الاهتمام.
في هذه السياق، نقدم WORC، إطارًا جديدًا لتحسين نقاط الضعف في التفكير الجماعي والتعاون بين الوكلاء، مستندًا إلى مبدأ الوصل الضعيف. يتبع WORC سير عمل مكون من مرحلتين.
في المرحلة الأولى، يتم تحديد الوكلاء الضعفاء بناءً على ميزات المهام، حيث يتم الاستفادة من خوارزميات الذكاء الجماعي لتدريب متنبئ يعتمد على التعلم الميتا (Meta-Learning) لتحديد الأوزان الخاصة بكل وكيل. الوكيل المُحدد بأدنى وزن يُعتبر وكيلًا ضعيفًا.
في المرحلة الثانية، يتم تطبيق استراتيجية تخصيص تعتمد على عدم اليقين، حيث يتم تخصيص ميزانيات تفكير إضافية للوكلاء الضعفاء، مما يسمح بتعويض النقاط الضعيفة من خلال زيادة حصة إعادة التكرار.
أظهرت النتائج التجريبية أن WORC حقق متوسط دقة بنسبة 82.2% على معايير التفكير، مع تحسين استقرار الإطار والتعميم بين الهياكل المعمارية المختلفة. مما يشير إلى أن تعزيز النظام من خلال معالجة نقاط الضعف بدلاً من التركيز على القوة وحدها يزيد من متانة أنظمة الوكلاء المتعددة.
توجه البحوث الحالية بشكل رئيسي نحو تحسين القدرات العالية للوكلاء أو كبت المخرجات غير الموثوقة لتعزيز فعالية الإطار. لكن التحديد المنهجي وتعزيز الوكلاء ذوي الأداء الضعيف لا يحظى بالكثير من الاهتمام.
في هذه السياق، نقدم WORC، إطارًا جديدًا لتحسين نقاط الضعف في التفكير الجماعي والتعاون بين الوكلاء، مستندًا إلى مبدأ الوصل الضعيف. يتبع WORC سير عمل مكون من مرحلتين.
في المرحلة الأولى، يتم تحديد الوكلاء الضعفاء بناءً على ميزات المهام، حيث يتم الاستفادة من خوارزميات الذكاء الجماعي لتدريب متنبئ يعتمد على التعلم الميتا (Meta-Learning) لتحديد الأوزان الخاصة بكل وكيل. الوكيل المُحدد بأدنى وزن يُعتبر وكيلًا ضعيفًا.
في المرحلة الثانية، يتم تطبيق استراتيجية تخصيص تعتمد على عدم اليقين، حيث يتم تخصيص ميزانيات تفكير إضافية للوكلاء الضعفاء، مما يسمح بتعويض النقاط الضعيفة من خلال زيادة حصة إعادة التكرار.
أظهرت النتائج التجريبية أن WORC حقق متوسط دقة بنسبة 82.2% على معايير التفكير، مع تحسين استقرار الإطار والتعميم بين الهياكل المعمارية المختلفة. مما يشير إلى أن تعزيز النظام من خلال معالجة نقاط الضعف بدلاً من التركيز على القوة وحدها يزيد من متانة أنظمة الوكلاء المتعددة.