في عالم الذكاء الاصطناعي، تحظى استراتيجيات النقاش بين الوكلاء باهتمام كبير، لا سيما في مجالات تنظيف البيانات. ولكن السؤال الذي يطرح نفسه هو: متى يساعد هذا النقاش ومتى يؤذي؟

أجريت دراسات موسعة على ثلاث محاور تجريبية واربعة أسر عائلية للنماذج، شملت أكثر من 6000 حالة مهام. ووجدت النتائج المثيرة أن تأثير النقاش قد ينعكس. حيث يؤثر سلبًا على الأداء عبر جميع النماذج الأربعة (-1.6 إلى -15.5 نقطة مئوية) بسبب الفوضى الناجمة عن الانتقادات غير المبررة، بينما في نفس الوقت يُحسن اكتشاف الأخطاء (+27.4 نقطة مئوية في قياس F1، d=1.0).

نتج عن هذه الدراسات شرط رئيسي لفائدة النقاش؛ يتمثل في أن النقاش يساعد عندما تكون احتمال إنقاذ نتيجة خاطئة (احتمالات تحقق النقد مع مراعاة إمكانية الإصلاح) أكبر من احتمال إتلاف نتيجة صحيحة. بالإضافة إلى ذلك، أثبتت التجارب الفردية ضرورة الفصل التنافسي، حيث فشلت عمليات التحقق الذاتية باستخدام أدوات مماثلة. لكن وجود نقاد منفصلين مع قاعدة تنفيذ الكود وإنتاج مدعوم بالأدلة أنتج أول تكوين نقاش يتجاوز بوضوح أداء الوكيل الفردي في مهمة إنتاجية (+5.3 نقطة مئوية، p<0.05).

بفضل هذا الشرط، تم التنبؤ بدقة بجميع أنماط المهام التسعة، وتعميم النتائج دون أي إيجابيات كاذبة عبر 19 مقارنة منشورة في سبعة مجالات مختلفة.

إن هذه الرؤية الجديدة للمسارات التي يمكن أن يسلكها النقاش بين الوكلاء تمثل خطوة مهمة نحو تحسين أداء أنظمة الذكاء الاصطناعي في مهام معالجة البيانات.