في عالم الذكاء الاصطناعي، يعتبر النقاش بين النماذج المتعددة (Multi-agent debate) واحدًا من الأساليب الشائعة لتعزيز دقة الإجابات. يعتقد الكثيرون أن هذه العمليات تعتمد على مراجعة الأقران لتصفية الأخطاء والتصورات الزائفة. ومع ذلك، أظهرت دراسة تجريبية جديدة أن التصحيح الذاتي المعزول (Isolated Self-Correction) يتفوق على أسلوب المناقشة الجماعية الغير موجهة (Unguided Homogeneous Debate) في توفير نتائج أكثر دقة.

تتضمن الدراسة مقارنة فرق من عشرة نماذج ذكاء اصطناعي مثل Qwen2.5 وLlama-3.1 وMinistral-3 في ثلاثة جولات نقاش على مجموعات بيانات عالية الصعوبة. لاحظ الباحثون أن أنواعًا معينة من الفشل كانت شائعة أثناء النقاش، مثل استسلام النماذج للآراء الأكثر شيوعًا، وهو ما أدى إلى تبني أكثر من 85% من الإجابات لمجموعة معينة، وما يعرف بـ"التوافق التملقي". كما تسببت الآراء الجماعية في عدم استقرار reasoning الصحيح، مع معدلات ضعف تصل إلى 70%.

بينما نشرت الدراسة نتائج مثيرة حول كيفية انهيار الإجماع، حيث تم إلغاء الإجابات الصحيحة من خلال تصويت الأغلبية، مما يؤدي إلى فقدان دقة كبيرة تصل إلى 32.3 نقطة مئوية. وعندما تمت مقارنة تأثير كثافة التواصل ودرجة العشوائية، كانت النتائج واضحة حيث أظهرت أن النقاش يستهلك من 2.1 إلى 3.4 مرات أكثر من البيانات دون تحقيق دقة مساوية.

تشير النتائج النهائية إلى أن فرق النماذج المتجانسة التي لا تعتمد على أدوار محددة لا تستفيد من التبادل غير الموجه، في حين أن التصحيح الذاتي المنعزل يقدم توازنًا أفضل بين التكلفة والدقة. هذا الطرح يفتح المجال لنقاش أعمق حول كيفية تحسين نماذج الذكاء الاصطناعي، والأساليب الأكثر فعالية لتجنب الأخطاء في العمليات ذات الطابع الجماعي.

ما رأيكم في هذا التطور؟ شاركونا أفكاركم في التعليقات!