في عالم الأبحاث، نادراً ما تعترف التحليلات النتائج الفريدة، حيث قد تؤدي الاختيارات المختلفة في التحليل إلى استنتاجات متباينة من نفس البيانات. هذا ما أكده البحث الجديد الذي تم نشره على منصة arXiv، حيث أظهر كيف أن وكالات الذكاء الاصطناعي (AI agents) تستطيع التقاط الفروق التحليلية الكبيرة بين البشر، مما يجعل هذه المسارات المخبأة أكثر وضوحًا.

عبر أربعة مجالات تتطلب دقة عالية، تبين أن اتخاذ شخصيات مختلفة تكفي للوكالات الاصطناعية لتقديم استنتاجات متباينة، وكثيراً ما تكون متعارضة، من نفس البيانات والسؤال المطروح. في دراسة حيث قام 42 فريق بحثي إنساني بتحليل نفس مجموعة بيانات الهجرة، تمكنت وكالات الذكاء الاصطناعي من إعادة إنتاج 72% من الفجوة الإيديولوجية بين البشر في تقديرات التأثير.

وعلى الرغم من الوصول إلى استنتاجات متعارضة، كان من الصعب تحديد مشكلات واضحة في كل تحليل بناءً على التقارير النهائية للذكاء الاصطناعي، حيث نجح 86% من التحليلات في اجتياز مراجعة مستقلة، و78% في اجتياز مراجعة أغلبية الخبراء من البشر. تشير هذه النتائج إلى أن التحدي المركزي ليس فقط في التحليلات المعيبة، بل في الاستكشاف الانتقائي والتقارير من مساحة كبيرة من التحليلات القابلة للدفاع عنها منهجياً.

قد تضخم وكالات الذكاء الاصطناعي هذه المشكلة المستمرة من خلال جعل هذا الاستكشاف منخفض التكلفة وقابل للتوسع. لذا، تم تقديم مفهوم (المتغير المئوي) (m-value)، الذي يحدد احتمال أن يؤدي مسار تحليل معين إلى استنتاج متطرف على الأقل مثل ذلك الذي تم الإبلاغ عنه. كما تم تقديم أسلوب (التحسين العاقل) (Agentic Bootstrap) الذي يستخدم وكالات الذكاء الاصطناعي لتقييم قيم المتغير.

عند تطبيقه على دراسة الهجرة الإنسانية، تبين أن 13.5% من التحليلات البشرية المبلغ عنها كانت تقع في أكثر 5% تطرفًا من مساحة التحليل (m<0.05). يجب تقييم الأدلة العلمية بصورة متكاملة، وليس فقط من خلال تحليل واحد، ولكن أيضًا من خلال موقعه ضمن توزيع التحليلات التي كان من الممكن الإبلاغ عنها بشكل معقول. يجعل التحسين العاقل هذا التوزيع قابلاً للرؤية، ويحوّله إلى معيار للمصداقية العلمية.

ما رأيكم في تشغيل وكالات الذكاء الاصطناعي في الأبحاث؟ هل تعتقدون أنها ستفيد أم ستؤدي لمشكلات أكبر؟ شاركونا آرائكم في التعليقات!