تعتبر أسواق التنبؤ أداة قوية تستخدمها المجتمعات لتجميع ذكاء الأفراد من أجل التنبؤ بالأحداث غير المؤكدة. إلا أن فعالية هذه الأسواق تعتمد بشكل كبير على تشغيلها السليم وموثوقيتها في حل النتائج. في عالم الذكاء الاصطناعي (AI)، تواجه أنظمة الأوراكل التقليدية (Oracle Systems) معضلة: السرعة مقابل الدقة. فبينما توفر الأتمتة العصرية الاستجابة السريعة، إلا أنها غالبًا ما تكون هشة، بينما يتطلب التحكيم البشري تكلفة ووقتًا أكبر.
تجلب الأنظمة المستندة إلى نماذج اللغة الكبيرة (Large Language Models) مثل GPT-5 Nano وDeepSeek V3 وLlama-3.3-70B تحسنًا في الدقة، لكنها ورثت أيضًا كافة أنواع الفشل للنموذج الأساسي بدون آلية تصحيح ذاتي. لذا، كان السؤال: هل يمكن أن تحسن الهياكل متعددة الوكلاء من دقة حل الأوراكل؟
خلال دراسة أجريت على 1,189 سؤالًا تم حلها ضمن أسواق التنبؤ بواسطة قاعدة بيانات KalshiBench، تم مقارنة طرق التجميع المستقلة مع إجماع التفكير لاستكشاف مدى فعالية الأنظمة المتعددة الوكلاء. تبين أن التجميع المستقل باستخدام التصويت المعتمد على الثقة حقق أعلى معدل دقة بلغ 83.43%، متفوقًا على أفضل نموذج فردي بنسبة 1.01%. في المقابل، انخفضت دقة إجماع التفكير إلى حوالي 76%، مما يظهر أن الأخطاء قد تتراكم في النقاشات بين النماذج.
علاوةً على ذلك، أثبتت الدراسات أن هناك حدودًا أساسية لمنهجيات التجميع، مع وجود ارتبطات أخطاء بين النماذج تتراوح بين 0.529 و0.689، مما يفسر لماذا لا تصل المكاسب إلى السقف النظري لنظام كونداك، مما يستدعي تصعيد الحالات إلى التحكيم البشري.
وأخيرًا، تم اقتراح معايير توجيه لأنظمة الأوراكل الهجينة بين الذكاء الاصطناعي والبشري: حيث أن الحل التلقائي للأسئلة بالإجماع والثقة العالية يحقق دقة 97.87% على 47% من قاعدة البيانات، بينما يتم توجيه أي انقسامات بين الوكلاء للمراجعة البشرية. في ختام هذه الدراسة، يُثبِت البحث كيف يمكن أن تكون أنظمة الأوراكل متعددة الوكلاء خطوة هامة نحو التقدم في دقة أسواق التنبؤ، لكن يبقى السؤال مفتوحًا: هل ستكون هذه الأنظمة قادرة على التغلب على تحدياتها في المستقبل؟
اكتشاف الآفاق الجديدة: تصميم أنظمة أوراكل الذكاء الاصطناعي المتعددة الوكلاء لتحسين دقة أسواق التنبؤ!
تظهر أنظمة الأوراكل المتعددة الوكلاء وعودًا مثيرًا في تحسين دقة أسواق التنبؤ، متفوقةً على أنظمة الأوراكل الفردية بمعدل دقة يصل إلى 83.43%. ولكن هل يمكن لهذه الأنظمة تجاوز القيود الحالية؟
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
