في عصر الذكاء الاصطناعي، يمثل تطبيق نماذج الذكاء الاصطناعي في الطب أحد أكبر التحديات. حيث تعتبر درجات الثقة غير الدقيقة، والتي تعني أن النماذج يمكن أن تكون مفرطة الثقة في توقعاتها، عائقاً خطيراً أمام استخدام هذه التكنولوجيا في قرارات الرعاية الصحية. ومع ذلك، تمكنت دراسة جديدة من تجاوز هذه القيود من خلال عرضها لإطار عمل مبتكر يعتمد على نماذج متعددة الوكلاء (Multi-Agent Framework).
يتضمن هذا الإطار دمج وكلاء متخصصين من مجالات طبية مختلفة، مثل الأمراض التنفسية وأمراض القلب والأعصاب وأمراض الجهاز الهضمي. كل وكيل يقوم بتوليد تشخيصات مستقلة باستخدام النموذج Qwen2.5-7B-Instruct. وبعد ذلك، تخضع كل تشخيص لعملية تحقق ذاتي من مرحلتين (Two-Phase Verification) لقياس الاتساق الداخلي وإنتاج درجة ثقة مختصة (S-Score).
تعمل درجات الثقة (S-scores) على دفع استراتيجية دمج وزنها يعتمد على النتائج التي تم التحقق منها، بحيث يتم تحديد الإجابة النهائية وضبط مستوى الثقة المبلغ عنها.
أظهرت نتائج التقييم على مجموعات بيانات طبية صعبة مثل MedQA-USMLE وMedMCQA تحسناً ملحوظاً، حيث سجل النظام الكامل أعلى مستوى دقة بلغ 59.2% مع تخفيض بنسبة 74.4% في الخطأ القياسي (ECE). وهذا يدل على قدرة النظام الجديد على تحسين دقة تقييم الثقة في القرارات السريرية.
تتناول هذه الدراسة أيضاً نقاط عدم اليقين المختلفة التي تظهر في نماذج اللغات الكبيرة (Large Language Models) وتسلط الضوء على ضرورة مزيد من التحقيقات للتأكد مما إذا كانت إشارات الثقة الناتجة كافية لدعم قرارات التأجيل السريرية في الممارسة العملية. هل أنتم أيضاً متشوقون لاستكشاف تأثير هذه التطورات على مستقبل الرعاية الصحية؟ شاركونا آراءكم في التعليقات!
تحسين دقة الذكاء الاصطناعي في الطب: كيف تسهم نماذج متعددة الوكلاء في معالجة عدم اليقين؟
تمثل درجات الثقة غير الدقيقة عقبة كبيرة أمام استخدام الذكاء الاصطناعي في البيئات السريرية. تقدم دراسة جديدة إطاراً متعدد الوكلاء يعزز دقة التشخيصات الطبية عبر نظام تحقق من الاتساق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
