في عالم الذكاء الاصطناعي الطبي، يسعى نموذج 'الإجابة على الأسئلة المتعلقة بالصور الطبية' (Medical Visual Question Answering - MedVQA) إلى توفير إجابات موثوقة سريرياً، ولكن يواجه تحديات كبيرة بسبب الاعتماد على تقاطعات سطحية بين البيانات المتعددة الأنماط. إذاً، كيف يمكن التغلب على هذه التحديات؟
تأتي الدراسة الجديدة لتعالج هذا القصور من خلال تقديم إطار العمل 'الاستدلال الثنائي' (Dual Causal Inference - DCI)، وهو الأول من نوعه الذي يجمع بين تعديل الخداع (Backdoor Adjustment - BDA) والتعلم باستخدام المتغيرات الآلية (Instrumental Variable - IV). يقوم هذا النموذج بتخفيف التحيزات المرئية والكتابية القابلة للرؤية، بينما يتعامل مع التحيزات غير المرئية عن طريق استخدام متغير آلي مستمد من فضاء مشترك مخفي.
اعتمد الباحثون على نموذج سببي هيكلي (Structural Causal Model - SCM)، حيث وضعوا قيود المعلومات المتبادلة لضمان مصداقية المتغيرات الآلية، مما يوفر قنوات واضحة لفهم العلاقات السببية الحقيقية في البيانات. وكان لاختباراتهم على أربع مجموعات بيانات هامة (SLAKE، SLAKE-CP، VQA-RAD، وPathVQA) نتائج مذهلة، حيث أظهرت الطريقة الجديدة تفوقاً مستمراً على الطرق الحالية، خاصة في تعميم البيانات غير الموجودة.
ويبرز هذا الأسلوب الجديد قدرته على تعزيز قابلية تفسير النتائج وموثوقية التفكير عبر الأنماط المختلفة، من خلال فصل التأثيرات السببية الحقيقية عن التوجيهات السطحية. إن إطار 'الاستدلال الثنائي' يعد خطوة كبيرة نحو تحسين دقة تشخيص الأمراض من خلال معالجة الصور الطبية.
ثورة جديدة في الذكاء الاصطناعي الطبي: كيف يواجه نموذج الاستدلال الثنائي التحيزات في تحليل الصور الطبية؟
تستعرض الدراسة الجديدة إطار العمل 'الاستدلال الثنائي' الذي يدمج تقنيتي تعديل الخداع والاختيار الآلي لمواجهة تحديات التعلم من البيانات الطبية. والنتائج تظهر تطوراً ملحوظاً في دقة استجابة النماذج لأسئلة الصور الطبية المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
