في عالم يتطور بسرعة في مجال الذكاء الاصطناعي، أصبحت تقنيات التعلم العميق (Deep Learning) أداة أساسية لفحص الأمراض، وخاصةً اعتلال الشبكية السكري (Diabetic Retinopathy). تعتمد جودة هذه الفحوصات على القدرة على تقييم شدة المرض بدقة، ولكن تواجه العديد من نماذج التعلم العميق تحديات في تفسير نتائجها في السياقات السريرية.
تقدم الدراسة الجديدة منهجية مبتكرة تدمج نماذج قوية ذات تمييز واضح مع تفسيرات متعددة الوسائط، حيث تقوم بتحويل البيكسلات الشبكية إلى نتائج سريرية واضحة. تم استخدام مجموعة بيانات APTOS 2019 لتقييم ستة نماذج معمارية تعتمد على الشبكات العصبية التلافيفية (CNN) والمحولات (Transformers) في إطار عمل محكم مع استخدام تقنيات التحقق المتقاطع.
تم مقارنة استراتيجيات التجميع مثل التصويت القوي، والتصويت الطري الموزون، والطبقات المدمجة، وتحديد العوامل الخاصة بكل تصنيف. ولتفسير النتائج، تم إنتاج خرائط تخصيص بصري من نوع Grad-CAM++ وزيادة نصوص مختصرة باستخدام نماذج الرؤية واللغة (Vision-Language Models) المرتبطة بصورة قاع العين ونتائج المصنف.
قدمت النماذج التلافيفية الحديثة مثل ResNet-50 وConvNeXt-Tiny أفضل خطوط أساس للنموذج الفردي، حيث سجلت دقة بمعدل QWK تصل إلى 0.919 و0.914 على التوالي. وأسفرت استراتيجيات التجميع عن تحسين مقبول في التوافق، حيث كان التصويت الطري الموزون هو الأكثر فعالية عبر التحقق المتقاطع.
لتحسين جودة التفسير، قدمت خرائط Grad-CAM++ تحديداً معقولاً ولكن بتفاصيل خفيفة، وكان التفسير المدعوم بالنماذج اللغوية بشكل عام متسقاً مع التصنيفات. من الناحية الكمية، أظهرت متغيرات VLM توازنًا بين الشمولية السريرية والتشابه الدلالي.
هذه النتائج تشير إلى إمكانيات كبيرة للتحسين المستمر في تصنيف اعتلال الشبكية السكري، مما يعزز من موثوقية النماذج الحالية ويوفر رؤى أكثر دقة للمتخصصين في الرعاية الصحية. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
من البيكسلات إلى التفسيرات: تصنيف شبكي لفحص اعتلال الشبكية السكري باستخدام تقنيات متقدمة!
تقدم دراسة حديثة منهجية مبتكرة لتفسير تصنيفات اعتلال الشبكية السكري باستخدام نماذج متقدمة. تجمع هذه الطريقة بين تقنيات التعلم العميق والتفسيرات متعددة الوسائط لتقديم رؤى سريرية دقيقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
