شهد مجال التشخيص الطبي للتنفس تقدمًا ملحوظًا بفضل استخدام تقنيات الذكاء الاصطناعي. في دراسة حديثة، تم الإبلاغ عن استراتيجيات جديدة لتحسين تمثيلات الإدخال الثنائية الأبعاد واستخدامها في تشخيص الربو ومرض الانسداد الرئوي المزمن (COPD). تتطرق هذه الدراسة إلى الأداء المتميز لنموذج VAR مقارنةً بمعاملات الموجات الصوتية Mel-frequency cepstral coefficient (MFCC) وطيف لوغاريتم الموجة (log-mel spectrogram).
تكمن التحديات الرئيسية في تصنيف الأصوات الرئوية في عدم انتظام الأبعاد الزمنية للتمثيلات الصوتية بسبب اختلاف مدد دورات التنفس. لا تتوقف الحلول على القص التقليدي أو التمديد الصفري، بل تم استخدام نافذة طول قابلة للتكيف لضبط الأبعاد الزمنية وتحسين الأداء.
استخدمت الدراسة مجموعة متنوعة من بنى الشبكات العصبية التلافيفية (CNN) لاستخراج الخصائص من التمثيلات الثنائية الأبعاد المستخلصة خلال مراحل فرعية مختلفة. تم دمج الخصائص المستخرجة باستخدام استراتيجيات متنوعة مثل الجمع المباشر، وشبكات وحدات التكرار المغلقة (GRU)، وآلية الانتباه في GRU. تم تقييم أداء النماذج من خلال تقويم مبني على دورة التنفس وتقويم قائم على الأشخاص والذي يتضمن دورات تنفس متعددة.
رغم مواجهة بعض التحديات في أحجام البيانات، أظهرت التقنيات المستخدمة في تعزيز البيانات نتائج مثيرة، حيث تم الحصول على أفضل درجة F1 القائمة على الدورة (0.877) باستخدام MFCC مع ثلاثة عشر معامل بدقة زمنية 64 نقطة لكل تمثيل مرحلة فرعية، في حين حققت درجة F1 الأفضل المعتمدة على الأشخاص (0.855) باستخدام 256 نقطة في التمثيل لكامل الدورة.
لقد أثبتت الدراسة تفوق MFCC مقارنة بطيف log-mel ونموذج VAR في تمييز الربو وCOPD، ومع ذلك لم تسهم استراتيجيات الدمج المتقدمة في تحسين التشخيص. وهذا يظهر أهمية البيانات الحقيقية في الدراسات المتعلقة بالأصوات الرئوية.
تكنولوجيا جديدة في تشخيص الربو وCOPD: تحسين تمثيلات الإدخال الثنائية الأبعاد واستراتيجيات دمج مبتكرة
تقدم هذه الدراسة منهجية مبتكرة لتشخيص الربو ومرض الانسداد الرئوي المزمن باستخدام الشبكات العصبية العميقة. من خلال تحسين طرق تمثيل المدخلات الثنائية الأبعاد، تم تحقيق نتائج دقيقة تدعم أهمية البيانات الحقيقية في الدراسات الصوتية الرئوية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
