يعد الاعتراف بالكلام لدى مرضى الديسارثريا (Dysarthria) أمرًا بالغ الأهمية، حيث يُسهِّل التواصل الفعال بين الأفراد الذين يعانون من هذه الحالة. إلا أن التحديات الكبيرة التي تواجه التعرف على الكلام الديسارثري ناتجة عن اختلاف حدة الأعراض وندرة البيانات المتاحة. في هذا الإطار، استكشفت دراسة جديدة تقنيات تحويل البيانات لتحسين أنظمة التعرف التلقائي على الكلام (ASR) للمصابين بالديسارثريا، من خلال إجراء تعديلات على نموذج Wav2Vec2 المدرب مسبقًا.
تتضمن الدراسة أربعة أساليب بارزة لتعزيز البيانات: تعديل سرعة الكلام (Speaking-Rate Modification - SRM)، تعديل النغمة (Pitch Modification - PM)، تعديل شكل الصوت (Formant Modification - FM)، وتغيير طول القناة الصوتية (Vocal Tract Length Perturbation - VTLP). تم تصميم هذه الأساليب لتتناسب مع الجوانب المختلفة للديسارثريا، حيث تم استخدام نماذج Wav2Vec2 المُعدِّلة بشكل فردي لكل فئة من فئات الحدة كأنظمة أساسية.
تُظهر النتائج أن هناك أنماط فعالية متميزة لكل تقنية تحسين عبر مستويات الحدة. كان أداء أفضل معدلات أخطاء الكلمات (Word Error Rates - WER) هو 9.02% للحدة المنخفضة و38.11% للحدة المتوسطة عند استخدام SRM، بينما سجلت الحدة العالية أدنى معدل WER بلغ 55.15% مع استخدام PM. تعكس هذه النتائج تحسنًا ملحوظًا يصل إلى 30.02% و16.64% و15.47% على التوالي.
تؤكد هذه النتائج فعالية أساليب التحويل في تعزيز أداء أنظمة التعرف على الكلام للمصابين بالديسارثريا، مما يفتح أفقًا للابتكارات المستقبلية في تطوير تقنيات تساعد هؤلاء الأفراد على التواصل بشكل أفضل.
تحسين التعرف على الكلام لمرضى الديسارثريا: تقنيات مبتكرة لتحسين التواصل
تسعى الأبحاث الجديدة إلى تحسين أنظمة التعرف على الكلام لمرضى الديسارثريا باستخدام تقنيات تحويل البيانات. نتائج التجارب تظهر فعالية ملحوظة تُسهِّل التواصل للأفراد الذين يعانون من صعوبة في النطق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
