حظيت أنظمة التعرف التلقائي على الكلام (ASR) بنجاح كبير في العديد من التطبيقات، ولكن التحديات تكون أكبر في البيئات السريرية التي تعتمد على نصوص متعددة. تواجه هذه الأنظمة مشكلة تعدد النصوص (multiscript variability) حيث يمكن أن يظهر نفس المصطلح بأشكال كتابية صحيحة متعددة.
تقوم معايير تقييم الأداء التقليدية بمعالجة التباينات النصية كأخطاء، مما قد يؤدي إلى التقليل من دقة الأنظمة. للتغلب على هذه المشكلة، تم تقديم معيار جديد باسم MultiClin، الذي يهدف إلى تحسين تقييم الجودة في هذه الأنظمة في البيئات السريرية.
وقد أظهرت التجارب مع نماذج ASR متنوعة أن التقييم الذي يأخذ في الاعتبار تعدد النصوص يوفر تقييمًا أكثر عدلاً بالنسبة لجودة التعرف مقارنةً بالتقييمات التقليدية التي تعتمد على مراجع فردية.
علاوةً على ذلك، تم تحليل أثر تناسق النصوص خلال عملية التدريب، حيث أظهرت النتائج أن عدم التناسق في الخرائط النصية يزيد من عدم اليقين الكتابي ويعوق تقارب النموذج. بينما تؤدي نسبة التناسق البالغة 50% إلى أعلى مستوى من الاضطراب (entropy). ومن المثير للاهتمام أن توحيد النصوص قاد إلى تحقيق أفضل أداء لنظام ASR باستمرار.
للحصول على مجموعة البيانات والكود المستخدم في هذه الدراسة، يمكن زيارة الرابط الخاص: GitHub.
تحديات جديدة في التعرف على الكلام: فحص الأداء في البيئات السريرية متعددة النصوص
تسلط الدراسة الجديدة الضوء على أهمية تقييم أداء نظام التعرف التلقائي على الكلام (ASR) في البيئات السريرية المعتمدة على النصوص المتعددة. تقدم الدراسة معياراً جديداً يساهم في تقييم دقة التعرف بشكل عادل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
