في عالم مليء بالتحديات المتعلقة باضطرابات النطق، يمثل الأطفال الكوريون محور اهتمام خاص حيث يعاني حوالي 44% منهم من مشكلات في التواصل. ومع ذلك، يظل تطوير أدوات التقييم الآلي لنطق هؤلاء الأطفال محدودًا. في محاولة للتغلب على هذه العقبة، قام الباحثون بتقديم نظام شامل لتقييم النطق الآلي، حيث يدمج هذا النظام بين تقنيات تنظيم الأصوات (Speaker Diarization) والتعلم الذاتي (Self-Supervised Learning).

يتميز هذا البحث بتقديم مجموعة بيانات جديدة تمت الموافقة عليها من قبل IRB، تحتوي على 53 تسجيلًا لأطفال يتحدثون اللغة الكورية تتراوح أعمارهم بين سنتين إلى خمس سنوات. تم تمييز جزء من هؤلاء الأطفال بواسطة ثلاثة مراجعين مستقلين، مما أدى إلى إنشاء 1,190 علامة دقة على مستوى الكلمات الساكنة و748 علامة على مستوى الحروف المتحركة.

أجرى الباحثون تقييمًا لثلاثة نماذج لتنظيم الأصوات، حيث أثبت نموذج NeMo SortFormer كفاءته العالية في تحقيق دقة بنسبة 88.69% في عد المتحدثين، مع معدل خطأ في التنظيم يبلغ 33.04%. جاءت هذه النتائج نتيجة للهيكل المبتكر الذي يعتمد على التعلم من توقيت وصول الأصوات، مما ساعد على معالجة التداخلات الصوتية الناتجة عن الأمهات في دورهن كمربيات يتحدثن بأسلوب مرح.

وفي ما يخص تقييم النطق، تم اختبار ثلاثة نماذج تعلم ذاتي مختلفة بمساعدة استراتيجيات تجمع متعددة. وقد أثبتت طريقة مجموعة النماذج المتنوعة دقتها في التنبؤ بالحروف الساكنة بمتوسط دقة يبلغ 0.720، والحروف المتحركة بشكل أفضل بمتوسط دقة 0.845، مما أدى إلى متوسط دقة قدره 0.782.

إن هذه الابتكارات لا تمثل مجرد تحسينات تقنية، بل إنها خطوة هامة نحو توفير أدوات تقيمية فعالة تسهم في دعم الأطفال الكوريين الذين يعانون من اضطرابات النطق، مضيئةً الطريق نحو مستقبل أفضل في مجال التواصل.