يعد التعرف على الكلام أحد التحديات الكبيرة التي تواجه المتحدثين الذين يعانون من صعوبات النطق (Dysarthria). بينما يقدم التعلم الفيدرالي (Federated Learning) أداة فعالة لحماية الخصوصية، إلا أنه يواجه قضايا تتعلق بالهتروجينية الناجمة عن تفاوت صوت المتحدثين. في هذا السياق، أصبحت فكرة شخصنة النموذج طريقة واعدة للتغلب على هذه التحديات.
في الورقة البحثية المعنية، تم استكشاف استراتيجيتين للأغراض في مجال التعلم الفيدرالي، وهما استراتيجية تجميع قائمة على المتوسط (Parameter-based Averaging) واستراتيجية تجميع قائمة على التضمين (Embedding-based Averaging). تظهر النتائج التجريبية على مجموعتي البيانات UASpeech و TORGO تفوق الأساليب المقترحة على الطريقة التقليدية المعروفة باسم FedAvg، مع تحسينات إحصائية ملحوظة في تقليل معدل الأخطاء في التعرف (Word Error Rate) تصل إلى 0.99% على UASpeech و0.56% على TORGO.
هذا التطور العلمي يمثل قفزة نوعية في كيفية تعامل الأنظمة الذكية مع تحديات الكلام البشري المتنوع، مما يعزز من تجربة المستخدمين ويدعمهم في التواصل بشكل فعال. نأمل أن تلهم هذه النتائج مزيدًا من الأبحاث واستكشافات مهمة في هذا المجال.
ما رأيكم في أهمية تطوير تقنيات التعرف على الكلام لذوي الاحتياجات الخاصة؟ شاركونا في التعليقات!
تقدم مذهل في تعلم الآلة الفيدرالي: كيف يعزز التعرف على الكلام لذوي صعوبات النطق؟
تقديم شخصنة فعالة لتعلم الآلة الفيدرالي لتعزيز التعرف على الكلام لدى المتحدثين ذوي صعوبات النطق. أساليب جديدة تحقق تحسينات ملحوظة في الأداء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
