في خطوة مبتكرة لتطوير تقنيات التعرف على الصوت، تركز دراستنا على تطبيق تقنية التعرف على الكلمات الرئيسية (KWS) في مجال اللغة الهندية، مستفيدين من مجموعة بيانات تضم 40,000 نموذج صوتي. تم تسجيل هذه البيانات بمعدل أخذ عينات يبلغ 44 كيلوهرتز ومدة متوسطة تقارب 1.9 ثانية لكل نموذج، وذلك بهدف تصميم نظام KWS فعّال يعتمد على الأجهزة ويستهدف استفسارات محددة من المستخدمين.
تعتمد دراستنا على الشبكات العصبية التلافيفية (CNNs) في عملية التصنيف، حيث نستخدم تقنيات هندسة الميزات لتحويل التسجيلات الصوتية الخام إلى معاملات التردد المللي (MFCCs)، والتي تعتبر مدخلًا مثاليًا لشبكتنا. من خلال سلسلة من التجارب، استكشفنا مختلف هياكل CNN لتقييم فعاليتها في تحديد الكلمات الرئيسية المعدة مسبقًا ضمن دفق الكلام المستمر.
بفضل هذه الطريقة المعتمدة على CNN، تمكنّا من تحقيق معدل دقة مثير للإعجاب بلغ 91.79% بعد تقييم دقيق، مما يظهر أداء واعدًا مع ضمان الكفاءة الحاسوبية وتخصيص النظام وفقًا لاحتياجات المستخدمين في التعرف على الكلام باللغة الهندية.
كلماتك تخرج للحياة: كيفية استخدام الشبكات العصبية التلافيفية في التعرف على الكلمات الرئيسية في اللغة الهندية
تستخدم دراستنا الشبكات العصبية التلافيفية لتطوير نظام فعال للتعرف على الكلمات الرئيسية في اللغة الهندية، محققين دقة مذهلة تصل إلى 91.79%. هل أنتم مستعدون لاستكشاف المستقبل؟
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
