في عالم الذكاء الاصطناعي، يعتبر [تحويل الكلام](/tag/[تحويل](/tag/تحويل)-[الكلام](/tag/الكلام)) إلى [نص](/tag/نص) (Automatic Speech [Recognition](/tag/recognition) - [ASR](/tag/asr)) إحدى أهم الابتكارات، حيث تمثل [FormalASR](/tag/formalasr) نقطة [تحول](/tag/تحول) جديدة في هذه [التكنولوجيا](/tag/التكنولوجيا). فبينما كانت الأنظمة التقليدية تتسم غالبًا بتدوين [الكلام](/tag/الكلام) بطريقة حرفية، مما يؤدي إلى تضمين كلمات ملء وهياكل غير رسمية، جاء [FormalASR](/tag/formalasr) ليقدم حلاً فعّالاً.
يُعتبر استخدام نموذجين مدمجين (0.6B و1.7B) [تقنية](/tag/تقنية) بارزة في مجال transcription المباشر للكلام الصيني إلى [نصوص](/tag/نصوص) رسمية. حيث تم [تدريب](/tag/تدريب) هذه [النماذج](/tag/النماذج) على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) ضخمة تُعرف باسم WenetSpeech-Formal وSpeechio-Formal، والتي تم إعدادها باستخدام [تقنيات](/tag/تقنيات) إعادة [الكتابة](/tag/الكتابة) المعتمدة على [نماذج لغوية كبيرة](/tag/[نماذج](/tag/نماذج)-لغوية-كبيرة) (Large Language [Models](/tag/models)) والفلترة النوعية.
وبفضل [أساليب](/tag/أساليب) [التحسين](/tag/التحسين) المشرف، أثبتت [التجارب](/tag/التجارب) على مجموعتي [البيانات](/tag/البيانات) [نجاح](/tag/نجاح) [FormalASR](/tag/formalasr) في تقليل معدل [الأخطاء](/tag/الأخطاء) النسبية (Character Error Rate - CER) بنسبة تصل إلى 37.4% مقارنة بالنماذج التقليدية. كما أظهرت التحسينات الكبرى في قياسات ROUGE-L وBERTScore، مما يدل على فعالية [نموذج](/tag/نموذج) النسخ المباشر هذا.
ما يُميز [FormalASR](/tag/formalasr) هو قدرته على تقديم [حلول](/tag/حلول) خفيفة وسهلة الاستخدام، حيث يتجنب الحاجة إلى معالجة إضافية للنموذج اللغوي في وقت النشر، مما يجعله خيارًا مثاليًا للتطبيقات المباشرة على [الأجهزة](/tag/الأجهزة).
باختصار، [FormalASR](/tag/formalasr) يعد خطوة جديدة ومهمة [نحو](/tag/نحو) تسهيل عملية [كتابة](/tag/كتابة) النصوص الرسمية من [الكلام](/tag/الكلام) المنطوق، ليس فقط في [اللغة](/tag/اللغة) الصينية ولكن قد يمتد تأثيره ليشمل [لغات](/tag/لغات) أخرى أيضًا. ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات).
⏱ 2 دقائق للقراءة👁 0 مشاهدة
ثورة في تحويل الكلام إلى نص: تعرف على FormalASR لتحويل اللغة الصينية المنطوقة إلى نصوص رسمية!
تقدم FormalASR نموذجًا مبتكرًا لتحويل الكلام الصيني المنطوق مباشرة إلى نصوص رسمية دون الحاجة إلى معالجة إضافية! هذه التقنية تعزز دقة الكتابة وتخفف من التعقيدات التقنية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
