في عالم الذكاء الاصطناعي، يعتبر [تحويل الكلام](/tag/[تحويل](/tag/تحويل)-[الكلام](/tag/الكلام)) إلى [نص](/tag/نص) (Automatic Speech [Recognition](/tag/recognition) - [ASR](/tag/asr)) إحدى أهم الابتكارات، حيث تمثل [FormalASR](/tag/formalasr) نقطة [تحول](/tag/تحول) جديدة في هذه [التكنولوجيا](/tag/التكنولوجيا). فبينما كانت الأنظمة التقليدية تتسم غالبًا بتدوين [الكلام](/tag/الكلام) بطريقة حرفية، مما يؤدي إلى تضمين كلمات ملء وهياكل غير رسمية، جاء [FormalASR](/tag/formalasr) ليقدم حلاً فعّالاً.

يُعتبر استخدام نموذجين مدمجين (0.6B و1.7B) [تقنية](/tag/تقنية) بارزة في مجال transcription المباشر للكلام الصيني إلى [نصوص](/tag/نصوص) رسمية. حيث تم [تدريب](/tag/تدريب) هذه [النماذج](/tag/النماذج) على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) ضخمة تُعرف باسم WenetSpeech-Formal وSpeechio-Formal، والتي تم إعدادها باستخدام [تقنيات](/tag/تقنيات) إعادة [الكتابة](/tag/الكتابة) المعتمدة على [نماذج لغوية كبيرة](/tag/[نماذج](/tag/نماذج)-لغوية-كبيرة) (Large Language [Models](/tag/models)) والفلترة النوعية.

وبفضل [أساليب](/tag/أساليب) [التحسين](/tag/التحسين) المشرف، أثبتت [التجارب](/tag/التجارب) على مجموعتي [البيانات](/tag/البيانات) [نجاح](/tag/نجاح) [FormalASR](/tag/formalasr) في تقليل معدل [الأخطاء](/tag/الأخطاء) النسبية (Character Error Rate - CER) بنسبة تصل إلى 37.4% مقارنة بالنماذج التقليدية. كما أظهرت التحسينات الكبرى في قياسات ROUGE-L وBERTScore، مما يدل على فعالية [نموذج](/tag/نموذج) النسخ المباشر هذا.

ما يُميز [FormalASR](/tag/formalasr) هو قدرته على تقديم [حلول](/tag/حلول) خفيفة وسهلة الاستخدام، حيث يتجنب الحاجة إلى معالجة إضافية للنموذج اللغوي في وقت النشر، مما يجعله خيارًا مثاليًا للتطبيقات المباشرة على [الأجهزة](/tag/الأجهزة).

باختصار، [FormalASR](/tag/formalasr) يعد خطوة جديدة ومهمة [نحو](/tag/نحو) تسهيل عملية [كتابة](/tag/كتابة) النصوص الرسمية من [الكلام](/tag/الكلام) المنطوق، ليس فقط في [اللغة](/tag/اللغة) الصينية ولكن قد يمتد تأثيره ليشمل [لغات](/tag/لغات) أخرى أيضًا. ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات).