في خطوة جديدة نحو تعزيز قدرات الذكاء الاصطناعي، أعلنت شركة مايكروسوفت عن إطلاق النسخة الثانية من عائلة نماذج تحويل الصوت إلى نص (speech-to-text) باسم MAI-Transcribe-1.5. يتضمن هذا النموذج الجديد تحسينات ملحوظة تشمل تغطيته لـ 43 لغة، بالإضافة إلى إضافة ميزة تمييز الكلمات الرئيسية (entity biasing) لدعم المصطلحات المحددة للمجالات المختلفة.
تتميز MAI-Transcribe-1.5 بدقة استثنائية تقدر بمعدل خطأ كلمات يبلغ 2.4% وفقًا لقائمة التقييم Artificial Analysis، مما يجعلها من بين النماذج الأفضل أداءً في السوق. لكن الأهم من ذلك، هو سرعة الأداء العالية حيث يمكنها تحويل ساعة كاملة من التسجيلات الصوتية إلى نص في أقل من 15 ثانية!
تحظى هذه التقنية بتوفر عام من خلال Azure AI Foundry، مما يتيح لمستخدميها الاستفادة منها في شتى المجالات، بدءًا من الأعمال التجارية ووصولاً إلى التعليم والمحتوى الإعلامي. إن هذه الإضافات والتحديثات تجعل من MAI-Transcribe-1.5 أداة قوية تساهم في تحسين الإنتاجية وتيسير الوصول إلى المحتوى الصوتي بصورة أفضل.
فما رأيكم في هذه التحسينات؟ هل تعتقدون أنها ستحدث ثورة في كيفية تعاملنا مع المحتوى الصوتي؟ لا تترددوا في مشاركتنا آرائكم وتجاربكم في التعليقات!
مايكروسوفت تطلق MAI-Transcribe-1.5: دقة استثنائية وسرعة متفوقة في تحويل الصوت إلى نص!
أطلقت مايكروسوفت النسخة الجديدة MAI-Transcribe-1.5، التي تتيح تحويل الصوت إلى نص بدقة مذهلة تبلغ 2.4% في معدل خطأ الكلمات. كما تسمح بتحويل ساعة واحدة من التسجيلات الصوتية في أقل من 15 ثانية، مما يرفع مستوى الإنتاجية بشكل غير مسبوق.
المصدر الأصلي:مارك تيك بوست
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
