في خطوة جديدة نحو تعزيز قدرات الذكاء الاصطناعي، أعلنت شركة مايكروسوفت عن إطلاق النسخة الثانية من عائلة نماذج تحويل الصوت إلى نص (speech-to-text) باسم MAI-Transcribe-1.5. يتضمن هذا النموذج الجديد تحسينات ملحوظة تشمل تغطيته لـ 43 لغة، بالإضافة إلى إضافة ميزة تمييز الكلمات الرئيسية (entity biasing) لدعم المصطلحات المحددة للمجالات المختلفة.

تتميز MAI-Transcribe-1.5 بدقة استثنائية تقدر بمعدل خطأ كلمات يبلغ 2.4% وفقًا لقائمة التقييم Artificial Analysis، مما يجعلها من بين النماذج الأفضل أداءً في السوق. لكن الأهم من ذلك، هو سرعة الأداء العالية حيث يمكنها تحويل ساعة كاملة من التسجيلات الصوتية إلى نص في أقل من 15 ثانية!

تحظى هذه التقنية بتوفر عام من خلال Azure AI Foundry، مما يتيح لمستخدميها الاستفادة منها في شتى المجالات، بدءًا من الأعمال التجارية ووصولاً إلى التعليم والمحتوى الإعلامي. إن هذه الإضافات والتحديثات تجعل من MAI-Transcribe-1.5 أداة قوية تساهم في تحسين الإنتاجية وتيسير الوصول إلى المحتوى الصوتي بصورة أفضل.

فما رأيكم في هذه التحسينات؟ هل تعتقدون أنها ستحدث ثورة في كيفية تعاملنا مع المحتوى الصوتي؟ لا تترددوا في مشاركتنا آرائكم وتجاربكم في التعليقات!