في خطوة متقدمة نحو تعزيز تكنولوجيا الذكاء الاصطناعي، أعلنت شركة StepFun، المعروفة بمختبرها البحثي في شنغهاي، عن إطلاق نموذج StepAudio 2.5 في مايو 2026. يُعتبر هذا النموذج نموذجاً لغوياً صوتياً متكاملاً يعمل في الوقت الحقيقي (Realtime)، مما يمكّن المستخدمين من تفاعلات وتجارب صوتية غنية ومخصصة.

يمتاز StepAudio 2.5 بإمكانياته الفريدة في تخصيص الشخصيات، مما يسمح لمطوري التطبيقات بخلق تجارب صوتية تتناسب مع محتويات معينة أو أدوار معينة، مما يزيد من تفاعل المستخدمين واهتمامهم.

علاوة على ذلك، يتصل النموذج عبر واجهة برمجة تطبيقات WebSocket (WebSocket API) ويدعم اللغتين الصينية والإنجليزية، مما يجعله خياراً متاحاً لمجموعة واسعة من المستخدمين.

تجدر الإشارة إلى أن StepAudio 2.5 حصل على درجات ممتازة في اختبارات الأداء في أبريل 2026، حيث حقق ما يصل إلى 80.41 في التقييم البشري و82.18 في الفهم اللغوي غير اللفظي (paralinguistic comprehension). هذا الإنجاز يُظهر قدرة النموذج على فهم سياقات وخلفيات المعاني، مما يعزز فعالية التواصل بين الإنسان والآلة.

إنها بداية جديدة لتطبيقات الصوت المتقدمة، وكما هو متوقع، سيكون لهذا التطور تأثير كبير على صناعة الذكاء الاصطناعي، بما في ذلك الألعاب، خدمة العملاء، والتدريب الافتراضي. هل ترى أن هذا النموذج سيؤثر بشكل إيجابي على تفاعل الإنسان مع التكنولوجيا؟ لا تتردد في مشاركتنا آرائك!