في عالم الذكاء الاصطناعي، يظهر كل يوم [ابتكار](/tag/ابتكار) [جديد](/tag/جديد) يأخذنا [نحو](/tag/نحو) آفاق غير متوقعة. واليوم، نسلط الضوء على انطلاقة جديدة في هذا المجال مع إعلان Stable Audio 3، التي تعد عائلة من [نماذج الانتشار](/tag/[نماذج](/tag/نماذج)-[الانتشار](/tag/الانتشار)) (Diffusion [Models](/tag/models)) السريعة لتوليد وتحرير [الصوت](/tag/الصوت) المتغير الطول. وبفضل هذه النماذج، يمكن للمستخدمين [توليد](/tag/توليد) مقاطع صوتية تصل إلى عدة دقائق في زمن قياسي، مما يجعل من الممكن التعامل مع [الأصوات](/tag/الأصوات) القصيرة دون الحاجة لتكاليف [إنتاجية](/tag/إنتاجية) مرتفعة.
تتميز Stable Audio 3 بدعمها لعملية التلوين (Inpainting)، وهو ما يسمح بتحرير صوتي مستهدف واستكمال التسجيلات القصيرة بشكل احترافي. كما أن [نماذج الانتشار](/tag/[نماذج](/tag/نماذج)-[الانتشار](/tag/الانتشار)) الكامنة (Latent Diffusion [Models](/tag/models)) تشتغل فوق مشفر صوتي [جديد](/tag/جديد) (Semantic-Acoustic Autoencoder) الذي يقوم بتحويل [الصوت](/tag/الصوت) إلى [فضاء](/tag/فضاء) كامن مضغوط، مما يسهم في [تحسين](/tag/تحسين) عملية [التوليد](/tag/التوليد) القائمة على [الانتشار](/tag/الانتشار) بينما يحافظ على [جودة الصوت](/tag/جودة-[الصوت](/tag/الصوت)) ويعزز الهيكل الدلالي فيه.
ولتحقيق المزيد من الكفاءة، تم استخدام [تقنيات](/tag/تقنيات) [التدريب](/tag/التدريب) المتواري (Adversarial Post-Training) لتسريع عملية [الاستنتاج](/tag/الاستنتاج) (Inference) وتحسين جودة التوليد، مما يقلل من [عدد](/tag/عدد) خطوات [الاستنتاج](/tag/الاستنتاج) مع [زيادة الدقة](/tag/زيادة-[الدقة](/tag/الدقة)) والامتثال للأوامر المُعطاة. تضم [نماذج](/tag/نماذج) Stable Audio 3 التي تم تدريبها على [بيانات مرخصة](/tag/[بيانات](/tag/بيانات)-مرخصة) وCreative Commons، القدرة على إنتاج [الموسيقى](/tag/الموسيقى) والأصوات في أقل من ثانيتين على وحدات المعالجة ([GPU](/tag/gpu)) H200 وأقل من بضع ثوانٍ على جهاز MacBook Pro M4.
كما تم إصدار أوزان [النماذج](/tag/النماذج) الصغيرة والمتوسطة التي يمكن تشغيلها على [الأجهزة](/tag/الأجهزة) ذات الجودة الاستهلاكية، مع توفير مسار [التدريب](/tag/التدريب) والاستنتاج الخاص بها. إن هذا التطور يعد بفتح آفاق جديدة للإبداع في مجال الصوتيات، مما يمنح فنانين ومدوني [الصوت](/tag/الصوت) [أدوات](/tag/أدوات) مبتكرة للتعبير عن أفكارهم بطريقة جديدة وجذابة. هل أنتم مستعدون لاستكشاف هذه التطورات في عالم [الصوت](/tag/الصوت)؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات)!
ثورة في عالم الصوت: استكشف قوة Stable Audio 3 لتوليد وتحرير الصوت بسرعة مذهلة!
تقدم Stable Audio 3 نماذج سريعة لتوليد الصوت وتحريره، مما يتيح إنتاج مقاطع صوتية متغيرة الطول بكفاءة. الفوائد تشمل تحرير الصوت المستهدف وتحسين جودة الصوت بفضل تقنيات مبتكرة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
