في عصر الذكاء الاصطناعي، تتسابق أنظمة توليد الأغاني لتقديم تجارب موسيقية غنية. ومع ذلك، كانت هناك تحديات كبيرة في تحسين التحكم الدقيق في العناصر الزمنية للموسيقى. هنا يأتي دور SegTune، الإطار الثوري المدعوم بتقنية التحويل Diffusion والذي يضع بين يديك إمكانية التحكم في هيكل الأغاني بطريقة جديدة ومبتكرة.
تعمل تقنية SegTune على تمكين المستخدمين أو نماذج اللغات الضخمة (Large Language Models) من تقديم أوصاف موسيقية محلية تتماشى بدقة مع مقاطع الأغاني. فبدلاً من الاعتماد على أوامر عامة، يمكنك الآن تحديد تفاصيل دقيقة لكل جزء من الأغنية، مما يساهم في تحقيق تجانس دائم في الأسلوب الموسيقي.
ولتوفير تنسيق دقيق بين الكلمات والموسيقى، تم إدخال متنبئ بالمدة المعتمد على نماذج اللغات الضخمة، والذي يقوم بإنشاء طوابع زمنية على مستوى الجمل في تنسيق LyRiCs بشكل تلقائي. بالإضافة إلى ذلك، تم بناء خط أنابيب بيانات واسع النطاق لجمع الأغاني عالية الجودة مع كلمات متوافقة.
تشير التجارب إلى أن SegTune يتفوق على الأنظمة الحالية من حيث الموسيقية وقدرة التحكم. إذا كنت تبحث عن أسلوب جديد في إنتاج الموسيقى أو ترغب في التعمق أكثر في هذه التقنية، يمكنك زيارة صفحتنا الخاصة بالمشروع [https://github.com/KlingAIResearch/SegTune] للحصول على الأكواد ومزيد من الأغاني المولدة.
ما رأيكم في مستقبل توليد الموسيقى بالذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!
SegTune: تحكم دقيق ومهيكل في انتاج الموسيقى بفضل الذكاء الاصطناعي!
يقدم SegTune طريقة مبتكرة لتوليد الأغاني من خلال التحكم الدقيق في الهيكل الموسيقي. باستخدام تقنية التحويل القائمة على الـ Diffusion، يمكن للمستخدمين تحديد أوصاف موسيقية محلية تتماشى مع مقاطع الأغاني.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
