تعتبر أنظمة توصيات الموسيقى (Music Recommendation Systems - MRSs) حجر الزاوية في العديد من المنصات الموسيقية الحديثة. اعتمدت النماذج الحالية لتوصيات الموسيقى، التي تمر بمراحل الاسترجاع والتصنيف، بشكل كبير على أساليب التصفية التعاونية، مما قاد إلى أداء غير مُرضٍ لا سيما في حالات بداية الانطلاق الباردة. أحد الأسباب الرئيسية لهذا القصور هو عدم استغلال الخصائص الداخلية للصوت.
لذا، جاء البحث الجديد ليقدم حلاً مبتكرًا يُعرف باسم TASTE، وهو dataset شامل وإطار عمل لقياس فعالية التوصيات، يسلط الضوء على أهمية المعلومات متعددة الوسائط. يتميز TASTE بإدماج كل من البيانات الصوتية والنصية، مما يُظهر كيف يمكن للنماذج الاستفادة من كليهما لتحقيق نتائج أفضل.
تستند النتائج إلى استخدام محولات موسيقية ذاتية التعليم على نطاق واسع، حيث تم إثبات القيمة الكبيرة للتمثيلات الصوتية المستخرجة في مختلف مهام التوصية، بدءًا من استرجاع المرشحين وصولاً إلى النقر على التوصيات (CTR). إلى جانب ذلك، تم تقديم طريقة جديدة تُسمي MuQ-token، التي تسهل دمج الميزات الصوتية متعددة الطبقات بطريقة أكثر فعالية، مما أدى إلى أداء يتفوق باستمرار على التقنيات الأخرى.
بهذه الطريقة، ليس فقط أن الدراسة تؤكد على فعالية الأساليب المدفوعة بالمحتوى، بل توفر أيضًا أساسًا قويًا وقابلًا لإعادة الاستخدام للأبحاث المستقبلية. يُمكنك الاطلاع على الشيفرة المصدرية للمشروع عبر [رابط الشيفرة على GitHub](https://github.com/zreach/TASTE). ما رأيكم في تطوير أنظمة توصيات الموسيقى باستخدام البيانات متعددة الوسائط؟ شاركونا أفكاركم في التعليقات.
ثورة توصيات الموسيقى: تحسين فعالية النماذج باستخدام البيانات متعددة الوسائط
تقدم دراستنا الجديدة إطار عمل متكاملاً لتوصييات الموسيقى يستفيد من البيانات الصوتية والنصية، ويعالج تحديات الأنظمة الحالية. مع النموذج الجديد TASTE، نحقق تحسينًا كبيرًا في دقة التوصيات حتى في السيناريوهات الصعبة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
