في عالم تطوير الذكاء الاصطناعي، تعد الموسيقى من المجالات الرائعة التي شهدت تحولاً ملحوظاً في السنوات الأخيرة. ومع تقدم نماذج توليد الموسيقى لمعالجة المدخلات المعقدة التي تجمع بين النصوص والكلمات والموسيقى المرجعية، كان من المحبط أن تكون آليات التقييم متخلفة عن الركب. ولكن، مع البحث الجديد الذي قام به العلماء، تم إحداث ثغرة في هذا الأمر.

تقدم الورقة الجديدة مفهوم CMI-RewardBench، وهو نظام شامل لتقييم نماذج المكافآت الموسيقية تحت إطار تعليمات متعددة الوسائط (Compositional Multimodal Instruction). يتيح هذا النظام تقييم الموسيقى التي يتم إنشاؤها استنادًا إلى أوصاف نصية، كلمات أغاني، وتحفيزات صوتية.

أحد الجوانب اللافتة للانتباه هو إدخال مجموعة بيانات CMI-Pref-Pseudo، والتي تتضمن 110,000 عينة مُعَلَّمَة بشكل زائف، ومجموعة CMI-Pref ذات الجودة العالية التي تم تحليلها من قبل البشر لمهام المحاذاة الدقيقة.

بهدف توحيد بيئة التقييم، تم اقتراح CMI-RewardBench كمعلمة موحدة لتقييم نماذج المكافآت الموسيقية ضمن عينات متنوعة تتعلق بالموسيقية وتوافق النص مع الموسيقى. باستخدام هذه الموارد، تم تطوير نماذج مكافآت CMI (CMI-RMs)، وهي عائلة من نماذج المكافآت ذات الكفاءة العالية مع القدرة على معالجة المدخلات المتنوعة.

أثبتت التجارب أن نماذج CMI-RM لا تتوافق فقط بقوة مع تقييمات البشر في الموسيقية والتوافق، ولكنها تتيح أيضاً توسيع نطاق الاستدلال بشكل فعال عبر تصفية top-k. وبالتالي، يوفر هذا البحث منصة قوية يمكن أن تعزز من جودة تقييم الموسيقى التي يتم إنشاؤها بواسطة الذكاء الاصطناعي.

إليكم الروابط للحصول على نموذج CMI-RM:
- CMI-RM Model Weights
- CMI-Pref-Pseudo Dataset
- CMI-Pref Dataset

هل تعتقد أن نماذج المكافآت الموسيقية ستحدث ثورة في كيفية تقييم الموسيقى التي ينتجها الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!