في عصر التكنولوجيا الحديثة، أظهرت نماذج اللغات الضخمة (Large Language Models) تقدمًا ملحوظًا في مجالات متعددة، بما في ذلك الموسيقى. ومع ذلك، كانت معظم الأبحاث تتركز حول التقاليد الموسيقية الغربية، مما ترك العديد من الأسئلة حول قدرة هذه النماذج على التعامل مع الموسيقى التقليدية المنخفضة الموارد، مثل الموسيقى الكلاسيكية في جنوب آسيا.
في دراسة جديدة، تمثل هذه الأبحاث مراجعة منهجية لمدى كفاءة نماذج اللغات الضخمة في فهم الموسيقى الكلاسيكية الهندية، والموسيقية البنجالية، بما في ذلك تقاليد مثل الربندر سانغيت (Rabindra Sangeet) ونزرويل سانغيت (Nazrul Sangeet). تعتمد هذه التقاليد على قواعد معينة مثل "راجا" و"طالا"، والتي تختلف جذرياً عن الموسيقى الغربية المرتكزة على التناغم.
لتحقيق تقييم شامل، أُنشئ معيار لتقييم الفهم الموسيقي يتضمن 504 سؤال وإجابة تشمل قواعد الرجا والمعرفة الثقافية واستدلال الرموز. تمت مقارنة 33 نموذجًا من نماذج اللغات الضخمة، حيث حققت النماذج الرائدة مثل Gemini 2.5 Pro دقة تتراوح بين 85-90%، فيما ظلت معظم النماذج مفتوحة المصدر ضمن نطاق 23-40%.
وعند النظر إلى القدرة على توليد الموسيقى، تم تطوير إطار عمل للتحكم يتضمن خمسة مستويات من التنبيهات. أظهرت النتائج أن النموذج الأقوى كان قادرًا على إنتاج مخرجات متوافقة مع الأسلوب فقط في 40% من الحالات. تكشف هذه النتائج عن الفروق بين الصحة الهيكلية والأمانة الأسلوبية في توليد الموسيقى، موضحةً تحديًا قائمًا في نمذجة الموسيقى المستندة إلى الثقافة.
تعتبر هذه الدراسة خطوة مهمة نحو فهم أفضل لنماذج اللغات الضخمة وتحقيق تنوع ثقافي في الفنون الموسيقية، مما يدعو إلى مزيد من البحث والابتكار.
استكشاف نماذج اللغات الضخمة لفهم وتوليد الموسيقى في جنوب آسيا: خطوة نحو التنوع الثقافي
تظهر الأبحاث الجديدة تقدم نماذج اللغات الضخمة (LLMs) في فهم وتوليد الموسيقى التقليدية جنوب الآسيوية. تكشف النتائج عن تحديات مهمة في تحقيق الأمانة الأسلوبية والهيكلية في هذه الفنون الغنية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
