في عالم الذكاء الاصطناعي، حققت الهندسة المعتمدة على Transformers تقدماً ملحوظاً في توليد تسلسلات موسيقية معقدة. ومع ذلك، لا يزال هناك تحدي كبير في تحقيق التحكم الدقيق والقابل للتفسير في الخصائص الإشارية المتمثلة في الموسيقى. تتناول هذه الورقة البحثية آلية التفسير الميكانيكي لنموذج موسيقى الملتراك ترانسفورمر (Multitrack Music Transformer - MMT) وتقترح إطار عمل يتيح التحكم في الخصائص الموسيقية بشكل دقيق ودون الحاجة إلى إعادة تدريب النموذج.

يعتمد البحث على منهجية Difference-in-Means (DiffMean) لعزل الاتجاهات الكامنة لخصائص الإشارة، تحديداً النغمة (Pitch) والمدة (Duration)، ضمن تيار المتبقي (Residual Stream). لقد أثبتنا صحة فرضية التمثيل الخطي في هذا المجال، حيث تحقق لدينا ارتباط قوي بين مدى التحكم في النغمة والتغيير الحاصل فيها.

لمعالجة مشكلة تشابك الخصائص في التحكم متعدد الخصائص، تم تقديم إطار التحكم المزدوج (Dual Steering) الذي يستخدم عملية الـ Gram-Schmidt Orthogonalization. أظهرت النتائج التجريبية أن هذا التفكيك الهندسي يقلل من التداخل المفاهيمي وتدهور الإشارة مقارنة بالجمع الخطي البسيط، مما يُمكننا من التحكم الد deterministic المستقل حتى في وجود شروط تحكم ذاتية قوية.