في عالم الذكاء الاصطناعي (AI)، تثير الهلوسات في نماذج التعرف على الصوت (ASR) قلقًا متزايدًا، حيث تمثل خطرًا كبيرًا على الأمان. وفي دراسة جديدة، تم تقديم ما يعرف بنظرية الحساسية الطيفية (Spectral Sensitivity Theorem)، التي تتنبأ بحدوث انتقال في مرحلة الشبكات العميقة من نظام تشتت (dispersive regime) إلى نظام جذب (attractor regime). يسيطر هذا الانتقال على الكسب والتوافق بين الطبقات.

قام الباحثون بتحليل الطيف الخاص برسوم التنشيط في نماذج Whisper، التي تتنوع من النماذج الصغرى إلى الكبيرة (Large-v3-Turbo)، تحت ضغوط معادية. وقد تؤكد النتائج التوقعات النظرية: إذ يظهر أن النماذج المتوسطة تعاني من ما يسمّى بـ”التفكيك الهيكلي“ (Structural Disintegration) في المرحلة الأولى، والذي يتصف بانخفاض قدره 13.4% في الرتبة للتركيز المتقاطع (Cross-Attention).

على النقيض من ذلك، تدخل النماذج الكبيرة في حالة ما يُعرف بـ”جاذبية السعي للضغط“ (Compression-Seeking Attractor) في المرحلة الثانية، حيث يقوم التركيز الذاتي (Self-Attention) بضغط الرتبة بنسبة -2.34% ويعزز من ميل الطيف، مما يفصل النموذج عن الأدلة الصوتية.

هذا الاكتشاف ليس فقط خطوة نحو فهم أعمق لديناميكيات نماذج التعلم الآلي ولكن أيضًا دلالة على كيفية تحسين أمان هذه النماذج وجعلها أكثر فعالية في المستقبل.