في خطوة جديدة نحو فهم أعمق لكيفية عمل نماذج المحولات (Transformers)، قام باحثون بتأطير عمليات نقل البيانات من خلال هذه المعمارية، التي تمثل جوهر نماذج اللغات الضخمة (Large Language Models)، كنظام تحكم غير خطي في فضاء توزيعات الاحتمالات. حيث تم تسليط الضوء على نموذج المحول الذي يعتمد على الانتباه الذاتي (Self-Attention) والطبقات التغذوية (Feed-Forward Layers).

تم إثبات أن التوزيعات الجاوسية (Gaussian Distributions) تظل كما هي خلال التدفق الناتج، مما يحد من ديناميكيات القياس اللامحدود إلى نظام تحكم ثنائي الأبعاد يقوم بتوجيه تحولات المتوسط والتباين. هذه الاكتشافات لا تظل محددة بعالم الرياضيات فحسب، بل تعيد تشكيل قدرة نماذج المحولات كمسألة وصول لحظات Gaussian المحددة.

كما تمكّن الباحثون من التعمق في علاقة هذا النظام بمعادلات رياضية تقليدية تُستخدم في التصفية والتحكم، موضحين كيف أن التحكم المتغير زمنياً يمكن أن يتيح الوصول الدقيق إلى أي توزيع Gaussian مستهدف يتمتع بمصفوفة تباين بنفس رتبة المصفوفة الأولية. بينما بالنسبة للمعلمات الثابتة زمنياً، تم الحصول على شروط طيفية واضحة تقود إما إلى استقرار آسيمبتي (Asymptotic Stability) نحو نقاط توازن موجبة محددة أو إلى انفجار محدود في التباين.

تجارب عددية حديثة تتماشى مع النظرية، تشير إلى أن المحولات العملية مع مدخلات جاوسية تظل قريبة جداً من توزيعات Gaussian المعدلة زمنياً خلال الطبقات الأولى والمتوسطة. كما أن المحولات التي تعتمد على مصفوفات الانتباه المحددة تُعيد إنتاج أنماط التباين المتوقعة: تطور محدود في إعدادات مستقر وإصدار مؤقت في الإعدادات غير المستقرة. كل هذه التطورات تضع الأساس لفهم أفضل لكيفية معالجة الذكاء الاصطناعي للبيانات المعقدة.