في العصر الحديث للذكاء الاصطناعي، تعتبر نماذج اللغة أداة غير قابلة للتجاهل في مجال توليد النصوص. ومع ذلك، كان هناك تحدٍ كبير في تحقيق الكفاءة والجودة. منذ فترة، ظهرت نماذج Diffusion اللغوية (dLLMs) كحل واعد، حيث كانت قادرة على استعادة الرموز المخفية بشكل متوازي، مما يزيد من سرعة توليد النصوص مقارنةً بأساليب التوليد التدريجي (AR).

لكن الأمر لم يكن بهذه السهولة، فقد واجهت هذه النماذج تحدياً معمارياً مهماً. فبينما يتيح الانتباه ثنائي الاتجاه جودة توليد عالية، فهو غير متوافق مع التخزين المؤقت للبيانات (KV caching)، مما يقلل من كفاءة الاستنتاج في عمليات الإنتاج الجماعية. من الناحية الأخرى، يوفر الانتباه المتسبب كفاءة أعلى في الاستنتاج عبر التخزين المؤقت، ولكنه يخسر المعلومات من السياق الأيمن، مما يؤثر سلباً على جودة النص المولد.

هذا ما جعل الباحثون يفكرون في نموذج Bifocal dLLMs، الذي يقدم حلاً مبتكراً من خلال مفهوم السياقات غير التماثلية (asymmetric bidirectional context). تم تقديم هذا النموذج تحت اسم R2LM (Right-to-Left Mamba)، والذي يجمع بين آليتين تكملان بعضهما البعض: الأولى، الانتباه المتسبب الذي يوفر سياقاً دقيقاً من اليسار مع كامل توافق التخزين المؤقت؛ والثانية، آلية Mamba SSM الخفيفة التي تزود بمعلومات مضغوطة من اليمين دون كسر إمكانية التخزين المؤقت.

أثبتت التجارب الشاملة التي أجريت على نموذج Qwen3-1.7B مع 60 مليار رموز، أن R2LM تحقق تحسينات ملحوظة في الأداء، حيث سجلت زيادة في سرعة التوليد تتراوح بين 2.4 إلى 12.9 مرة مقارنةً بنماذج dLLMs ثنائية الاتجاه، و1.9 إلى 2.9 مرة مقارنةً بأساليب AR في سياقات الإنتاج الجماعية من خلال فك تشفير متوازي مع التخزين المؤقت. كما تفوق النموذج أيضاً في معظم الاختبارات وأظهر أداءً متميزًا مقارنةً بنموذج dLLM ثنائي الاتجاه.

تعد هذه النتائج خطوة كبيرة نحو تحسين تجربة توليد النصوص باستخدام نماذج الذكاء الاصطناعي، مما يفتح آفاقًا جديدة للبحث والتطوير في هذا المجال.