في عالم الذكاء الاصطناعي، يكمن التحدي الأبرز في نماذج العالم (World Models) في قدرتها على التنبؤ بالمستقبل بناءً على المشاهدات السابقة. هذه النماذج تلعب دوراً حيوياً في التخطيط واتخاذ القرارات في سياق التعليم التعزيزي (Reinforcement Learning). ومع ذلك، تواجه تلك الهياكل المعمارية الحالية عائقاً أساسياً يتمثل في نوع من التجارة في الذاكرة.

تتمتع نماذج التحويل (Transformers) بقدرة لافتة على الحفاظ على التفاصيل المحلية، ولكنها تعاني من قيود الانتباه التربيعي (Quadratic Attention). في المقابل، تتيح النماذج المتكررة (Recurrent Models) ونماذج الحالة (State-Space Models) كفاءة أكبر، لكنها تقلل من صدقية التاريخ. للتغلب على هذه المعوقات، تقدم الدراسة الجديدة فهماً مبتكراً من خلال فصل التناسق بين المستقبل والماضي عن أي هيكل معماري واحد، مع الاستفادة من مجموعة من الخبراء المتخصصين.

يتم تقديم إطار عمل قائم على الانتشار (Diffusion-Based Framework) يدمج نماذج ذاكرة متباينة من خلال صيغة تباينية للمنتج من الخبراء (Contrastive Product-of-Experts). يتضمن هذا النهج ثلاثة أدوار تكاملية: خبير ذاكرة قصيرة الأمد يلبي الديناميات المحلية بدقة، وعبارة الذاكرة الطويلة الأمد التي تخزن التاريخ الحلقاتي عبر توازن خفيف في وقت الاختبار، وخبير ذاكرة طويلة الأمد مكاني يعزز التماسك الهندسي والمكاني.

هذا التصميم المركب يتجنب انهيار الأنماط (Mode Collapse) ويتيح التوسع في السياقات الطويلة دون تكاليف تربيعية متزايدة. في الاختبارات التجريبية والعالمية، تُظهر طريقتنا تحسناً ملحوظاً في التناسق الزمني، واسترجاع المشاهدات السابقة، وأداء التنقل، مما يؤسس نموذجاً جديداً لبناء وتشغيل نماذج العالم الانتشاري المعززة بالذاكرة.