في عالم الذكاء الاصطناعي، يعد الوصول الفوري إلى المعرفة أحد أكبر التحديات التي تواجه نماذج اللغات الضخمة (Large Language Models). ولكي يتم تطوير هذه النماذج بشكل فعال، قدم الباحثون نموذج ذاكرة مبتكر يُعرف بـ N-gram Memory (NGM)، وهو نموذج يعمل بدون الحاجة إلى تدريب مسبق، مما يفتح آفاق جديدة في كيفية التعامل مع البيانات والمعرفة.

يعتمد NGM على تركيبة من مكونات متطورة تشمل مشفر N-gram السببي (Causal N-Gram Encoder) ومحقن الذاكرة المدفوع ببوابة الكوسين (Cosine-Gated Memory Injector). فبدلاً من الاعتماد على مسارات حسابية ديناميكية كما هو الحال في نماذج Mixture of Experts (MoE)، يوفر NGM طريقة بحث أكثر كفاءة في استرجاع المعرفة من خلال استخدام تمثيلات N-gram مباشرة.

يتمكن مشفر N-gram من تصميم تمثيلات خاصة به باستخدام رموز النموذج الأساسي المدربة مسبقًا، مما يعني أنه يمكنه استيعاب المعرفة بدون الحاجة لتدريب مستمر أو جداول ذاكرة إضافية. أما محقن الذاكرة، فيقوم بتعديل التمثيلات المستخرجة وتكييفها ضمن السياق المطلوب.

أظهرت التقييمات الأولية لـ NGM مع سلسلة Qwen3، التي تتراوح من 0.6 مليار إلى 14 مليار معلمة، تحسنًا ملحوظًا في الأداء. حيث سجل NGM تحسينات تتراوح بين 0.5 إلى 1.2 نقطة، مع نتائج استثنائية في المهام التي تتطلب معرفة كثيفة مثل توليد الأكواد.

ففي اختبارات LiveCodeBench و GPQA، سجل NGM زيادات تصل إلى 3.0 و3.03 على التوالي. كما عزز أيضًا من الأداء في معايير الأداء متعددة الوسائط.

يمكن القول إن NGM يمثل نقلة نوعية في قدرة نماذج الذكاء الاصطناعي على استخدام واسترجاع المعرفة، ويتجلى ذلك في الأداء المتميز الذي أظهره في مختلف الاختبارات.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات!