في عالم الذكاء الاصطناعي، يعد الوصول الفوري إلى [المعرفة](/tag/المعرفة) أحد أكبر التحديات التي تواجه [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)). ولكي يتم [تطوير](/tag/تطوير) هذه [النماذج](/tag/النماذج) بشكل فعال، قدم الباحثون [نموذج ذاكرة](/tag/[نموذج](/tag/نموذج)-[ذاكرة](/tag/ذاكرة)) مبتكر يُعرف بـ N-gram Memory (NGM)، وهو [نموذج](/tag/نموذج) يعمل بدون الحاجة إلى [تدريب](/tag/تدريب) مسبق، مما يفتح آفاق جديدة في كيفية التعامل مع [البيانات](/tag/البيانات) والمعرفة.
يعتمد NGM على تركيبة من مكونات متطورة تشمل مشفر N-gram السببي (Causal N-Gram Encoder) ومحقن [الذاكرة](/tag/الذاكرة) المدفوع ببوابة الكوسين (Cosine-Gated Memory Injector). فبدلاً من الاعتماد على مسارات حسابية [ديناميكية](/tag/ديناميكية) كما هو الحال في [نماذج](/tag/نماذج) [Mixture of Experts](/tag/mixture-of-experts) (MoE)، يوفر NGM طريقة [بحث](/tag/بحث) أكثر [كفاءة](/tag/كفاءة) في استرجاع [المعرفة](/tag/المعرفة) من خلال استخدام [تمثيلات](/tag/تمثيلات) N-gram مباشرة.
يتمكن مشفر N-gram من [تصميم](/tag/تصميم) [تمثيلات](/tag/تمثيلات) خاصة به باستخدام [رموز](/tag/رموز) النموذج الأساسي المدربة مسبقًا، مما يعني أنه يمكنه استيعاب [المعرفة](/tag/المعرفة) بدون الحاجة لتدريب مستمر أو جداول [ذاكرة](/tag/ذاكرة) إضافية. أما محقن الذاكرة، فيقوم بتعديل التمثيلات المستخرجة وتكييفها ضمن [السياق](/tag/السياق) المطلوب.
أظهرت [التقييمات](/tag/التقييمات) الأولية لـ NGM مع سلسلة Qwen3، التي تتراوح من 0.6 مليار إلى 14 مليار معلمة، تحسنًا ملحوظًا في [الأداء](/tag/الأداء). حيث سجل NGM [تحسينات](/tag/تحسينات) تتراوح بين 0.5 إلى 1.2 نقطة، مع نتائج استثنائية في المهام التي تتطلب [معرفة](/tag/معرفة) كثيفة مثل [توليد الأكواد](/tag/[توليد](/tag/توليد)-الأكواد).
ففي [اختبارات](/tag/اختبارات) LiveCodeBench و GPQA، سجل NGM زيادات تصل إلى 3.0 و3.03 على التوالي. كما عزز أيضًا من [الأداء](/tag/الأداء) في [معايير الأداء](/tag/[معايير](/tag/معايير)-[الأداء](/tag/الأداء)) [متعددة الوسائط](/tag/متعددة-الوسائط).
يمكن القول إن NGM يمثل نقلة نوعية في قدرة [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) على استخدام واسترجاع المعرفة، ويتجلى ذلك في [الأداء](/tag/الأداء) المتميز الذي أظهره في مختلف الاختبارات.
ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات)!
اكتشف NGM: نموذج الذاكرة الثوري الذي لا يتطلب تدريبًا لتحسين أداء نماذج اللغات الضخمة!
تقدم الدراسات الأخيرة نموذج ذاكرة جديد يُعرف بـ N-gram Memory (NGM) الذي لا يحتاج إلى تدريب، مما يسهل الوصول إلى المعرفة بطريقة أكثر فعالية. يأتي هذا الابتكار ليحقق تحسينات ملحوظة في أداء نماذج اللغات الضخمة في مهمات متعددة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
