في خطوة غير مسبوقة، أعلنت NVIDIA عن إطلاق نموذج Gated DeltaNet-2، الذي يمثل تقدماً نوعياً في مجال الذكاء الاصطناعي. يهدف هذا النموذج إلى تحسين طريقة إدارة الذاكرة الاصطناعية، حيث يحتوي على بنية جديدة تمكّن من فصل وظيفتي المسح (Erase) والكتابة (Write) باستخدام بوابات متخصصة.
تعتمد العديد من النماذج السابقة على قواعد دلتا (Delta Rule) التي تستخدم بوابة واحدة للتحكم في كلا العمليتين، ولكن Gated DeltaNet-2 يقدم حلاً مبتكراً عبر اعتماد بوابة مسح على المحور المفتاح (Key Axis) وبوابة كتابة على المحور القيمة (Value Axis).
لقد تم تدريب هذا النموذج العملاق الذي يحتوي على 1.3 مليار معامل على 100 مليار وحدة بيانات من FineWeb-Edu، مما جعله يتفوق على نماذج سابقة مثل Mamba-2 وGated DeltaNet وKDA وMamba-3 في العديد من المهام، بما في ذلك النمذجة اللغوية والتفكير المنطقي واسترجاع السياقات الطويلة.
التحديثات الجديدة تبرز بشكل خاص أداءً مذهلاً في اختبارات RULER S-NIAH واسترجاع المفاتيح المتعددة، مما يدل على أن Gated DeltaNet-2 ليس مجرد تطور بسيط، بل يمثل قفزة نحو فهم أفضل للذكاء الاصطناعي وكيفية استغلال الذاكرة بشكل فعال.
فهل أنتم مستعدون لاستكشاف آفاق جديدة في العالم الرقمي مع هذا الابتكار؟ شاركونا آراءكم في التعليقات!
إطلاق NVIDIA لنموذج Gated DeltaNet-2: ثورة في معالجة الذاكرة الاصطناعية!
NVIDIA تكشف النقاب عن Gated DeltaNet-2، نموذج جديد يعيد تعريف كيفية إدارة الذاكرة الاصطناعية من خلال فصل وظائف المسح والكتابة. بفضل قدرته الفائقة، يتفوق هذا النموذج على السابق ويلبي احتياجات الذكاء الاصطناعي المتقدمة.
المصدر الأصلي:مارك تيك بوست
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
