في عالم تسارع فيه [تطوير](/tag/تطوير) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) (Large Language [Models](/tag/models) - [LLMs](/tag/llms))، تبرز [تحديات جديدة](/tag/[تحديات](/tag/تحديات)-جديدة) تظهر عند التعامل مع [سياقات](/tag/سياقات) طويلة، مثل القدرة على الاستنتاج، وتوليد الأكواد، والحوار متعدد الأدوار. ومع استخدام هذه [النماذج](/tag/النماذج) في مهام تمتد [عبر](/tag/عبر) [نصوص](/tag/نصوص) طويلة، يصبح من الصعب الحفاظ على [الكفاءة](/tag/الكفاءة) في ظل تعقد العمليات.
غالبًا ما تعاني [النماذج](/tag/النماذج) نتيجة لاستخدام [تخزين](/tag/تخزين) [ذاكرة](/tag/ذاكرة) المفاتيح والقيم (Key-Value cache) الذي يتزايد بشكل خطي مع زيادة طول التسلسل النصي، مما يؤثر سلبًا على زمن الاستجابة. مؤخرًا، ظهرت طرق ضغط [تخزين](/tag/تخزين) الذاكرة، لكنها كانت تركز بشكل رئيسي على إدخال السياقات دون معالجة [الأخطاء](/tag/الأخطاء) التراكمية التي قد تنتج أثناء عملية [التوليد](/tag/التوليد) الطويل.
هنا تأتي [الابتكارات](/tag/الابتكارات) الملحوظة في [البحث](/tag/البحث) الحديث، حيث تم تقديم [تقنية جديدة](/tag/[تقنية](/tag/تقنية)-جديدة) تُدعى RetroAttention، وهي [تقنية](/tag/تقنية) [تحديث](/tag/تحديث) جديدة لتخزين [الذاكرة](/tag/الذاكرة) تتيح [تسريع الأداء](/tag/[تسريع](/tag/تسريع)-[الأداء](/tag/الأداء)) من خلال مراجعة النتائج السابقة مع إدخال مدخلات جديدة بُعيد خطوات [التوليد](/tag/التوليد).
تعمل [RetroAttention](/tag/retroattention) على الحفاظ على مخزن مخرجات خفيف الوزن، مما يمكّن الاستعلامات الماضية من أن تتلقى [تحديثات](/tag/تحديثات) أكثر فعالية، مع تقليل زمن الاستجابة بشكل ملحوظ. هذه [التقنية](/tag/التقنية) تُعد خطوة ثورية في مجال الذكاء الاصطناعي، حيث تتجاوز [القيود](/tag/القيود) التقليدية المتمثلة في تكرار المدخلات وتجلب إمكانية التصحيح المستمر للنتائج السابقة.
تظهر [التجارب](/tag/التجارب) التي أجريت على [معايير](/tag/معايير) [التوليد](/tag/التوليد) الطويل أن [RetroAttention](/tag/retroattention) تتفوق باستمرار على أفضل الطرق المستخدمة حاليًا، مما يزيد من التعرض الفعال للذاكرة بمقدار يصل إلى 1.6 مرة، ودقة النتائج بمعدل يصل إلى 21.9%. هذا التطور يمثل قفزة نوعية في [تحسين](/tag/تحسين) [كفاءة](/tag/كفاءة) [نماذج اللغات](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)) الكبيرة، مما يشعل آمال جديدة في مجالات متعددة.
ثورة في الذكاء الاصطناعي: تقنية RetroAttention لتحسين أداء نماذج اللغات الطويلة!
تم تقديم تقنية جديدة تدعى RetroAttention لتحسين أداء نماذج اللغات الكبيرة في معالجة السياقات الطويلة. هذه التقنية تحقق قفزات في الدقة والكفاءة بفضل تحديثات تخزين الذاكرة الديناميكية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
