في عالم الذكاء الاصطناعي، تعد آلية [الانتباه](/tag/الانتباه) القائم على الصيغة الخطية ([Linear Attention](/tag/linear-attention)) من أحدث التطورات التي تجذب الأنظار، خاصة عند التعامل مع [السياقات الطويلة](/tag/السياقات-الطويلة). وفي هذا السياق، برزت الحاجة لتطوير [أنظمة](/tag/أنظمة) خدمية تتعامل بكفاءة مع هذه [التقنية المتقدمة](/tag/[التقنية](/tag/التقنية)-المتقدمة).

تواجه [أنظمة](/tag/أنظمة) الخدمة الحالية [تحديات](/tag/تحديات) كبيرة تتمثل في الحاجة إلى [حساب](/tag/حساب) وتحديث حالة [انتباه](/tag/انتباه) خطية ضخمة في كل خطوة من خطوات [فك](/tag/فك) التشفير، مما يؤدي إلى استهلاك كبير لذاكرة الوصول العشوائي. في هذا الإطار، يتم تقديم [KVBuffer](/tag/kvbuffer) كآلية خدمية واعية لإدخال/إخراج (IO-aware) تهدف لتحسين [أداء](/tag/أداء) [الانتباه](/tag/الانتباه) القائم على الصيغة الخطية.

من خلال [تخزين المفاتيح والقيم](/tag/[تخزين](/tag/تخزين)-المفاتيح-والقيم) الحديثة، تمكّن [KVBuffer](/tag/kvbuffer) الأنظمة الخدمية من [حساب](/tag/حساب) مخرجات [الانتباه](/tag/الانتباه) بطريقة أكثر [مرونة](/tag/مرونة) وكفاءة في استخدام [الذاكرة](/tag/الذاكرة). هذه الآلية تسمح بالتعامل مع [البيانات](/tag/البيانات) على دفعات، مما يقلل من متوسط الوصول إلى [الذاكرة](/tag/الذاكرة) وزمن الاستجابة، كما تُسهل عمليات [فك التشفير](/tag/[فك](/tag/فك)-[التشفير](/tag/التشفير)) التقديرية من خلال [التحقق](/tag/التحقق) من الرموز التجريبية بالتوازي دون الحاجة لتخزين حالات مؤقتة.

وبالنسبة للسياقات القصيرة، تتمكن [KVBuffer](/tag/kvbuffer) من [حساب](/tag/حساب) المخرجات مباشرة من المفاتيح والقيم المخزنة، مما يلغي الحاجة لإنشاء أو [تحديث](/tag/تحديث) الحالة الخطية. تم [تنفيذ](/tag/تنفيذ) [KVBuffer](/tag/kvbuffer) في [SGLang](/tag/sglang) الخاصة بـ Qwen3-Next، حيث أظهرت تقييماتنا أن هذه الآلية يمكن أن تقلل من زمن استجابة [فك التشفير](/tag/[فك](/tag/فك)-[التشفير](/tag/التشفير)) للانتباه الخطّي بنسبة تصل إلى 45.17%، مع زيادة الحد الأقصى لعدد الطلبات الخدمية بمقدار 5 مرات عند [التحقق](/tag/التحقق) من أربعة [رموز](/tag/رموز) تجريبية.

تنافس [التكنولوجيا](/tag/التكنولوجيا) في مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) أصبح أكثر حماسة من أي وقت مضى! هل تعتقد أن [KVBuffer](/tag/kvbuffer) يمكن أن يغير الطريقة التي نتعامل بها مع [الانتباه](/tag/الانتباه) القائم على الصيغة الخطية في المستقبل؟ شاركونا آراءكم في [التعليقات](/tag/التعليقات)!