في عالم الذكاء الاصطناعي، تعتبر [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) من أكثر [الأدوات](/tag/الأدوات) تقدماً في [معالجة اللغة](/tag/معالجة-[اللغة](/tag/اللغة)) وفهم النصوص. ومع ذلك، يواجه الباحثون [تحديات](/tag/تحديات) كبيرة في [تحسين](/tag/تحسين) [كفاءة](/tag/كفاءة) هذه [النماذج](/tag/النماذج) عند التعامل مع [سياقات](/tag/سياقات) طويلة، حيث تلعب [الذاكرة](/tag/الذاكرة) وعملية الحفظ (Key-Value cache) دوراً مهماً.
هنا يأتي دور
**ProxyKV**، وهو إطار [عمل](/tag/عمل) مبتكر يرمي إلى [تحقيق](/tag/تحقيق) توازن بين [السرعة](/tag/السرعة) والدقة. يقدم هذا الأسلوب الجديد طريقة جديدة للتخلص من [البيانات](/tag/البيانات) غير الضرورية من خلال استخدام [نماذج صغيرة](/tag/[نماذج](/tag/نماذج)-صغيرة) كواجهة بديلة تساعد في [تحسين](/tag/تحسين) عمليات [حساب](/tag/حساب) الأهمية بشكل متزامن مع النموذج الكبير، مما يؤدي إلى زيادة [الكفاءة](/tag/الكفاءة).
لتجاوز التحديات [المعمارية](/tag/المعمارية) بين [النماذج](/tag/النماذج) المختلفة، تم [تصميم](/tag/تصميم)
**HybridAxialMapper** الذي يقوم بفصل عملية استخراج الميزات الزمنية عن [محاذاة](/tag/محاذاة) رؤوس [البيانات](/tag/البيانات). كما يتضمن الإطار **Multi-Granularity Hybrid Loss** الذي يغير الهدف التعليمي من تقدير صارم إلى مبدأ [تقييم](/tag/تقييم) نسبي.
في الاختبارات التي تم إجراؤها على [نماذج](/tag/نماذج) [Llama](/tag/llama)-3.1 وQwen-2.5 وQwen-3، أظهر ProxyKV نتائج مبهرة، حيث تم [تحقيق](/tag/تحقيق) [دقة](/tag/دقة) [تقارب](/tag/تقارب) 98.7% من [الدقة](/tag/الدقة) المتوسطة باستخدام [تخزين](/tag/تخزين) [الذاكرة](/tag/الذاكرة) (KVZip)، مع تضاعف [سرعة](/tag/سرعة) المعالجة حتى 3.21 مرة في [نموذج Llama](/tag/[نموذج](/tag/نموذج)-llama)-3.1-8B. وتمكن النظام من الحفاظ على هذه [السرعة](/tag/السرعة) حتى في [سياقات](/tag/سياقات) تحتوي على 170,000 وحدة من النص.
ختامًا، يعد ProxyKV خطوة مهمة [نحو](/tag/نحو) المستقبل في استخدام [نماذج](/tag/نماذج) الذكاء الاصطناعي، مما يفتح آفاقًا جديدة للتطبيقات التي تتطلب معالجة [نصوص](/tag/نصوص) طويلة بكفاءة عالية. ما رأيكم في هذا [الابتكار](/tag/الابتكار) المثير؟ شاركونا في [التعليقات](/tag/التعليقات)!
ProxyKV: ثورة في تحسين الكفاءة لتطبيقات الذكاء الاصطناعي على النصوص الطويلة!
تقدم ProxyKV إطار عمل مبتكر يقلل من وقت المعالجة ضمن نماذج اللغات الضخمة (LLMs) دون فقدان دقة النتائج. يأتي هذا الابتكار كحل فعال للتحديات المرتبطة بتخزين الذاكرة وتحسين الأداء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
