في عالم تقنيات الذكاء الاصطناعي، تواجه نماذج اللغة الطويلة (Long-context LLM) تحديًا كبيرًا عند تنفيذ الاستدلال، وهو "تناقض الرأس الديناميكي". فأثناء سعيها نحو دقة متفوقة عبر خوارزميات ضغط (مثل عينة Top-$p$)، تحتاج هذه الأنظمة إلى استخدام أنماط ذاكرة ثابتة لضمان الأداء العالي، الأمر الذي يبدو متناقضًا.
هنا يأتي دور إطار العمل الجديد HARD-KV الذي يقدم حلاً فريدًا يجمع بين الاختيار الديناميكي والنظم الثابتة. من خلال تقديم هيكل سريع يدير دورة حياة الرموز (token lifecycle) عبر مستويات كثيفة ونادرة ومكثفة، تمكننا HARD-KV من معالجة البيانات بصورة أكثر فعالية.
تقدم HARD-KV آلية ضبط لوجستيات (Logits Calibration) تعمل على توحيد مقاييس الأهمية المتنوعة ضمن مساحة احتمال موحدة، مما يسمح بتوزيع ثابت لميزانية Top-$p$ عبر نماذج متنوعة.
تقدم الدراسات التجريبية على مقاييس المنطق الرياضي (AIME، U-Math) نتائج مذهلة، حيث تحقق HARD-KV تحسينًا يصل إلى ضعف الإنتاجية مقارنة بالأساليب الثابتة، مع الحفاظ على دقة عالية في سيناريوهات تتجاوز 10,000 رمز. كل ذلك بفضل الحلول النظامية التي تعيد كتابة الفهارس الديناميكية المتقطعة إلى ترتيبات مادية متصلة تتوافق مع محركات الاستنتاج عالية الأداء.
لمزيد من التفاصيل عن هذا الإنجاز الرائد، يمكنكم زيارة رابط المشروع على GitHub. فهل أنتم مستعدون لاستكشاف مستقبل نماذج اللغة؟ شاركونا آرائكم.
إطلاق HARD-KV: الحل الثوري لضغط ذاكرة النماذج اللغوية الكبيرة
تم الكشف عن HARD-KV، إطار عمل ثوري يجسد التوافق بين تكنولوجيا الضغط الديناميكي والقيود الثابتة للأنظمة الحديثة. بدعم من آلية خاصة لضبط اللوجستيات، يعد HARD-KV بإحداث ثورة في كفاءة استنتاج نماذج اللغة الطويلة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
