في عالم الذكاء الاصطناعي، يُعتبر [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) والتقليل من استهلاك [الذاكرة](/tag/الذاكرة) من الأولويات الأساسية. وهنا يأتي دور [تقنية](/tag/تقنية) TokenButler، التي تُعدُّ طفرة في معالجة [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)). تعتمد هذه [التقنية](/tag/التقنية) على [تخزين](/tag/تخزين) طرازات [تاريخ](/tag/تاريخ) الرموز ضمن [ذاكرة](/tag/ذاكرة) تُعرف بالـ Key-Value (KV) Cache، ولكن مع ازدياد حجم هذه الذاكرة، تصبح العوائق المرتبطة بالذاكرة والحساب أكثر وضوحًا.
أحد التحديات الرئيسية هو أن القليل من الرموز فقط هي التي تُحدث فرقًا حقيقيًا في كل خطوة [فك](/tag/فك) تشفير، بينما تتغير الرموز الحرجة بشكل ديناميكي وتكون معتمدة بشكل كبير على [استعلامات](/tag/استعلامات) المدخلات. تحاول الطرق الحالية معالجة هذه المشكلة، لكن غالبًا ما يؤثر ذلك على الجودة أو يعتمد على [استرجاع](/tag/استرجاع) كتل من الرموز التي قد لا تكون دقيقة.
تقدم [TokenButler](/tag/tokenbutler) حلاً متطورًا من خلال كونها متنبئة ذات [دقة](/tag/دقة) عالية، حيث تتعلم [التعرف](/tag/التعرف) على الرموز الحرجة. تقوم هذه [التقنية](/tag/التقنية) بتنبؤ [استعلامات](/tag/استعلامات) الأهمية ذات الأبعاد المنخفضة مع خطوات ثابتة، مما يسمح بالحفاظ على الـ KV-Cache كاملًا مع إمكانية اختيار الرموز بشكل ديناميكي دون الحاجة إلى إخلاء الرموز بشكل دائم.
تظهر [التجارب](/tag/التجارب) مع [TokenButler](/tag/tokenbutler) [دقة](/tag/دقة) قريبة من [الأداء](/tag/الأداء) المثالي في مهام الاسترجاع المترابطة الصغيرة، إلى جانب [تحقيق](/tag/تحقيق) زيادة ملحوظة في [السرعة](/tag/السرعة) على [معايير](/tag/معايير) [السياق](/tag/السياق) الطويل. هذا [الابتكار](/tag/الابتكار) يعد بمثابة خطوة مهمة [نحو](/tag/نحو) [تحسين](/tag/تحسين) قدرات [نماذج](/tag/نماذج) الذكاء الاصطناعي، حيث يسهم في خفض زمن الاستجابة بنسبة تصل إلى 7.6 مرة مقارنةً بأساليب [الانتباه](/tag/الانتباه) الكثيف، مما يفتح أبوابًا جديدة للكفاءة في [التطبيقات](/tag/التطبيقات) المستقبلية.
هل أنتم مهتمون بمعرفة المزيد عن كيفية [تحسين أداء](/tag/[تحسين](/tag/تحسين)-[أداء](/tag/أداء)) [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة))؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات).
تكنولوجيا TokenButler: كيف تُحدّد أهمية الرموز بدقة في نماذج اللغة؟
تقدم TokenButler حلًا مبتكرًا لمشكلة تخزين تاريخ الرموز في نماذج اللغة الكبيرة، مما يعزز من كفاءة فك تشفير الرموز. تعتمد هذه التقنية على تحديد الرموز الحرجة الديناميكية بدقة لتقليل العوائق المتعلقة بالذاكرة والحساب.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
