في عالم الذكاء الاصطناعي، أصبح التعامل مع كميات ضخمة من [البيانات](/tag/البيانات) والاعتماد على [نماذج [التعلم](/tag/التعلم) الآلي](/tag/[نماذج](/tag/نماذج)-[التعلم](/tag/التعلم)-الآلي) المبتكرة ضرورة قصوى. من أبرز هذه [الابتكارات](/tag/الابتكارات) هو ما يعرف بالانتباه الكمي المعتمد أثناء التشغيل (Runtime-Certified Bounded-Error Quantized [Attention](/tag/attention))، الذي يعد تقدماً بارزًا في [تقنيات](/tag/تقنيات) [نموذج اللغة](/tag/[نموذج](/tag/نموذج)-[اللغة](/tag/اللغة)).
تركز [أبحاث جديدة](/tag/[أبحاث](/tag/أبحاث)-جديدة) على تقليل تكلفة [الذاكرة](/tag/الذاكرة) المستخدمة في التعامل مع [السياقات الطويلة](/tag/السياقات-الطويلة) من خلال [تقنيات](/tag/تقنيات) [تخزين القيم](/tag/[تخزين](/tag/تخزين)-القيم) المفهرسة ([KV Cache](/tag/kv-cache)) والتي تجعل عملية [الاستنتاج](/tag/الاستنتاج) أسرع وأكثر [كفاءة](/tag/كفاءة). ولكن، هل تضمن هذه التقنيات جودة النتائج؟ غالبًا ما تعتمد الأنظمة الحالية على الصلابة المتوسطة، مما يعني أن [الأخطاء](/tag/الأخطاء) المحتملة قد لا يُكتشف إلا تجريبيًا.
هنا تأتي الأهمية الفائقة للنموذج الجديد الذي يقدم هيكلًا هرميًا لمخزن القيم المفهرسة، مما يمكن من [تحقيق](/tag/تحقيق) [انتباه](/tag/انتباه) موثوق أثناء التشغيل. تستخدم هذه [التقنية](/tag/التقنية) مفاتيح بتقنية INT8 وقيم بتقنية INT4، مما يؤدي إلى تقليل استخدام [الذاكرة](/tag/الذاكرة) بشكل كبير، مع الاحتفاظ بنسخ دقيقة بدقة FP16 في [ذاكرة](/tag/ذاكرة) النظام كخيار احتياطي.
يعمل هذا النظام على [تقسيم](/tag/تقسيم) [الأخطاء](/tag/الأخطاء) المحتملة إلى مصطلحين: الأول يتعلق بتشويه توزيع [الانتباه](/tag/الانتباه) الناتج عن [تقنيات](/tag/تقنيات) الكمي، والثاني يتعلق بأخطاء إعادة [بناء](/tag/بناء) القيم. يتم [حساب](/tag/حساب) هذه الحدود على الفور، مما يتيح [تنفيذ](/tag/تنفيذ) اختيارات دقيقة تتكيف مع الحاجة، وضمان استرداد النتائج الدقيقة عند الحاجة.
[التجارب](/tag/التجارب) الناجحة على المقاييس المعتمدة مثل PG-19 وNIAH وRULER على [نموذج](/tag/نموذج) LLaMA 3.1-8B، أظهرت أن هذا النظام يحقق جودة قريبة من جودة FP16 بكفاءة ملحوظة وبفقدان ضئيل بجوانب الضوضاء. كما أن [أداء النظام](/tag/[أداء](/tag/أداء)-النظام) في المهام التي تتطلب [دقة](/tag/دقة) عالية في القيم [كشف](/tag/كشف) عن توازن محسوب بين الضغط والموثوقية.
في الختام، لا يهدف هذا [الابتكار](/tag/الابتكار) فقط إلى [تحقيق](/tag/تحقيق) السرعة، بل يسعى إلى ضمان [نشر](/tag/نشر) آمن لضغط القيم العددي تحت [قيود](/tag/قيود) الجودة الصارمة. لهذا، فإن الاعتماد على نظام مؤهل أثناء التشغيل يعد خطوة [استراتيجية](/tag/استراتيجية) [نحو](/tag/نحو) [تحسين](/tag/تحسين) [الأخطاء](/tag/الأخطاء) واستخدام [تقنيات الذكاء الاصطناعي](/tag/[تقنيات](/tag/تقنيات)-الذكاء-الاصطناعي) بشكل أكثر فعالية.
ابتكار ثوري في تقنيات الذكاء الاصطناعي: اعتماد محاسبة الأخطاء المحدودة في الانتباه الكمي
تقدم الأبحاث الجديدة نهجًا مبتكرًا في تقنيات نظرية الانتباه (Attention) ضمن نماذج اللغة، حيث يتيح نظام مؤهل أثناء التشغيل تصحيح الأخطاء أثناء العملية. يشكل هذا التطور خطوة هامة نحو تحسين الأداء والجودة في مهام معالجة اللغات الطبيعية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
