يعد الذكاء الاصطناعي واحداً من أهم الابتكارات التكنولوجية في عصرنا الحالي، ويبحث المطورون بشكل مستمر عن حلول لزيادة فعالية وأداء أنظمة الذكاء الاصطناعي. في هذا السياق، تم تقديم تقنية جديدة تحمل اسم BudgetDraft، التي تعد بتحقيق ثورة في سرعة الاستنتاج عبر نموذج التدريب متعدد المناظير.

تعتمد تقنية BudgetDraft على استخدام **التشفير الاستشراقي** (Speculative Decoding) الذي يسرع من عملية التنبؤ بالتتابعات من خلال اقتراح عدة رموز بواسطة مُعدِّل (Drafter) يتم التحقق من صحة الاقتراحات بواسطة مُدقق (Verifier) في وقت واحد. تعمل التقديرات في بيئات متقيدة بالموارد على استخدام مخزن مفتاح-قيمة (Sparse KV Cache) لضبط استخدام الذاكرة وقصر زمن الانتظار.

من المثير أن التقنيات التقليدية غالباً ما تواجه تحديات عندما يزداد طول السياق في التطبيقات العملية، حيث تقل نسبة القبول بشكل ملحوظ نتيجة ما يُعرف بمشكلة عدم تطابق الأبعاد بين التخزين الواسع والضيق. هنا يأتي دور **BudgetDraft**، حيث يقدم منهجية جديدة في التدريب تعكس تجربة عدة ميزات عشوائية خلال مرحلة التدريب ليتمكن من مواءمة كل مشاهدة مع هدف مُعلم مشترك.

يثبت الـ BudgetDraft فعاليته من خلال معدلات تحسن ملحوظة في السرعة. إذ تُظهر التجارب على مجموعات بيانات مثل PG-19 و LongBench و LWM تحقيق زيادات تصل إلى 6.55 مرة في السرعة مقارنة بأسلوب الاستدلال التلقائي (AR)، وذلك على طول سياق يصل إلى 4K.

تستمر التقنية في الابتكار من خلال دمج خسائر واعية بالقبول في فرع التخزين الكامل مع خسائر متعددة المناظير في فرع التخزين الضيق، مما يؤدي إلى إنشاء مُعدِّل موحد يدعم مستويات مختلفة من الكثافة دون الحاجة لمكونات إضافية خلال فترة الاستدلال.

عندما يتعلق الأمر بالتطبيقات العملية، قد تكون هذه التكنولوجيا مؤثرة بشكل كبير، مما يحسن من كفاءة نماذج الذكاء الاصطناعي في مختلف الاستخدامات. كيف ترى تأثير BudgetDraft على مستقبل التقنيات الذكية؟ شاركونا رأيكم في التعليقات!