تمثل تقنية تحليل الأشجار التخمينية (Speculative Tree Decoding) إحدى الأساليب الحديثة لتسريع عمليات التوليد الآلي، حيث يعتمد هذا النوع من التحليل على التحقق من شجرة متفرعة من الرموز الأولية في عملية واحدة لنموذج الهدف. لكن، مع الأساليب الحالية، يتم التركيز بشكل كبير على زيادة احتمال الرموز المستلمة، مما يؤدي إلى تجاهل ما يسمى "مفارقة الكفاءة". هذه المفارقة تشير إلى أن تكاليف صيانة وتحقق الأشجار الكبيرة يمكن أن تتزايد بشكل كبير، خصوصًا أثناء زيادة أحجام الدفعات أو عند وصول حدود أداء الأجهزة إلى الذروات.
للمعالجة هذه القضايا، تم تقديم إطار العمل الجديد المعروف باسم SMART، الذي يعتمد على تحليل هوامش مؤسسة على وعي بالأجهزة لتحسين إنشاء الأشجار في الوقت الفعلي. يقوم SMART بإعادة صياغة توسيع الشجرة كمشكلة تحسين تعتمد على الأجهزة، حيث يسعى بشكل مباشر إلى تحقيق تسريع في الأداء من النهاية إلى النهاية. باستخدام قاعدة فوائد الهامش إلى التكلفة بشكل مبدئي خلال وقت الاستدلال، يقوم SMART بتوسيع العقدة فقط عندما يتجاوز نسبة الفائدة إلى التكلفة مستوى تسريع الشجرة.
يتسم SMART بعدم الحاجة إلى التدريب، ويعمل كمتController مدمج يمكن استخدامه مع الأطر الموجودة مثل MSD وEAGLE. وقد أثبتت تقييمات شاملة عبر ثلاثة نماذج لغوية متعددة الوسائط (MLLMs) مثل LLaVA وQwen2-VL، وأربعة نماذج لغوية (LLMs) مثل Llama-3.1 وDeepSeek-R1، أن SMART يتفوق باستمرار على المعايير الحالية. وأظهر النتائج متوسط تسريع إضافي يبلغ 20.0% للـ MLLMs و15.4% للـ LLMs عبر أنظمة الدفعات القوية والمتنوعة من بنى GPU، دون أي فقدان في الأداء.
من الواضح أن SMART ليس مجرد إضافة، وإنما تحول كامل في كيفية تحسين كفاءة التوليد التلقائي. ما رأيكم في هذا التطور الثوري؟ شاركونا في التعليقات.
ابتكار ثوري في تسريع تحليل الأشجار: هل آن الأوان لتوسيع شجرة التكهنات؟
قدمت الدراسة الجديدة إطار SMART الذي يعيد صياغة تحليل الأشجار للتسريع الكفاءة والتي توفر مزايا كبيرة في تسريع الأجيال التلقائية. النتائج تبشر بنتائج ممتازة تتجاوز التوقعات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
