في عصر تتنوع فيه الأهدافDeployment بشكل كبير، أصبحت القدرة على اختيار النموذج المناسب أمراً ضرورياً لتحسين الأداء داخل حدود الميزانية المتاحة. تمثل KLAS (الإطار الجديد لاختيار الدمج) إضافة نوعية حيث تُظهر الأبحاث الحديثة أن دمج النماذج المدربة مسبقاً داخل عائلة النماذج يسمح باستغلال فعال لخيارات الدقة والكفاءة.
تقوم KLAS بتحويل التفاعلات الوسيطة من نموذج مدرب مسبقاً إلى آخر، مما ينتج شبكة جديدة مدمجة تُوفر مجموعات متنوعة من الخيارات للنشر بناءً على توازن الدقة والكفاءة. لكن، للأسف كانت الطرق الحالية في الدمج غالباً ما تؤدي إلى توازنات غير مثالية وتفتقر إلى القابلية للتعميم، حيث كانت تعتمد بشكل كبير على الهيوريستيك لاختيار تكوينات الدمج.
ما تحتاجه هي أساليب ومعايير تعتمد على تصوير وتحليل التشابه بين النماذج المدربة مسبقاً. هذا ما فعله KLAS من خلال استخدام تقنيات كـ KL divergence بين التمثيلات الوسيطة، حيث يتيح النظام تحديد أفضل خيارات الدمج الثنائية من عدد ضخم من الاحتمالات.
من خلال تجارب شاملة، أثبتت KLAS تحسينها لمنحنى الدقة والكفاءة للنماذج المدمجة بتكاليف فنية مماثلة للقواعد الأساسية. حيث حققت KLAS دقة أعلى بنسبة تصل إلى 1.21% في تقييم ImageNet-1K مع الحفاظ على نفس تكاليف الحوسبة، أو تصغر قيمة FLOPs بنسبة 1.33× دون المساس بالدقة.
KLAS: ثورة جديدة في دمج الشبكات العصبية لتحسين توازن الدقة والكفاءة!
تقدم KLAS إطاراً مبتكراً لدمج الشبكات العصبية مما يحسن من توازن الدقة والكفاءة. هذا الإطار يستخدم تقنيات جديدة لتمكين الوصول إلى خيارات فعالة من حيث التكلفة في إنتاج الشبكات العصبية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
