تُظهر نماذج تحويل الانجراف (Diffusion Transformers) قدرة مذهلة في توليد الصور، ولكنها غالبًا ما تعاني من عبء حسابي كبير واستهلاك مرتفع للموارد. ولحسن الحظ، يقدم مفهوم التخفيض بعد التدريب (Post-training Pruning) حلاً واعدًا. لكن، وبسبب التصميم المعماري الفريد وتوزيع المعاملات في نماذج تحويل الانجراف، فإن طرق التخفيض التقليدية لا تكون فعّالة، مما يؤدي إلى انخفاض كبير في أداء النموذج.
تتمثل مشكلة هذه الطرق التقليدية في أنها تستند إلى مقاييس تعتمد على تقريبات متعددة، مما يزيد من أهمية الأوزان ضمن مقياس الجاذبية (saliency metric). بالمقارنة، فإن الأوزان في نماذج تحويل الانجراف تكون بمقدار أكبر بكثير من تلك الموجودة في نماذج اللغات الضخمة (Large Language Models). علاوة على ذلك، فإن دقة التخفيض الحالية لا تأخذ في الاعتبار التباينات في الهياكل النموذجية.
في هذه الورقة، نقدم DiT-Pruning، الذي يحسن أداء التخفيض من خلال إدخال معايير جاذبية مخصصة ودقة تخفيض جديدة. قمنا بتصميم مقياس مبتكر يوازن بين مساهمات الأوزان والتفاعلات من منظور قائم على الطاقة، مما يعزز تحديد العناصر المهمة بكفاءة أكبر. بالإضافة إلى ذلك، لاحظنا أنماط تجميع مميزة في فضاء الأوزان ثنائي الأبعاد. بناءً على ذلك، اعتمدنا دقة تخفيض واعية بالتجميع، مما يسمح بتخصيص فعال لنسب Sparse.
تظهر التقييمات الشاملة التي أجريناها على مختلف نماذج تحويل الانجراف أن طريقتنا تحافظ باستمرار على جودة الصور، خاصةً تحت حالات زيادة النسبة الفارغة. فعلى سبيل المثال، وفي نموذج FLUX.1-dev بدقة 512x512 على مجموعة بيانات MJHQ، حقق DiT-Pruning خسارة تصل إلى 0.001 فقط في نتيجة CLIP عند 50% من النسبة الفارغة، متفوقًا بشكل ملحوظ على طرق التخفيض الحديثة.
ثورة في تقنيات الذكاء الاصطناعي: تخفيض حجم نماذج تحويل الانجراف بعد التدريب!
اكتشف الابتكار الجديد في تقنيات الذكاء الاصطناعي مع DiT-Pruning، الذي يعد بتحسين الكفاءة وتقليل استهلاك الموارد في نماذج تحويل الانجراف (Diffusion Transformers). اجعل تجربتك في توليد الصور أكثر فعالية دون فقدان الجودة!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
