في عالم الذكاء الاصطناعي، يُعد تحسين أداء نماذج الشبكات العصبية من القضايا المركزية التي تشغل الباحثين والمطورين. مؤخرًا، تم تقديم إطار جديد يركز على تقنية الانفصال المتين (Robust Basis Spline Decoupling)، التي تعد بمثابة قفزة نوعية في مجال تقليل حجم نماذج المحولات (Transformer Models).
تقوم هذه الطريقة على مفهوم الانفصال الذي يُمكّن من تمثيل الدوال المتعددة المتغيرات كتركيبات من التحويلات الخطية والدوال غير الخطية الأحادية المتغيرة. وهو يعكس ارتباطًا مباشرًا بالشبكات العصبية، مما يجعله جذابًا بشكل خاص.
البحوث السابقة كانت تعتمد غالبًا على طرق الانفصال المستندة إلى الدوال متعددة الحدود أو خطوط متكسرة، والتي قد تواجه مشكلات في الاستقرار العددي أو قلة التعبيرية. لكن مع استخدام B-splines، فقد تم تعزيز الاستقرار والقدرة على التعبير، مما يوفر نموذجًا أكثر مرونة.
يتمثل الأسلوب الجديد في تطوير مصفوفة لنموذج الانفصال المقرونة (Coupled Matrix-Tensor Factorization) واستحداث خوارزمية جديدة قوية تُعرف باسم R-CMTF-BSD، تتضمن تنظيم وتطبيع، مما يُحسن أيضًا من الأداء. وقد تم اختبار هذا النهج من خلال تجارب على بيانات صناعية وتحققت النتائج على نماذج Vision وSwin Transformer لتُظهر إمكانيات تقليل كبيرة في المعلمات مع الحفاظ على دقة منافسة.
إن هذا الإنجاز يعد بمثابة خطوة حاسمة نحو تحقيق نماذج شبكية أكثر كفاءة، مما يجعل خوارزمية R-CMTF-BSD أداة واعدة في مجال ضغط الشبكات العصبية المركزة. ماذا تعتقد حول هذا التطور في مجال الذكاء الاصطناعي؟ شاركنا بآرائك في التعليقات!
استراتيجية مبتكرة لتقليل حجم نماذج المحولات باستخدام تقنية الانفصال المتين
تقدم الدراسة إطار انفصال قائم على B-spline يقوي نماذج التعلم العميق في تقليل الحجم دون التأثير على الدقة. النتائج تشير إلى فعالية الطريقة الجديدة في نماذج المحولات مثل Vision وSwin.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
