في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) الحديث، تأخذ [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) المتكررة (LoopLMs) خطوة إلى الأمام من خلال [تحسين](/tag/تحسين) [كفاءة](/tag/كفاءة) المعلمات عن طريق إعادة استخدام كتل الـTransformer بشكل متكرر. هذا التقدم منذ بزوغ [أفكار](/tag/أفكار) [نماذج](/tag/نماذج) اللغة، يعكس دعماً كبيراً لتقنيات [التعلم](/tag/التعلم) الآلي، إلا أن التحديات الجديدة قد اكتسحت الساحة.
تتجاوز قضية إعادة الاستخدام البسيطة [مخاوف](/tag/مخاوف) الأداء، حيث تجعل LoopLMs أكثر هشاشة أثناء الكوانتيزايشن بعد [التدريب](/tag/التدريب) (Post-training [Quantization](/tag/quantization) PTQ). لذا، تمّت [دراسة](/tag/دراسة) هذه القضايا النظامية للمرة الأولى، وتعريف [تحديات](/tag/تحديات) ثلاث رئيسية: انتقال التوزيع [عبر](/tag/عبر) الأدوار، إعادة استخدام الحالة [عبر](/tag/عبر) [تحولات](/tag/تحولات) الحلقة، وتراكم [الأخطاء](/tag/الأخطاء) المتكررة.
للتصدي لهذه التحديات، أُطلق على هذا [الابتكار](/tag/الابتكار) اسم LoopQ، وهو إطار [عمل](/tag/عمل) لوعي الحلقات يسمح بالحفاظ على بنية مشتركة كمية مع إدخال تعديلات بسيطة. يجمع [LoopQ](/tag/loopq) بين [تقنيات](/tag/تقنيات) مثل توسيع التنشيط، التحويل الانتقائي، [محاذاة](/tag/محاذاة) الحالة [عبر](/tag/عبر) الحلقات، وتحسين مستند إلى مسار الحركة، مما يقلل [الفجوة](/tag/الفجوة) التوزيعية داخل الحلقات وتراكم [الأخطاء](/tag/الأخطاء) عبرها.
أظهرت [التجارب](/tag/التجارب) التي تم إجراءها على سبعة [معايير](/tag/معايير) مختلفة أن LoopQ، باستخدام [كوانتيزايشن](/tag/كوانتيزايشن) W4A4، قد حسّن [دقة](/tag/دقة) [الأداء](/tag/الأداء) بنسبة 68.8% بينما قلّل الارتباك بنسبة 87.7% مقارنة بأقوى [قاعدة بيانات](/tag/قاعدة-[بيانات](/tag/بيانات)) ثابتة لـ PTQ.
إن هذه [الإنجازات](/tag/الإنجازات) تمثل خطوة عملاقة [نحو](/tag/نحو) [تحسين](/tag/تحسين) [نماذج التعلم](/tag/[نماذج](/tag/نماذج)-[التعلم](/tag/التعلم)) الآلي، مما يفتح آفاق جديدة للتطبيقات [العملية](/tag/العملية) في مجالات متعددة.
LoopQ: ثورة في تحسين نماذج اللغة بتقنية الكوانتيزايشن
تقدم LoopQ إطار عمل جديداً لتحسين نموذج اللغة من خلال معالجة مشكلة الكوانتيزايشن للأنظمة المتكررة. تجارب تظهر زيادة فعالية بنسبة 68.8% وتقليص الارتباك بنسبة 87.7%.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
