في عالم الذكاء الاصطناعي، لا تزال [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) تتطور بسرعة مذهلة، وأحدث [الأبحاث](/tag/الأبحاث) في هذا المجال تشير إلى [تقنية جديدة](/tag/[تقنية](/tag/تقنية)-جديدة) تُعرف باسم [DynMuon](/tag/dynmuon). هذه [التقنية](/tag/التقنية) تعتبر خطوة ثورية في [تدريب](/tag/تدريب) [نماذج](/tag/نماذج) اللغة، حيث يجري تطبيق عملية تشكيل طيفي [ديناميكية](/tag/ديناميكية) يتم خلالها تعديل معاملات [التدريب](/tag/التدريب) بشكل فعال لتحسين [الأداء](/tag/الأداء) بسرعة وكفاءة.
الاختلاف الجوهري الذي تطرحه [DynMuon](/tag/dynmuon) يكمن في استبدال مصفوفة التحديث التقليدية بمصفوفة ذات تركيب قطبي، مما يساعد على [استغلال](/tag/استغلال) منحنيات الخسارة بطريقة أكثر فعالية. تشتمل النظرية الجديدة أيضًا على القدرة على ضبط معلمة مهمة تُعرف بـ (p) بناءً على عوامل متعددة، تشمل انحناء الدالة الخسارية، الضوضاء الناتجة عن [التدرجات](/tag/التدرجات) العشوائية، ومرحلة [التدريب](/tag/التدريب).
أظهرت [التجارب](/tag/التجارب) أن استخدام القيم الإيجابية لـ (p) يساعد في المراحل الأولى من [التدريب](/tag/التدريب) من خلال التركيز على الاتجاهات ذات الانحناء العالي، بينما القيم السلبية الطفيفة لـ (p) تكون فعالة في المراحل اللاحقة، حيث تعيد توزيع [قوة](/tag/قوة) التحديث [نحو](/tag/نحو) الاتجاهات الأقل انحناءً التي لا تزال تحتوي على [إشارات](/tag/إشارات) [تدريب](/tag/تدريب) مفيدة.
[عبر](/tag/عبر) مجموعة متنوعة من [المخططات](/tag/المخططات) [المعمارية](/tag/المعمارية) وأحجام النماذج، نجحت [DynMuon](/tag/dynmuon) في خفض معدل الخسارة على [البيانات](/tag/البيانات) المخصصة للتقييم بنسبة تتراوح بين 10.6% إلى 26.5%، مما يجعلها خيارًا جذابًا للباحثين والمطورين. في حين أن التطورات في [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) لا تتوقف، تعكس [DynMuon](/tag/dynmuon) إمكانية هائلة لتحسين [أساليب](/tag/أساليب) [التدريب](/tag/التدريب) الحالية.
اكتشاف جديد في تدريب نماذج اللغة: DynMuon وفاعلته الديناميكية!
تقدم DynMuon نهجاً جديداً ومبتكراً في تدريب نماذج اللغة الكبيرة، من خلال عملية تشكيل طيفي ديناميكية تعزز من فعالية وتقليل المدة الزمنية للتدريب. اكتشفوا كيف يمكن لهذا التطور أن يغيّر المستقبل في الذكاء الاصطناعي!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
