في عالم الذكاء الاصطناعي، يعد ضبط [النماذج](/tag/النماذج) من أهم العوامل التي تؤثر على [الأداء](/tag/الأداء) النهائي لنماذج [اللغة](/tag/اللغة) الكبيرة ([LLM](/tag/llm)). ومن المثير أن [دراسة](/tag/دراسة) حديثة تناولت استخدام [تقنية](/tag/تقنية) [التكيف منخفض الرتبة](/tag/[التكيف](/tag/التكيف)-منخفض-الرتبة) ([Low-Rank Adaptation](/tag/low-rank-adaptation) - [LoRA](/tag/lora)) كاستراتيجية رئيسية لتحقيق [كفاءة](/tag/كفاءة) عالية في ضبط هذه [النماذج](/tag/النماذج).
بالاستناد إلى هذه التقنية، اقترحت بعض الدراسات السابقة [استراتيجيات جديدة](/tag/[استراتيجيات](/tag/استراتيجيات)-جديدة) لتهيئة النماذج، مما أدى إلى [تحسينات](/tag/تحسينات) ملحوظة مقارنة باستخدام Vanilla [LoRA](/tag/lora). ولكن، تبين أن هذه التحسينات غالباً ما تم تنفيذها ضمن إعدادات ثابتة أو معدلة بشكل ضيق لمتغيرات التحكم، على الرغم من [حساسية](/tag/حساسية) [الشبكات العصبية](/tag/[الشبكات](/tag/الشبكات)-العصبية) للإعدادات التدريبية.
تناولت هذه [الدراسة](/tag/الدراسة) إعادة [تقييم](/tag/تقييم) منهجية لتسعة متغيرات تمثل LoRA، بما في ذلك Vanillia LoRA، من خلال إجراء [بحث](/tag/بحث) شامل حول معلمات التعلم، حجم الدفعة، الرتبة، ومدى فترة [التدريب](/tag/التدريب). وقد شمل [البحث](/tag/البحث) مهاماً متعددة مثل [التفكير](/tag/التفكير) الرياضي، والتحليل المنطقي، وتوليد الأكواد، واتباع [التعليمات](/tag/التعليمات) [عبر](/tag/عبر) [نماذج](/tag/نماذج) مختلفة الأحجام.
لقد وجد الباحثون أن الطرق المختلفة لـ [LoRA](/tag/lora) تفضل نطاقات معدلات [تعلم](/tag/تعلم) محددة، وبتعديل مناسب لمعدلات التعلم، يمكن [تحقيق](/tag/تحقيق) [أداء](/tag/أداء) قريب جداً من قمم [الأداء](/tag/الأداء) (ضمن 1-2%) على جميع الأساليب. وهذا يشير إلى أن Vanilla [LoRA](/tag/lora) لا يزال يعتبر نقطة انطلاق فعالة، وأن التحسينات المبلغ عنها في ظل إعدادات [تدريب](/tag/تدريب) معينة قد لا تعكس مزايا منهجية ثابتة.
وتعكس التحليلات اللاحقة عن العوامل الثانية اختلاف نطاقات معدلات [التعلم](/tag/التعلم) المثلى بفضل التباينات في أكبر خاصية لهيسيان، مما يتماشى مع [النظريات](/tag/النظريات) التعليمية التقليدية.
في النهاية، تفتح هذه النتائج باب النقاش حول أهمية [تحسين](/tag/تحسين) [ميزات](/tag/ميزات) [التعلم](/tag/التعلم) وتأثيرها على [أداء](/tag/أداء) [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي). هل تعتقدون أن Vanilla [LoRA](/tag/lora) تكفي لضبط [النماذج](/tag/النماذج)؟ شاركونا آراءكم!
هل يكفي استخدام Vanilla LoRA في ضبط نماذج اللغة الكبيرة؟ اكتشفوا الإجابة الآن!
تظهر الدراسة الحديثة أن استخدام تقنية Low-Rank Adaptation (LoRA) يمكن أن يكون كافيًا لضبط نماذج اللغة الكبيرة (LLM)، مما يفتح المجال أمام فهم أفضل لاختيار معدلات التعلم. اكتشفوا كيف يمكن أن تؤثر التعديلات البسيطة على أداء النماذج!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
