في عالم الذكاء الاصطناعي، يعتبر التكيف مع مجالات متعددة تحدياً كبيراً، خاصة عندما تكون بيانات التدريب الأصلية غير قابلة للمشاركة. وقد اقترحت الدراسة الجديدة، المنشورة على موقع arXiv، طريقة مبتكرة تُعرف بـ "Hard-Routed MoR-LoRA". هذه الطريقة تعتمد على إنشاء خبراء LoRA (Low-Rank Adaptation) متخصصين يتم تدريبهم بشكل مستقل، وتستخدم تقنية التعلم التعزيزي لتحسين أدائهم.
تتكون الطريقتان من مرحلتين رئيسيتين: في البداية، نستخدم التعلم التعزيزي لجعل الخبراء قادرين على التفكير في مجالات محددة، وبعد ذلك نقوم بتجميد جميع الخبراء وتنقيح نقاط التفكير الخاصة بهم. بدلاً من نماذج MoE التقليدية (Mixture of Experts) التي تستخدم نمط التوجيه الناعم، يتيح نظام الاختيار الصارم لـ "Hard-Routed MoR-LoRA" الاختيار الحاد لخبير واحد لكل وحدة، مما يحسن الأداء العام دون الحاجة إلى عدد كبير من المعلمات القابلة للتدريب.
أظهرت التجارب على خمسة معايير قياسية، بالإضافة إلى دعم نماذج متنوعة، أن هذه المنهجية تحافظ على أداء الخبراء مع تقليل كبير في العدد الإجمالي للمعلمات القابلة للتدريب مقارنةً بأساليب التوجيه اللينة التقليدية. وهكذا، تبرز هذه الدراسة نموذجاً بسيطاً وفعالاً في دمج خبراء LoRA المجمدين.
إذا كنت مهتماً بالأبحاث المتقدمة في مجالات الذكاء الاصطناعي والتعلم الآلي، فإن هذه الدراسة تمثل خطوة هامة نحو تحسين الكفاءة في نماذج التعلم المتعددة.
تعلم الاختيار وليس إعادة التعلم: الطريقة الثورية لهياكل عبر تفسير الآراء
تقدم الدراسة الجديدة منهجية مبتكرة لدمج خبراء LoRA المجمدين في نماذج لغوية ضخمة، مما يساعد في التكيف مع مجالات متعددة. باستخدام أسلوب الاختيار الصارم، تحافظ المنهجية على أداء الخبراء مع تقليل عدد المتغيرات القابلة للتدريب بشكل ملحوظ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
