في عالم متسارع التطور في الذكاء الاصطناعي، تقدم التقنيات الحديثة طرقاً مبتكرة لتعزيز أداء النماذج اللغوية. أحدث هذه الابتكارات هو نموذج LEAF (Low-rank Exploration with Adaptive Forking)، الذي يمثل قفزة نوعية في تدريب نماذج اللغة الكبيرة الموجهة للكلام (speech-aware large language models).
تعاني الطُرق الشعبية الحالية، مثل أساليب GRPO، من مشكلة تخصيص الاعتمادات بشكل خشن، حيث تعطي مكافآت متساوية لكل رمز (token) في الاستجابة. هذا يكاد يغفل الهيكل المفيد داخل دفعات التوزيع، حيث تشترك الإكمالات المعتمدة على الكلام في البادئات قبل أن تتباعد في قرارات هامة. هنا يأتي دور LEAF، الذي يقدم طريقة استناداً إلى الشجرة لاستعادة هذا الهيكل بدون الحاجة إلى التفرع عبر الإنترنت أو فك تشفير إضافي.
تعمل تقنية LEAF على أخذ عينات من الاستجابات الكاملة، واختيار حدود ذات مفاجآت عالية، وتجميع الاستجابات حسب البادئات المشتركة، مما يتيح تخصيص ميزات على مستوى النطاق باستخدام المكافآت من السلالات السلفية. وقد تم تبرير تصميم LEAF نظريًا، مما يثبت فعالية تخصيص الميزات والاختيار القائم على الحدود.
من خلال التجارب، حققت LEAF تحسينات ملحوظة على GRPO في معايير مثل إجابة الأسئلة المعتمدة على الكلام والترجمة الكلامية، رغم استخدام نفس موازنة التوزيع وميزانية التكيف منخفضة المرتبة. الأهم من كل ذلك، أن النماذج الأصغر المدربة باستخدام LEAF تفوقت على نماذج المعلمات الكاملة المعروفة حتى الآن.
هذا الابتكار يفتح آفاقًا جديدة في تحسين تفاعل الإنسان مع الآلات، ويعزز من إمكانية التفاعل الذكي في المستقبل. ما رأيكم في هذا التطور المثير؟ شاركونا في التعليقات.
LEAF: ثورة في الذكاء الاصطناعي مع شجرة النمو بدون تفرع لتدريب نماذج اللغة الكبيرة الموجهة للكلام!
تمكن نموذج LEAF من تحسين التدريب بعد الإطلاق لنماذج اللغة الكبيرة من خلال معالجة القضايا المرتبطة بتخصيص الاعتمادات. يتيح هذا الابتكار معالجة أفضل للرسائل الموجهة الكلام، مما يحقق أداءً متفوقًا بين النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
