في خطوة مثيرة نحو مستقبل البرمجة الذكية، قدمنا نموذجين متطورين من عائلة لاغونا وهما M.1 و XS.2. يبدو أن هذه النماذج، القائمة على فكرة خليط الخبراء (Mixture-of-Experts)، ستحدث تغييرًا جذريًا في مجال البرمجة الطويلة الأمد.

يتضمن نموذج L.M.1 عددًا هائلًا من المعلمات تصل إلى 225.8 مليار معلمة، مع تفعيل 23.4 مليار معلمة لكل توكن، بينما يأتي نموذج XS.2 بعدد 33.4 مليار معلمة مع تفعيل 3 مليار معلمة فقط. الأمر المثير هنا هو أن كلا النموذجين تم تدريبهما من الصفر في بيئة متكاملة تسمى مصنع النماذج (Model Factory)؛ وهي بنية قوية تتضمن جميع المكونات اللازمة لتطوير النماذج، مما يجعل عملية التدريب كأنها عملية صناعية.

نستعرض في هذا التقرير المبادئ والاختيارات التصميمية لمصنع النماذج، وكذلك نفصل عملية التدريب الشاملة بدءًا من البيانات المعتمدة للتدريب، ثم المعمارية، وصولًا إلى مراحل ما بعد التدريب والتقييم والتكميم.

عند قياس الأداء في مجالات هندسة البرمجيات (agentic software engineering) والمعايير النهائية مثل SWE-bench Verified و SWE-bench Multilingual، يظهر كلا النموذجين كخيارات تنافسية مع أفضل النماذج المفتوحة المتاحة في فئتهما.

لم يكن هناك وقت أفضل لاستكشاف إمكانيات هذه النماذج، خاصة مع إصدار أوزان نموذج XS.2 تحت ترخيص Apache 2.0، والمتوفر الآن على موقع الهوجينغ فايس (Hugging Face) [رابط الأوزان].

ما رأيكم في تطويرات الذكاء الاصطناعي هذه؟ هل تعتقدون أنها ستغير طريقة برمجة البرمجيات بشكل جذري؟ شاركونا آرائكم في التعليقات!