تتسارع وتيرة استخدام [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) ([LLMs](/tag/llms)) في الذكاء الاصطناعي، حيث تُستخدم لدعم [تطبيقات](/tag/تطبيقات) متخصصة وخدمات شخصية. ومع تزايد هذا الاستخدام، أصبحت جودة وكفاءة مرحلة ما بعد [التدريب](/tag/التدريب) لنماذج [اللغة](/tag/اللغة) أمراً بالغ الأهمية. هذا الأمر يستدعي الانتباه، خاصة بسبب [القيود](/tag/القيود) المرتبطة بالموارد المستخدمة.
رغم أن التطورات الأخيرة في [تقنية](/tag/تقنية) [التدريب](/tag/التدريب) الفيدرالي الفعّال (FL [PEFT](/tag/peft)) واستدلال منخفض الكمون قد حسّنت [أداء المهام](/tag/[أداء](/tag/أداء)-المهام) الفردية، إلا أن [تحسين النموذج](/tag/[تحسين](/tag/تحسين)-النموذج) والاستدلال كانا يُعالجان كعبءين منفصلين. هذه الطريقة تتجاهل التداخل بينهما، مما يؤدي إلى نشرات زائدة وتحسينات متأخرة في جودة [الاستدلال](/tag/الاستدلال).
لتجاوز هذه الحدود، تم تقديم إطار [عمل](/tag/عمل) [جديد](/tag/جديد) يُعرف بـ [CoLLM](/tag/collm). يُعد [CoLLM](/tag/collm) نظاماً يدمج بين FL [PEFT](/tag/peft) والاستدلال [عبر](/tag/عبر) النسخ المشتركة من المعلمات والنماذج، حيث يلبي احتياجات كل من النسخ والمجموعات.
تُظهر الميزات التي يقدمها [CoLLM](/tag/collm) [كفاءة](/tag/كفاءة) مدهشة من خلال:
1. **آلية [مشاركة](/tag/مشاركة) النموذج داخل النسخة**، التي تتيح إعادة استخدام معلمات النموذج في الوقت الحقيقي، وذلك [عبر](/tag/عبر) [استدلال](/tag/استدلال) غير مدمج واستراتيجيات [محولات](/tag/محولات) الظل.
2. **خوارزمية [تنسيق](/tag/تنسيق) زمنية مزدوجة بين النسخ**، التي تُوازن بذكاء بين حملات [تحسين النموذج](/tag/[تحسين](/tag/تحسين)-النموذج) والاستدلال لتحسين جودة النموذج على المدى الطويل وكفاءة [الاستدلال](/tag/الاستدلال) على المدى القصير.
تظهر [التقييمات](/tag/التقييمات) المكثفة [عبر](/tag/عبر) مجموعة متنوعة من [نماذج](/tag/نماذج) [LLM](/tag/llm) وآثار العالم الحقيقي أن [CoLLM](/tag/collm) يتفوق باستمرار على [أنظمة](/tag/أنظمة) [LLM](/tag/llm) المتطورة، حيث يحقق زيادة تصل إلى ثلاث مرات في [الإنتاجية](/tag/الإنتاجية) الجيدة (goodput). هذا يبرز فعاليته في [تمكين](/tag/تمكين) عملية ما بعد [التدريب](/tag/التدريب) لنماذج [اللغة](/tag/اللغة) في [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المتخصص.
ثورة في الذكاء الاصطناعي: CoLLM يحقق تحسينات ضخمة في نماذج اللغة الكبيرة!
يقدم نظام CoLLM إطار عمل مبتكر يجمع بين تحسين النموذج والاستدلال لتجاوز قيود الموارد. هذه التقنية تجعل نماذج اللغة الكبيرة أكثر كفاءة وفعالية في التطبيق العملي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
