تتسارع وتيرة استخدام نماذج اللغة الكبيرة (LLMs) في الذكاء الاصطناعي، حيث تُستخدم لدعم تطبيقات متخصصة وخدمات شخصية. ومع تزايد هذا الاستخدام، أصبحت جودة وكفاءة مرحلة ما بعد التدريب لنماذج اللغة أمراً بالغ الأهمية. هذا الأمر يستدعي الانتباه، خاصة بسبب القيود المرتبطة بالموارد المستخدمة.

رغم أن التطورات الأخيرة في تقنية التدريب الفيدرالي الفعّال (FL PEFT) واستدلال منخفض الكمون قد حسّنت أداء المهام الفردية، إلا أن تحسين النموذج والاستدلال كانا يُعالجان كعبءين منفصلين. هذه الطريقة تتجاهل التداخل بينهما، مما يؤدي إلى نشرات زائدة وتحسينات متأخرة في جودة الاستدلال.

لتجاوز هذه الحدود، تم تقديم إطار عمل جديد يُعرف بـ CoLLM. يُعد CoLLM نظاماً يدمج بين FL PEFT والاستدلال عبر النسخ المشتركة من المعلمات والنماذج، حيث يلبي احتياجات كل من النسخ والمجموعات.

تُظهر الميزات التي يقدمها CoLLM كفاءة مدهشة من خلال:
1. **آلية مشاركة النموذج داخل النسخة**، التي تتيح إعادة استخدام معلمات النموذج في الوقت الحقيقي، وذلك عبر استدلال غير مدمج واستراتيجيات محولات الظل.
2. **خوارزمية تنسيق زمنية مزدوجة بين النسخ**، التي تُوازن بذكاء بين حملات تحسين النموذج والاستدلال لتحسين جودة النموذج على المدى الطويل وكفاءة الاستدلال على المدى القصير.

تظهر التقييمات المكثفة عبر مجموعة متنوعة من نماذج LLM وآثار العالم الحقيقي أن CoLLM يتفوق باستمرار على أنظمة LLM المتطورة، حيث يحقق زيادة تصل إلى ثلاث مرات في الإنتاجية الجيدة (goodput). هذا يبرز فعاليته في تمكين عملية ما بعد التدريب لنماذج اللغة في الذكاء الاصطناعي المتخصص.