في عالم الذكاء الاصطناعي، يعد التعلم المستمر (Lifelong Learning) عنصرًا أساسيًا لوكلاء نموذج اللغة الكبير (Large Language Model) الذين يتفاعلون في بيئات ديناميكية. في حين أن معظم الوكلاء الحاليين يعتمدون على استرجاع المهارات أو الخبرات السابقة باستخدام معايير ثابتة في مرحلة الاستدلال، فإن هذا النموذج يمنعهم من داخلي التغذية الراجعة في الوقت الحقيقي كما يفعل المتعلمون البشر. للتغلب على هذه العقبة، تم تقديم نظام 'LifeSkill'، والذي يعد إطارًا مبتكرًا يعتمد على التعلم المعزز (Reinforcement Learning) لوكلاء التعلم المستمر عبر الإنترنت.

يعتمد نظام 'LifeSkill' على مرحلتين رئيسيتين: أولاً، التعلم المستند إلى التحقق (Verifier-Guided Skill Learning) الذي يوفر تحفيزًا لاسترجاع المهارات بفضل نجاح ما يتم التحقق منه من مهارات متعددة، مما يشجع النموذج على إنتاج مهارات تتناسب مع تطبيق المهام بدلًا من التركيز على قابلية توظيفها النصية فقط.

ثانيًا، نقدم عملية 'التدوين المستمر للمهارات' (Online Skill Internalization)، والتي تعمل على تحسين النموذج أثناء التفاعل في الاختبار من خلال تحويل المسارات المستندة إلى المهارات إلى إشارات تحفيزية. هذا يسمح للعميل بدمج قدرات الاستدلال مباشرة ضمن برامجه، مما يقلل من مشكلة استرجاع الخبرات المزعجة. أظهرت التجارب على منصة LifelongAgentBench أن نظام 'LifeSkill' قد حسّن الأداء بمعدل 7 نقاط مقارنة بأساليب التعلم المستمر الموجودة.

يمثل هذا التطور الجديد خطوة مهمة نحو تعزيز قدرة الذكاء الاصطناعي على التكيف والتعلم في الوقت الفعلي، مما يمهد الطريق لمستقبل أكثر تفاعلية واستجابة.