في عالم الذكاء الاصطناعي الحديث، يصبح التعلم الذاتي (Self-Evolution) مساراً حيوياً لتطوير نظم أكثر ذكاءً وقدرة على التكيف مع تحديات المستقبل. هذا هو الهدف وراء تطوير SE-Bench، بيئة تشخيصية تهدف إلى قياس قدرة الوكلاء على التعلم مدى الحياة واستيعاب الخبرات الجديدة.

ومع ذلك، قد تواجه جهود القياس هذه عوائق عدة، منها التداخل بين المعرفة السابقة حيث يمكن أن يظهر 'الجديد' من المعرفة في بيانات التدريب الأولي، بالإضافة إلى تعقيد التفكير الذي يمكن أن يؤدي إلى إخفاقات ناجمة عن صعوبة المشكلة بدلاً من عدم القدرة على استرجاع المعرفة المكتسبة.

يأتي SE-Bench كابتكار لتجاوز هذه التحديات، حيث يقوم بإخفاء مكتبة NumPy ووثائق برامجها لتصبح حزمة جديدة غير معروفة مع معرّفات عشوائية. يُطلب من الوكلاء استيعاب هذه الحزمة وتقييمهم على مهام برمجية بسيطة دون أي وصول إلى الوثائق، مما يخلق بيئة نقية حيث تكون المهام سهلة مع الوثائق الجديدة، ولكن مستحيلة للنماذج الأساسية بدونها.

تكشف نتائج البحث ثلاثة رؤى مهمة:
1. **مفارقة الكتاب المفتوح**: التدريب مع الوثائق المرجعية يساعد على انخفاض الاحتفاظ بالمعرفة، مما يتطلب "تدريب الكتاب المغلق" لإجبار النماذج على ضغط المعرفة في الأوزان.
2. **فجوة التعلم المعزز**: لا تستطيع أساليب التعلم المعزز التقليدية استيعاب المعرفة الجديدة بالكامل بسبب تقليم سياسات الاختيار والانحدارات السلبية.
3. **جدوى اللعب الذاتي**: النماذج يمكنها التعلم من المهام المُولَّدة ذاتياً، ولكن عندما يتم دمج ذلك مع تقنيات الترميز الذاتي بدلاً من التعلم المعزز.

بشكل عام، يضع SE-Bench منصة تشخيصية صارمة للتطور الذاتي مع استيعاب المعرفة، مما يمهد الطريق لدراسات أعمق في مجال الذكاء الاصطناعي. انضم إلينا واستكشف الكود ومجموعة البيانات المتاحة على [https://github.com/thunlp/SE-Bench].

كيف تعتقد أن هذه التطورات ستؤثر على مستقبل الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!