في عالم البرمجة المتطور بسرعة، يواجه الوكلاء البرمجيون تحديات كبيرة في إدارة تاريخ التفاعل الطويل والضوضاء ضمن ميزانيات السياق المحدودة. تتبنى الطرق التقليدية لإدارة الذاكرة غالبًا أنماط ضغط ثابتة تفرض قيودًا صارمة على توقيت الضغط ودقته. لكن ماذا لو كان من الممكن تجاوز هذه القيود التقليدية؟

هنا يأتي دور SWE-MeM، الإطار التدريبي الثوري الذي يقدم أساليب جديدة لإدارة الذاكرة بطريقة استباقية وفعالة عند الطلب. يتيح SWE-MeM لمستخدميه من الوكلاء البرمجيين تخصيص قراراتهم بشأن متى وما وكيفية الضغط بناءً على حالة المسار وتقدم المهمة وميزانية السياق المتبقية.

تدرب الوكلاء باستخدام مسارات إدارة الذاكرة الاستباقية وGRPO المعتمد على الذاكرة، مما يساهم في تحسين كفاءة إدارة الذاكرة وحل المشكلات في وقت واحد. وقد أثبت SWE-MeM نجاحه في تجربة SWE-Bench Verified، حيث حقق معدل حل يصل إلى 43.4% و60.2% باستخدام نماذج بحجم 4B و30B على التوالي، متفوقًا بذلك على الممارسات الحالية في الأداء والكفاءة.

مع هذه الابتكارات، من المؤكد أن SWE-MeM سيعيد صياغة طريقة تعامل الوكلاء البرمجيين مع المعلومات، ويضفي طابعًا جديدًا على عالم برمجة الذكاء الاصطناعي. ما رأيكم في هذا التطور؟ شاركونا آراءكم في التعليقات!