يمثل ظهور الوكلاء البرمجيين المستقلين ثورة في تطوير البرمجيات، حيث أصبح بإمكانهم فتح ودمج الطلبات في مستودعات برمجية مشتركة بشكل آلي. ومع ذلك، يغفل معظم البحوث التركيز على تقييم هذه الوكلاء بصورة فردية، مما قد يعطي انطباعاً خاطئاً عن أدائهم.

الدراسة التي تم نشرها في arXiv، تطرح تساؤلات مهمة حول كيفية إدارة مستودعات البرمجيات وكيف يمكن قياس المخاطر المرتبطة بها. فعندما يقوم وكلاء الذكاء الاصطناعي بإجراء تغييرات، قد لا تعكس نتائج اختباراتهم الفعلية حالة المستودع الكلي، الذي قد يتعرض لمشكلات تتجاوز ما يمكن لوكيل واحد التغلب عليه.

من خلال تحليل أكثر من 930,000 طلب دمج تم تأليفه بواسطة وكلاء، وجد الباحثون أن حوالي نصف التغير في «احتكاك الدمج» (integration friction) يبقى مرتبطًا بالمستودع بعد النظر في عوامل مثل حجم الطلب، مؤلفه، ونوع الوكيل. بمعنى آخر، يعتبر احتكاك الدمج مصدراً للقلق على مستوى النظام البيئي، وليس فقط في الأداء الفردي للوكيل.

النتيجة الدقيقة هي أن البرمجيات المدعومة بالذكاء الاصطناعي يجب أن تُقاس وتُدار على مستوى النظام البيئي بدلاً من تقييمها على أساس الوكلاء الفرديين. إن هذه النتائج تدفعنا لإعادة التفكير في كيفية تقييم وإدارة البرمجيات في سياقات متصلة بالذكاء الاصطناعي.