في ظل التسارع الملحوظ في تبني الوكلاء البرمجيين المعتمدين على الذكاء الاصطناعي (AI coding agents)، تظهر الحاجة الملحة لفهم كيفية استخدام المطورين لهذه الأدوات ومدى فاعليتها في واقع العمل. تُعد قاعدة بيانات SWE-chat الجديدة الأولى من نوعها، حيث تتضمن مجموعة كبيرة من جلسات التفاعل بين المطورين هؤلاء والوكلاء البرمجيين، وتم جمعها من مشاريع البرمجيات مفتوحة المصدر في بيئات العمل الحقيقية.

تحتوي قاعدة بيانات SWE-chat على 6,000 جلسة، تتضمن أكثر من 63,000 طلب من المستخدمين و355,000 استدعاء لأدوات الوكلاء. وما يميز هذه القاعدة هو نظام جمع البيانات المتواصل، الذي يتيح للباحثين تتبع كيفية تفاعل المطورين مع الوكلاء في الزمن الحقيقي.

تشير النتائج التي تم استخلاصها من قاعدة البيانات أن أنماط البرمجة تحتوي على تقسيم ثنائي، حيث في 41% من الجلسات ينشئ الوكلاء البرمجيون كل الكود بشكل فعلي، بينما في 23% يتم دفع الكود بشكل كامل من قبل المطورين. ورغم التحسين السريع في قدرات الوكلاء، تبين أن الكود الذي ينتجه الوكلاء يبقى غير فعال، حيث إن 44% فقط من الكود المنتَج بواسطة الوكيل يتجاوز إلى الالتزامات النهائية للمستخدمين، كما أظهرت البيانات أن الكود المكتوب بواسطة الوكلاء يضيف مزيدًا من الثغرات الأمنية مقارنةً بالكود الذي يؤلفه البشر.

علاوة على ذلك، تشهد تفاعلات المستخدمين ردود فعل ملحوظة، حيث يتم تصحيح المخرجات أو الإبلاغ عن الأخطاء في 44% من جميع التفاعلات. من خلال تقديم تتبع كامل لتفاعلات البرمجة وتحديد ملكية الكود بين البشر والوكلاء، توفر SWE-chat أساسًا علميًا لفهم كيفية أداء وكلاء الذكاء الاصطناعي في سير العمل الحقيقي للمطورين، بعيدًا عن المعايير المقننة.

هل تنفست التكنولوجيا أنفاس جديدة في عالم البرمجة، أم أنها لا تزال تعاني من تلك الثغرات؟ شاركونا آراءكم وتجاربكم.