في عالم البرمجة الحديثة، أصبح استخدام وكلاء الذكاء الاصطناعي (AI Coding Agents) ضرورة ملحة تساهم في تسريع عملية كتابة الأكواد وإصلاح الأخطاء. ولكن، ماذا يحدث عندما يؤدي دور هذه الوكلاء إلى نتائج غير مُرضية؟ وفقًا لدراسة جديدة تم إعدادها استنادًا إلى بيانات مجموعة AIDev، اتضح أن 46.41% من التحديثات (Pull Requests) التي اقترحها وكلاء مثل Copilot وDevin وCursor وClaude تم رفضها.

هذا العدد الكبير يشير إلى كمية هائلة من الموارد التي تم إهدارها في مراجعة هذه التحديثات، حيث يتطلب الأمر مراجعة بشرية واختبارات للتحقق من جودة الأكواد التي في نهاية المطاف تُهمل. تكمن أهمية هذا البحث في فهم الأسباب التي أدت إلى رفض هذه التحديثات، مما سيساهم في تعزيز فعالية هذه الوكلاء وجعلهم زملاء عمل أكثر كفاءة.

من خلال دراسة نوعية قائمة على عينة تمثيلية تضم 306 طلبات سحب غير مدمجة، تم تحديد 14 سببًا رئيسيًا تؤدي إلى رفض التحديثات المولدة بواسطة الوكلاء. هذه الأسباب تم تقسيمها إلى أربع فئات رئيسية، منها:
- **التنفيذ الخاطئ**: وجود أخطاء في التنفيذ مثل وجود أكواد غير مكتملة أو طرق عمل غير صحيحة.
- **فشل في اختبار التكامل المستمر**: طلبات سحب لا تمر عبر الأنابيب الخاصة بالاختبار.
- **عدم قدرة الوكيل على التنفيذ**: عدم وجود الأكواد المطلوبة أو فقدان الجلسات.
- **أولوية منخفضة**: طلبات سحب لا تُعتبر ذات أولوية.

تشير النتائج إلى ضرورة تحسين توجيه الوكلاء على عدة مستويات، بدءًا من تقديم اقتراحات حول كيفية إصلاح مشكلات معينة، وتحديد القيود المتعلقة بالأساليب غير المرغوب فيها، وانتهاءً بتعليم الوكيل كيفية التحقق من صحة التنفيذ دون إدخال تغييرات مضرة.

الاختصاص يجعل ما تم إنجازه فعلاً مثيرًا للفضول حقًا، إذ نحن بحاجة إلى تحسين الأولويات لضمان عدم إهدار مراجعات البشر أو موارد الوكيل.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات.