في عالم الذكاء الاصطناعي، أصبحت وكالات البرمجة (Coding Agents) تتصدر المشهد كأحد التطبيقات الرئيسية للذكاء الاصطناعي الوكالي (Agentic LLMs)، ومع ذلك، يظل تقديم هذه الوكالات بشكل فعال تحدياً مستمراً. لتحقيق تقدم في هذا المجال، يحتاج الباحثون إلى فهم أنماط العمل الحقيقية، والتي تظل في معظَمها غائبة بسبب عدم وجود بيانات كافية.

تأتي فكرة مشروع TraceLab للمساعدة في سد هذه الفجوة من خلال تجميع ونشر مجموعة بيانات ضخمة تتضمن معلومات عن حوالي 4300 جلسة لوكالات البرمجة، تحتوي على حوالي 350,000 خطوة من نماذج اللغات و430,000 استدعاء أدوات، استناداً إلى استخدامنا اليومي للأنظمة مثل Claude Code وCodex.

تشير التحليلات الأولية إلى أن أحمال العمل لوكالات البرمجة تتميز بدورات مستقلة طويلة وسياقات طويلة مع نتائج قصيرة، بالإضافة إلى استدعاءات أدوات متنوعة ومعقدة. تظهر نتائج الدراسة أيضًا أن هناك فرصًا حقيقية لتحسين كفاءة تقديم الخدمات، مثل تقليل التكاليف الناتجة عن استدعاءات الأدوات، وتوقع زمن استجابة الأدوات بشكل مدروس، وإدارة الكاش بشكل فعال.

للاستفادة من هذه البيانات، تم إطلاق مجموعة البيانات، مع قناة تجميع البيانات، وأكواد التحليل على موقع GitHub الخاص بالمشروع. لمزيد من التفاصيل، يمكن زيارة Tracelab. هذا التحليل لا يسهم فقط في تحسين أداء الوكالات البرمجية، بل يفتح الآفاق لابتكارات جديدة في هذا المجال المتطور سريعاً.

ما رأيكم في أهمية البيانات الكبيرة لتحسين أداء الذكاء الاصطناعي؟ شاركونا في التعليقات.