في عالم تطوير البرمجيات الحديث، يعد توسع الذكاء الاصطناعي حجر الزاوية نحو تحقيق هندسة برمجيات ذاتية الاستقلالية. ومع ذلك، تواجه هذه العملية تحديًا كبيرًا يتمثل في نقص البيانات المتنوعة والواسعة لعمليات البرمجة. هنا يأتي دور قاعدة البيانات الجديدة Open-SWE-Traces، التي تمثل خطوة نوعية في هذا الاتجاه.

تحتوي هذه القاعدة على أكثر من 207,489 مسارًا برمجيًا باللغة الإنجليزية، وتغطي تسعة لغات برمجية رئيسية مثل بايثون (Python)، وجافا (Java)، وجافا سكريبت (JavaScript)، وغيرها. تم جمع هذه البيانات من 20,000 عملية سحب حقيقية عبر منصتي OpenHands و SWE-agent، مما يمنح قاعدة البيانات موثوقية كبيرة.

تستخدم Open-SWE-Traces منهجية تفكير هجينية تجمع بين نموذج Minimax-M2.5 الذي يولد مسارات برمجية تتضمن عمليات "تفكير" واضحة، ونموذج Qwen3.5-122B الذي يقدم مسارات عالية الجودة تعتمد على الاستنتاجات غير المباشرة.

تعتبر هذه القاعدة ذات قيمة كبيرة، حيث تم تصفية البيانات وفقًا لرخص الاستخدام المسموح بها مثل MIT وApache وBSD، مما يسهم في تدريب نماذج قادرة على التفكير العميق.

تعزيزًا لهذه الجهود، تم تحسين سلسلة نماذج Qwen3-30B-A3B عبر التدريب على هذه البيانات، وسجل النموذج الأفضل نتائج ملحوظة، حيث حقق معدلات دقة تصل إلى 61.7% على معيار SWE-bench Verified و57.1% على معيار SWE-bench Multilingual.

باستخدام Open-SWE-Traces، يمكن للمطورين والباحثين الآن الوصول إلى موارد قيمة تسهم في صقل قدرات البرمجيات الذكية على مستوى إنساني والكفاءة في الأداء مع توفير الموارد كود مفتوح المصدر. كيف يمكن أن تُحدث هذه التطورات ثورة في صناعة البرمجيات برأيك؟ شاركونا آرائكم في التعليقات.