في عالم تطوير البرمجيات، تعتبر القدرة على تحرير الكود على مستوى المستودع (repository-level code editing) من الأمور الشائكة التي تتطلب فهماً عميقاً للروابط المعقدة وتنفيذ تعديلات متعددة الملفات بدقة. وفي ظل التقدم الأخير في مجال الذكاء الاصطناعي، يسعى باحثون إلى تحقيق هذا الهدف بطرق مبتكرة.
تقدم الدراسة الجديدة التي تم نشرها في arXiv تحت العنوان "طلبات السحب كإشارة تدريب لتعديل الكود على مستوى المستودع" (Pull Requests as a Training Signal for Repo-Level Code Editing) وسيلة جديدة. حيث يقترح الباحثون نموذج "Clean Pull Request" (Clean-PR)، وهو أداة تدريب تستخدم طلبات السحب الحقيقية من GitHub كإشارة لتدريب نماذج الذكاء الاصطناعي في تعديلات الكود.
تتضمن هذه المبادرة إنشاء خط أنابيب قابل للتوسع يقوم بتحويل التغييرات الفوضوية في طلبات السحب إلى كتل تحرير بحث/استبدال (Search/Replace edit blocks) وذلك من خلال إعادة بناء البيانات والتحقق منها. وبفضل هذا النموذج، تم تجميع أكبر مجموعة متاحة علنياً من 2 مليون طلب سحب تغطي 12 لغة برمجة، مما يمثل خطوة كبيرة نحو تعزيز فهم الذكاء الاصطناعي للكود.
عند استخدام هذه الإشارات التدريبية، تم إجراء مرحلة تدريب وسطى تليها عملية تحسين محددة بدون استخدام وكلاء، وبأسلوب يركز على تعزيز البيانات بالاستناد إلى الأخطاء. إذ أظهرت النتائج عبر مقياس SWE-bench تفوق النموذج الجديد بشكل ملحوظ، مع تحسينات مطلقة تصل إلى 13.6% في SWE-bench Lite و12.3% في SWE-bench Verified.
تشير هذه النتائج إلى إمكانية تطوير فهم الكود وقدرات التعديل على مستوى المستودع بشكل فعال ضمن بروتوكول مبسط، دون الاعتماد على بنى تحتية معقدة في وقت الاستنتاج. هذا الاكتشاف يجعلنا نتساءل عن كيفية تغيير نموذج عمل تطوير البرمجيات والتفاعل بين الإنسان والآلة في المستقبل.
ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
ثورة في تعديل الكود: كيف تسهم طلبات السحب في تدريب نماذج الذكاء الاصطناعي!
تقدم دراسة جديدة طريقة مبتكرة لتدريب نماذج الذكاء الاصطناعي على تعديل الكود من خلال استخدام طلبات السحب (Pull Requests). تم إثبات فعالية هذا الأسلوب من خلال تحسينات ملحوظة على الأداء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
