وضعت دراسة جديدة تحت عنوان "CodeTaste" معيارًا جديدًا لاختبار قدرة وكلاء البرمجة المعتمدة على نماذج اللغات الضخمة (Large Language Models) في مجال إعادة هيكلة الكود (Code Refactoring). فقد أظهرت الأبحاث أن هذه الوكلاء يمكنهم بالفعل توليد كود يعمل بكفاءة، لكن العديد من الحلول التي يقدمونها تعاني من التعقيد والازدواجية والديون الهيكلية.
تقوم أبحاث إعادة الهيكلة بتحسين بنية البرمجيات والحفاظ على قابلية صيانتها، وهي عملية يقوم بها المطورون البشر لتقديم حلول أنظف وأكثر كفاءة. ولكن، هل يستطيع الذكاء الاصطناعي محاكاتها بشكل موثوق؟
لتحقيق ذلك، طور الباحثون معيارًا يسمى CodeTaste يستند إلى بيانات تم استخراجها من مشاريع مفتوحة المصدر تحتوي على إعادة هيكلة متعددة الملفات. يتم تقييم الحلول باستخدام مجموعات اختبارات مستودع تقيس الصحة الوظيفية للكود، بالإضافة إلى فحوصات ثابتة خاصة تتحقق من إزالة الأنماط غير المرغوب فيها وإضافة الأنماط المرغوبة باستخدام تحليل تدفق البيانات.
نتائج التجربة أظهرت وجود فجوة بارزة: agents الأمثل قاموا بتنفيذ إعادة هيكلة محددة بالتفصيل بشكل جيد، لكن لم يتمكنوا غالبًا من اكتشاف خيارات إعادة الهيكلة التي اتخذها المطورون البشر. وبفضل تقنية الاقتراح ثم التنفيذ، تم تحسين التوافق، حيث أثبتت النتائج أن اختيار الاقتراح الأفضل قبل التنفيذ يمكن أن يحقق المزيد من المكاسب.
يعتبر CodeTaste ليست مجرد أداة تقييم، بل يشكل أيضًا إشارة قوية للتوجه نحو تحسين وكالات البرمجة الذكائية بحيث تتماشى مع قرارات إعادة الهيكلة البشرية، مما يفتح آفاقًا جديدة في مجال البرمجة الذكائية. تم إصدار المعيار وترتيب المتصدرين والشيفرة المصدرية، مما يوفر المصدر الأفضل للمهتمين.
CodeTaste: هل يمكن لوكلاء البرمجة الذكائية إنشاء إعادة هيكلة كود على مستوى البشر؟
تقدم دراسة جديدة تحت عنوان CodeTaste وسيلة لتحليل قدرة نماذج لغات البرمجة على تحقيق إعادة هيكلة كود فعالة. النتائج تكشف عن فرق واضح بين أداء الوكلاء البشريين والذكائيين في اتخاذ القرارات الإنشائية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
