وضعت دراسة جديدة تحت عنوان "CodeTaste" معيارًا جديدًا لاختبار قدرة وكلاء البرمجة المعتمدة على نماذج اللغات الضخمة (Large Language Models) في مجال إعادة هيكلة الكود (Code Refactoring). فقد أظهرت الأبحاث أن هذه الوكلاء يمكنهم بالفعل توليد كود يعمل بكفاءة، لكن العديد من الحلول التي يقدمونها تعاني من التعقيد والازدواجية والديون الهيكلية.

تقوم أبحاث إعادة الهيكلة بتحسين بنية البرمجيات والحفاظ على قابلية صيانتها، وهي عملية يقوم بها المطورون البشر لتقديم حلول أنظف وأكثر كفاءة. ولكن، هل يستطيع الذكاء الاصطناعي محاكاتها بشكل موثوق؟

لتحقيق ذلك، طور الباحثون معيارًا يسمى CodeTaste يستند إلى بيانات تم استخراجها من مشاريع مفتوحة المصدر تحتوي على إعادة هيكلة متعددة الملفات. يتم تقييم الحلول باستخدام مجموعات اختبارات مستودع تقيس الصحة الوظيفية للكود، بالإضافة إلى فحوصات ثابتة خاصة تتحقق من إزالة الأنماط غير المرغوب فيها وإضافة الأنماط المرغوبة باستخدام تحليل تدفق البيانات.

نتائج التجربة أظهرت وجود فجوة بارزة: agents الأمثل قاموا بتنفيذ إعادة هيكلة محددة بالتفصيل بشكل جيد، لكن لم يتمكنوا غالبًا من اكتشاف خيارات إعادة الهيكلة التي اتخذها المطورون البشر. وبفضل تقنية الاقتراح ثم التنفيذ، تم تحسين التوافق، حيث أثبتت النتائج أن اختيار الاقتراح الأفضل قبل التنفيذ يمكن أن يحقق المزيد من المكاسب.

يعتبر CodeTaste ليست مجرد أداة تقييم، بل يشكل أيضًا إشارة قوية للتوجه نحو تحسين وكالات البرمجة الذكائية بحيث تتماشى مع قرارات إعادة الهيكلة البشرية، مما يفتح آفاقًا جديدة في مجال البرمجة الذكائية. تم إصدار المعيار وترتيب المتصدرين والشيفرة المصدرية، مما يوفر المصدر الأفضل للمهتمين.