في عالم تطوير البرمجيات، يُعتبر استرجاع الكود من الأدوات الأساسية التي تعزز من إعادة استخدام الكود وتسريع عملية تصحيح الأخطاء. ورغم ذلك، فإن المعايير الحالية تركز بشكل رئيسي على الصلة الوظيفية، متجاهلةً أبعادًا هامة لجودة البرمجيات. لمعالجة هذه الفجوة، تم تقديم CoQuIR، وهو أول معيار كبير متعدد اللغات مصمم لتقييم استرجاع الكود مع التركيز على جودة الكود.

يسلط معيار CoQuIR الضوء على أربعة أبعاد رئيسية لجودة الكود: الدقة (Correctness)، الكفاءة (Efficiencyالأمن (Security)، وقابلية الصيانة (Maintainability). يتضمن هذا المعيار 42,725 استعلامًا و134,907 مقتطفات من الكود في 11 لغة برمجة، ويعتمد على مقاييس تقييم جديدة تركز على الجودة، مثل دقة التفضيل الثنائي (Pairwise Preference Accuracy) ونقطة التصنيف المبنية على الهامش (Margin-based Ranking Score).

عند استخدام CoQuIR، تم تقييم 23 نموذج استرجاع في هذا المجال، بما في ذلك الأنظمة مفتوحة المصدر والأنظمة التجارية، وقد أظهرت النتائج أن النماذج ذات الأداء العالي غالبًا ما تفشل في التمييز بين الكود المصاب بالأخطاء أو الغير آمن وبين الكود الأكثر متانة. بالإضافة إلى ذلك، تم إجراء تحقيقات أولية في أساليب التدريب التي تشجع بالضرورة على التعرف على جودة الكود. من خلال استخدام مجموعات بيانات صناعية، أظهرنا تحسينات واعدة في مقاييس الجودة عبر نماذج مختلفة دون التأثير على الصلة الدلالية.

تؤكد التجارب في توليد الكود على فعالية نهجنا. يعكس عملنا أهمية دمج إشارات الجودة في أنظمة استرجاع الكود، مما يمهد الطريق لأدوات تطوير برمجيات أكثر موثوقية ومتانة.