يعد علم الذكاء الاصطناعي والتحول الذي يشهده حقل تطوير البرمجيات من أهم الاتجاهات في عصرنا الحديث. حيث ركزت بعض الأبحاث الأخيرة على مواءمة نماذج اللغات الضخمة (Large Language Models) لتحقيق نتائج أفضل في مهام البرمجة. تتعامل هذه الدراسة مع سؤالين جوهريين: كيف يمكن أن تدعم التقنيات المتاحة كلاً من المتطلبات الوظيفية وغير الوظيفية؟ وكيف يؤثر بدء عملية المواءمة من نموذج مدرب مسبقًا مقارنة بنموذج معدّل بحسب التعليمات؟

في هذه الدراسة، تمت معالجة خمسة نماذج لغات ضخمة باستخدام تقنيتين شائعتين في مواءمة النماذج: تحسين التفضيل المباشر (Direct Preference Optimization) ونموذج BoNBoN. تم إنشاء أزواج من التفضيلات من خلال استخدام خط أنابيب SelfCodeAlign، مما يتيح مواءمة فعّالة دون الحاجة لدرجات متعددة من المكافآت. شمل البحث تقييم كلا من المتطلبات الوظيفية - مثل إنتاج كود صحيح وقابل للتنفيذ - والمعايير غير الوظيفية، بما في ذلك قابلية قراءة الكود والأسلوب.

أشارت النتائج إلى أن المسارات المهيأة مسبقًا تحقق تحسينات أكبر في النسخة المهيأة مقارنةً بالنسخة المدربة مسبقًا. ومع ذلك، تظهر البيانات أن النسخة المدربة مسبقًا أقل دقة من النسخة المعدلة، بينما أظهرت النسخة المعدلة التي خضعت للمواءمة زيادة بسيطة في الأداء أو حتى تدهور في بعض الحالات.

إذاً، هل ينبغي للمطورين الاعتماد على النماذج المدربة مسبقًا أم على النسخ المعدلة بشكل خاص لتحقيق أقصى فوائد في إنتاج الأكواد؟ هذا البحث يقدم إجابات مهمة في هذا المجال المتطور.