في عالم البرمجة المتطور، تبرز الحاجة لتقنيات قادرة على قياس أداء الكود بشكل دقيق وموحد. إن النماذج اللغوية التقليدية تواجه تحديات عدة نتيجة للطبيعة المفتوحة وغير المحدودة للغات البرمجة. لكن مع ظهور نموذج الانحدار اللغوي (Regression Language Model - RLM)، تبدو الآفاق أكثر إشراقًا.

تستند هذه الدراسة الحديثة، المنشورة في arXiv، إلى فكرة بناء نموذج موحد يمكنه توقع عدة مقاييس تنفيذية من النصوص البرمجية. من خلال الاعتماد على مُشفّر LLM ثابت، يتيح هذا النموذج القدرة على التنبؤ بعدة مؤشرات مثل، (i) استهلاك الذاكرة بلغات برمجة مثل بايثون (Python) وC++، (ii) زمن الانتظار لعمليات GPU باستخدام Triton، و(iii) دقة وسرعة الشبكات العصبية التي تُعبّر عنها بصيغة ONNX.

المثير في الأمر هو أنه بالرغم من حجم النموذج الذي يتضمن 300 مليون معلمة، استطاع RLM المبني على T5Gemma تحقيق نتائج ممتازة، حيث حصل على أكثر من 0.9 في تصنيف سبيرمان عند تقييمه على تقديمات البرمجة من قاعدة بيانات APPS.

ليس هذا فحسب، بل قدّم النموذج أداءً قويًا آخر بتحقيقه معدل سبيرمان يفوق 0.5 عبر 17 لغة مختلفة من مجموعة CodeNet. ورغم هيمنة الشبكات العصبية الرسومية على مجالات تصميم الشبكات، تمكن RLM من الحصول على أعلى معدل كيندال-تاو بلغ 0.46 على خمسة مجالات تصميم تقليدية، مع القدرة على توقع زمن الانتظار الهندسي عبر منصات الأجهزة المختلفة.

إن الابتكار الذي يقدمه نموذج RLM يمثل بالفعل خطوة كبيرة نحو تحسين تجربة المبرمجين والمطورين، مما يفتح أبوابًا جديدة للبحث والتطوير في هذا المجال.