في عالم تطوير البرمجيات، يُعتبر كتابة الرسائل البرمجية بطريقة منظمة من الأمور الحيوية، حيث يُساهم ذلك في تحسين القراءة وصيانة البرمجيات. في صياغة جديدة لهذا المفهوم، تم مؤخرًا تسليط الضوء على استخدام نماذج اللغات الضخمة (Large Language Models) في تصنيف الرسائل البرمجية التقليدية دون الحاجة إلى التدريب المسبق.

تتطلب الطرق التقليدية لتصنيف الرسائل البرمجية عادةً نماذج تعتمد على التعلم الآلي أو التعلم العميق، وتحتاج إلى مجموعات بيانات كبيرة محددة مسبقًا. ولكن، قام الباحثون في دراسة جديدة باستكشاف خيار بديل يعتمد على نماذج اللغات الضخمة (LLMs) من خلال أساليب تسمى هندسة النصوص (Prompt Engineering).

يتضمن البحث تجربة ثلاث استراتيجيات للتوجيه، هي: تعليمات بدون أية أمثلة (Zero-shot)، تعليمات مع أمثلة قليلة (Few-shot)، وسلسلَة من الأفكار (Chain-of-thought). وقد تم تطبيق هذه الاستراتيجيات على ثلاثة نماذج ذات أحجام مختلفة: Mistral-7B-Instruct وLLaMA-3-8B وDeepSeek-R1-32B.

تم تنفيذ عملية التصنيف مباشرةً على الفروقات البرمجية (Code Diffs) المأخوذة من مجموعة بيانات متوازنة تضم 3200 رسالة برمجية تم استخراجها من مستودع InfluxDB، دون أي تعديلات على النماذج. أظهرت النتائج أن الاستراتيجية المتعلقة بتعليمات قليلة الأمثلة (Few-shot) حققت أعلى دقة بشكل متسق، في حين لم تقدم سلسلة الأفكار (Chain-of-thought) تحسينات إضافية. من بين النماذج المُختبرة، حقق DeepSeek-R1-32B أداءً ممتازًا، مما يدل على أن حجم النموذج له دورٌ مهم في تصنيف الرسائل البرمجية التقليدية.

توفر هذه النتائج توجيهات عملية للباحثين والممارسين الذين يسعون لأتمتة تصنيف الرسائل البرمجية دون الحاجة للتكاليف المرتبطة بإنشاء وصيانة بيانات تدريب مرخصة. ما رأيكم في هذه التطورات المثيرة في عالم البرمجة؟ شاركونا في التعليقات!