في عصر الذكاء الاصطناعي، أصبحت نماذج البرمجيات (Code LLMs) واحدة من الأدوات الأساسية في تطوير البرامج. لكن ماذا يحدث عندما تقوم هذه النماذج بمراجعة شفراتها الخاصة دون تدخل بشري كافٍ؟

تشير الأبحاث إلى أن التدريب الذاتي المتكرر (Recursive Self-Training) يمكن أن يتسبب في تدهور أداء النماذج التوليدية العصبية، خاصة إذا تمت إعادة استخدام الشفرات التي تم إنشاؤها بواسطة الذكاء الاصطناعي دون وجود بيانات بشرية جديدة أو مراقبة خارجية للجودة. هذا الأمر يمثل خطرًا حقيقيًا عند استخدام نماذج البرمجيات في بيئات الإنتاج حيث يمكن أن تدخل الشفرات المولدة إلى مستودعات حقيقية، وتصبح تدريجيًا بيانات تدريبية، مما يؤسس حلقة تدريب ذاتية على مستوى المستودع.

تميل عمليات تطوير البرمجيات التقليدية إلى إيقاف هذه الحلقة عبر مراجعات الطلبات، والاختبارات، والتجميع، والموافقة البشرية. لكن مع تقدم أدوات البرمجة المدعومة بالذكاء الاصطناعي، أصبح إنتاج الشفرات أسرع من قدرة البشر على مراجعتها، مما يجعل مراجعة الشفرة نفسها تتزايد أوتوماتيكيًا بواسطة أنظمة الذكاء الاصطناعي.

أجرينا مقارنة بين ثلاثة أنظمة للتعديل الدقيق المتكرر:
1. **عدم المراجعة**: الأكثر تفككًا.
2. **مراجعة بشرية**: باستخدام عوامل تصفية غير مرتبطة بالنموذج مثل التجميع والتحقق من الجودة.
3. **مراجعة ذاتية بواسطة الذكاء الاصطناعي**: باستخدام إشارات نموذج البرمجيات مثل الغموض (perplexity) والتقييم الذاتي الثنائي.

النتائج توضح أن عدم وجود مراجعة هو الأسوأ، بينما عوامل تصفية المراجعة البشرية قد تؤخر الانهيار لكنها لا توقفه. وفي المقابل، يمكن أن تبدو عوامل تصفية المراجعة الذاتية للذكاء الاصطناعي قوية في البداية، لكنها تفقد تأثيرها مع الوقت. الفهم الدقيق لهذه العملية يمكن أن يساهم في إيجاد استراتيجيات فعالة لضمان استقرار تدريب نماذج البرمجيات.

باختصار، يتطلب التدريب المستقر لنماذج البرمجيات الاعتراف بأهمية التحقق الخارجي بدلاً من الاعتماد فقط على المراجعة الذاتية للنموذج.