في خطوة مبتكرة نحو تطوير أدوات الذكاء الاصطناعي، قامت دراسات حديثة باستكشاف كيفية تحسين نماذج اللغة الصغيرة (Small Language Models) التي تحتوي على ما يصل إلى 4 مليار معلمة، لتوليد تطبيقات بلغة معينة تتعلق بـ Kubernetes. يتمحور البحث حول تقنية جديدة تُعرف باسم التغذية الراجعة البيانية (Context-Instrumental Data Distillation)، والتي تعتمد على توليد بيانات صناعية ومن ثم استخدام التعليمات العكسية من ملفات YAML الحقيقية المختصة بـ Kubernetes.

تتضمن هذه الطريقة تشكيل مجموعة المصادر من خلال توليد بيانات اصطناعية، ومع وجود نظام لخدمات التحقق الخارجي لضمان توافق البيانات مع نموذج السياق المطلوب.
لا تعتمد هذه الطريقة على طريقة تقطير المعرفة التقليدية، بل تركز أكثر على ضبط عينة التدريب عبر أمثلة موثقة تمثل السياق المطلوب بدقة.

في الجزء التجريبي، تم تنفيذ مشروع تجريبي مع موارد محدودة، حيث استخدمت واجهة برمجة التطبيقات DeepSeek-V4 Flash كمدرس للتوليد الاصطناعي، بينما جرى تحسين النموذج Qwen2.5-Coder-1.5B-Instruct من خلال تقنية LoRA على وحدة المعالجة المركزية.
أظهرت النتائج التجريبية التي استُخدمت على مجموعة بيانات K8s-Distill-Pilot (تدريب_1200، تحقق_100، اختبار_200) نسبة نجاح 91.5%، كانت أكثر اعتمادًا على شروط التنسيق الصارمة للمخرجات بدلاً من زيادة عدد أمثلة التدريب. هذه النتائج تعكس أهمية تحسين الجودة في التوليد الآلي للملفات في ظل انعدام الموارد الكافية لإجراء تجارب موسعة.