في عالم الذكاء الاصطناعي، يواجه العديد من المطورين تحديات متعلقة بتحسين أداء نماذجهم، خاصة عند العمل مع نماذج صغيرة واقتصادية مثل Gemini 3.1 Flash Lite. هنا يأتي دور أسلوب جديد يُطلق عليه SKETCHVERIFY، الذي يُعد بمثابة سياسة تعتمد على تكلفة وأداء النموذج، وليس مجرد وسيلة لتحسين الدقة.

تعتمد تقنية SKETCHVERIFY على فكرة تقسيم فضاء البحث بحيث يقوم النموذج اللغوي الكبير (Large Language Model) بإنشاء K استراتيجيات خوارزمية متميزة، ويرسم مخطط برنامج لكل منها. يتضمن كل مخطط ثغرات تُملأ عدة مرات، مما يؤدي إلى إنتاج مجموعة من المرشحين المتنوعين هيكليًا، يتم التحقق منهم من خلال التنفيذ وإجراء اختيار يقوم على تجميع بصمات الأداء.

تشير البيانات المستخلصة من اختبار HumanEval+ إلى أن الأسلوب الجديد يتفوق على أساليب العينة السطحية في نفس الفئة، حيث استطاع مخطط Lite Sketch استعادة 79% من الحالات مقارنةً بـ53% فقط للعينة السطحية على 100 مرشح. كما بينت النتائج أهمية الاستفادة من التخطيط في حالة وجود ميزانية محدودة، حيث أن الخيارات التقليدية لم تُظهر تحسنًا ملحوظًا حتى مع زيادة الميزانية بشكل كبير.

ختامًا، يُظهر الأسلوب أن استخدام التخطيط البرمجي يمكن أن يكون الحل الفعال لتحسين أداء نماذج الذكاء الاصطناعي، خاصةً عندما تكون الموارد محدودة.