في عالم التكنولوجيا، تعتبر دقة التحكم في شكل الدوائر الكهربائية أمرًا جوهريًا للاختبارات في مجال أشباه الموصلات. ومع ذلك، يبقى الحصول على بيانات تدريب واقعية كافٍ مهمة مكلفة. على الرغم من أن النماذج التوليدية مثل نماذج الانتشار (Diffusion Models) والشبكات التنافسية التوليدية (Generative Adversarial Networks - GANs) يمكن أن تعزز من بيانات التدريب، إلا أنها لا تضمن الدقة المطلوبة على المستوى النانومتري لمهام القياس. لذا، نقدم إطار عمل جديد في برمجة البرامج البصرية حيث يقوم نموذج اللغة والرؤية (Vision-Language Model - VLM) بتحويل صور الفحص إلى شيفرة بلغة محددة للنطاق (Domain-Specific Language - DSL) تصف هندسة الدوائر، مما يمكّن من توليد بيانات تدريب مضبوطة مع القدرة على تعديل المعلمات بدقة.

ومع أن النموذج يتم تدريبه فقط على بيانات مرسومة بصورة صناعية، يظهر فجوة في الأداء عند معالجة الصور الحقيقية الملتقطة بواسطة المجهر الإلكتروني الماسح (Scanning Electron Microscope - SEM). ولتجاوز هذه الفجوة، نطبق استراتيجية التشفير المدخلاتي التي تزيل القوام والضوضاء الخاصة بأشعة SEM، مما يسمح للنموذج بالتركيز على الهيكل الهندسي.

وفقًا لبيانات مجموعة MIIC، أدت المدخلات المشفرة إلى تحسين معامل Dice من 0.4393 إلى 0.5256 مقارنة بالمدخلات الخام، مما يثبت أن تجريد القوام البسيط يقلل بشكل كبير من الفجوة بين المحاكاة والواقع. هذه النتائج ليست فقط خطوة مهمة نحو تحسين تقنيات فحص أشباه الموصلات، بل تفتح أيضًا آفاقًا جديدة للتطبيقات المستقبلية في مجالات متعددة.