تعتبر تقنيات ربط الواجهة الرسومية (GUI grounding) جزءًا حيويًا في نماذج رؤية اللغة (VLMs)، حيث يتطلب الأمر منها التعرف على عناصر صغيرة مستهدفة في لقطات الشاشة عالية الدقة والتنبؤ بالإحداثيات بدقة. إحدى الطرق الواعدة بعد التدريب والتي تهدف لتحسين هذه المهمة الدقيقة هي "التعليم الذاتي أثناء التشغيل" (On-policy self-distillation - OPSD). هذه الطريقة تقدم إشارات تدريس دقيقة على مستوى الرموز بدلاً من الاعتماد فقط على علامات الإحداثيات الصعبة.

ومع ذلك، تجد OPSD أنها غير ملائمة تمامًا لربط الواجهة الرسومية؛ فهي تقوم بتقييم المعلم بناءً على المقدمات التي ينتجها الطالب، مما قد يؤدي إلى تدهور جودة إشارات المعلم عندما تنحرف هذه المقدمات عن الإحداثيات المستهدفة، مما ينتج عنه إشارات تدريس غير موثوقة.

وللتغلب على هذه المشكلة، تم اقتراح طريقة جديدة تُعرف بـ "تحسين التعليم الذاتي مع مراعاة الجودة"، والتي تعزز جودة إشارات المعلم من خلال استخدام بوابة للأخطاء الصحيحة وتعديل احتمال المعلم. تعمل بوابة الأخطاء على التحقق مما إذا كانت توقعات المعلم الحالية يمكن استكمالها في الصندوق الحقيقي عند استخدام المقدمة المنتجة من الطالب. إذا لم يكن الأمر كذلك، فإن الإشارة المقابلة تُخفض أهميتها.

بينما يستخدم تعديل احتمال المعلم ثقة المعلم كعوامل خفيفة لتعديل قوة الإشراف. أظهرت التجارب أن هناك تحسين دائم في النموذج الأساسي مقارنة بالأساليب التقليدية القوية، مما يوضح حركة متكاملة بين الآليتين:
- تعمل بوابة الأخطاء على كبح إشراف الرموز غير الموثوقة.
- بينما يقوم تعديل احتمال المعلم بمعايرة قوة الإشارات المتبقية.

توجهت التجارب على ستة معايير مختلفة لربط الواجهة الرسومية لاختبار فعالية هذه الطريقة، وأكدت النتائج أنها تساهم بوضوح في تحسين الأداء العام للنموذج.