مع ارتفاع قدرات نماذج اللغات الضخمة (Large Language Models)، تبرز ضرورة ضمان أن تكون مخرجاتها قابلة للتحقق من قِبل أنظمة أقل قدرة. تُستخدم ألعاب المبرهن-المدقق (Prover-Verifier Games) كشكل من أشكال تحسين قابلية التحقق من مخرجات النماذج، ولكن المشكلة تكمن في انخفاض الدقة مقارنةً مع الأساليب التقليدية التي تركز على تعظيم الدقة فقط، وهو ما يعرف بـ'ضريبة القابلية للقراءة'.

للتغلب على هذه العقبة، تم اقتراح نهج مبتكر من خلال فصل مفهوم الدقة عن شرط القابلية للتحقق، بإنشاء نموذج 'مترجم' (Translator Model) يقوم بتحويل حلول نموذج معين إلى شكل قابل للتحقق. يتيح لنا هذا الأسلوب أولاً تدريب النموذج الأساسي لتعظيم الدقة، ثم تدريب المترجم لتحويل إجابة النموذج إلى صيغة يمكن التحقق منها، مع الحفاظ على الإجابة الأصلية.

لتلبية هذا الهدف الجديد، تم تصميم لعبة مبرهن-مدقق مفصولة (Decoupled Prover-Verifier Game - DPVG)، حيث تتوافق نقاط التوازن مع مترجمين موثوقين ويمكن التحقق منهم. هذا الابتكار يعد خطوة كبيرة نحو تعزيز موثوقية النماذج الذكية وضمان شفافية مخرجاتها، مما يزيد من الثقة بها على المديين القصير والطويل.