مع تزايد استخدام نماذج اللغات الضخمة (Large Language Models) في عمليات التفكير الرياضي، أصبح من الضروري التأكد من صحة النتائج باستخدام أدوات إثبات رسمية مثل Lean. هذا يتيح التحقق الدقيق من outputs لأغراض عملية، مثل اختيار الإجابات المناسبة في أوقات الاختبار، حيث يتم التعامل مع K إجابة مرشحة.

ولكن لماذا يعد هذا الأمر معقدًا؟ يتطلب الأمر أولاً تحويل النتائج من اللغة الطبيعية إلى صيغ رسمية، وهو ما يكلف موارد هائلة.

هنا تأتي تقنية BASE، وهي عملية تعتمد على تحديد مرشح أساسي وحيد لكل مشكلة، وتشتق بقية الإجابات (K-1) عن طريق تعديل الصيغة الأساسية. هذه الطريقة تعتمد على نموذج يسمى LEANSCRIBE الذي يعمل على تحديد الإجابة في الصياغة الأساسية ويولد دالة تعديل قابلة لإعادة الاستخدام لبقية المرشحين.

من خلال هذه الطريقة، يتم تعزيز دقة الاختيار وتقليل تكاليف التحويل الرسمي، مما يمثل تحسينًا كبيرًا في الأداء عبر 12 إعداداً مختلفاً (مجموعة بيانات، موحل) و4 معايير و3 موحلات، مما يؤدي إلى تقليل استدعاءات التحويل الرسمي بنسبة 5 مرات عندما يكون K = 8، ومن المتوقع أن يتسع هذا الخفض كلما زادت قيمة K.

لمزيد من التفاصيل التقنية، يمكنكم زيارة الرابط التالي: [رابط_المقال]