في عالم الذكاء الاصطناعي، أصبحت نماذج اللغات الضخمة (Large Language Models) جزءاً أساسياً من توليد البرهانات الرسمية. ومع ذلك، غالبًا ما تبقى نتائج هذه النماذج أقل قابلية للقراءة والتنظيم مقارنةً بالبرهانات الموجودة في مكتبات الرياضيات الرسمية العريقة. لماذا يحدث هذا؟

هناك مشكلة أصلية تتمثل في هدف التركيب المبكر المدمج في معظم خطوط إنتاج توليد البرهان. هذا الهدف يشجع على إنشاء برهانات أحادية أو وقائية بدلاً من تطوير عناصر ذات جودة مكتبية. كما أن الأساليب الحالية لتحسين جودة البرهان تعتمد غالبًا على أهداف تحسين صريحة وقابلة للحساب، ولكن وفقًا للدراسات، فإن الأهداف الأكثر قابلية للتطبيق والتي تم التحقق منها تجريبياً هي غالبًا ما تكون مرتبطة بالطول، بينما الجوانب الأهم مثل قابلية القراءة والتنظيم والصيانة تجد صعوبة في قياسها باستخدام مقاييس آلية موثوقة.

لذلك بدلاً من تحسين جودة البرهان استناداً إلى مقياس وحيد، نقدم نموذجًا جديدًا يسمى Proof-Refactor، يعتمد على منهج مستوحى من أساليب البشر في إعادة صياغة البرهان. هذا النموذج يقوم بتفكيك عملية إعادة صياغة البرهان إلى أربع مراحل:
1. استخراج أجزاء برهان مرشحة.
2. تصميم إعلانات مساعدة.
3. إثبات الأجزاء المستخرجة والمصممة رسميًا.
4. إصلاح البرهان الأصلي باستخدام الأجزاء التي تم التحقق منها.

أظهرت النتائج على برهانات Lean المُولَّدة من PutnamBench وPutnam2025 أن Proof-Refactor قد حسَّن من درجات إعادة الصياغة المعتمدة على المعايير بشكل ملحوظ مقارنةً بأسلوب Claude Code القوي. كانت أكبر المكاسب في جودة التوقيع وقابلية القراءة من قبل البشر. هذه النتائج تشير إلى أن إعادة الصياغة المستندة إلى العمليات يمكن أن تحسن هيكل البرهان دون اعتبار طول البرهان كهدف رئيسي.

في ختام هذا الاستثمار العلمي، يرتسم أمامنا افق جديد لتحسين عمليات البرهان ومنحها الصفات التي تميز البرهانات الأرقى من حيث التنظيم والجودة. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.