شهدت الآونة الأخيرة تقدمًا ملحوظًا في مجالات إثبات [النظريات](/tag/النظريات) رسمياً (Formal Theorem Proving)، حيث أسهمت [أساليب](/tag/أساليب) [توليد](/tag/توليد) [الأدلة](/tag/الأدلة) على نطاق واسع ودورات [التدريب](/tag/التدريب) المدركة من قبل المحققين (Verifier-aware Training) بشكل كبير. ومع ذلك، فإن دمج إثبات [النظريات](/tag/النظريات) باستخدام [تقنيات الذكاء الاصطناعي](/tag/[تقنيات](/tag/تقنيات)-الذكاء-الاصطناعي) (Agentic Proving) في [تدريب](/tag/تدريب) المحققين نادرٌ جداً، حيث يظهر فقط في مرحلة [الاستدلال](/tag/الاستدلال).

نقدم لكم OProver، الإطار الشامل لإثبات [النظريات](/tag/النظريات) رسمياً باستخدام [Lean 4](/tag/lean-4). هذا النظام الجديد يؤدي إلى مراجعة متكررة لمحاولات الإثبات الفاشلة من خلال استخدام [الأدلة](/tag/الأدلة) الموثقة بالتحقق وملاحظات المترجم من Lean. يعمل [OProver](/tag/oprover) من خلال مواصلة عملية [التدريب](/tag/التدريب) الأولي ثم [التدريب](/tag/التدريب) الإضافي المتكرر: كل دورة تندرج تحت إثبات نظري، وفهرسة [الأدلة](/tag/الأدلة) الموثقة حديثاً في OProofs وذاكرة الاسترجاع، واستخدام مسارات [الإصلاح](/tag/الإصلاح) كبيانات نموذجية للتعلم بالإشراف ([SFT](/tag/sft))، بالإضافة إلى استخدام الحالات المعقدة التي لم يتم حلها في سياق [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) (RL).

يشمل OProofs موارد Lean العامة، وتوليد أدلة على نطاق واسع، وآثار [إثباتات](/tag/إثباتات) العملاء، حيث يحتوي على 1.77 مليون بيان Lean، 6.86 مليون دليل موثق من قبل المترجم، ومسارات مؤشرة تتضمن السياقات المسترجعة، والمحاولات الفاشلة، والملاحظات، والإصلاحات.

عند [تقييم](/tag/تقييم) [OProver](/tag/oprover)-32B [عبر](/tag/عبر) خمسة محاور، حصل على أفضل معدل [نجاح](/tag/نجاح) (Pass@32) في MiniF2F (93.3%)، ProverBench (58.2%)، وPutnamBench (11.3%)، كما حصل على المركز الثاني في MathOlympiad (22.8%) وProofNet (33.2%) محققاً المزيد من الجوائز مقارنة بأي محقق بمؤشر مفتوح كامل سابق.

يسلط [OProver](/tag/oprover) الضوء على أهمية دمج [تقنيات الذكاء الاصطناعي](/tag/[تقنيات](/tag/تقنيات)-الذكاء-الاصطناعي) مع طرق إثبات [النظريات](/tag/النظريات) التقليدية، مما يمثل خطوة جديدة [نحو](/tag/نحو) [تطوير](/tag/تطوير) [أدوات](/tag/أدوات) فعالة لدعم [الباحثين](/tag/الباحثين) والمهتمين بالتفكير الرياضي الضخم. ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات)!