شهدت الآونة الأخيرة تقدمًا ملحوظًا في مجالات إثبات النظريات رسمياً (Formal Theorem Proving)، حيث أسهمت أساليب توليد الأدلة على نطاق واسع ودورات التدريب المدركة من قبل المحققين (Verifier-aware Training) بشكل كبير. ومع ذلك، فإن دمج إثبات النظريات باستخدام تقنيات الذكاء الاصطناعي (Agentic Proving) في تدريب المحققين نادرٌ جداً، حيث يظهر فقط في مرحلة الاستدلال.
نقدم لكم OProver، الإطار الشامل لإثبات النظريات رسمياً باستخدام Lean 4. هذا النظام الجديد يؤدي إلى مراجعة متكررة لمحاولات الإثبات الفاشلة من خلال استخدام الأدلة الموثقة بالتحقق وملاحظات المترجم من Lean. يعمل OProver من خلال مواصلة عملية التدريب الأولي ثم التدريب الإضافي المتكرر: كل دورة تندرج تحت إثبات نظري، وفهرسة الأدلة الموثقة حديثاً في OProofs وذاكرة الاسترجاع، واستخدام مسارات الإصلاح كبيانات نموذجية للتعلم بالإشراف (SFT)، بالإضافة إلى استخدام الحالات المعقدة التي لم يتم حلها في سياق التعلم المعزز (RL).
يشمل OProofs موارد Lean العامة، وتوليد أدلة على نطاق واسع، وآثار إثباتات العملاء، حيث يحتوي على 1.77 مليون بيان Lean، 6.86 مليون دليل موثق من قبل المترجم، ومسارات مؤشرة تتضمن السياقات المسترجعة، والمحاولات الفاشلة، والملاحظات، والإصلاحات.
عند تقييم OProver-32B عبر خمسة محاور، حصل على أفضل معدل نجاح (Pass@32) في MiniF2F (93.3%)، ProverBench (58.2%)، وPutnamBench (11.3%)، كما حصل على المركز الثاني في MathOlympiad (22.8%) وProofNet (33.2%) محققاً المزيد من الجوائز مقارنة بأي محقق بمؤشر مفتوح كامل سابق.
يسلط OProver الضوء على أهمية دمج تقنيات الذكاء الاصطناعي مع طرق إثبات النظريات التقليدية، مما يمثل خطوة جديدة نحو تطوير أدوات فعالة لدعم الباحثين والمهتمين بالتفكير الرياضي الضخم. ما رأيكم في هذا التطور؟ شاركونا في التعليقات!
OProver: الإطار الشامل لإثبات النظريات رسمياً باستخدام الذكاء الاصطناعي
OProver يمثل طفرة جديدة في مجال إثبات النظريات رسمياً، حيث يدمج تقنيات الذكاء الاصطناعي لتحسين عملية التدريب وإنتاج الأدلة. يوفر هذا الإطار المتقدم وسيلة فعالة لتعزيز الفعالية في حل المشكلات الرياضية المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
