شهدت الآونة الأخيرة تقدمًا ملحوظًا في مجالات إثبات [النظريات](/tag/النظريات) رسمياً (Formal Theorem Proving)، حيث أسهمت [أساليب](/tag/أساليب) [توليد](/tag/توليد) [الأدلة](/tag/الأدلة) على نطاق واسع ودورات [التدريب](/tag/التدريب) المدركة من قبل المحققين (Verifier-aware Training) بشكل كبير. ومع ذلك، فإن دمج إثبات [النظريات](/tag/النظريات) باستخدام [تقنيات الذكاء الاصطناعي](/tag/[تقنيات](/tag/تقنيات)-الذكاء-الاصطناعي) (Agentic Proving) في [تدريب](/tag/تدريب) المحققين نادرٌ جداً، حيث يظهر فقط في مرحلة [الاستدلال](/tag/الاستدلال).
نقدم لكم OProver، الإطار الشامل لإثبات [النظريات](/tag/النظريات) رسمياً باستخدام [Lean 4](/tag/lean-4). هذا النظام الجديد يؤدي إلى مراجعة متكررة لمحاولات الإثبات الفاشلة من خلال استخدام [الأدلة](/tag/الأدلة) الموثقة بالتحقق وملاحظات المترجم من Lean. يعمل [OProver](/tag/oprover) من خلال مواصلة عملية [التدريب](/tag/التدريب) الأولي ثم [التدريب](/tag/التدريب) الإضافي المتكرر: كل دورة تندرج تحت إثبات نظري، وفهرسة [الأدلة](/tag/الأدلة) الموثقة حديثاً في OProofs وذاكرة الاسترجاع، واستخدام مسارات [الإصلاح](/tag/الإصلاح) كبيانات نموذجية للتعلم بالإشراف ([SFT](/tag/sft))، بالإضافة إلى استخدام الحالات المعقدة التي لم يتم حلها في سياق [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) (RL).
يشمل OProofs موارد Lean العامة، وتوليد أدلة على نطاق واسع، وآثار [إثباتات](/tag/إثباتات) العملاء، حيث يحتوي على 1.77 مليون بيان Lean، 6.86 مليون دليل موثق من قبل المترجم، ومسارات مؤشرة تتضمن السياقات المسترجعة، والمحاولات الفاشلة، والملاحظات، والإصلاحات.
عند [تقييم](/tag/تقييم) [OProver](/tag/oprover)-32B [عبر](/tag/عبر) خمسة محاور، حصل على أفضل معدل [نجاح](/tag/نجاح) (Pass@32) في MiniF2F (93.3%)، ProverBench (58.2%)، وPutnamBench (11.3%)، كما حصل على المركز الثاني في MathOlympiad (22.8%) وProofNet (33.2%) محققاً المزيد من الجوائز مقارنة بأي محقق بمؤشر مفتوح كامل سابق.
يسلط [OProver](/tag/oprover) الضوء على أهمية دمج [تقنيات الذكاء الاصطناعي](/tag/[تقنيات](/tag/تقنيات)-الذكاء-الاصطناعي) مع طرق إثبات [النظريات](/tag/النظريات) التقليدية، مما يمثل خطوة جديدة [نحو](/tag/نحو) [تطوير](/tag/تطوير) [أدوات](/tag/أدوات) فعالة لدعم [الباحثين](/tag/الباحثين) والمهتمين بالتفكير الرياضي الضخم. ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات)!
OProver: الإطار الشامل لإثبات النظريات رسمياً باستخدام الذكاء الاصطناعي
OProver يمثل طفرة جديدة في مجال إثبات النظريات رسمياً، حيث يدمج تقنيات الذكاء الاصطناعي لتحسين عملية التدريب وإنتاج الأدلة. يوفر هذا الإطار المتقدم وسيلة فعالة لتعزيز الفعالية في حل المشكلات الرياضية المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
