في عالم الذكاء الاصطناعي وتقنية المبرهنات الرسمية، يأتي Pythagoras-Prover كابتكار يغير قواعد اللعبة. يعتمد هذا البرنامج على مجموعة مفتوحة المصدر من مبرهنات Lean، وهو مصمم خصيصًا ليتناسب مع الميزانيات الحاسوبية العملية.
أحد التحديات الكبرى التي يواجهها مطوروا المبرهنات الرسمية هو الحاجة إلى بيانات إثبات موثقة وموارد حسابية هائلة، ما يجعل كل من التدريب الدقيق (Supervised Fine-Tuning) واستخدام النماذج مكلفًا للغاية. لذا، قام فريق Pythagoras-Prover بتطوير أساليب جديدة تعزز الكفاءة وتقليل التكاليف.
يتضمن Pythagoras-Prover جيلين من نماذج المبرهنات: نماذج ذات 4 مليار و32 مليار من المعلمات، بالإضافة إلى نموذج جديد يعتمد على تقنية الانتشار (Diffusion) الذي يقوم بتحسين إثباتات Lean بشكل تكراري خلال مرحلة الاستدلال.
لتحقيق كفاءة التدريب، تم إعداد مجموعة متجانسة من المسائل المصنفة إلى سهلة ومتوسطة وصعبة لتعزيز التعلم التدريجي. وبهذه الطريقة، يتعلم البرنامج إثبات المهارات خطوة بخطوة، بدءًا من المسائل البسيطة وصولاً إلى المعقدة.
وخلال عملية التدريب، يُستخدم نظام تصفية ديناميكي حافظًا على أثر الإثباتات المفيد، مع ضمان بقاء كل حالة ضمن ميزانية سياق محددة لا تتجاوز 8000 توكين.
كما تم إدخال مفهوم Augmented Lean Formalisation (ALF)، الذي يوسع مجموعات البيانات المثبتة النادرة من خلال تحوير البيانات لتعزيز إشارات التدريب الإضافية، دون الحاجة إلى التحقق الرسمي من كل حالة محسنة.
على مستوى الأداء، تجاوز Pythagoras-Prover-4B مبرهن DeepSeek-Prover-V2-671B في اختبار MiniF2F بنسبة 86.1% مقابل 82.4% مع عدد معلمات أقل بحوالي 167 مرة. بينما سجل Pythagoras-Prover-32B أفضل أداء مفتوح المصدر بنسبة 93.0% في نفس الاختبار، مع تقديم حلول لـ 93 من أصل 672 مسألة في PutnamBench. أخيرًا، تم إصدار MiniF2F-ALF، وهو معيار حساس للتلوث يعكس قدرة النماذج على الحفاظ على الدقة تحت ظروف صعبة.
هذا التطور في تقنيات الإثباتات الرسمية يعد بفتح آفاق جديدة للبحث وتطبيقات الذكاء الاصطناعي، ويبشر بمستقبل مشرق للبرمجة وتحليلات البيانات. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
Pythagoras-Prover: ثورة جديدة في إثباتات المبرهنات باستخدام Lean!
يقدم Pythagoras-Prover أسلوبًا مبتكرًا لتحقيق إثباتات رسمية فعالة عبر تقنيات Lean المتقدمة، مما يتيح تحقيق أداء قوي مع ميزانية حسابية محدودة. بفضل نموذج التصفية الديناميكي والبيانات المحسّنة، يتجاوز هذا المبرهن المقاييس التقليدية بكثير.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
