مع تزايد الاعتماد على [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) ([AI](/tag/ai)) في مختلف المجالات، أصبح [تقييم](/tag/تقييم) قدرات [التفكير المنطقي](/tag/[التفكير](/tag/التفكير)-المنطقي) لهذه [النماذج](/tag/النماذج) ضرورة ملحة. وقد ظهرت برهنة [النظريات](/tag/النظريات) الرياضية الرسمية (Formal Theorem Proving) كأداة رئيسية تتيح إمكانية [التحقق الآلي](/tag/[التحقق](/tag/التحقق)-الآلي) من [صحة](/tag/صحة) الإثباتات الرياضية على نطاق واسع. لكن، قد يواجه الباحثون [تحديات](/tag/تحديات) تتعلق بنقص [البيانات](/tag/البيانات) المتاحة بسبب [تكاليف](/tag/تكاليف) [التنسيق](/tag/التنسيق) اليدوي المرتفعة ونقص المشكلات المثيرة للاهتمام.

هنا تأتي الفكرة المبتكرة: الاعتماد على [علم الكمبيوتر النظري](/tag/علم-الكمبيوتر-النظري) (Theoretical Computer Science) كمصدر شامل لمشكلات الإثبات الصارمة. من خلال التعريفات الخوارزمية، يمكن [توليد](/tag/توليد) العديد من أزواج [تحديات](/tag/تحديات) البرهنة بشكل آلي. في هذه الدراسة، تم تطبيق هذه المنهجية على منطقتين في [علم الكمبيوتر النظري](/tag/علم-الكمبيوتر-النظري): مشكلات Busy Beaver التي تتطلب إثبات حدود [سلوك](/tag/سلوك) توقف [آلات](/tag/آلات) تورنج، ومشكلات Mixed Boolean Arithmetic التي تجمع بين [التفكير المنطقي](/tag/[التفكير](/tag/التفكير)-المنطقي) والحسابي.

من خلال إطار عملنا، تم [توليد المشكلات](/tag/[توليد](/tag/توليد)-المشكلات) بشكل متوازي، حيث توفر [المواصفات](/tag/المواصفات) الرسمية (Lean4) وغير الرسمية (Markdown) مسارًا قابلاً للتوسع لإنشاء [تحديات](/tag/تحديات) إثبات موثوقة. وتظهر [التقييمات](/tag/التقييمات) التي تمت على [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) الرائدة نقصًا كبيرًا في [كفاءة](/tag/كفاءة) البرهنة الآلية: حيث حقق [نموذج](/tag/نموذج) DeepSeekProver-V2-671B نسبة [نجاح](/tag/نجاح) تصل إلى 57.5% في مشكلات Busy Beaver، لكنه حصل على 12% فقط في مشكلات Mixed Boolean Arithmetic.

تسلط هذه النتائج الضوء على [الصعوبة](/tag/الصعوبة) التي تواجهها [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) في [توليد](/tag/توليد) الإثباتات المطولة حتى في المشكلات القابلة للتحقق حسابيًا، مما يبرز [قيمة](/tag/قيمة) [علم الكمبيوتر النظري](/tag/علم-الكمبيوتر-النظري) في دفع [البحث](/tag/البحث) [نحو](/tag/نحو) المزيد من التقدم في [الأبحاث](/tag/الأبحاث) المتعلقة بالتفكير الآلي.