في عالم الرياضيات والذكاء الاصطناعي، يظل سؤال مثير للجدل مطروحًا: هل يمكن للأنظمة الذكية إنتاج إثباتات أصلية غير تافهة لمشكلات بحثية مفتوحة؟ رغم الأداء القوي لنماذج اللغات الضخمة (Large Language Models) في معايير الاختبار، لا يزال إنتاج إثباتات جديدة يشكل تحديًا كبيرًا.

في دراسة مثيرة، أجرينا تجارب منهجية مع نماذج اللغات المتطورة على مهام الإثبات البحثية، وتمكنا من تحديد سبع مشكلات رئيسية تعيق التوليد الموثوق للإثباتات. تتنوع هذه المشكلات بين تلوث السياق (Context Contamination) وتوهم الاقتباسات (Citation Hallucination) إلى عدم التركيز أثناء التحقق (Unfocused Verification) وتعديلات على المشكلة نفسها.

تتعامل هذه الصعوبات مع فجوة التصميم النظامي، وهو ما دفعنا لتطوير نظام QED، وهو نظام مفتوح المصدر يعتمد على نهج متعدد الوكلاء لإنتاج الإثباتات. يركز كل قرار معماري في هذا النظام على معالجة مشكلة معينة من المشكلات السبع.

عند تقييم QED على خمس مشكلات مفتوحة في التحليل التطبيقي والمعادلات التفاضلية الجزئية (PDEs)، تمكنا من الحصول على إثباتات صحيحة لثلاث من هذه المشكلات، وقد أكدها الخبراء كمبتكرة وغير تافهة.

نظام QED متاح الآن كمصدر مفتوح ويمكن للمهتمين الاطلاع عليه أو المساهمة في تطويره عبر الرابط: [https://github.com/proofQED/QED].

هل تعتقد أن الذكاء الاصطناعي يمكن أن يحدث ثورة في عالم الرياضيات؟ شاركونا آراءكم في التعليقات!