في عالم الذكاء الاصطناعي، برزت نماذج اللغات الضخمة (Large Language Models) كأحد أهم الابتكارات. ومع ذلك، فإن قدراتها في معالجة الرياضيات الرسمية كانت تعاني من بعض التحديات. هنا يأتي دور LEAP، الإطار الابتكاري الذي يعدل تلك النماذج لتحقيق مستوى غير مسبوق من الأداء في إثبات النظريات الرياضية.
تظهر الأبحاث أن نماذج اللغات الضخمة تُظهر قدرة قوية على التفكير الرياضي غير الرسمي، لكنها تواجه صعوبات عند محاولة توليد أدلة يمكن التحقق منها بشكل ميكانيكي باستخدام لغات رسمية مثل Lean. لكن LEAP يتجاوز هذه العقبات باستخدام إطار عمل يعتمد على نموذج عام يحقق أداءً يفوق التوقعات.
يستفيد LEAP من ميزات نماذج الأساس مثل القدرة على التفكير غير الرسمي، اتباع التعليمات، والتنقيح الذاتي. من خلال تحليل المشكلات المعقدة إلى وحدات أصغر، يرتبط النظام ببناء الأدلة الرسمية مع الخطط غير الرسمية، ويدعم ذلك التفاعل المستمر مع مترجم Lean.
لضمان تقييم دقيق يتجاوز المقاييس التقليدية، قدمنا معيار Lean-IMO-Bench، الذي يحتوي على مشاكل بأسلوب IMO موثقة بلغة Lean، تتميز ببيانات قصيرة لكنها تشمل أدلة متعددة الخطوات وصعبة عبر مجموعة متنوعة من مستويات الصعوبة.
على الرغم من التحديات، حقق LEAP إنجازات ملحوظة في مسابقة Putnam 2025، حيث تمكن من حل جميع المسائل الـ 12، متفوقًا على النماذج الرياضية الرسمية الرائدة. كما زاد LEAP معدل إنجاز الحلول الرسمية من أقل من 10% إلى 70%، متجاوزاً بشكل ملحوظ معيار 48% المحدد من قبل نظام IMO المتخصص.
وإضافةً إلى ذلك، أثبت LEAP قدرته في الأبحاث من خلال صياغة أدلة معقدة للتحديات التوافقيات المفتوحة، متضمناً إثباتاً موثقاً لمشكلة فرعية أساسية في تقسيم هاملتوني لنماذج كالي.
يبدو أن LEAP يعد بمستقبل واعد في مجال الرياضيات والأبحاث التكنولوجية، لكنه يثير الآن تساؤلات: ماذا يمكن أن يعني هذا التطور بالنسبة لمستقبل الذكاء الاصطناعي؟
LEAP: تعزيز نماذج اللغات الضخمة لإثبات الرياضيات بشكل رسمي بإطارات عمل مبتكرة!
تعرفوا على LEAP، الإطار الذي يعزز نماذج اللغات الضخمة (LLMs) لتحقيق أداء مذهل في إثبات النظريات الرياضية. يحقق LEAP قفزات نوعية في دقة الحلول الرياضية الرسمية من خلال تفاعله المستمر مع مترجم Lean.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
