🔬 أبحاث2 دقائق للقراءة👁 0 مشاهدة

إطلاق إطار عمل مفتوح المصدر لتعزيز إثبات الفرضيات في بيئة صعبة!

أطلق الباحثون إطار عمل جديد تحت مسمى 'Discover And Prove' لدعم إجراءات إثبات الفرضيات بشكل ذاتي في بيئة صعبة، مما يكشف عن فجوة كبيرة في قدرات نماذج الذكاء الاصطناعي. هذا الإطار يعد تطوراً مهماً في مجال النظرية الرياضية.

في خطوة غير مسبوقة نحو تحسين قدرة نماذج الذكاء الاصطناعي في إثبات الفرضيات، أعلنت مجموعة من الباحثين عن إطلاق إطار عمل جديد مفتوح المصدر بعنوان "Discover And Prove" (DAP). يهدف هذا الإطار إلى تعزيز مستوى الدقة والفاعلية في إثبات الفرضيات في بيئة تُعرف باسم 'Hard Mode'.

تقليدياً، كانت معظم اختبارات إثبات الفرضيات تعتمد على ما يسمى 'Easy Mode' حيث يُدمج الجواب النهائي في البيان الرسمي. ومع ذلك، فإن هذا التصميم يُسهل المهمة، ويؤدي إلى تقديرات متفائلة عن قدرات النماذج. وفي المقابل، يُعتبر 'Hard Mode' بيئة أكثر واقعية تتطلب من النظام اكتشاف الجواب بشكل مستقل قبل الشروع في صياغة الإثبات الرسمي.

لتسهيل البحث في هذه البيئة الصعبة، قدم الباحثون مساهمتين رئيسيتين. الأولى هي إصدار نسخ جديدة من معايير قياس التحدي تُعرف باسم MiniF2F-Hard و FIMO-Hard، وهي إعادة توصيف لنسخ صعبة من اختبارات إثبات الفرضيات المستخدمة على نطاق واسع. والثانية تتعلق بإطلاق إطار عمل DAP، الذي يستخدم نماذج اللغات الضخمة (Large Language Models) في إجراء الاستدلال الطبيعي مع تفكير ذاتي واضح، ليتمكن من اكتشاف الإجابات.

يقوم نظام DAP بإعادة صياغة البيانات الصعبة إلى صيغة سهلة الاستخدام لمقدمي الإثباتات، مما سيساعد في تعزيز الفاعلية. وقد أظهرت النتائج حتى الآن تحسنات ملحوظة: في اختبار CombiBench، ارتفع عدد المشكلات التي تم حلها من 7 إلى 10. في حين أن نظام DAP هو الأول في إثبات 36 فرضية بشكل رسمي في بيئة 'Hard Mode'.

بجانب ذلك، يكشف النظام عن فجوة كبيرة بين أداء نماذج الذكاء الاصطناعي، حيث تتجاوز دقة الأجوبة 80% على المشكلات ذاتها التي تعاني فيها مقدمو الإثباتات من دقة أقل من 10%. يُظهر هذا الفرق أن اختبار 'Hard Mode' يُعد مقياسًا فريدًا لقياس التحديات التي تواجهها النماذج الحديثة.

مع هذه التطورات الحديثة، يفتح أمام الباحثين والمهتمين في مجال الذكاء الاصطناعي آفاقًا جديدة لاستكشاف قدرات نماذجهم. هل تعتقد أن الذكاء الاصطناعي سيشهد مزيدًا من التحسينات في الفرضيات الرياضية؟ شاركونا آرائكم!
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة