في عصر تتنافس فيه التكنولوجيا لتطوير أدوات أكثر كفاءة، برزت الأنظمة الوكيلة كأحدث وأفضل الطرق لتحقيق إثبات النظريات في الرياضيات الرسمية. ولكن كيف يمكن استغلال هذه الأنظمة لتفعيل التحقق من البرامج؟
في دراسة جديدة، تم تقييم نظام Claude Code ضمن إطار عمل خاص بإثبات الوكيل، على مجموعة CLEVER، وهي معيار Lean 4 الذي يركز على توليد التعليمات البرمجية القابلة للتحقق. أظهرت النتائج أن Claude تمكن من إنتاج مواصفات صحيحة لما يقرب من 98.8% من القضايا المطروحة، حيث تم قبول 81.3% منها من قبل نظام تقييم CLEVER الذي يعتمد على التماثلية.
علاوة على ذلك، نجح النظام في التأكيد على صحة التنفيذ ضد مواصفات صحيحة بنسبة 87.5% وتمكن من تحقيق معدل نجاح يصل إلى 98.1% في عملية توليد البرامج والتحقق منها، من خلال افتراضات ذاتية التوافق.
تنقضي هذه النتائج لتبرز الفجوة المتزايدة بين صعوبة معايير التحقق الحالية والقدرات التي تمتلكها أدوات الإثبات الوكيل الحديثة، مما يستدعي الحاجة إلى طرق تقييم أكثر صرامة وقاومة للأخطاء. ونتيجة لذلك، تظهر هذه الدراسة دليلاً على أن أساليب التحقق من البرامج المعتمدة على تقنيات العوامل الوكيلة تعتبر الأكثر فعالية حتى الآن.
ما رأيكم في إنجازات هذه الأنظمة الجديدة؟ هل ترون أنها قادرة على تغيير مستقبل البرمجة والتكنولوجيا؟ شاركونا في التعليقات!
نظام إثبات وكيل: إنجازات غير مسبوقة في التحقق من برمجيات اللقاءات
يكشف النظام الجديد لإثبات الوكيل عن إمكانيات غير محدودة في التحقق من البرامج، حيث سجل Claude Code نتائج مدهشة في تأكيد صحة التعليمات البرمجية. إليكم ما حققه هذا النظام المتقدم!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
