أصبحت وكالات الذكاء الاصطناعي تتفوق بشكل متزايد في مجالات توليد واختبار وصقل الأكواد. إلا أن هذه الوكالات تقف عند عائق عدم قدرتها على ضمان تغطية كاملة للجوانب التي تتطلب تأكيدات رسمية لا يمكن للاختبار وحده توفيرها. تُعد الأنظمة الموزعة مثالاً واضحًا على هذا التحدي، حيث يجب أن تظل الخصائص مثل الاتساق بين القراءة والكتابة صحيحة تحت كل تداخل ممكن للأحداث.

توفر عملية التحقق الرسمي الميكانيكية ضمانات للدقة المطلوبة، لكنها غالباً ما تتطلب جهداً خبيرًا يمتد لشهور إلى سنوات. ولإثبات ذلك، نجد أن أفضل الوكالات مثل Codex مع GPT-5.4 وClaude Code مع Opus 4.6 لم تحقق سوى النجاح في 2 من أصل 7 مواصفات لمخازن القيم الموزعة.

في ورقتنا هذه، نقدم نهجًا مبتكرًا لحل هذه الفجوة وهو التركيب الاستقرائي والاستنتاجي (Inductive Deductive Synthesis)، الذي يقوم بتوليف التنفيذ والدليل بشكل مشترك وتدريجي. يعتمد هذا النظام على التعلم من المحاولات الفاشلة لاختبار استراتيجيات واعدة بشكل منهجي. وكجزء من نهجنا، تم تصميم IDS كمنظومة لغويّة ذات طابع وكيل، حيث استطاعت تحقيق النجاح في جميع المواصفات السبع خلال حوالي 6.8 ساعات بتكلفة متوسطة تبلغ 106 دولارات فقط لكل مواصفة، مما يجعلها أسرع بحوالي 200 مرة من الجهود التقليدية وأرخص بنسبة 17% مقارنة بالوكالات الأخرى.

كما يدمج IDS أيضًا ملاحظات الأداء في نفس الحلقة، مما ينتج عنه تنفيذات أسرع حتى 3 مرات من الأنظمة الموثقة المنشورة سابقًا. هذه التطورات تمثل قفزة نوعية في كيفية تعامل الذكاء الاصطناعي مع تحديات البرمجة الدقيقة، مما يفتح آفاقاً جديدة نحو أنظمة ذات موثوقية عالية.