في عصر الذكاء الاصطناعي، تُعد قدرة الوكلاء على تنفيذ المهام البرمجية وتعديل المستودعات أمرًا بالغ الأهمية. في هذا السياق، تم تقديم مفهوم عقود تفويض البرمجيات كمكون رئيسي لتحليل العمل المُفوض لوكلاء البرمجة. لكن ماذا عن تأثير هذه العقود على نتائج العمل؟

أجرت دراسة حديثة تجربة خاضعة للرقابة لاستكشاف تأثير العقود التفويضية على أعمال وكلاء البرمجة. تم تصميم بيئة اختبار تعتمد على واجهة برمجة التطبيقات (API) بلغة TypeScript، مزودة بعيوب مستهدفة وثغرات في الوثائق. تم إعداد عشرة مهام عبر خمس عائلات من المهام، وتم تنفيذ 64 عملية تشغيل للوكيل تحت ثلاث ظروف مختلفة: موجهات نمطية واقعية، وعقد تفويض صريح، وعقد يتطلب حزمة من الأدلة.

عند تقييم كل عملية تشغيل باستخدام اختبارات قبول مخفية، وعمليات فحص الطفرات، وتحليل النطاق، قام ثلاثة مراجعين مستقلين، اعتمدوا على نموذج محدد، بمراجعة 192 تقرير.

نتائج الدراسة كانت مثيرة: على الرغم من أن العقود التفويضية لم تُحسن نتائج المهام بشكل موضوعي، حيث تجاوز جميع الوكلاء الاختبارات المخفية دون انتهاكات في النطاق، إلا أنها ساهمت بشكل كبير في تحسين قابلية المراجعة. ارتفعت كفاءة الأدلة في 22 من 30 مقارنة زوجية، مع انخفاض في الغموض لدى المراجعين.

إجمالًا، تكلفت العقود التفويضية زيادة بنسبة 13% في الرموز الخاصة بالوكيل، و38% من الوقت المستغرق، مع تأثيرات أكبر على النماذج الأضعف. لذا، يبدو أن هذه العقود تؤدي إلى تحسين قابلية المراجعة بدلاً من تصحيح النتائج.

بالتالي، كيف ترى دور العقود التفويضية في تطوير أدوات الذكاء الاصطناعي بالمستقبل؟ شاركونا آرائكم في التعليقات.