في عصر الذكاء الاصطناعي، أصبحت الوكلاء المستقلين قادرين على اتخاذ إجراءات غير قابلة للتراجع ضمن الأنظمة التشغيلية، لكن تبقى مشكلة تحديد المخاطر الناجمة عن تلك الإجراءات وتقييمها وتحويلها إلى عواقب مادية غير واضحة. في هذا السياق، غالبًا ما يتجاهل مقدمو الخدمة الأضرار الناتجة، مما يترك المستخدمين دون تعويض عن خسائرهم، بينما تحدّ المراجعة البشرية من تحسين الكفاءة.

تسعى هذه الدراسة الجديدة للإجابة على سؤال مهم: متى يصبح نشر الذكاء الاصطناعي المستقل مقبولًا اقتصاديًا رغم مخاطر الفشل؟ وتقدم الإجابة من خلال قياس المخاطر على مستوى حلقة العميل - المهمة - الأثر (customer-task-trace episode) وتوفير التأمين المناسب.

يصبح من المقبول استخدام الأتمتة عندما تتجاوز الفوائد المتوقعة تكاليف التأمين، تكاليف التحكم والمخاطر المتبقية. لضمان ذلك، يتعين تحديد دور مع أذونات محدودة ومستويات مقارنة واضحة.

تقدم الدراسة مفهوم التأمين الاقتصادي القائم على الأثر (trace-economic underwriting)، الذي يقوم بربط آثار استخدام الأدوات بالتعرض للخسائر القابلة للمطالبة، ثم يستخدم هذه التمثيل لتحديد الأسعار، وعملية التحكم، ونقل المخاطر. وتعتمد هذه الطريقة على تسميات اقتصادية محددة بدلاً من حكم نموذج لغة كبير (LLM).

في اختبارات التأمين القائم على الأثر، تم تقليل متوسط الخطأ في الأسعار من 17,700 دولار إلى 569 دولار، وتم إزالة الدعم العكسي. ومن خلال مراجعة أُجريت على 300 أثر، تم قبول 295 تسمية دون تغيير. كما أن استخدام ضوابط مشروطة بالأثر على 1,000 أثر حقيقي أدّى إلى تقليل المخاطر في المتغيرات ذات 95% من القيمة المفقودة (CVaR95) بنسبة 72%.

تم إصدار الكود، التسميات، وورقات التدقيق للمساعدة في اعتماد هذه الأساليب المستقبلية.