في عصر الذكاء الاصطناعي، ومع انتشار وكلاء نماذج اللغات الضخمة (Large Language Models) في البيئات الحساسة مثل الرعاية الصحية والمالية، تصبح مسألة التفويض الآمن لمهام فرعية إلى وكلاء متخصصين واحدة من أبرز التحديات. قدم فريق بحثي حديث حلولاً مبتكرة من خلال تطوير إطار عمل جديد يُعرف باسم "التفويض الآمن ذو المستويين (Safe Bilevel Delegation - SBD)"، والذي يعد رائدًا في تحقيق التوازن بين السلامة والكفاءة في الأنظمة متعددة الوكلاء.
يتمحور مفهوم SBD حول تحليل عملية التفويض كمسألة تحسين بُعدية، حيث يتضمن نظاماً مكوناً من عدة مستويات. في هذا النظام، يتعلم "شبكة الوزن الخارجية (Meta-weight Network)" كيفية تحديد أوزان السلامة والكفاءة المتغيرة وفقًا لسياق المهام. بينما تتولى الدورات الداخلية تحسين سياسة التفويض وفقًا لمحددات سلامة احتمالية.
يتيح لنا SBD التحكم الدقيق في درجة التفويض، حيث يمكننا الانتقال بسلاسة من التفويض الكامل للإنسان (عندما تكون النسبة 0) إلى التنفيذ المستقل الكامل (عندما تكون النسبة 1).
تتضمن النتائج النظرية التي توصل إليها الباحثون ثلاثة قوانين رئيسية، وهي:
1. **أمان موزون (Safety Monotonicity)**: زيادة الوزن الخارجي يؤدي إلى سياسة داخلية أكثر أمانًا.
2. **تلاقي السياسة الداخلية (Inner Policy Convergence)**: تحسين السياسة الداخلية يتقارب بسرعة بناءً على افتراضات السلاسة القياسية.
3. **حدود انتشار المساءلة (Accountability Propagation Bound)**: يوزع المسؤولية عبر سلاسل التفويض، مما يضمن سلامة كل وكيل.
تم تطبيق SBD في ثلاثة مجالات حساسة: الرعاية الصحية باستخدام بيانات MIMIC-III، والتحكم في المخاطر المالية باستخدام مؤشر S&P 500، والإشراف التعليمي مع برنامج ASSISTments. يشمل هذا البحث تفاصيل البيانات، ومجموعات قيود السلامة، والمعايير، وبروتوكولات التقييم.
من خلال هذه الإطروحة، سيتم تقديم إطار العمل والنتائج النظرية بصورة متكاملة، كما يُتوقع إجراء تحقق تجريبي يتبع البروتوكولات المذكورة، وسنوافيكم بالتحديثات قريبًا.
استراتيجيات آمنة للتفويض: إطار عمل مبتكر لضمان سلامة الأنظمة متعددة الوكلاء
مقاربة جديدة تبرز آليات التفويض الآمن في البيئات الحساسة باستخدام إطار عمل متكامل. استعد لاكتشاف كيفية تحقيق توازن ممتاز بين السلامة والكفاءة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
