في عالم الذكاء الاصطناعي، تتزايد الحاجة إلى أنظمة ذكية تتواصل بشكل فعال. ولعل أحد أبرز التطورات في هذا المجال هو التعلم المعزز المتعدد الوكلاء (Multi-Agent Reinforcement Learning - MARL)، الذي يسمح للوكلاء بتطوير استراتيجيات تنسيق عبر التواصل الناشئ. ومع ذلك، يواجه الباحثون التحدي الكبير المتمثل في عدم وجود ضمانات سلامة رسمية للسياسات العصبية المستخدمة، وهو ما يعد أمراً حيوياً لتطبيقات الروبوتات في السيناريوهات الحرجة مثل أسراب الطائرات بدون طيار وفرق المركبات الذاتية القيادة.
قدمت دراستنا الجديدة أول إطار عمل شامل للتحقق من الأمان للسياسات المتعددة الوكلاء، حيث يتم تجريد السياسات العصبية إلى أشجار قرار قابلة للتفسير. بعد ذلك، يتم التحقق منها بشكل رسمي، مع تأكيدات تجريبية توضح أن خصائص الأمان المعتمدة تنتقل إلى الشبكات الأصلية. يتكون خط الأنابيب الخاص بنا من أربع مراحل تشمل استخلاص الميزات الخاصة بالسياقات المحددة من ملاحظات الوكلاء، وتقطير الأشجار القرار لتحقيق دقة تصل إلى 97.9%، والترجمة الآلية إلى مواصفات_checker PRISM، والتحقق التراكمي لخصائص منطق الحسابات الاحتمالية (PCTL) عبر معالجة ثنائية الارتباط.
من خلال تقييم سياسات Vector-Quantized Variational Information Bottleneck (VQ-VIB) لتنسيق عدة طائرات بدون طيار (5-7 وكلاء)، تمكنا من التحقق من 18 خاصية منطقية زمنية عبر الأمان، والوجود، والتعاون، محققين نسبة رضا قدرها 88.9% مع الوفاء بجميع حدود الأمان الخمسة.
تؤكد نتائج Monte Carlo أن الخصائص المعتمدة على الأمان تنتقل مع انحراف لا يتجاوز 0.6 نقطة مئوية، مما يعكس دقة وثبات نظامنا. يقدم نموذج VQ-VIB الرسائل المنفصلة مزايا دقة تتراوح من 11.6 إلى 13.6 نقطة مئوية مقارنة بالطرق المستمرة، مما يمكّن من تسريع عمليات التحقق بمعدل 3-4 مرات.
يعد إطار عملنا جسرًا عمليًا بين التعلم العميق متعدد الوكلاء وعمليات أمان رسمية لتناول تطبيقات الروبوتات المتعددة. كل هذه التطورات تجعلنا متفائلين بشأن مستقبل الروبوتات الذكية والآمنة.
تحقق من الأمان في سياسات التواصل المتعددة الوكلاء: ثورة في الذكاء الاصطناعي للروبوتات!
تمكنت دراسة جديدة من إثبات أمان سياسات التواصل المتعددة الوكلاء باستخدام الأشجار القرار، مما يضمن فرص أكبر لتطبيقات الروبوتات المستقلة. هذه التقنية توفر ضمانات أمان مطلوبة لتطبيقات الطائرات بدون طيار والمركبات الذاتية القيادة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
