في عصر الذكاء الاصطناعي المتقدم، يتطلب ظهور الأنظمة الذكية الذاتية (Agentic AI) استراتيجيات جديدة لتقييم سلامة النماذج المستخدمة في اتخاذ القرارات. على عكس النماذج التقليدية التي تركز فقط على الدقة التنبؤية، تتيح الأنظمة الذاتية نفسها من خلال الاستفادة من المعلومات المحيطة لتشكيل معتقدات حول الحالات الخفية في بيئتها، مما يزيد من التعقيد في عملية التقييم.

هذا البحث الجديد يقترح إطار عمل يعتمد على عمليات ماركوف ذات الملاحظة الجزئية (POMDPs) لتقديم تقييم شامل لهذه الأنظمة. يقوم هذا الإطار بتفكيك عملية اتخاذ القرار إلى مكوناتها الأساسية من معلومات ومعتقدات وتوقعات وأفعال ومنفعة، مما يسمح بتقييم كل مكون بشكل مستقل.

كما يطرح البحث بحوث حول النماذج اللغوية الكبيرة (Large Language Models) من خلال تعريفها كمشغلات تقريبية استناداً إلى الفلاتر البيزية. يهدف الإطار المقترح إلى تصنيع تصنيف شامل لمخاطر النموذج، يغطي مخاطر مساحة الحالة، والفلاتر، والتوقعات، والسياسات، وتحديد المنفعة، ومعايير المخاطر.

قدم الباحثون دراسة حالة تتعلق بإدارة المحافظ المالية، حيث يقوم الوكيل بتحليل الأنظمة السوقية الخفية باستخدام معلومات السوق والبيانات الاقتصادية الكلية، ومن ثم يولد توقعات مشروطة بمعتقداته، ويبني محافظ استثمارية باستخدام إطار عمل بلاك-ليترمان.

تشمل طرق التحقق التجريبي تحليل الأداء، وتشخيص معايرة المعتقدات، واختبارات التغطيه، ودراسات الاستئصال، وتحليل حساسية المعلمات. تشير النتائج إلى أن استنتاج الحالة الخفية يساهم بشكل مستقل في جودة القرار وأن الاستنتاجات الأساسية تظل موثوقة في نطاق واسع من قيم المعلمات.

بذلك، يوفر هذا البحث إطار عمل عملي لتمديد مفاهيم إدارة مخاطر النموذج التقليدية لتشمل أنظمة الذكاء الاصطناعي الذاتية، مما يضمن أساساً دقيقاً لتقييمها وحوكمة سلوكها ورصدها.