مع تزايد استخدام وكلاء الذكاء الاصطناعي (AI Agents)، تزداد التحديات المتعلقة بالسلامة والأمن بشكل معقد بسبب الاستخدام الذاتي للأدوات والتفاعل مع البيئات المحيطة. وقد أثبتت النماذج الحارسة الحالية عجزها عن استيعاب المخاطر المتعلقة بالوكيل، وعدم الشفافية في تشخيص المخاطر.
في هذه الأثناء، يُقدم إطار عمل "AgentDoG" نموذجاً جديداً يركز على استيعاب المخاطر المرتبطة بالوظائف المستقلة للوكلاء. نبدأ بتقديم تصنيف موحد ثلاثي الأبعاد يُصنّف المخاطر بناءً على المصدر (أين)، نمط الفشل (كيف)، والعواقب (ماذا).
استناداً إلى هذا التصنيف المنظم والهرمي، تم تقديم معيار أمان وكيل دقيق يسمى "ATBench"، بالإضافة إلى إطار زمني تشخيصي لأمان وخصوصية الوكلاء (AgentDoG). يُوفر إطار AgentDoG مراقبة دقيقة وسياقية خلال مسارات الوكيل، مما يمكّن من تشخيص الأسباب الجذرية للأفعال غير الآمنة، وغيرها من الأفعال التي تبدو آمنة ولكن غير معقولة، موفراً الشفافية اللازمة بدلاً من التصنيفات الثنائية.
تتواجد متغيرات AgentDoG بثلاثة أحجام (4B، 7B، و8B من المعلمات) ضمن عائلات نماذج Qwen وLlama. وقد أظهرت النتائج التجريبية الشاملة أن AgentDoG يحقق أداءً متفوقاً في مجال تنظيم سلامة الوكلاء في سيناريوهات تفاعلية معقدة ومتنوعة. كما تم إطلاق جميع النماذج ومجموعات البيانات بشكل مفتوح، مما يتيح للباحثين والمطورين الاستفادة منها.
تُعد هذه الابتكارات خطوة كبيرة نحو تحقيق بيئة تفاعلية أكثر أماناً، مما يُمكّن وكلاء الذكاء الاصطناعي من العمل بكفاءة وثقة أكبر في مختلف التطبيقات.
إطار عمل AgentDoG: حارس تشخيصي لضمان سلامة وأمان وكلاء الذكاء الاصطناعي
يقدم إطار AgentDoG نموذجاً مبتكراً يُعنى بتشخيص مخاطر وكلاء الذكاء الاصطناعي، مشدداً على أهمية السلامة والأمان في استخدام هذه التكنولوجيا المتقدمة. اكتشف معنا كيف يساهم هذا الإطار في تهيئة بيئة أكثر أماناً للتفاعل مع الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←