في عصر يقود فيه [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) ([AI](/tag/ai)) الابتكارات، يتزايد استخدام [الوكلاء](/tag/الوكلاء) الأوتونوميين (Autonomous Agents) في [تنفيذ](/tag/تنفيذ) مهام طويلة الأمد. ومع ذلك، تواجه هذه [الوكلاء](/tag/الوكلاء) تحديًا كبيرًا في [الالتزام](/tag/الالتزام) بالسياسات الواقعية، وهو مجال لم يُستكشف بشكل كافٍ مقارنةً بأهداف [الأمان](/tag/الأمان) التقليدية. لحل هذه المشكلة، قدم الباحثون مؤخرًا نموذجًا مبتكرًا يحمل اسم PolicyGuard، يعمل كحارس فعال لضمان [الالتزام](/tag/الالتزام) بالسياسات.
يعتمد [نموذج PolicyGuard](/tag/[نموذج](/tag/نموذج)-policyguard) على [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) فريدة تتضمن 60,000 زوج من [السياسات](/tag/السياسات) والطرائق، والتي تُستخدم لتقييم مدى التقيد بالسياسات من خلال مهام الكشف عن الانتهاكات. من خلال استخلاص [المعرفة](/tag/المعرفة) من هذه البيانات، تم [تطوير](/tag/تطوير) [نموذج](/tag/نموذج) Guardrail خفيف الوزن، قادر على [تحقيق](/tag/تحقيق) [دقة](/tag/دقة) قوية في الكشف، مع الحفاظ على [كفاءة](/tag/كفاءة) عالية في [الأداء](/tag/الأداء).
المثير في الأمر هو أن هذا النموذج يظهر قدرات كبيرة في التعميم، حيث يحافظ على [أداء عالي](/tag/[أداء](/tag/أداء)-عالي) حتى في المجالات التي لم يتم [تدريب النموذج](/tag/[تدريب](/tag/تدريب)-النموذج) عليها مسبقًا. هذه النتائج ترسم إطارًا شاملًا لدراسة [الالتزام](/tag/الالتزام) بالسياسات، مما يُثبت أن الحراس الدقيقين والقابلين للتعميم يمكن تحقيقهم على [مقاييس](/tag/مقاييس) صغيرة.
هل تشعر بالفضول حيال تأثير هذه [التقنية](/tag/التقنية) على المستقبل؟ شارك برأيك في [التعليقات](/tag/التعليقات)!
ثورة الذكاء الاصطناعي: اكتشاف نموذج PolicyGuard لضمان الالتزام بالسياسات
مع تزايد استخدام الوكلاء الأوتونوميين في المهام الطويلة، أطلق الباحثون نموذج PolicyGuard الذي يُعتبر طفرة في مجال الالتزام بالسياسات. يقدم هذا النموذج دقة عالية في الكشف عن التجاوزات مع كفاءة في الأداء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
