في عالم الذكاء الاصطناعي، تلعب المهارات المعتمدة (Skill-based [agents](/tag/agents)) دوراً حيوياً في تعزيز فعالية [الوكلاء](/tag/الوكلاء) من خلال [توجيهات](/tag/توجيهات) معينة، سكربتات قابلة للتنفيذ، وموارد إضافية. لكن هذا [التصميم](/tag/التصميم) القابل لإعادة الاستخدام يكشف عن [ثغرات](/tag/ثغرات) جديدة، حيث يمكن تحميل مهارة ضارة أو مخترقة كإرشادات موثوقة، مما يوجه استخدام [الوكلاء](/tag/الوكلاء) للأدوات خلال عمليات التنفيذ.
حتى وقت قريب، كانت [هجمات](/tag/هجمات) حقن المهارات تعتمد بشكل كبير على العمليات اليدوية، وكانت هشة، حيث يتم [رفض](/tag/رفض) [التعليمات](/tag/التعليمات) الضارة عند عدم توافقها مع [سير العمل](/tag/سير-العمل) الأصلي. ولكن الآن، تم تقديم SkillJect، الإطار الأول من نوعه الذي يتيح [توليد](/tag/توليد) [مهارات](/tag/مهارات) مسمومة بشكل آلي.
كيف يعمل [SkillJect](/tag/skillject)؟ يقوم بتفكيك الهجوم إلى قناتين منسقين. في القناة الأولى، يتم إخفاء المحتوى الضار في سكربت مساعد إضافي. بينما في القناة الثانية، يتم إعادة [كتابة](/tag/كتابة) ملف SKILL.md باستخدام [استراتيجية](/tag/استراتيجية) تحفيزية تضع المحتوى المُدخل في البداية، مما يجعل السكربت الإضافي يبدو كخطوة تمهيدية إلزامية.
إنه يتضمن أيضًا عملية مغلقة متعددة [الوكلاء](/tag/الوكلاء) لتحسين [أداء](/tag/أداء) الهجوم. يقوم [وكيل](/tag/وكيل) الهجوم بإنشاء المهارات المسننة، بينما ينفذ [وكيل](/tag/وكيل) الضحية المهام مع هذه المهارات، ويقوم [وكيل](/tag/وكيل) [التقييم](/tag/التقييم) بفحص آثار التنفيذ لتحديد ما إذا تم [تنفيذ](/tag/تنفيذ) المحتوى المخفي. هذه الحلقة المغلقة تسمح لوكيل الهجوم بتشخيص الفشل وإعادة [كتابة](/tag/كتابة) SKILL.md، مع الحفاظ على ثبات المحتوى الضار.
أثبتت [التجارب](/tag/التجارب) [عبر](/tag/عبر) المنصات ونظم [LLM](/tag/llm) الخلفية وفئات الهجوم أن [SkillJect](/tag/skillject) يتفوق بشكل ملحوظ على [أساليب](/tag/أساليب) الحقن اليدوية السابقة، مما يكشف عن المهارات المسمومة كوسيلة [هجوم](/tag/هجوم) مستمرة في النظم البيئية المعتمدة على المهارات القابلة لإعادة الاستخدام.
ما رأيكم في هذه التطورات الثورية؟ شاركونا أفكاركم وتجاربكم في [التعليقات](/tag/التعليقات)!
SkillJect: كيفية تعزيز أمان_agents المعتمدة على المهارات بفعالية من خلال آلية حقن مبتكرة!
يعتبر SkillJect الابتكار الأول من نوعه في مكافحة هجمات حقن المهارات المسمومة، حيث يتيح تصميمًا مدروسًا يعزز أمان الأنظمة المعتمدة على الذكاء الاصطناعي. استعد لتجاوز التحديات القديمة بحلول جديدة وتقنيات متطورة!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
