في عالم الذكاء الاصطناعي (AI) النامي بسرعة، أصبحت الأنظمة الذكية مثل OpenClaw جزءاً لا يتجزأ من تسهيل تدفق العمل المحلي، مما يُلزمها بالوصول إلى أدوات خارجية متنوعة. لكن هذا التقدم التكنولوجي جاء معه خطر جديد: مخاطر التلقين غير المباشر (Indirect Prompt Injection - IPI).
تتجلى هذه المخاطر عندما يقوم الوكيل الذكي بتنفيذ تعليمات ضارة مخفية في مدخلات غير موثوقة، مثل رسائل البريد الإلكتروني، أو الملفات المحملة، أو الصفحات الإلكترونية، أو حتى الرسائل في مجموعات الدردشة. وبما أن التقييمات الحالية تُظهر قيوداً متعددة، سواء من حيث حجمها أو محاكاة مواقف محدودة، يتم تقديم LivePI كحل مبتكر.
يتضمن LivePI معياراً منظمًا لمخاطر التلقين غير المباشر، مما يوفر بيئة اختبار قريبة من إنتاجية النظام الحقيقي، مع فحص سبع واجهات إدخال، واثنى عشر عائلة من هجمات التنفيذ والتقديم، وخمسة أهداف خبيثة تشمل: استخراج المعلومات المحمية، وتغييرات غير مصرح بها في أدوات الأمان، واسترجاع أو تنفيذ كود غير آمن، واستخراج ملخصات البريد الوارد، وتحويل العملات المشفرة.
باستخدام بيئة اختبار يتم التحكم فيها، تم تشغيل LivePI على آلة افتراضية حقيقية تتضمن واجهات حية للبريد الإلكتروني، والدردشة، والويب، والملفات المحلية، ومستودعات البرمجة، ومحافظ العملات.
تراوحت معدلات نجاح الهجمات بين 10.7% و29.6% عبر نماذج مثل GPT-5.3-Codex، وClaude Opus 4.6، وGemini 3.1 Pro، وKimi K2.5، وGLM-5. وتبين أن هجمات الدردشة الجماعية كانت ناجحة بشكل موحد عبر مختلف النماذج، بينما حققت هجمات روابط المستودعات أعلى نسب فشل على الرغم من قلة الهجمات.
لضمان الحماية، تم تقييم دفاع ذو طبقتين يتكون من تصفية على مستوى المنبه وتفويض استدعاء الأداة قبل التنفيذ. في بيئة GPT-5.3-Codex، استطاع هذا الدفاع اعتراض جميع الأهداف الخبيثة المُختبرة في LivePI، مما يضمن الحفاظ على الفائدة العامة في العمل أثناء تنفيذ المهام المبتكرة.
LivePI: معيار جديد يثري تقييم المخاطر في ذكاء الخوارزميات!
تقدم LivePI فحصاً دقيقاً لمخاطر البرمجة غير المباشرة في الوكالات الذكية. تتبع هذه الأداة الجديدة نهجاً مبتكراً لتقييم قدرة الأنظمة على التعامل مع التهديدات المحتملة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
