في عصر تتزايد فيه التهديدات ضد أنظمة الذكاء الاصطناعي، قدم الباحثون ابتكارًا جديدًا يحمل اسم MIRROR، وهو نظام يهدف إلى تعزيز الأمان في أنظمة استرجاع المعلومات المعززة بالذكاء الاصطناعي (RAG). يعتمد نظام MIRROR على منهجية متطورة تسمح له بمواجهة مجموعة متنوعة من الهجمات التي كانت تعتبر تحديًا، بما في ذلك حقن النصوص، حقن الصور، والهجمات المباشرة على الاستعلامات.

وبينما تعتمد الأساليب التقليدية لمواجهة التهديدات على إعادة استخدام نماذج الهجمات المعروفة، فقد سجلنا في تقييمات اختبار حقن النصوص القائم على MIRROR أن نسبة التكرار تبلغ 73-84%، مما يشير إلى ضرورة إيجاد حلول مبتكرة.

يتميز نظام MIRROR بإطار موحد يلجأ إلى البحث باستخدام شجرة مونت كارلو (Monte Carlo Tree Search) ويقوم بتوليد مرشحات مرنة تعتمد على السياق المسترجع، متبوعًا ببوابة حداثية (Novelty Gate) التي ترفض أي مرشح مطابق لمجموعة الاسترجاع، مما يعزز من قدراته على الحماية دون السماح بنسخ التعليمات البرمجية.

وقد أظهرت التجارب أن نظام MIRROR حقق نجاحًا ملحوظًا بزيادة نسبة استرداد الهجمات (ASR) إلى 76% في حالات التسمم بالصورة، مقارنة بالأساليب التقليدية التي تبلغ 52%. كما سجل 97% ASR في الهجمات المنسقة بتكلفة استعلام نصف القيمة، وهو ما يعكس كفاءة استثنائية.

علاوة على ذلك، أطلق الباحثون ART-SafeBench، الذي يحتوي على 41815 سجلًا في حزمة الملفات، ليصل العدد الإجمالي للسجلات إلى 41991 عبر أربع سطحيات مختلفة

إن هذا الابتكار ليس فقط خطوة مهمة في تعزيز أمان الذكاء الاصطناعي، بل يمثل أيضًا تطورًا بارزًا في مجال مكافحة التهديدات المتعددة.
لذلك، كيف تظن أن بإمكان هذا النظام الجديد تغيير مشهد أمان أنظمة استرجاع المعلومات المعززة؟ شاركونا آرائكم!