في عالم الذكاء الاصطناعي المتطور، تعتبر نماذج اللغات الضخمة المعززة بالاسترجاع (RAG) من الأدوات الرائدة في معالجة البيانات والمعلومات. لكن، مع القوة الكبيرة لهذه الأنظمة، تظهر أيضًا تحديات جديدة لم يكن يُنظر إليها من قبل. آخر الأبحاث تشير إلى وجود ثغرة حادة في هذه الأنظمة تتعلق بتكاليف الاستدلال.
تعتمد أنظمة RAG على بروتوكولات متعددة المراحل لجلب وتوليف المعلومات من مصادر المعرفة الخارجية، مما يجعلها عرضة لهجمات تُعرف بهجمات تكلفة الاستدلال (Inference Cost Attacks - ICAs). بينما تتطلب بعض أساليب الهجوم manipulations مباشرة للطلبات، قام الباحثون بتطوير نموذج جديد يُعرف بهجوم تكلفة الاستدلال المعزز بالاسترجاع (Retrieval-Augmented Inference Cost Attack - RA-ICA).
هذا النموذج الجديد لا يكتفي بالأساليب التقليدية، بل يستغل الثغرات داخل قواعد المعرفة الخارجية، مثل المعلومات المتاحة على الإنترنت، من خلال ما يُعرف بإجراءات تسمم المحتوى. لقد اقترح الفريق البحثي إطار عمل يُسمى استنفاد الموارد الحاسوبية عبر التسمم الخارجي (Computational Resource Exhaustion via External Poisoning - CREEP)، والذي يستخدم وكلاء لتوليد وثائق ضارة مما يؤدي إلى زيادة استهلاك التوكنات خلال فترة الاستدلال.
لزيادة فعالية هذا الهجوم، تم تقديم خوارزمية جديدة تعتمد على التعلم المعزز تُعرف بتحسين السياسة النسبية المدعومة بالذاكرة (Memory-Augmented Group Relative Policy Optimization - MA-GRPO)، والتي تعمل على تحسين أداء الوكلاء عن طريق تعلم من الذكريات التاريخية لأفضل الوثائق الضارة.
أظهرت التجارب التي شملت ثلاثة مجموعات بيانات حقيقية أن RA-ICA يستطيع أن يزيد من استهلاك التوكنات بنسبة تصل إلى 13.12 مرة مع معدل نجاح يتجاوز 90%، دون التأثير على نزاهة الإجابات المنتجة.
بالتالي، يفتح هذا البحث آفاق جديدة في فهم التحديات التي تواجه نماذج الذكاء الاصطناعي المعززة، مما يستدعي ضرورة تطوير استراتيجيات دفاعية متقدمة لحماية هذه الأنظمة من التهديدات الناشئة.
هجمات تكلفة الاستدلال تهدد نماذج اللغات الضخمة المعززة بالاسترجاع!
يكشف الباحثون عن تهديد جديد لنماذج اللغة المعززة بالاسترجاع، حيث قد تؤدي هجمات تكلفة الاستدلال إلى ارتفاع حاد في التكاليف التشغيلية. تعرف على كيفية استغلال هذا الضعف وكيفية مواجهته.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
