أصبحت مصنفات الأمان التي تراقب مدخلات نماذج اللغات الضخمة (LLMs) لعمليات الهروب (jailbreak attempts) جزءاً أساسياً في انتشار الأنظمة، لكن معظم الأنظمة الإنتاجية تعتمد على نماذج تعتمد على وحدات معالجة الرسوميات (GPU). هذه الطرق تفرض تكاليف كبيرة وتأخيرات ملحوظة في الاستجابة لكل استعلام.لذا، ظهرت تساؤلات حول إمكانية أن تتوافق المصنفات المعتمدة على وحدات المعالجة المركزية (CPU) مثل آلات الدعم الناقل (Support Vector Machines) والأشجار المعززة (Gradient-Boosted Trees) مع معايير الدقة اللازمة في ظروف التطبيفات الإنتاجية.
في دراستنا الجديدة، قمنا بتقييم خمس عائلات من مصنفات الـ CPU مقارنة مع مصنف GPU مثل Mamba-130M ونماذج تعتمد على المحولات (Transformers) مثل DeBERTa-v3 وGemma-2B. أجرينا الاختبارات عبر تسع مصادر لهجمات jailbreak وثلاثة أنظمة مختلفة: ضمن التوزيع (D1)، خارج التوزيع (D2)، والرموز المعقدة (D3).
وأظهرت النتائج أنه على D1، تتساوى أفضل مصنفات الـ CPU مع أفضل نموذج GPU من حيث الأداء ولكن بتكلفة أقل بخمس مرات. بينما في D2، تبيّن أن مصنفات CPU غالباً ما تؤدي إلى سجلات خاطئة واضحة، مما يسمح لبعض الهجمات بالمرور دون أن يلاحظها أحد. أما في D3، فقد تفوقت مصنفات CPU على نماذج GPU بنسبة تزيد عن 26 نقطة مئوية في دقة F1.
وبناءً على هذه الأنماط المختلفة من الفشل، قمنا بتصميم GuardChain، وهي خط أنابيب أمان ثلاثي المراحل (Regex -> CPU -> GPU) الذي يوجه كل طلب إلى المرحلة الأقل تكلفة القادرة على اتخاذ قرار موثوق. المرحلة الخاصة بالـ CPU وحدها تعالج 80% من الطلبات ضمن التوزيع بأعلى دقة ممكنة، بينما تستعيد المرحلة الخاصة بالـ GPU حالات الفشل خارج التوزيع.
هذا البحث يقدم أدلة للممارسين في مجال الأمن لتوظيف تكنولوجيا الـ LLM بشكل فعّال وبأقل التكاليف المطلوبة.
هل تحتاج حقاً إلى وحدة معالجة الرسوميات لحماية نماذج الذكاء الاصطناعي الخاصة بك؟
تكشف دراسة جديدة أن استخدام وحدات المعالجة المركزية (CPU) قد يكون كافياً للامتثال لمعايير الأمان دون الحاجة لوحدات معالجة الرسوميات (GPU). هذا البحث يوفر رؤية جديدة حول تكاليف وفاعلية تصنيف الأمان في نماذج اللغات الضخمة (LLMs).
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
