تُعتبر هجمات التسميم (Poisoning Attacks) واحدة من أبرز التهديدات التي تواجه نظم الذكاء الاصطناعي، وخاصة نظم تصنيف الأوامر الصوتية. في هذه الهجمات، يقوم المهاجمون بالتلاعب بالبيانات التدريبية بشكل متعمد، مما يؤدي إلى تغيير تصنيفات الأوامر الصوتية، مما يضعف أداء النظام بشكل كبير.

في دراسة حديثة، تم استكشاف سيناريو هجوم التسميم القذر على نظام تصنيف الأوامر الصوتية. يتضمن نموذج التهديد فرضية أن بعض العبارات من فئة معينة يمكن أن تُسمم بطريقة معينة، عن طريق فرض "إشارة" على العبارة وتغيير تصنيفها إلى فئة أخرى يختارها المهاجم. لمواجهة هذا التهديد، اقترح الباحثون تصفية دفاعية مبتكرة.

الخطوة الأولى في هذه الدفاعات تشمل استخدام تقنية التعلم غير المراقب المعروفة باسم "DIstillation with NO labels (DINO)"، حيث يتم تعلم تمثيلات غير مراقبة لجميع أمثلة التدريب. بعد ذلك، يتم استخدام تقنيات مثل "K-means" و"LDA" لتجميع هذه التمثيلات.

الأهم من ذلك، يتم الاحتفاظ بالعبارات التي تحتوي على التصنيف الأكثر تكراراً في كل مجموعة للتدريب، بينما يتم التخلص من باقي العبارات. وقد أظهرت النتائج أنه في حالة وجود 10% من الفئة الأساسية المسممة، انخفض معدل نجاح الهجوم من 99.75% إلى 0.25% فقط، مما يدل على فعالية هذه الدفاعات.

تم اختبار هذا الدفاع ضد مجموعة متنوعة من نماذج التهديد، بما في ذلك اختلافات في الفئات المستهدفة والمصدر، فضلاً عن تنوعات في العوامل المحفزة. هذه النتائج تمثل خطوة هامة نحو تحسين أمان نظم تصنيف الأوامر الصوتية وتقديم حلول مبتكرة لمواجهة التهديدات المستمرة.