مع التوسع الكبير في استخدام الذكاء الاصطناعي (AI) في الأنظمة الحيوية، أصبحت الحاجة لضمانات رسمية للمتانة أكثر إلحاحًا من أي وقت مضى. الأشهر الأخيرة شهدت تطوير أساليب جديدة تقلل من الجوانب المحافظة المفرطة لبعض طرق التحقق، مثل استخدام اضطرابات lp-norm في سياقات الفيديو، والتي تفترض أن المهاجم يمكنه إدخال ضوضاء في كل إطار من الفيديو. لكن في الواقع، تتجلى الاضطرابات العدائية في نمطٍ مركب من التوزيعات الزمنية والمكانية، دون الامتداد إلى الفراغات ذات الأبعاد العليا ذات المعنى الدلالي.

تتناول هذه الدراسة التحقق من المتانة في الشبكات العصبية ثلاثية الأبعاد (3D CNNs) والتي تعالج المدخلات الفيديوية والمجسمة، مستهدفةً تطبيقات حيوية مثل تمييز الأفعال (UCF-101)، القيادة الذاتية (Udacity)، والتصوير الطبي (MedMNIST). يتم استخدام افتراضات واقعية حول قوة المهاجم، عن طريق صياغة تلك القيود كقيود زمانية مكانية، ما يسمح للمهاجم بتعديل مجموعة مختارة من الإطارات أو اللوحات ضمن مجموعة من الإطارات المتتالية.

قد قمت بعرض كيفية تمكين النمذجة الواقعية لهذه القيود من تحقيق تقديرات أكثر دقة. ومن خلال تقديم إطار عمل جديد يُعرف باسم Spatio-Temporal Bound Propagation (STBP)، تم حساب توصيف مغلق دقيق للطبقة التلافيفية الأولى ونقل الحدود المعتمدة عبر الطبقات التالية باستخدام تقديرات قابلة للتوسع. يسهم حساب الشكل المغلق الدقيق في توفير أقوى الحدود للطبقة التلافيفية الأولى، بينما يتم استخدام طرق التقدير في بقية الشبكة.

وفي إطار دفع المزيد من التقدم في هذا المجال، نقترح ST-Bench، وهو معيار تحقق للقيادة الذاتية وتمييز الأنشطة، لتقييم المتانة القابلة للتحقق بشكل منهجي. وبالمقارنة مع الأساليب المعتمدة على التحقق المتاحة، يوفر STBP ضمانات متانة أقوى مع تحسين ملحوظ في القابلية للتوسع، حيث بلغ تحقيقه دقة معتمدة لامتحانات متينة أعلى بمقدار 1.7 مرة تحت نفس قيود الاضطراب.