في عالم الذكاء الاصطناعي، يسعى الباحثون دائمًا لتحقيق التوازن بين الكفاءة والدقة، وخاصةً عند التعامل مع النماذج البصرية طويلة المدى. تُظهر الأبحاث الأخيرة حول Mamba، إحدى هذه النماذج، نتائج مثيرة في كيفية نمذجة التسلسلات المرئية. ومع ذلك، عندما تم تطبيق تقنيات خفض التوكنات (Token Reduction) على متغيرات Mamba المعززة هيكليًا، كان هناك انهيار كبير في الأداء.

تُعزى هذه الانهيارات إلى الطبيعة غير المعتمدة على الفضاء لأساليب الخفض الحالية، التي تتجاهل المبادئ الهيكلية الثنائية الأبعاد المطلوبة. لكن الآن، نقدم لكم الإطار الجديد STORM (Spatial-Aware Token Reduction Framework) المصمم للحفاظ على السلامة الهيكلية خلال عملية الضغط.

يعمل STORM على إعادة صياغة خفض التوكنات كعملية منظمة على وحدات الفضاء، ويطبق قيودًا محلية للحفاظ على كل من شبكة التخطيط وتماسك الجوار. يعد هذا الإطار وحدة إضافية سهلة التركيب، تعزز من خطوط أنابيب الخفض الحالية بوعي مكاني واضح ودون حاجة لأي تدريب إضافي.

تظهر النتائج التجريبية أن STORM يحقق دقة تقليم تنافسية في بيئات تدريب خالية، حيث يتفوق على النماذج السابقة بنسبة تصل إلى 63.3% في دقة التصنيف من الطراز الأول. وفي الوقت نفسه، يُظهر STORM انخفاضًا طفيفًا بمقدار 1.0% في دقة نموذج PlainMamba، مما يجعله في مرتبة قريبة من أداء ViT.

إن تطوير مثل هذا الإطار يعكس التقدم المستمر في مجال الذكاء الاصطناعي ويدعو الباحثين والمطورين إلى استكشاف إمكانياته وتطبيقاته الجديدة.