في ظل التقدم الهائل في تكنولوجيا الذكاء الاصطناعي، لا تزال نماذج Transformers للرؤية السريعة (Spiking Vision Transformers - SViTs) تواجه تحديات كبيرة تتعلق بالحجم والقدرة على التنفيذ في الأجهزة المدمجة. وللتغلب على هذه المشكلة، تم تقديم PrimeSVT، وهو إطار مبتكر يركز على تقنيات القطع الذكي (Pruning) التي تأخذ في الاعتبار الذاكرة بشكل مسبق.

يعتمد PrimeSVT على تقنية القطع المهيكلة التلقائية، مما يسمح بتقليل حجم النماذج المدربة مسبقًا بشكل فعال دون الحاجة إلى إعدادات معقدة أو وقت تصميم مكلف. يهدف هذا الإطار إلى تحقيق كفاءة عالية في الأداء أثناء عملية الاستدلال، مع مراعاة البنى الحاسوبية المستخدمة بشكل واسع.

يبدأ PrimeSVT بتصنيف طبقات SViTs وفقًا لحجمها وعدد المعلمات، ثم يحدد الطبقات المستهدفة للقطع بناءً على قدرتها على مقاومة معدلات القطع المختلفة. من خلال هذه العملية، يتم تنفيذ عملية القطع تدريجيًا من الطبقة الأكبر إلى الأصغر، وذلك وفق سياسة ضغط ذات أولوية. كما يتم استخدام تقنية قطع الفلاتر بناءً على قيم L2-norm لإزالة الوزن غير المؤثر بشكل هيكلي.

أظهرت التجارب أن PrimeSVT يوفر توفيرًا في الذاكرة بنسبة 26.68% من خلال القطع التلقائي بوحدة واحدة، مع الحفاظ على دقة تصل إلى 72.9% بعد التعديل، مما يعني أن الإطار يلبي المعايير المطلوبة من حيث الدقة وتوفير الذاكرة. هذه النتائج تسلط الضوء على قدرة PrimeSVT على أتمتة تصميم نماذج SViT وإمكانية تنفيذها في الأجهزة المدمجة بشكل أكثر كفاءة.

مع استمرار التطورات في هذا المجال، يبقى السؤال: كيف ستؤثر هذه الابتكارات على مستقبل تكنولوجيا الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!