في عالم يتطور بسرعة نحو الذكاء الاصطناعي، ظهرت تقنية جديدة مثيرة تُعرف باسم SANTA (Stochastic Additive No-mulT Attention)، والتي تُعد بمثابة ثورة في مجال معالجة البيانات في نماذج الذكاء الاصطناعي. تعتمد المشكلة الكبيرة في عملية التفكيك الذاتي (Autoregressive Decoding) على استهلاك النطاق الترددي (Bandwidth) عندما يتعلق الأمر بالسياقات الطويلة، حيث يتطلب توليد كل رمز قراءة جميع متجهات المفاتيح (Key) والقيم (Value) من ذاكرة KV.

تقدم تقنية SANTA حلاً ذكيًا عن طريق تقليل الوصول إلى ذاكرة القيم عبر أخذ عينات من توزيعات ما بعد الـ softmax، مما يُتيح فقط الوصول إلى صفوف القيم المحددة، وهو ما يوفر تقديرًا غير متحيز للتجميع. وهذه التقنية تحل محل عملية الضرب والتراكم التقليدية في مرحلة القيمة، بفضل طريقة جديدة تجمع وتضيف القيم المستهدفة.

كما تم تقديم عينات ذات بناء طبقي لتصميم نسخ صديقة لوحدات معالجة الرسوم (GPU) مع تقليل التباين، تقدم نتائج مبهرة بتسريع Kernel لخطوات معالجة تفكيك البيانات بنسبة 1.5 مرة مقارنة بتقنيات سابقة مثل FlashInfer وFlashDecoding.

تسعى هذه التقنية لفتح أبواب جديدة نحو طرق جديدة وصديقة للطاقة في استخدام الطاقة خلال الاستنتاج. يترافق هذا مع تقنية أخذ عينات من الصنف Bernoulli لتقليل الوصول إلى ميزات المفاتيح من خلال استعلامات ثلاثية عشوائية، وهو ما يضع سANTA كحل مثالي للنماذج اللغوية عالية الأداء.

بفضل سANTA، نحن نخطو نحو عصر جديد من الذكاء الاصطناعي الرشيق، الذي لا يحتاج إلى مضاعفات مكلفة، فهو يوفر طاقة أكبر وكفاءة أعلى. اكتشف المزيد من التفاصيل والأنوية المفتوحة المصدر عبر الرابط.

تتسم هذه التقنيات بالقدرة على التكيف مع تقنيات مسبقة، مثل الترميز ثلاثي الأبعاد (Ternary Quantization) والإسقاطات منخفضة الرتبة (Low-Rank Projections)، مما يفتح الأفق لاستنتاجات ذكية، موفرة للطاقة وآمنة.

ما رأيكم في هذا التطور الاستثنائي في عالم الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!