في عالم الذكاء الاصطناعي، يُعتبر الانتباه الكتلي (Block-Sparse Attention) أحد أبرز الابتكارات في تسريع نماذج اللغة الطويلة (LLMs). ومع ذلك، تواجه هذه التقنية تحديات كبيرة في تحديد الكتل ذات الصلة بشكل فعال. تكمن المشكلة الرئيسية في الأساليب الحالية التي تعتمد على الانتباه الخشن لتقدير أهمية الكتل، مما يؤدي غالباً إلى عمليات بحث مكلفة على مستوى الرموز أو تقييمات غير دقيقة.
في هذا السياق، تم تقديم تقنية Prism، التي تمثل خطوة ثورية في معالجة العوائق المرتبطة بالانتباه الكتلي. يستند هذا النهج إلى التفاعل بين الانتباه الخشن ومرشحات الموضع الدوراني (Rotary Positional Embeddings - RoPE). مما يسمح لشكل من أشكال تجميع المعلومات بخلق "نقاط عمياء" تفقد المعلومات المحلية الحيوية.
لكن بفضل Prism، أصبح بالإمكان إنهاء هذه التحديات. تعتمد تقنية Prism على طريقة غير تعتمد على التدريب للوعي الطيفي، حيث تقوم بتجزئة اختيار الكتل إلى فرعين: أحدهما مرتفع التردد والآخر منخفض التردد. من خلال استخدام استراتيجيات المعايرة الحرارية، تستطيع Prism استعادة الإشارات الموضعية المتراجعة مباشرة من التمثيلات المجمعة، مما يمكّن تقدير أهمية الكتل باستخدام عمليات على مستوى الكتل فقط.
ثبتت تقييمات شاملة أن Prism تحافظ على دقة توازي الانتباه الكامل، مع تحقيق تسريع يصل إلى 5.1 مرة. يمهد هذا الابتكار الطريق لتحسين كبير في كفاءة نموذج اللغة، مما يفتح آفاق جديدة في مجال الذكاء الاصطناعي.
اكتشف Prism: ثورة في تقنية الانتباه الكتلي مع الوعي الطيفي!
تقدم تقنية Prism حلاً مبتكرًا لتحديات الانتباه الكتلي من خلال وعي طيفي يمكنها من تسريع العمليات بشكل ملحوظ. مع تحسين كفاءة تقدير أهمية الكتل، تحقق Prism زيادة في السرعة تصل إلى 5.1 مرة دون فقدان الدقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
