في عالم التقنية المتسارع، تمثل أنظمة التوصية (Recommendation Systems) جزءًا جوهريًا من تجربة المستخدم، حيث تساعدنا في اكتشاف المحتوى المناسب. إلا أن تطويرها يتطلب فهمًا عميقًا لقوانين التوسع (Scaling Laws) التي تربط بين أداء النموذج وموارد الحوسبة.
على الرغم من وجود قوانين التوسع عند التعامل مع نماذج اللغات الضخمة (Large Language Models)، فإنها تبقى تحديًا مع أنظمة التوصية، خصوصًا أثناء معالجة تاريخ المستخدم وميزات السياق. هنا تأتي كنلون (Kunlun) كحل مبتكر يعالج هذه القضية.
تعتبر كفاءة التوسع الضعيفة من أكبر العوائق التي تمنع الوصول إلى أداء متوقع، حيث تعود الأسباب إلى وحدات غير فعالة تستخدم نسبة منخفضة من قدرات نموذج عاملات النقاط العائمة (Model FLOPs Utilization - MFU) وتخصيص موارد غير مثالي. لذلك، قدمت كنلون تصميمًا معماريًا قابلًا للتوسع يُحسن بشكل منهجي كفاءة النموذج وتخصيص الموارد.
تتضمن تحسينات المستوى المنخفض في كنلون تقنيات متقدمة مثل:
- الانتباه المعمّق القائم على المنتجات العامة (Generalized Dot-Product Attention - GDPA).
- التجميع الهرمي للبذور (Hierarchical Seed Pooling - HSP).
- الانتباه من خلال نافذة متحركة (Sliding Window Attention).
أما الابتكارات على مستوى الهيكل العالي فتتضمن:
- تخطي العمليات الحسابية (Computation Skip - CompSkip).
- التخصيص على مستوى الفعالية (Event-level Personalization).
هذه التطورات أسفرت عن زيادة MFU من 17% إلى 37% عند استخدام بطاقات NVIDIA B200، مما يعزز كفاءة التوسع إلى الضعف مقارنة بالطرق التقليدية. وبالفعل، تم نشر كنلون في نماذج إعلانات ميتا (Meta Ads)، محققة تأثيرًا كبيرًا في الإنتاج.
إذا كنت متحمسًا لتقنيات الذكاء الاصطناعي، فلا تفوت فرصة التعرف على هذا الابتكار الرائد في عالم أنظمة التوصية!
كنلون: ثورة جديدة في تصميم أنظمة التوصية من خلال قوانين التوسع المبتكرة!
تقدم كنلون خطوة هائلة نحو تحسين كفاءة أنظمة التوصية الضخمة عبر قوانين التوسع القابلة للتنبؤ. بفضل تصميمها المعماري الفريد، تعمل على زيادة كفاءة استخدام الموارد بشكل مذهل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
