في عالم الذكاء الاصطناعي، تعتبر النماذج اللغوية الكبيرة (Large Language Models) من أهم الابتكارات التي تتيح للأجهزة الذكية فهم اللغة البشرية بشكل أعمق. لكن دراسة جديدة أثارت الجدل حول الأداء الحقيقي لوحدات المعالجة العصبية (NPU) عند استخدامها في هذه النماذج على الأجهزة المحمولة.
التحليل المعمق الذي أجريناه يوضح أن الاعتماد على التنفيذ المتنوع قد يحمل مفاجآت غير متوقعة. في حين أن بنى معمارية الأجهزة كانت توحي بأن وحدات المعالجة العصبية ستكون الأسرع في جميع الحالات، أظهرت النتائج أن وحدات المعالجة المركزية (CPU) تتفوق في الأداء خلال المرحلة الأكثر تحديًا للمعالجة، وهي مرحلة "Prefill". حيث حققت وحدات المعالجة المركزية سرعات تصل إلى 1.6 مرة أسرع من وحدات المعالجة العصبية.
أما في مرحلة "Decode" التي تعتمد على الذاكرة، فقد كانت فوائد وحدات المعالجة العصبية محدودة، حيث ارتفعت السرعة بين 1.05 و 1.2 مرة فقط. بالإضافة إلى ذلك، تم الكشف عن أن تكاليف جدولة الحمل وعمليات التراجع بين الأنظمة تقلل من الفوائد العملية لاستخدام وحدات المعالجة العصبية.
قامت الدراسة أيضًا بتسليط الضوء على تأثير نقل الحمل على استهلاك الطاقة، حيث شهدت الزيادة في استخدام وحدات المعالجة العصبية زيادة تصل إلى 51% في استهلاك الطاقة. بناءً على هذه النتائج، تم وضع إرشادات تصميمية لمهندسي وحدات المعالجة العصبية لتحسين الأداء عند تشغيل النماذج اللغوية الكبيرة.
هل تظن أن وحدات المعالجة العصبية ستظل الخيار الأفضل في المستقبل؟ شاركونا آراءكم في التعليقات!
هل تعتقد أن وحدات المعالجة العصبية أسرع دائمًا؟ اكتشف الحقيقة المدهشة حول النماذج اللغوية الكبيرة على الأجهزة المحمولة!
تشير دراسة جديدة إلى أن وحدات المعالجة العصبية (NPU) قد لا تكون الخيار الأكثر سرعة لنماذج اللغويات الكبيرة (LLMs) على الأجهزة المحمولة. اكتشفوا كيف تفوقت وحدات المعالجة المركزية (CPU) في مراحل معينة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
