في عصر الذكاء الاصطناعي، باتت [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) تعتمد بشكل متزايد على [كفاءة الطاقة](/tag/[كفاءة](/tag/كفاءة)-[الطاقة](/tag/الطاقة)) والموارد المتاحة في [مراكز البيانات](/tag/مراكز-[البيانات](/tag/البيانات)) الحديثة. في هذا الإطار، ظهر نظام [جديد](/tag/جديد) يدعى [PALS](/tag/pals) (Power-Aware [LLM](/tag/llm) Serving) يهدف إلى تغيير قواعد [اللعبة](/tag/اللعبة) من خلال دمج القدرة الطاقية كأداة [تحكم](/tag/تحكم) فعالة أثناء [معالجة البيانات](/tag/معالجة-[البيانات](/tag/البيانات)).
لم تعد [الطاقة](/tag/الطاقة) مجرد قيد ثابت، بل أصبحت عنصراً قابلاً للتحكم يتمt optimizado من خلال التوازن بين حجم الحزمة (batch size) وأداء [معالجة البيانات](/tag/معالجة-[البيانات](/tag/البيانات)). يعتمد نظام [PALS](/tag/pals) على [نماذج خفيفة](/tag/[نماذج](/tag/نماذج)-خفيفة) الوزن للأداء والطاقة، بالإضافة إلى نظام [تحكم](/tag/تحكم) يعتمد على ردود الفعل لاختيار التكوينات التي تلبي [معايير الأداء](/tag/[معايير](/tag/معايير)-[الأداء](/tag/الأداء)) المطلوبة بينما تعظم [الكفاءة الطاقية](/tag/[الكفاءة](/tag/الكفاءة)-الطاقية).
الأهم أن هذا النظام تم تطبيقه ضمن إطار [عمل](/tag/عمل) قائم يسمى vLLM، حيث أظهر فاعلية ملحوظة من دون الحاجة إلى إعادة [تدريب النماذج](/tag/[تدريب](/tag/تدريب)-[النماذج](/tag/النماذج)) أو تغيير [واجهات](/tag/واجهات) [البرمجة](/tag/البرمجة). وقد أظهرت النتائج تحسيناً في [كفاءة](/tag/كفاءة) استهلاك [الطاقة](/tag/الطاقة) بنسبة تصل إلى 26.3%، وتقليص الانتهاكات المتعلقة بجودة الخدمة (QoS) بمعدل يتراوح بين أربع إلى سبع مرات، وذلك في ظل [قيود](/tag/قيود) [الطاقة](/tag/الطاقة) الديناميكية.
تسلط هذه النتائج الضوء على أهمية دمج [تحكم](/tag/تحكم) [الطاقة](/tag/الطاقة) مباشرة في أوقات معالجة [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) الكبيرة، مما يفتح المجال أمام [أنظمة](/tag/أنظمة) [ذكاء اصطناعي](/tag/ذكاء-اصطناعي) قادرة على [التفاعل](/tag/التفاعل) مع [الشبكات الكهربائية](/tag/[الشبكات](/tag/الشبكات)-الكهربائية) بكفاءة أكبر.
PALS: ثورة التحكم بالطاقة لنماذج اللغة الكبيرة في عالم الذكاء الاصطناعي!
تقدم دراسة جديدة نظام PALS الذي يتيح تحسين استهلاك الطاقة في نماذج اللغة الكبيرة (LLMs) عبر التحكم الديناميكي في القدرة الكهربائية. النتائج تظهر تحسناً ملحوظاً في الكفاءة الطاقية وتقليل الانتهاكات المتعلقة بالجودة بشكل كبير.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
