في عصر الذكاء الاصطناعي، باتت [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) تعتمد بشكل متزايد على [كفاءة الطاقة](/tag/[كفاءة](/tag/كفاءة)-[الطاقة](/tag/الطاقة)) والموارد المتاحة في [مراكز البيانات](/tag/مراكز-[البيانات](/tag/البيانات)) الحديثة. في هذا الإطار، ظهر نظام [جديد](/tag/جديد) يدعى [PALS](/tag/pals) (Power-Aware [LLM](/tag/llm) Serving) يهدف إلى تغيير قواعد [اللعبة](/tag/اللعبة) من خلال دمج القدرة الطاقية كأداة [تحكم](/tag/تحكم) فعالة أثناء [معالجة البيانات](/tag/معالجة-[البيانات](/tag/البيانات)).

لم تعد [الطاقة](/tag/الطاقة) مجرد قيد ثابت، بل أصبحت عنصراً قابلاً للتحكم يتمt optimizado من خلال التوازن بين حجم الحزمة (batch size) وأداء [معالجة البيانات](/tag/معالجة-[البيانات](/tag/البيانات)). يعتمد نظام [PALS](/tag/pals) على [نماذج خفيفة](/tag/[نماذج](/tag/نماذج)-خفيفة) الوزن للأداء والطاقة، بالإضافة إلى نظام [تحكم](/tag/تحكم) يعتمد على ردود الفعل لاختيار التكوينات التي تلبي [معايير الأداء](/tag/[معايير](/tag/معايير)-[الأداء](/tag/الأداء)) المطلوبة بينما تعظم [الكفاءة الطاقية](/tag/[الكفاءة](/tag/الكفاءة)-الطاقية).

الأهم أن هذا النظام تم تطبيقه ضمن إطار [عمل](/tag/عمل) قائم يسمى vLLM، حيث أظهر فاعلية ملحوظة من دون الحاجة إلى إعادة [تدريب النماذج](/tag/[تدريب](/tag/تدريب)-[النماذج](/tag/النماذج)) أو تغيير [واجهات](/tag/واجهات) [البرمجة](/tag/البرمجة). وقد أظهرت النتائج تحسيناً في [كفاءة](/tag/كفاءة) استهلاك [الطاقة](/tag/الطاقة) بنسبة تصل إلى 26.3%، وتقليص الانتهاكات المتعلقة بجودة الخدمة (QoS) بمعدل يتراوح بين أربع إلى سبع مرات، وذلك في ظل [قيود](/tag/قيود) [الطاقة](/tag/الطاقة) الديناميكية.

تسلط هذه النتائج الضوء على أهمية دمج [تحكم](/tag/تحكم) [الطاقة](/tag/الطاقة) مباشرة في أوقات معالجة [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) الكبيرة، مما يفتح المجال أمام [أنظمة](/tag/أنظمة) [ذكاء اصطناعي](/tag/ذكاء-اصطناعي) قادرة على [التفاعل](/tag/التفاعل) مع [الشبكات الكهربائية](/tag/[الشبكات](/tag/الشبكات)-الكهربائية) بكفاءة أكبر.