في عصر الذكاء الاصطناعي، أصبحت [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) تُستخدم بشكل يومي من قبل ملايين المستخدمين، حيث تتجاوز [تكاليف](/tag/تكاليف) توفيرها 700,000 دولار يومياً. تعكس كل عملية طلب استخدام هذه [النماذج](/tag/النماذج) احتياجاً شديداً لقدرة [الاستدلال](/tag/الاستدلال) التدريجي، مما يجعل [جدولة](/tag/جدولة) وحدات المعالجة الرسومية ([GPU](/tag/gpu)) عنصراً مهماً لتقليل زمن الاستجابة والتكلفة.

تُعاني هذه [النماذج](/tag/النماذج) من مشكلة نمو [الذاكرة](/tag/الذاكرة) التلقائية، حيث تؤدي الرموز المنتجة إلى [توسع](/tag/توسع) [ذاكرة](/tag/ذاكرة) [التخزين](/tag/التخزين) المؤقت ([KV Cache](/tag/kv-cache))، مما قد يتسبب في فقدان الطلبات قيد المعالجة وهدر عمليات [الحساب](/tag/الحساب) السابقة. لمعالجة هذه المشكلة، تم صياغة [استدلال](/tag/استدلال) [النماذج](/tag/النماذج) كمسألة [جدولة](/tag/جدولة) [ديناميكية](/tag/ديناميكية) متعددة المراحل مع اعتبار نمو [الذاكرة](/tag/الذاكرة) وقيود [الذاكرة](/tag/الذاكرة) في وحدات المعالجة.

قُدِّمت [نموذج ديناميكي](/tag/[نموذج](/tag/نموذج)-ديناميكي) "Fluid [Model](/tag/model)" الذي يحدد مكونات الدفعة في حالة توازن ومتطلبات [الذاكرة](/tag/الذاكرة) ومنطقة [الاستقرار](/tag/الاستقرار). مستفيدين من هذا النموذج، صمم الباحثون [خوارزمية](/tag/خوارزمية) "WAIT" وهي قاعدة قبول تعتمد على عتبات محددة لطول المخرجات المعروفة، وأيضًا "Nested WAIT" التي تمدد هذه القاعدة لتشمل الأطوال المجهولة عن طريق [تنظيم](/tag/تنظيم) كيفية تقدم الطلبات [عبر](/tag/عبر) مراحل [فك](/tag/فك) الشفرة.

تشير المحاكيات التجريبية، مثل "Vidur" المصممة لنموذج "[Llama](/tag/llama)-2-7B" على جهاز معالجة "A100"، إلى أن هذه [السياسات](/tag/السياسات) [توسع](/tag/توسع) المجال الثابت المرصود عمليًا مقارنةً بالخوارزميات المستخدمة على نطاق واسع، مما يقلل من زمن الاستجابة، خصوصًا في ظروف التحميل العالي.

في الختام، تساهم هذه التطورات في بلوغ أهداف أكبر في [تحسين](/tag/تحسين) [استدلال](/tag/استدلال) [نماذج اللغات](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)) الضخمة، مما يمهد الطريق لمستقبل أكثر [كفاءة](/tag/كفاءة) للتفاعل بين [الإنسان والآلة](/tag/الإنسان-والآلة).
ما رأيكم في هذه [الابتكارات](/tag/الابتكارات) الحديثة من مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي)؟ شاركونا في [التعليقات](/tag/التعليقات).