في عصر الذكاء الاصطناعي، أصبحت [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) تُستخدم بشكل يومي من قبل ملايين المستخدمين، حيث تتجاوز [تكاليف](/tag/تكاليف) توفيرها 700,000 دولار يومياً. تعكس كل عملية طلب استخدام هذه [النماذج](/tag/النماذج) احتياجاً شديداً لقدرة [الاستدلال](/tag/الاستدلال) التدريجي، مما يجعل [جدولة](/tag/جدولة) وحدات المعالجة الرسومية ([GPU](/tag/gpu)) عنصراً مهماً لتقليل زمن الاستجابة والتكلفة.
تُعاني هذه [النماذج](/tag/النماذج) من مشكلة نمو [الذاكرة](/tag/الذاكرة) التلقائية، حيث تؤدي الرموز المنتجة إلى [توسع](/tag/توسع) [ذاكرة](/tag/ذاكرة) [التخزين](/tag/التخزين) المؤقت ([KV Cache](/tag/kv-cache))، مما قد يتسبب في فقدان الطلبات قيد المعالجة وهدر عمليات [الحساب](/tag/الحساب) السابقة. لمعالجة هذه المشكلة، تم صياغة [استدلال](/tag/استدلال) [النماذج](/tag/النماذج) كمسألة [جدولة](/tag/جدولة) [ديناميكية](/tag/ديناميكية) متعددة المراحل مع اعتبار نمو [الذاكرة](/tag/الذاكرة) وقيود [الذاكرة](/tag/الذاكرة) في وحدات المعالجة.
قُدِّمت [نموذج ديناميكي](/tag/[نموذج](/tag/نموذج)-ديناميكي) "Fluid [Model](/tag/model)" الذي يحدد مكونات الدفعة في حالة توازن ومتطلبات [الذاكرة](/tag/الذاكرة) ومنطقة [الاستقرار](/tag/الاستقرار). مستفيدين من هذا النموذج، صمم الباحثون [خوارزمية](/tag/خوارزمية) "WAIT" وهي قاعدة قبول تعتمد على عتبات محددة لطول المخرجات المعروفة، وأيضًا "Nested WAIT" التي تمدد هذه القاعدة لتشمل الأطوال المجهولة عن طريق [تنظيم](/tag/تنظيم) كيفية تقدم الطلبات [عبر](/tag/عبر) مراحل [فك](/tag/فك) الشفرة.
تشير المحاكيات التجريبية، مثل "Vidur" المصممة لنموذج "[Llama](/tag/llama)-2-7B" على جهاز معالجة "A100"، إلى أن هذه [السياسات](/tag/السياسات) [توسع](/tag/توسع) المجال الثابت المرصود عمليًا مقارنةً بالخوارزميات المستخدمة على نطاق واسع، مما يقلل من زمن الاستجابة، خصوصًا في ظروف التحميل العالي.
في الختام، تساهم هذه التطورات في بلوغ أهداف أكبر في [تحسين](/tag/تحسين) [استدلال](/tag/استدلال) [نماذج اللغات](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)) الضخمة، مما يمهد الطريق لمستقبل أكثر [كفاءة](/tag/كفاءة) للتفاعل بين [الإنسان والآلة](/tag/الإنسان-والآلة).
ما رأيكم في هذه [الابتكارات](/tag/الابتكارات) الحديثة من مجال [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي)؟ شاركونا في [التعليقات](/tag/التعليقات).
تحسين استدلال نماذج اللغات الضخمة: جدولة ديناميكية فعالة تحت قيود الذاكرة
تعزيز تجربة استخدام نماذج اللغات الضخمة (Large Language Models) يتطلب معالجة فعّالة لطريقة جدولة الاستدلال. تعرفوا على كيفية تحقيق هذا الهدف من خلال نماذج جديدة للجدولة الديناميكية التي تتجاوز تحديات نمو الذاكرة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
