في عالم الذكاء الاصطناعي، يتطلب [تدريب](/tag/تدريب) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) ([LLM](/tag/llm)) حاليًا الاعتماد على مجموعات ضخمة من [وحدات معالجة الرسوميات](/tag/وحدات-معالجة-الرسوميات) ([GPUs](/tag/gpus)) التي تصل إلى آلاف الوحدات. ورغم أن هذه [البنية التحتية](/tag/البنية-التحتية) تسهل [تحقيق](/tag/تحقيق) [إنجازات](/tag/إنجازات) سريعة في [تطوير](/tag/تطوير) النماذج، إلا أن هذه [العملية](/tag/العملية) تتسم بالتعقيد والتكلفة العالية بسبب الحاجة إلى الوصول المتكرر إلى هذه [المجموعات](/tag/المجموعات) الضخمة لتشخيص المشكلات أو [تقييم](/tag/تقييم) التحسينات.
ظهرت مفهوم [جديد](/tag/جديد) يدعى PrismLLM، والذي يهدف إلى فصل عملية التنفيذ على نطاق واسع عن الحاجة للوصول إلى هذه [المجموعات](/tag/المجموعات) الكبيرة من [وحدات معالجة الرسوميات](/tag/وحدات-معالجة-الرسوميات). [التكنولوجيا](/tag/التكنولوجيا) الجديدة تسمح للمهندسين بإجراء [تجارب](/tag/تجارب) وتقييم [أداء](/tag/أداء) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) بدقة باستخدام [عدد](/tag/عدد) قليل من وحدات معالجة الرسوميات، مما يسهل عليهم [مراقبة](/tag/مراقبة) [سلوكيات النماذج](/tag/[سلوكيات](/tag/سلوكيات)-[النماذج](/tag/النماذج)) بشكل فعال.
يعتمد PrismLLM على إنشاء خريطة [تنفيذ](/tag/تنفيذ) عالية [الدقة](/tag/الدقة) من خلال استخدام نهج يعتمد على تقسيم المهام، مما يضمن التقاط كل جوانب [الحساب](/tag/الحساب) والتواصل والاعتماد المطلوبة. بفضل [تقنية](/tag/تقنية) [المحاكاة](/tag/المحاكاة) الهجينة التي يقدمها PrismLLM، يمكن اختيار بعض الأنماط لتنفيذ البرنامج الأصلي، بينما يتم معالجة الجوانب الأخرى كمشاركين افتراضيين.
أظهرت [التجارب](/tag/التجارب) التي أجريت على حمولات [تدريب](/tag/تدريب) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) [دقة](/tag/دقة) PrismLLM في إعادة إنتاج [أداء](/tag/أداء) وذاكرة النماذج، حيث حقق متوسط [خطأ](/tag/خطأ) قدره 0.58% في زمن التكرار و أقل من 0.01% في استخدام [الذاكرة](/tag/الذاكرة) العظمى لوحدات معالجة الرسوميات. وبفضل هذه [التقنية](/tag/التقنية) الرائدة، يمكن لمحاكاة PrismLLM تقليد مجموعات تصل إلى 8192 وحدة معالجة رسومية باستخدام أقل من 1% من الوحدات الفيزيائية المطلوبة في النشر الأصلي.
إن التقدم في [تكنولوجيا](/tag/تكنولوجيا) PrismLLM يمثل خطوة هائلة [نحو](/tag/نحو) تبسيط وتعزيز [الكفاءة](/tag/الكفاءة) في عالم [تدريب](/tag/تدريب) [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي). ما رأيكم في هذا التطور في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي)؟ شاركونا في [التعليقات](/tag/التعليقات).
ثورة في تدريب نماذج اللغات: كيف يمكن لـ PrismLLM تحقيق الأداء العالي باستخدام عدد قليل من وحدات معالجة الرسوميات؟
تقدم PrismLLM نموذجًا مبتكرًا يتيح تدريب نماذج اللغات الكبيرة (LLM) بكفاءة عالية دون الحاجة إلى مجموعات ضخمة من وحدات معالجة الرسوميات. تكنولوجيا PrismLLM تسمح للمهندسين برؤية سلوكيات النماذج بدقة عالية باستخدام عدد قليل من الموارد.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
