في عالم الذكاء الاصطناعي، تتطلب نقل خوارزميات التعلم العميق إلى معالجات تسريع جديدة جهودًا متكررة للبناء على تحسينات عميقة، مثل تقنيات الكم (quantization) وتعديل الوصول إلى الذاكرة. هذه العملية اليدوية تُعد من مصادر الإعاقة الرئيسية في تطوير التطبيقات، حيث يحتاج المطورون إلى تكرار عمليات الاختبار والتعديل لتناسب قيود الأجهزة المختلفة. وقد تم الإعلان عن Xe-Forge كحل مبتكر يعمل على أتمتة هذه العملية.
تستفيد Xe-Forge من سلسلة من المراحل المُعززة بنماذج لغوية ضخمة (LLM)، حيث تستطيع أن تُطبق حتى تسع مراحل من التحسينات على كل نواة Triton بشكل تلقائي. الابتكارات تشمل إعادة هيكلة الخوارزمية، ودمج العمليات، وتعديل وفقًا لمتطلبات معمارية Intel، مع وجود وكيل خاص يُدعى Chain-of-Verification-and-Refinement (CoVeR) يتحكم في العملية بالكامل. يقوم هذا النظام بإنشاء مرشحات للتحسين، اختبارها على الأجهزة الفعلية، وتحديثها بناءً على النتائج.
عبر تقييم Xe-Forge على 97 نواة من مستوى KernelBench، أظهر النظام تحسينًا بمتوسط مكسب هندسي 1.17x مقارنةً بأداء PyTorch. الغالبية العظمى من النوى، أي 67% منها، قد شهدت تحسينات واضحة، فيما وصل مكسب بعض النوى إلى 82x. هذا يُظهر بوضوح كيف يمكن أن تُحدث المعرفة المنهجية في المجال مع التحقق من تقنيات الأجهزة ثورة في كيفية تطبيق الخوارزميات على أجهزة التسريع الجديدة.
هذه التطورات ليست مجرد تحسينات عابرة، بل تمنح المطورين الفرصة لتوسيع نطاق مشاريعهم واستغلال كامل إمكانيات الأجهزة الحديثة.
ماذا عنكم؟ هل تعتقدون أن هذه التكنولوجيا ستغير طريقة تطوير تطبيقات الذكاء الاصطناعي في المستقبل؟ شاركونا آرائكم في التعليقات!
إطلاق Xe-Forge: ثورة في تحسين نوى الذكاء الاصطناعي لأداء أفضل على معالجات Intel GPU!
أعلن الباحثون عن إطلاق Xe-Forge، أداة مبتكرة تعتمد على نماذج اللغات الضخمة (LLM) لتبسيط عملية تحسين نوى الذكاء الاصطناعي. تتيح هذه الأداة خصوصًا تحسين الكفاءة بشكل كبير على معالجات Intel GPU، مما يسرع من زمن تنفيذ الخوارزميات المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
