تعتبر الوحدات المعالجة العصبية المكانية (NPUs) بمثابة ثورة في عالم الذكاء الاصطناعي، حيث توفر منصة مثالية وفعالة من حيث استهلاك الطاقة لنشر نماذج اللغات الضخمة (LLMs) على حافة الشبكة. على الرغم من ذلك، يظل نشر هذه النماذج بشكل كامل على مثل هذه الأجهزة متطلباً لجهود بشرية مكثفة. ومع تطور وكلاء الذكاء الاصطناعي، بدأنا نشهد تحسناً في التكلفة، إلا أن الكثير من الدراسات الحالية لا تزال تركز بشكل أساسي على تحسينات فردية بدلاً من النشر الشامل للـ LLMs على الوحدات المحدودة الموارد.
نقدم في هذا التقرير منهجية مكونة من مرحلتين، تم تنفيذها على معالج AMD XDNA 2، حيث ننتقل من تطوير توجيهي بشري إلى استعادة الاستقلالية من قبل الوكلاء. في المرحلة الأولى، قمنا بتطوير نشر مرجعي لنموذج Llama-3.2-1B بمساعدة الوكلاء المدعومين بتوجيه إنساني. وقد حقق التنفيذ الناتج سرعة تفوق محققة بنسبة 2.2 ضعف خلال مرحلة التعبئة و4.0 ضعف خلال مرحلة فك التشفير مقارنة بالمعايير المحسنة باليد. وتم توثيق مسار التحسين والدروس المستفادة بشكل منظم.
في المرحلة الثانية، قمنا بتلخيص الوثائق إلى نظام مهارات للوكلاء يتكون من ثماني مراحل، حيث تنظم مهارات التحسين وتصحيح الأخطاء مع فرض دقة عددية صارمة في كل مرحلة. باستخدام نظام مهارات الوكلاء لدينا، تمكننا من نشر ثمانية نماذج لغوية إضافية من نوع فك التشفير فقط (Llama-3.2-3B، SmolLM2-1.7B، Qwen2.5-{0.5B، 1.5B، 3B}، Qwen3-{0.6B، 1.7B، 4B}) بشكل كامل على معالج AMD XDNA 2 باستخدام مجموعة المترجم المفتوح المصدر.
إلى علمنا، لم يتم نشر هذه النماذج مسبقاً على وحدات المعالجة العصبية من AMD عبر أي مجموعة برمجيات مفتوحة المصدر. أكمل كل نشر في غضون 0.5-4 ساعات من وقت الوكلاء مع تكاد تكون بدون توجيه بشري، واجتاز البوابات المعنية بالدقة العددية، مما يدل على التعميم الوظيفي على نماذج جديدة لم يتم التعامل معها مسبقاً. ونجح ثلاثة من النماذج الثمانية في تحقيق أو تجاوز الأداء المستدام لنموذج Llama-3.2-1B المرجعي، مما يشير إلى أن التطبيقات الناتجة يمكن أن تكون ذات تنافسية عالية دون الحاجة إلى المزيد من التعديلات البشرية الخاصة بالنموذج.
من التوجيه البشري إلى الاستقلالية: نظام مهارات الوكلاء لنشر نماذج لغات ضخمة بشكل متكامل
تقدم الوحدات المعالجة العصبية المكانية (NPUs) منصة فعالة من حيث الطاقة لنشر نماذج اللغات الضخمة (LLMs). بدعم من نظام مهارات الوكلاء، تمكنا من تحقيق نشر مستقل وفعال لنماذج جديدة في غضون ساعات وبأقل تكلفة بشرية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
