تسعى المجتمعات التقنية دائماً لتطوير أدوات جديدة تعزز من إمكانيات المعالجات الرسومية، ومع ظهور Argus، يبدو أن هذا الهدف تحقق بشكل ملحوظ. يعتمد Argus على نماذج لغات كبيرة (Large Language Models) لتوليد شفرات GPUs التي تؤدي وظيفتها بكفاءة، رغم أن أدائها ما زال أدنى من المكتبات التي تم تحسينها يدوياً، خصوصاً في العمليات الهامة مثل ضرب المصفوفات (matrix multiplication) وتركيز الانتباه (attention).
يُعد الأداء القوي للمعالجات الرسومية (GPUs) متوقفًا على أداء التنسيق بين مجموعة من التحسينات المترابطة، والتي تتضمن عمليات التقطيع (tiling)، وتخزين الذاكرة المشتركة (shared-memory staging)، وإدارة الأنابيب البرمجية (software pipelining)، وتنظيم التعليمات (instruction scheduling). لكن النماذج الموجودة حالياً اعتادت الاعتماد على تقييمات ضئيلة من النجاح والفشل فقط، مما يعوق قدرتها على تشخيص انتهاكات القيود العامة.
وهنا يأتي دور Argus كحل مبتكر يعالج هذه المشكلة من خلال اعتماد ثوابت تدفق البيانات (data-flow invariants) التي تحدد كيفية تنسيق البيانات خلال تنفيذ الشفرة. يقدم Argus بيئة تطويرية جديدة بلغة بايثون، تعرض التعليمات البرمجية الخاصة بالأجهزة وسياسات المترجم، بينما تخفي التفاصيل الدنيا منها، وهو ما يضيف لمسة من الفعالية في التصميم.
مع Argus، يمكن للمبرمجين استخدام وظائف العلامات لنشر تعليقات رمزية على تدفق البيانات، مما يعزز قدرة المترجم على فرض قيود على العلاقات المهمة عند نقاط الاستخدام. وعندما تحدث انتهاكات، يوفر المترجم أمثلة محددة توضح المشكلة، مما يسهل عملية التشخيص وإجراء التعديلات اللازمة.
تم التحقق من الثوابت في وقت الترجمة عبر تفسير مجرد وارتفاع مستوى تكنولوجيا حل المعادلات (SMT solving) مما يضمن عدم حدوث أي تأخير خلال زمن التشغيل. يقوم مخطط التعزيز في السياق (in-context reinforcement learning planner) بتعلم كيفية اختيار التحسينات وتوليف الثوابت الفعالة، مستفيداً من قاعدة بيانات منسقة لتقنيات تحسين الـ GPU.
تم اختبار Argus على معالج AMD MI300X عبر مهام GEMM، تكنولوجيا الانتباه السريع (flash attention)، وعمليات Mixture-of-Experts (MoE)، والتي تشغل أكثر من 90% من زمن GPU في استدلال نماذج اللغات الكبيرة. وكانت النتائج مذهلة، حيث حققت الكودات المولدة بين 99% إلى 104% من إنتاجية الكودات المعدلة يدوياً، بجانب كونها أسرع حتى 1543 مرة من الأنظمة الحالية. ولا تتوقف إنجازات Argus عند هذا الحد، بل تتوسع لتشمل 200 مهمة عبر KernelBench، حيث نجحت في حل 100% من مشاكل المستوى 1 و90% من مشاكل المستوى 2.
بهذه الطريقة، يُعتبر Argus مفتاحاً لفتح آفاق جديدة في عالم تحسين الأداء البصري، لتكون نماذج الملفات الخوارزمية (algorithmic models) أكثر كفاءة ومنتجة. ماذا تتوقع أن يحدث في عالم التكنولوجيا بعد هذه التطورات؟ شاركونا آراءكم في التعليقات.
ثورة في أداء المعالجات الرسومية: تعرف على Argus والأمل الجديد في تحسين الأداء
تقديم Argus، إطار عمل مبتكر لتحسين أداء المعالجات الرسومية، يطرح حلولاً جديدة لتعزيز كفاءة تكويد المهام. مع Argus، يمكن الوصول إلى أداء عالي بشكل لم يسبق له مثيل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
