في عالم تحسين أداء نوى المعالجات الرسومية (GPU)، يمثل daVinci-kernel خطوة رائدة نحو تحقيق الكفاءة العالية. يعتمد هذا النظام المتطور على إطار تعلم معزز (Reinforcement Learning) يدمج بين اكتشاف المهارات واستغلالها، من خلال مكتبة مهارات ديناميكية تتطور باستمرار.
يُدرب daVinci-kernel ثلاثة عملاء متعاونين بمشاركة نفس الهيكل الأساسي الذي يعتمد على نماذج اللغات الضخمة (Large Language Models). العميل الأول هو "عميل اختيار المهارات"، الذي يبحث عن التقنيات المناسبة باستخدام خوارزمية BM25 وإعادة ترتيب النتائج بواسطة نموذج اللغة. أما العميل الثاني، "عميل السياسة"، فيقوم بإنشاء نوى متعددة المراحل بلغة CUDA/Triton بناءً على المهارات المختارة. وأخيرًا، يأتي "عميل ملخص المهارات" الذي يعمل على تقطير التجارب الناجحة إلى مهارات قابلة لإعادة الاستخدام.
يُضاف إلى النظام مهارات جديدة فقط بعد التحقق التجريبي الذي يؤكد تحسينات قابلة للتكرار في السرعة، مما يعزز من موثوقيته.
تم اختبار daVinci-kernel-14B على مجموعة بيانات KernelBench، حيث حقق نتائج مبهرة بلغت 37.2%، 70.6%، و32.2% لمستويات الأداء الأول والثاني والثالث. هذه النتائج تتخطى أداء أقوى نموذج سابق مدرب على التعلم المعزز، Dr.Kernel-14B.
يمثل daVinci-kernel رمزًا للتقدم التكنولوجي في عالم المعالجات الرسومية، وقد يعيد تشكيل طريقة تحسين أداء التطبيقات الرسومية في المستقبل. كيف ترون تأثير هذه التقنية على الصناعة؟ شاركونا آراءكم في التعليقات!