لم يكن يُعتقد يومًا أن بالإمكان تجاوز الأعراف التقليدية للحوسبة الفائقة (High-Performance Computing) التي تعتبر الدائرة الدقيقة FP64 المعيار الذهبي في الحسابات العلمية. لكن دراسة جديدة عرضت نتائج مثيرة تكشف عن قوة مذهلة للدوائر المخصصة لحسابات FP8، وكيف يمكن أن تصبح الخيار الأفضل للحوسبة الفائقة.
تستند هذه الدراسة على أداء وحدات معالجة الرسوميات (GPUs) من الجيل B300 وما بعده، حيث تتفوق FP8 مع أسلوب Ozaki II القائم على نظرية الباقي الصيني، مما يتيح تنفيذًا دقيقًا تمامًا بالاعتماد على ذاكرة منخفضة.
أظهرت النتائج أن وحدة NVIDIA Blackwell Ultra (B300) ليست قادرة إلا على تحقيق سرعة 1.3 TFLOPS فقط عند الاعتماد على FP64، مما يمثل تراجعًا بنحو 31 مرة مقارنة بالجيل السابق B200. هذه المعطيات توضح تغيّر الاتجاه في نهج الحسابات القائمة على FP64، حيث تصبح المهام المرتبطة بالذاكرة، مثل SpMV وGEMV، مقيدة بالحوسبة بشكل أكبر.
تقدم هذه الدراسة أربعة مساهمات رئيسية:
1. نموذج تحليلي موحد يعتمد على توازن الذاكرة (Tensor-Memory Equilibrium - TME) الذي يعزز التقييمات التقليدية بإضافة معايير جديدة لقياس الأداء.
2. تحديد عملية دمج البيانات على مستوى السجل كمحرك رئيسي يجعله أكثر فعالية.
3. تقدير قدرة أسلوب Ozaki II على تعزيز FP64 بمحاكاة تصل إلى 500 TFLOPS للجيل B300، مما يتجاوز الحواجز التقليدية.
4. مقارنة أداء Ozaki II مع H100 في مختلف الأحمال، حيث أظهر تفوقًا ملحوظًا رغم الانخفاض البالغ الذي يتطلبه FP64.
تحظى كل فئة من فئات الكيرنل على B300 بإمكانات جزائية، مما يثبت أنه مع الابتكارات الجديدة مثل FP8 وأسلوب Ozaki II، يمكن للحوسبة الفائقة أن تدخل عصرًا جديدًا بعيدًا عن الأساطير القديمة حول FP64. كما أن هذه المعطيات قد تفتح آفاقًا جديدة في مجال الحوسبة.
ما رأيكم في هذا التطور المذهل في حوسبة الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات!
FP8: المعجزة الجديدة في حسابات الحواسيب الفائقة التي تتحدى مفهوم FP64!
يدحض بحث جديد الأسطورة حول ضرورة استخدام دائرة FP64 في الحوسبة الفائقة، مُبرزًا قوة FP8 وأهميتها بالاستعانة بأسلوب Ozaki II. قد يكون FP8 هو الحل الأمثل لحسابات الحواسيب الفائقة!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
