في عالم الذكاء الاصطناعي، تأتي [الابتكارات](/tag/الابتكارات) تلو الأخرى لتحويل الطريقة التي نتعامل بها مع [البيانات](/tag/البيانات) والنماذج. **DMax** هو [نموذج جديد](/tag/[نموذج](/tag/نموذج)-[جديد](/tag/جديد)) يعد بتغيير قواعد اللعبة في [فك](/tag/فك) الشيفرات بالتوازي باستخدام [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) المتقدمة (dLLMs).

إن أحد التحديات الكبيرة التي تواجهها هذه [النماذج](/tag/النماذج) هو تراكم [الأخطاء](/tag/الأخطاء) خلال عملية [فك الشيفرة](/tag/[فك](/tag/فك)-الشيفرة). ولكن مع DMax، يتم [حماية](/tag/حماية) جودة النواتج من هذا التراكم بفضل أسلوب [فك الشيفرة](/tag/[فك](/tag/فك)-الشيفرة) المبتكر الذي يعتمد على [الاستقلالية](/tag/الاستقلالية) والتكرارية. بدلاً من الأساليب التقليدية التي تستخدم الانتقال من القناع إلى الرمز، يستخدم DMax نهجًا يرتكز على [تحسين](/tag/تحسين) [ذاتي](/tag/ذاتي) تدريجي.

في جوهر هذا النظام الجديد نجد [استراتيجية](/tag/استراتيجية) [تدريب](/tag/تدريب) فريدة تُعرف باسم **On-Policy Uniform Training**، والتي تعزز [التنسيق](/tag/التنسيق) بين [النماذج](/tag/النماذج) المقنعة والموحدة، مما يساعد النموذج على استعادة الرموز النقية من المدخلات المقنعة وتوقعاته الخاطئة السابقة.

ومع هذه الأساس، تقدم DMax أيضًا أسلوب **Soft Parallel Decoding** الذي يمثل كل حالة [فك](/tag/فك) شيفرة متوسطة كتداخل بين تمثيل الرموز المرشحة والتمثيلات المقنعة، مما يتيح للموديل [تحسين](/tag/تحسين) ذاته في [فضاء](/tag/فضاء) [التمثيل](/tag/التمثيل).

أظهرت [التجارب](/tag/التجارب) على مجموعة متنوعة من [المعايير](/tag/المعايير) أن DMax يُحقق [تحسينات](/tag/تحسينات) ملحوظة؛ فهو يرفع معدل [الأداء](/tag/الأداء) (TPF) على **GSM8K** من 2.04 إلى 5.47، وفي نفس الوقت يحافظ على [دقة النتائج](/tag/[دقة](/tag/دقة)-النتائج). وعند اختبار النموذج على **MBPP**، تم زيادة معدل [الأداء](/tag/الأداء) من 2.71 إلى 5.86، دون التأثير على الجودة. في إطار المعالجة، يحقق النموذج أداءً بمعدل **1,338 TPS** باستخدام بطاقتي **H200**.

يمكنك الاطلاع على الشفرة المصدرية لهذا [الابتكار](/tag/الابتكار) الرائع على [رابط GitHub](https://github.com/czg1225/DMax). ما رأيكم في هذا التطور المدهش؟ شاركونا في [التعليقات](/tag/التعليقات).