في عالم الذكاء الاصطناعي، تأتي الابتكارات تلو الأخرى لتحويل الطريقة التي نتعامل بها مع البيانات والنماذج. **DMax** هو نموذج جديد يعد بتغيير قواعد اللعبة في فك الشيفرات بالتوازي باستخدام نماذج اللغة المتقدمة (dLLMs).

إن أحد التحديات الكبيرة التي تواجهها هذه النماذج هو تراكم الأخطاء خلال عملية فك الشيفرة. ولكن مع DMax، يتم حماية جودة النواتج من هذا التراكم بفضل أسلوب فك الشيفرة المبتكر الذي يعتمد على الاستقلالية والتكرارية. بدلاً من الأساليب التقليدية التي تستخدم الانتقال من القناع إلى الرمز، يستخدم DMax نهجًا يرتكز على تحسين ذاتي تدريجي.

في جوهر هذا النظام الجديد نجد استراتيجية تدريب فريدة تُعرف باسم **On-Policy Uniform Training**، والتي تعزز التنسيق بين النماذج المقنعة والموحدة، مما يساعد النموذج على استعادة الرموز النقية من المدخلات المقنعة وتوقعاته الخاطئة السابقة.

ومع هذه الأساس، تقدم DMax أيضًا أسلوب **Soft Parallel Decoding** الذي يمثل كل حالة فك شيفرة متوسطة كتداخل بين تمثيل الرموز المرشحة والتمثيلات المقنعة، مما يتيح للموديل تحسين ذاته في فضاء التمثيل.

أظهرت التجارب على مجموعة متنوعة من المعايير أن DMax يُحقق تحسينات ملحوظة؛ فهو يرفع معدل الأداء (TPF) على **GSM8K** من 2.04 إلى 5.47، وفي نفس الوقت يحافظ على دقة النتائج. وعند اختبار النموذج على **MBPP**، تم زيادة معدل الأداء من 2.71 إلى 5.86، دون التأثير على الجودة. في إطار المعالجة، يحقق النموذج أداءً بمعدل **1,338 TPS** باستخدام بطاقتي **H200**.

يمكنك الاطلاع على الشفرة المصدرية لهذا الابتكار الرائع على رابط GitHub. ما رأيكم في هذا التطور المدهش؟ شاركونا في التعليقات.