في عالم الذكاء الاصطناعي، تأتي [الابتكارات](/tag/الابتكارات) تلو الأخرى لتحويل الطريقة التي نتعامل بها مع [البيانات](/tag/البيانات) والنماذج. **DMax** هو [نموذج جديد](/tag/[نموذج](/tag/نموذج)-[جديد](/tag/جديد)) يعد بتغيير قواعد اللعبة في [فك](/tag/فك) الشيفرات بالتوازي باستخدام [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) المتقدمة (dLLMs).
إن أحد التحديات الكبيرة التي تواجهها هذه [النماذج](/tag/النماذج) هو تراكم [الأخطاء](/tag/الأخطاء) خلال عملية [فك الشيفرة](/tag/[فك](/tag/فك)-الشيفرة). ولكن مع DMax، يتم [حماية](/tag/حماية) جودة النواتج من هذا التراكم بفضل أسلوب [فك الشيفرة](/tag/[فك](/tag/فك)-الشيفرة) المبتكر الذي يعتمد على [الاستقلالية](/tag/الاستقلالية) والتكرارية. بدلاً من الأساليب التقليدية التي تستخدم الانتقال من القناع إلى الرمز، يستخدم DMax نهجًا يرتكز على [تحسين](/tag/تحسين) [ذاتي](/tag/ذاتي) تدريجي.
في جوهر هذا النظام الجديد نجد [استراتيجية](/tag/استراتيجية) [تدريب](/tag/تدريب) فريدة تُعرف باسم **On-Policy Uniform Training**، والتي تعزز [التنسيق](/tag/التنسيق) بين [النماذج](/tag/النماذج) المقنعة والموحدة، مما يساعد النموذج على استعادة الرموز النقية من المدخلات المقنعة وتوقعاته الخاطئة السابقة.
ومع هذه الأساس، تقدم DMax أيضًا أسلوب **Soft Parallel Decoding** الذي يمثل كل حالة [فك](/tag/فك) شيفرة متوسطة كتداخل بين تمثيل الرموز المرشحة والتمثيلات المقنعة، مما يتيح للموديل [تحسين](/tag/تحسين) ذاته في [فضاء](/tag/فضاء) [التمثيل](/tag/التمثيل).
أظهرت [التجارب](/tag/التجارب) على مجموعة متنوعة من [المعايير](/tag/المعايير) أن DMax يُحقق [تحسينات](/tag/تحسينات) ملحوظة؛ فهو يرفع معدل [الأداء](/tag/الأداء) (TPF) على **GSM8K** من 2.04 إلى 5.47، وفي نفس الوقت يحافظ على [دقة النتائج](/tag/[دقة](/tag/دقة)-النتائج). وعند اختبار النموذج على **MBPP**، تم زيادة معدل [الأداء](/tag/الأداء) من 2.71 إلى 5.86، دون التأثير على الجودة. في إطار المعالجة، يحقق النموذج أداءً بمعدل **1,338 TPS** باستخدام بطاقتي **H200**.
يمكنك الاطلاع على الشفرة المصدرية لهذا [الابتكار](/tag/الابتكار) الرائع على [رابط GitHub](https://github.com/czg1225/DMax). ما رأيكم في هذا التطور المدهش؟ شاركونا في [التعليقات](/tag/التعليقات).
DMax: ثورة في فك الشيفرات الموازية لنماذج اللغة المتقدمة!
تقدم DMax أسلوبًا جديدًا في فك الشيفرات بالتوازي، مما يقلل من تراكم الأخطاء ويحافظ على جودة النواتج. هذا الابتكار يعد طفرة في نماذج اللغة المتقدمة ويحقق أداءً محسناً يحبس الأنفاس.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
