في عالم [النماذج اللغوية](/tag/[النماذج](/tag/النماذج)-اللغوية) الحديثة (Language [Models](/tag/models))، يبدو أن النشر (Diffusion) أصبح بمثابة الصيحة الجديدة، حيث تزايد الاهتمام بصورة كبيرة بالنماذج المستندة إلى النشر خلال الفترة الأخيرة. لكن الجدال كان مستمراً حول فعالية النشر المستمر (Continuous Diffusion) مقارنة بنظائره التقليدية.لتحقيق ذلك، تم إعادة [تقييم](/tag/تقييم) [نموذج](/tag/نموذج) Plaid، وهو [نموذج لغوي](/tag/[نموذج](/tag/نموذج)-لغوي) مستمر قائم على الاحتمالية (Likelihood-based Continuous Diffusion Language [Model](/tag/model))، وتطوير [نموذج جديد](/tag/[نموذج](/tag/نموذج)-[جديد](/tag/جديد)) يسمى [RePlaid](/tag/replaid). هذا النموذج يتميز بتوافق هيكلي مع [النماذج](/tag/النماذج) التقليدية، مما يجعله لأول مرة يضع قانوناً للتوسع (Scaling Law) يتساوى مع ما تقدمه [النماذج](/tag/النماذج) التقليدية.
النموذج [RePlaid](/tag/replaid) يبهرنا بأدائه، حيث يقلل [الفجوة](/tag/الفجوة) الحسابية حتى 20 مرة مقارنة بالنماذج التلقائية، ويتفوق على [نموذج](/tag/نموذج) Duo مع تقليل [عدد](/tag/عدد) المعلمات، كما يُظهر تفوقه على MDLM في وضعية الإفراط في [التدريب](/tag/التدريب).
إن الاختبارات التجريبية أظهرت أن RePlaid، على سبيل المثال، حقق أفضل [أداء](/tag/أداء) على مجموعة OpenWebText مسجلاً نقطة جديدة في الحد الأدنى لنسبة احتمال فقدان [المعلومات](/tag/المعلومات) (PPL)، حيث وصل إلى 22.1.
تقدم هذه النتائج دليلاً قوياً على أن النشر المستمر، عند تدريبه باستخدام أسلوب الاحتمالية، يعتبر بديلاً استثنائياً وقابلاً للتوسع بالمقارنة مع [النماذج](/tag/النماذج) التقليدية.
كما يتم تقديم [رؤى](/tag/رؤى) [نظرية](/tag/نظرية) لفهم [ميزات](/tag/ميزات) [التدريب](/tag/التدريب) القائم على الاحتمالية، حيث أظهرت الدراسات أن [تحسين](/tag/تحسين) جدول الضوضاء (Noise Schedule) يقلل من تباين ما يُعرف بكفاءة [التعلم](/tag/التعلم) (ELBO's variance)، مما يؤدي إلى توزيع متساوٍ لصعوبة [إزالة الضوضاء](/tag/إزالة-الضوضاء) دون إعادة تهيئة خاصة لكل حالة.
بلا شك، فإن النجاح الكبير في [تحسين](/tag/تحسين) التضمينات وتعزيز الهيكليات المهيكلة من خلال الاحتمالية قد أدت إلى [تحقيق](/tag/تحقيق) مكاسب واسعة في الكفاءة، مما يجعل [النماذج](/tag/النماذج) المستمرة خياراً قوياً. كيف ترون هذا التطور؟ هل تعتقدون أن النشر المستمر سيغلب على [النماذج](/tag/النماذج) التقليدية؟
ثورة النشر المستمر: كيف تتفوق النماذج اللغوية المستمرة على التقليدية
في تطور مثير، أثبت نموذج RePlaid المستند إلى النشر المستمر كفاءته في منافسة النماذج التقليدية. نتائج البحث تُظهر قدرة استثنائية على التوليد اللغوي بجودة أعلى وبتكاليف حسابية أقل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
