في عالم الذكاء الاصطناعي، تتوالى [الابتكارات](/tag/الابتكارات) التي تلبي الحاجات المتزايدة للذكاء والكفاءة. ومن بين هذه الابتكارات، تأتي [مشفرات](/tag/مشفرات) [التمثيل](/tag/التمثيل) التلقائية (RAE) لتقدم بديلاً واعداً للنماذج التقليدية مثل VAE. في ورقة بحثية حديثة، تم [استكشاف](/tag/استكشاف) عدة خيارات تصميمية للمشفرات وتوصل الباحثون لثلاثة اكتشافات رئيسية تعزز من أدائها.

أولاً، تم تحديد صيغة معممة حيث يتم تعريف [التمثيل](/tag/التمثيل) كمجموع لآخر k طبقات من المشفر بدلاً من الاعتماد على الطبقة النهائية فقط. هذا التغيير البسيط أحدث تحسناً ملحوظاً في إعادة [بناء](/tag/بناء) [البيانات](/tag/البيانات) دون الحاجة لضبط المشفر أو استخدام [بيانات](/tag/بيانات) متخصصة مثل النصوص أو [الصور](/tag/الصور) الشخصية.

ثانياً، تم [فحص](/tag/فحص) الافتراضات السائدة حول استخدام RAE كبديل لمحاذاة [التمثيل](/tag/التمثيل) (REPA)، التي تتطلب [تقطير](/tag/تقطير) نفس [التمثيل](/tag/التمثيل) إلى الطبقات الوسيطة. ومن خلال [تحليل](/tag/تحليل) تجريبي على نطاق واسع، تم الكشف عن أن RAE وREPA يعملان بشكل تكاملي، مما يمكّن الاستفادة من نفس [التمثيل](/tag/التمثيل) ككل من المشفر والهدف للطبقات الوسيطة.

أخيراً، كانت النسخة الأصلية من RAE تواجه صعوبات مع [توجيه](/tag/توجيه) بدون مصنف (CFG) وكانت تتطلب [تدريب](/tag/تدريب) [نموذج](/tag/نموذج) تفاضلي ثاني أضعف لتحقيق [التوجيه](/tag/التوجيه) الذاتي (AG). ولكن من خلال إعادة [هيكلة](/tag/هيكلة) بسيطة لنموذج DiT، يمكن الحصول على [توجيه](/tag/توجيه) "مجاني".

أصبح [نموذج](/tag/نموذج) RAEv2 يوفر أكثر من 10 مرات من [سرعة](/tag/سرعة) التقارب مقارنةً بالإصدار الأصلي، محققاً مقياس gFID الرائد عند 1.06 فقط خلال 80 دورة تدريبية على [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) ImageNet-256. كما حقق أداءً متميزاً على [نموذج](/tag/نموذج) FDr^k، حيث وصل إلى gFID بقيمة 2.17 مقارنةً بالرقم القياسي السابق 3.26 بعد 800 دورة تدريبية، دون الحاجة لأي [تدريب](/tag/تدريب) لاحق. كل ذلك حفز على اعتماد مقياس EP_FID@k ([عدد](/tag/عدد) الدورات للوصول إلى gFID بدون [توجيه](/tag/توجيه) أقل من أو يساوي k) كمقياس [جديد](/tag/جديد) للكفاءة التدريبية.

يظهر [نموذج](/tag/نموذج) RAEv2 EP_FID@2 بمعدل 35 دورة، مقارنةً بـ177 للدورة الأصلية. كما تم التأكيد على فعالية النهج المطور [عبر](/tag/عبر) إعدادات متنوعة لتوليد [الصور](/tag/الصور) من النصوص ونماذج العالم للقيادة، مما أظهر تحسناً ثابتاً. [الكود](/tag/الكود) متاح على [https://raev2.github.io].