في الآونة الأخيرة، حقق الذكاء الاصطناعي (AI) خطوات هائلة في مجال توليد الصور من النصوص في خطوة واحدة (one-step text-to-image generation)، حيث أصبح بالإمكان إنشاء صور فورية بجودة لا تصدق وكفاءة عالية. ومع ذلك، كانت الطرق السابقة المعتمدة على التعلم المعزز (Reinforcement Learning) تواجه تحديات كبيرة بسبب التباين بين تحسين المكافآت النهائية والديناميكيات التوليدية الأساسية.
لذا، عُرضت مؤخرًا تقنية جديدة تُدعى Diff-Instruct with Diffused Reward (DIDR)، وهي إطار لتوافق المسار على مستوى البيانات، مُشتق من الحد الأدنى لتكامل KL. تكمن فكرة DIDR في نشر توزيع الصورة النظيفة المُحسنة عبر كافة مستويات الضوضاء على طول مسار الانحدار.
تقدم هذه التكنولوجيا تحسينات مهمة، حيث يُظهر هذا الهدف نفس المُصغِر مثل التعلم المعزز للصورة النظيفة (RLHF). أيضًا، تُدخل DIDR نقطة مكافأة الانتشار (Diffused Reward Score - DRS) كتصحيح مدفوع بالمكافآت لوظيفة النقطة المرجعية.
في جانب آخر، تم تقديم النطاق البديل لمكافأة الانتشار (Diffused Reward Proxy - DRP)، والذي يعد تقديرًا فعالًا لـ DRS بناءً على تقنيات إزالة الضوضاء القصيرة القابلة للتفاضل.
أثبتت التجارب الواسعة أن DIDR تتفوق باستمرار على الأسس الحالية لتوليد الصور ذات الخطوة الواحدة SDXL. وعندما تم تطبيقها على العمود الفقري للنوع 6B DiT (Z-Image)، فاقت DIDR أداء المُعلم الخاص بها المكون من 50 خطوة في توافق التفضيلات مع تقليل عدد خطوات التوليد إلى واحدة فقط.
هذه الابتكارات تؤكد على أهمية التطورات الجديدة في الذكاء الاصطناعي، والتي قد تغير مستقبل توليد الصور مع المزيد من الدقة والجودة. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
ابتكار ثوري في الذكاء الاصطناعي: خداعة مكافأة الانحدار لتحسين مولدات صور النصوص
تقدم تقنية Diff-Instruct with Diffused Reward (DIDR) طفرة جديدة في مجال توليد الصور من النصوص، حيث تعالج مشاكل تتعلق بجودة الصورة ودقة المكافآت. تضمن الطريقة الجديدة تحسينات ملحوظة في كفاءة الأداء وواقعية النتائج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
