في السنوات الأخيرة، حققت نماذج الانتشار (Diffusion Models) نجاحًا ملحوظًا في توليد الصور، لكنها في الغالب تعتمد على أهداف مرجعية كاملة تتطلب توافقًا دقيقًا مع الصور الحقيقية. ورغم أن هذه الطريقة فعالة من ناحية الدقة، إلا أنها قد تكون غير كافية من حيث الجودة البصرية وتجسيد المعاني بين النص والصورة.
في دراسة حديثة، تم استكشاف مشكلة دمج الجودة البصرية غير المرجعية في تدريب نماذج الانتشار. التحدي الرئيسي هنا هو أن تحسين الإشارات البصرية بشكل مباشر، مثل تلك التي يقدمها تقييم جودة الصورة بدون مرجع (No-Reference Image Quality Assessment - NR-IQA)، قد يؤدي إلى عدم التوافق مع الأهداف الأصلية لنموذج الانتشار، مما يُسبب عدم استقرار في التدريب وتحول في توزيعات البيانات أثناء التخصيص.
لمعالجة هذه المشكلة، تم اقتراح إطار عمل لتحسين موجه بالدليل، يتيح التكيف البصري بشكل مستقر. حيث تم الاستفادة من نموذج تقييم الجودة بدون مرجع كإشارة توجيه بصرية، مع إدخال تقييد قائم على الأٍس الذي يضمن التناسق مع نموذج الانتشار الأساسي في توقع الضوضاء.
هذا التصميم يحقق توازنًا فعّالًا بين تحسين الجودة البصرية والدقة التوليدية، مما يسمح بالتكيف المControlled نحو نتائج مرضية بصريًا دون التضحية بالسلوك التوليدي الأصلي.
تظهر التجارب الواسعة أن هذه الطريقة تحسن باستمرار الجودة البصرية مع الحفاظ على تنوع التوليد وثبات التدريب، مما يبرز فعالية تحسين الجودة البصرية الموجه بالقيد للأداء في نماذج الانتشار.
تحسين الجودة البصرية باستخدام نماذج الانتشار: نهج مبتكر بدون مرجع
استكشف كيف يمكن لنماذج الانتشار أن تحقق توازنًا مثاليًا بين الجودة البصرية والتنوع في التوليد. نهج جديد يعيد تعريف كيفية تحسين الصور دون الاعتماد على المراجع التقليدية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
