تعتبر نماذج توليد الصور من الأدوات الإبداعية الرائعة، ولكنها غالبًا ما تفتقر إلى الدعم اللازم للتحكم التركيبي الذي يستخدمه المصورون والفنانون البصريون بانتظام. في دراسة حديثة نُشرت على موقع arXiv، تم تقديم نتائج مبكرة عن إطار عمل يعتمد على التحكم التركيبي الموجه، مخصص لتوليد صور المناظر الطبيعية.

يعتمد هذا الإطار المبتكر على استخراج متجه موحد رباعي الأبعاد من الصور التدريبية، ليتم حقنها إلى نموذج Difussion عبر آلية انتباه متصل تفصل بين المكونات، مع استخدام تشفير فورييه ودعم دقيق عبر تصنيف خالٍ من النموذج.

تشير التقييمات الكمية المستندة إلى معيار أساسي وثلاثة متغيرات تجريبية، إلى أن الهيكل المدرَج يحقق أعلى معدل اكتشاف أفق بنسبة 0.850، وأعلى توافق في قاعدة التركيب الطولي (Rule of Thirds) بنسبة 0.817. كما أظهر تقييم إضافي أكثر تخصيصًا أن التدريب على مجموعات مشهد متجانسة تركيبياً يقلل من انحراف الأفق بنسبة تصل إلى 40% مقارنة بالتدريب المختلط، مما يثبت أن دقة التحكم التركيبي تعتمد على الفئة.

باختصار، هذه النتائج تمهد الطريق أمام تطورات جديدة في مجال الذكاء الاصطناعي، مما يفتح آفاقًا جديدة للإبداع الفني ودقة التصوير. ما رأيكم في هذه التقنية الجديدة؟ شاركونا آراءكم في التعليقات!