في عالم الذكاء الاصطناعي، تعتمد تقنية تحويل التصميم إلى صورة (Layout-to-Image - L2I) على تقديم تحكم دقيق في توليد الصور عبر تصنيفات العناصر وتنظيمها المكاني. إلا أن الطرق الحالية في L2I تُظهر قصورًا في الأداء، حيث تؤدي إلى تجزئة الصورة وتشوهها في الإعدادات المحدودة.

تسمى هذه المشكلة "تفكيك التمثيلات"، وهي ناتجة عن عدم التوافق في الدقة الذي يمزج الهوية الدلالية بالتفاصيل البصرية. ولحل هذه المشكلة، تم اقتراح إطار عمل جديد يعتمد على تفكيك المعاني من العناصر الأساسية، مما يسهم في تحقيق تكيف قوي بين الصور المحدودة.

يقوم نظام "Semantic Anchoring" بتجميع المعاني الدلالية في نقاط مرجعية مستقرة، مما يساعد في الحفاظ على الهوية أثناء عملية التوليد. بينما يُسهم "Primitive Imbuing" في تصميم عناصر يمكن إعادة تشكيلها بشكل فعّال لتفاصيل محلية قوية.

علاوة على ذلك، يضمن "Conceptual Steering" تنظيمًا أفضل بفضل هدف مدروس يحافظ على اتساق المعاني في المقدمة.

أثبتت تجارب شاملة أن هذه التقنيات تقدم تحسينات ملحوظة في تقييمات الصور ذات الخمس نقاط، متفوقة على أحدث الطرق المعروفة في مجال L2I من حيث الجودة والتوافق عبر مجالات غير تقليدية متنوعة. يمكنك الاطلاع على الكود المصدري المتاح للجمهور على GitHub.