في عالم الذكاء الاصطناعي، لا تتوقف الابتكارات عن إذهالنا، وآخرها جاء كخطوة ثورية في مجال توليد الصور باستخدام نماذج اللغة الضخمة (MLLMs). استلهمت هذه التقنية من ظاهرة الانتشار في الفيزياء، حيث تعمل نماذج الانتشار التوليدية على محاكاة الحركة العشوائية للبيانات. وقد تمكن الباحثون من إعادة تصوّر هذه العملية الفوضوية كأداة فعّالة لتحسين جودة الصورة والإبقاء على الترابط السياقي.

لقد كشفت الدراسات أن الفوضى الطبيعية لمعلومات الانتشار يمكن أن تؤثر سلباً على جودة الصورة، مما يؤدي إلى تدهور في تفاصيلها وانعدام التناسق السياقي. لذا، ابتكر فريق البحث طريقة جديدة سمتها "الانتشار أحادي الاتجاه الانتقائي" (Selective One-Way Diffusion - SOW)، والتي تستخدم نماذج اللغة الضخمة لتوضيح العلاقات السيمائية والمكانية داخل الصورة.

تبدأ الرحلة مع نموذج "الانتشار أحادي الاتجاه الدوري" (Cyclic One-Way Diffusion - COW) الذي يساهم في توفير إطار فعال لنقل المعلومات بدقة مع الحد من التداخل الضار. من هنا، يأتي دور نموذج SOW الذي يجمع بين آليات الانتباه لتنسيق الاتجاه والشدة حسب العلاقات السياقية.

أظهرت التجارب الواسعة أن نموذج SOW يقدم إمكانيات غير مسبوقة في التحكم في انتشار المعلومات، مما يؤدي إلى نماذج توليد أكثر مرونة وقدرة على التكيف. هل أنتم مستعدون لاستكشاف فرص جديدة في عالم توليد الصور؟