تشهد مجالات الذكاء الاصطناعي قفزة نوعية مع تطور النماذج اللامركزية للتشتت (Decentralized Diffusion Models - DDM) التي تفتح آفاق جديدة لمزيد من الباحثين والمطورين. هذه النماذج ليست مجرد آليات جديدة، بل هي تجارب تعكس ثورة في كيفية تعاملنا مع الذكاء الاصطناعي، مما يمهد الطريق لمزيد من التعاون والإبداع في هذا المجال.

عادةً ما يتطلب تدريب نماذج التشتت التقليدية موارد حاسوبية ضخمة، تتركز في مجموعات قوية ومترابطة، مما يعيق مشاركة المؤسسات ذات الموارد المحدودة. ولكن مع ظهور DDM، أصبح بالإمكان تدريب النماذج بشكل منفرد مع المحافظة على كفاءة عالية. فأثناء التجريب، تمكن الباحثون من تقليل المتطلبات الحاسوبية إلى 16 مرة وتقليل البيانات إلى 14 مرة مقارنة بالنماذج السابقة.

يأتي هذا الإنجاز بفضل ثلاثة عناصر رئيسية: أولاً، يتم تقديم مفهوم التدريب اللامركزي المتنوع الذي يسمح لكل خبير باستخدام أهداف مختلفة مثل DDPM وFlow Matching، مما يسهل الدمج في وقت الاستدلال دون الحاجة لإعادة التدريب. ثانيًا، تم تصميم آلية تحويل النقاط المرجعية المدربة مسبقًا، مثل تحويل أهمية نموذج ImageNet-DDPM إلى أهداف Flow Matching، مما يسهم في تسريع معدل التقارب وبالتالي تسهيل بداية التدريب. وأخيرًا، يأتي التصميم الهيكلي المبتكر PixArt-$\alpha$ الذي يقلل من عدد المعاملات اللازمة مع الحفاظ على جودة النتائج.

بالنظر إلى التجارب التي أجريت على مجموعة LAION-Aesthetics، ارتفع معدل التنوع داخل المحتوى المدرب مما يعني نتائج أفضل. من خلال إزالة الحاجة إلى مزامنة الأهداف، أصبح الآن التدريب للمساهمين باستخدام وحدات معالجة الرسوميات الأحادية (GPUs) أمرًا ممكنًا، مما يتطلب فقط بين 24 إلى 48 جيجابايت من ذاكرة الوصول العشوائي.

نعيش فترة مثيرة في مجال الذكاء الاصطناعي، حيث نرى تحولات غير مسبوقة في كيفية تدريب النماذج وزيادة الوصول إليها.

ما رأيكم في هذا التطور المذهل؟ شاركونا آراءكم وتجاربكم في التعليقات.