في عالم يتسارع فيه التطور التكنولوجي، يظهر نموذج JuZhou 1.0 كنجاح بارز في مجال الذكاء الاصطناعي، حيث يمثل أول نموذج تأسيسي لتحويل النص إلى صورة (Text-to-Image) تم تدريبه بالكامل على معالجات ذكاء اصطناعي صينية.
تواجه نماذج تحويل النص إلى صورة التقليدية مجموعة من التحديات، مثل الحاجة الكبيرة لموارد الحوسبة والبنية التحتية السحابية، مما يجعل من الصعب تطبيقها في الوقت الحقيقي. ولكن JuZhou 1.0 يأتي بحل مبتكر، حيث تم تصميمه ليعمل بشكل كامل دون الحاجة للاتصال بالإنترنت، مما يعزز من الخصوصية ويقلل التكلفة.
ما يميز هذا النموذج هو كفاءته العالية التي تحققت من خلال أربعة مكونات رئيسية: أولًا، يعتمد على هيكل خفيف لتوليد الصور مكون من 0.385 مليار معلمة في نموذج U-Net، بالإضافة إلى 1.90 مليون معلمة في جهاز فك التشفير، مما يصل بالإجمالي إلى حوالي 0.387 مليار معلمة. ثانيًا، يعتمد على تقنية Rectified Flow مع تخفيف DMD2، مما يقلل عدد الخطوات اللازمة للتخمين إلى 4 خطوات فقط. ثالثًا، تم تدريبه على توافق دلالي صيني باستخدام 9 ملايين زوج من النصوص والصور، مما يتيح للمستخدمين إصدار الأوامر مباشرة باللغة الصينية دون الحاجة لترجمتها. وأخيرًا، تمت عملية التدريب والتخفيف على معالجات Sugon K100 التي تم تطويرها محليًا، بدون الاعتماد على معالجات NVIDIA.
تظهر نتائج النموذج أن نموذج JuZhou 1.0 قد حقق تصنيف GenEval العام 0.69، متفوقًا على نماذج شهيرة أخرى مثل SDXL وSD3-Medium وIF-XL. كما تم التحقق من أداء النموذج على أنظمة تشغيل متعددة، حيث يستغرق العملية الكاملة حوالي 4.5 ثوانٍ على الهواتف الذكية مثل Xiaomi 17 Pro Max، مما يجعلها تجربة سلسة وسريعة.
يمكن اعتبار JuZhou 1.0 نقطة انطلاق جديدة لتوليد الصور اعتمادًا على النصوص، ويمثل نموذجًا عمليًا للتطبيقات المستقبلية، خاصة للمستخدمين الذين يعتمدون على التكنولوجيا المحلية. فهل أنتم مستعدون لاستكشاف التصميمات اللغوية الجديدة التي يقدمها هذا النموذج الرائد؟
ثورة الذكاء الاصطناعي: تقديم نموذج JuZhou 1.0 لتحويل النص إلى صورة بالكامل بفضل تقنيات صينية رائدة!
أبهر نموذج JuZhou 1.0 الساحة التقنية من خلال تقديمه كأول نموذج تحويلي للنص إلى صورة مصمم للعمل بالكامل على الأجهزة دون الحاجة للاتصال بالإنترنت. يضمن هذا التطور السريع تجربة مستخدم متميزة بفضل الأداء العالي والموارد القليلة المطلوبة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
