في خطوة جديدة تُعزّز من إمكانيات الذكاء الاصطناعي، تم الكشف عن نيتروتون 3 نانو أومني، أحدث إضافة إلى عائلة نيتروتون للذكاء المتعدد الوسائط (Multimodal Intelligence). يُعتبر هذا النموذج الجديد الأول من نوعه الذي يدعم المدخلات الصوتية بشكل مباشر، إلى جانب النصوص والصور والفيديو.
يتميز نيتروتون 3 نانو أومني بتحسينات ملحوظة في الدقة مقارنة بالسابق، نيتروتون نانو V2 VL، وذلك بفضل التقدم في مناهج البناء والبيانات التدريبية. حيث قدمت التحسينات المعمارية نتائج رائدة في فهم الوثائق الحقيقية، وفهم محتوى الفيديو الطويل، واستخدام الحواسيب بشكل متفاعل.
استناداً إلى بنية نيتروتون 3 نانو 30B-A3B القوية، أضاف نيتروتون 3 تقنيات مبتكرة لتقليل عدد الرموز (Token Reduction)، مما يُحقق أوقات استجابة أقل بكثير وقدرة معالجة أعلى مقارنةً بالنماذج المماثلة.
كما يُعلن المطورون عن توفير نقاط تفتيش النموذج بتنسيقات BF16 وFP8 وFP4، إضافةً إلى أجزاء من بيانات التدريب وقاعدة الشيفرة (Codebase) لتسهيل أبحاث التطوير المتبعة في هذا المجال.
مع هذا التقدم الرائع، يتجاوز نيتروتون 3 نانو أومني مجرد نموذج تقني ليصبح أداة قوية تسهم في تشكيل مستقبل الذكاء الاصطناعي.
ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
نيتروتون 3 نانو أومني: الذكاء المتعدد الوسائط الذي يُحدث ثورة في عالم التقنية!
تقدم نيتروتون 3 نانو أومني أحدث نموذج في سلسلة التقنية المتعددة الوسائط، يجمع بين المدخلات الصوتية والنصوص والصور والفيديو. بفضل الابتكارات المعمارية، يحقق النموذج أداءً مذهلاً وتقديم نتائج رائدة في فهم الوثائق الحقيقية وفهم الفيديوهات الطويلة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
