🏷️ #نماذج متعددة الوسائط

36 مقال

EGRA: ثورة في تحسين جودة التوصيات متعددة الوسائط!

EGRA: ثورة في تحسين جودة التوصيات متعددة الوسائط!

أركايف للذكاءمنذ 13 يوم

اكتشف iFLYTEK-Embodied-Omni: نموذج متعدد الوسائط لعالم الذكاء الاصطناعي!

نماذج لغوية

اكتشف iFLYTEK-Embodied-Omni: نموذج متعدد الوسائط لعالم الذكاء الاصطناعي!

أركايف للذكاءمنذ 13 يوم

MMBench-Live: الثورة في تقييم النماذج متعددة الوسائط!

MMBench-Live: الثورة في تقييم النماذج متعددة الوسائط!

أركايف للذكاءمنذ 17 يوم

توليد صور آمن بأسلوب تدريجي: استراتيجيات مبتكرة باستخدام القوائم الذكية!

توليد صور آمن بأسلوب تدريجي: استراتيجيات مبتكرة باستخدام القوائم الذكية!

أركايف للذكاءمنذ 24 يوم

TOPS: ثورة جديدة في تحسين فعالية نماذج اللغات متعددة الوسائط!

TOPS: ثورة جديدة في تحسين فعالية نماذج اللغات متعددة الوسائط!

أركايف للذكاءمنذ 24 يوم

FISHER: نموذج ثوري لتحليل الإشارات الصناعية بتمثيل شامل متعدد الوسائط!

FISHER: نموذج ثوري لتحليل الإشارات الصناعية بتمثيل شامل متعدد الوسائط!

أركايف للذكاءمنذ 26 يوم

تحرير الصوت بدقة مذهلة: تحول الهجين الذي يخدم التعليمات عبر تدفق مصحح!

تحرير الصوت بدقة مذهلة: تحول الهجين الذي يخدم التعليمات عبر تدفق مصحح!

أركايف للذكاءمنذ 1 شهر

أسرار العائلة: تعزيز التأسيس السياقي عبر رؤوس الحقيقة الموروثة في سلاسل النماذج

أسرار العائلة: تعزيز التأسيس السياقي عبر رؤوس الحقيقة الموروثة في سلاسل النماذج

أركايف للذكاءمنذ 1 شهر

ابتكار تقنية جديدة لتقييم الشخصية والقدرات العقلية من خلال المقابلات المرئية غير المتزامنة!

ابتكار تقنية جديدة لتقييم الشخصية والقدرات العقلية من خلال المقابلات المرئية غير المتزامنة!

أركايف للذكاءمنذ 1 شهر

IMUG-Bench: معيار جديد لتقييم نماذج متعددة الوسائط في حوار تفاعلي مُعقد

IMUG-Bench: معيار جديد لتقييم نماذج متعددة الوسائط في حوار تفاعلي مُعقد

أركايف للذكاءمنذ 1 شهر

جوجل ديب مايند تطلق نموذج Gemma 4 12B: معجزة جديدة تعمل بدون مشفر على لابتوب بحجم 16 غيغابايت!

نماذج لغوية

جوجل ديب مايند تطلق نموذج Gemma 4 12B: معجزة جديدة تعمل بدون مشفر على لابتوب بحجم 16 غيغابايت!

مارك تيك بوستمنذ 1 شهر

فيستا هوب: ثورة جديدة في تقييم الذكاء البصري للبحث العميق

فيستا هوب: ثورة جديدة في تقييم الذكاء البصري للبحث العميق

أركايف للذكاءمنذ 1 شهر

كيف يمكن أن يحدث التعلم الآلي المتجدد؟ اكتشف إطار عمل VGID لإزالة المعلومات الغير مرغوب فيها من نماذج الذكاء الاصطناعي متعددة الوسائط!

كيف يمكن أن يحدث التعلم الآلي المتجدد؟ اكتشف إطار عمل VGID لإزالة المعلومات الغير مرغوب فيها من نماذج الذكاء الاصطناعي متعددة الوسائط!

أركايف للذكاءمنذ 1 شهر

APB-V: ثورة في فهم مقاطع الفيديو الطويلة بتقنيات متقدمة!

APB-V: ثورة في فهم مقاطع الفيديو الطويلة بتقنيات متقدمة!

أركايف للذكاءمنذ 1 شهر

كيف تتحدى نماذج الذكاء الاصطناعي المتعددة الوسائط قوانين الفيزياء؟

كيف تتحدى نماذج الذكاء الاصطناعي المتعددة الوسائط قوانين الفيزياء؟

أركايف للذكاءمنذ 1 شهر

خطوات مبتكرة نحو ذكاء أصلي للممارسات الفيزيائية في النماذج متعددة الوسائط

خطوات مبتكرة نحو ذكاء أصلي للممارسات الفيزيائية في النماذج متعددة الوسائط

أركايف للذكاءمنذ 1 شهر

ابتكار SAVER: إطار رؤي انتقائي لتحسين استخراج المعلومات متعددة الوسائط

ابتكار SAVER: إطار رؤي انتقائي لتحسين استخراج المعلومات متعددة الوسائط

أركايف للذكاءمنذ 1 شهر

تطور ثوري في الذكاء الاصطناعي: Chronicle يجمع بين اللغة والسلاسل الزمنية!

نماذج لغوية

تطور ثوري في الذكاء الاصطناعي: Chronicle يجمع بين اللغة والسلاسل الزمنية!

أركايف للذكاءمنذ 1 شهر

تعرَّف على TorchUMM: قاعدة الشيفرة الموحدة لنماذج متعددة الوسائط

تعرَّف على TorchUMM: قاعدة الشيفرة الموحدة لنماذج متعددة الوسائط

أركايف للذكاءمنذ 1 شهر

جوجل تدخل عالم الفيديو: نموذج Gemini Omni يحول النصوص والصور والصوت إلى فيديوهات بسهولة مذهلة!

نماذج لغوية

جوجل تدخل عالم الفيديو: نموذج Gemini Omni يحول النصوص والصور والصوت إلى فيديوهات بسهولة مذهلة!

تيك كرانشمنذ 2 شهر

1 / 2التالي →