🏷️ #نماذج متعددة الوسائط
25 مقال
نماذج لغوية
جوجل ديب مايند تطلق نموذج Gemma 4 12B: معجزة جديدة تعمل بدون مشفر على لابتوب بحجم 16 غيغابايت!
مارك تيك بوستمنذ 1 يوم
أبحاث
فيستا هوب: ثورة جديدة في تقييم الذكاء البصري للبحث العميق
أركايف للذكاءمنذ 2 يوم
أبحاث
كيف يمكن أن يحدث التعلم الآلي المتجدد؟ اكتشف إطار عمل VGID لإزالة المعلومات الغير مرغوب فيها من نماذج الذكاء الاصطناعي متعددة الوسائط!
أركايف للذكاءمنذ 3 يوم
أبحاث
كيف تتحدى نماذج الذكاء الاصطناعي المتعددة الوسائط قوانين الفيزياء؟
أركايف للذكاءمنذ 3 يوم
أبحاث
خطوات مبتكرة نحو ذكاء أصلي للممارسات الفيزيائية في النماذج متعددة الوسائط
أركايف للذكاءمنذ 9 يوم
نماذج لغوية
تطور ثوري في الذكاء الاصطناعي: Chronicle يجمع بين اللغة والسلاسل الزمنية!
أركايف للذكاءمنذ 14 يوم
أبحاث
ابتكار SAVER: إطار رؤي انتقائي لتحسين استخراج المعلومات متعددة الوسائط
أركايف للذكاءمنذ 14 يوم
أبحاث
تعرَّف على TorchUMM: قاعدة الشيفرة الموحدة لنماذج متعددة الوسائط
أركايف للذكاءمنذ 14 يوم
نماذج لغوية
جوجل تدخل عالم الفيديو: نموذج Gemini Omni يحول النصوص والصور والصوت إلى فيديوهات بسهولة مذهلة!
تيك كرانشمنذ 16 يوم
أبحاث
التحول في الذكاء الاصطناعي: كيف يمكن لـ CAVE تحسين التفكير البصري المعقد؟
أركايف للذكاءمنذ 17 يوم
نماذج لغوية
ثورة في توليد الصور: السيطرة على الأفعال الخفية لتحسين الفهم البصري
أركايف للذكاءمنذ 17 يوم
أبحاث
اختيار الأدلة البصرية الذكية: الثورة في استرجاع المعلومات متعددة الوسائط
أركايف للذكاءمنذ 22 يوم
أبحاث
إعادة توجيه توليد المحتوى البصري: كيف يعزز نموذج متعدد الوسائط الفهم والإنتاجية!
أركايف للذكاءمنذ 28 يوم
أبحاث
كيف يفهم GPT-4o الرؤية؟ تقييم النماذج متعددة الوسائط في مهام الرؤية الحاسوبية
أركايف للذكاءمنذ 1 شهر
أبحاث
لغة معمارية مبتكرة لوكلاء بصريين مرونين: كيف يمكن للذكاء الاصطناعي تجاوز التحديات المعمارية؟
أركايف للذكاءمنذ 1 شهر
أبحاث
أبستريم كيو إيه: إطار عمل مبتكر لتحسين استنتاج الفيديو والإجابة على الأسئلة!
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة الصوت: اكتشفوا Audio-Omni - الإطار الشامل لتوليد وتحرير الصوتيات!
أركايف للذكاءمنذ 1 شهر
أبحاث
كيفية تعليم نماذج متعددة الوسائط الكبيرة مهارات جديدة دون فقدان القدرات السابقة
أركايف للذكاءمنذ 1 شهر
أبحاث
التفكير المتسلسل يعاني من تدهور الذكاء المكاني في النماذج متعددة الوسائط!
أركايف للذكاءمنذ 1 شهر
أبحاث
MERRIN: ثورة في استرجاع الأدلة المتعددة الوسائط في بيئات الإنترنت المربكة
أركايف للذكاءمنذ 1 شهر
1 / 2التالي →
