🏷️ #MLLMs
32 مقال
أبحاث
إحداث ثورة في الذكاء الاصطناعي: إطار MIND لتحسين التفكير متعدد الرؤى في نماذج اللغات الضخمة!
أركايف للذكاءمنذ 2 يوم
أبحاث
ثورة تكنولوجيا الذكاء الاصطناعي: PRISM لتقليل التكاليف والتعقيد في اختيار بيانات التعلم المتعددة الدلالات!
أركايف للذكاءمنذ 4 يوم
أبحاث
هل يمكن للذكاء الاصطناعي إتقان البحث البصري؟ اكتشافات ثورية مع VisualNeedle!
أركايف للذكاءمنذ 9 يوم
أبحاث
ثورة في فهم الفيديو: DynFrame الإطار الديناميكي القادر على الاستدلال المتكيف!
أركايف للذكاءمنذ 9 يوم
أبحاث
بين الرؤية والايمان: استكشاف انحياز اللغة في نماذج اللغات الضخمة مفتوحة المصدر
أركايف للذكاءمنذ 9 يوم
أبحاث
تصحيح الضبابية البصرية الناتجة عن تشتيت الانتباه: كسر الحواجز نحو تحسين النماذج متعددة الوسائط
أركايف للذكاءمنذ 10 يوم
أبحاث
ابتكار PathMem: ثورة في تعزيز الذاكرة للذكاء الاصطناعي في علم الأمراض
أركايف للذكاءمنذ 10 يوم
أبحاث
تحديث المعرفة في الذكاء الاصطناعي: التحسينات الثورية لنماذج البيانات متعددة الوسائط
أركايف للذكاءمنذ 11 يوم
أبحاث
تحول الصورة: كيف يعزز CVSearch الذكاء البصري لنماذج اللغة متعددة الوسائط!
أركايف للذكاءمنذ 11 يوم
أبحاث
تحسين الفهم البصري في نماذج اللغة متعددة الوسائط عبر المهام المتولدة تقنيًا
أركايف للذكاءمنذ 11 يوم
نماذج لغوية
ابتكار ثوري: محرر متميز لتعديل نماذج اللغة متعددة الوسائط!
أركايف للذكاءمنذ 14 يوم
أبحاث
نحو فهم أعمق: كيف يؤثر ضعف الإدراك على أداء نماذج اللغات المتعددة الوسائط؟
أركايف للذكاءمنذ 14 يوم
أبحاث
كيف تؤثر رؤوس الانتباه في توازن الهلوسة الناتجة عن تعارض الحواس؟
أركايف للذكاءمنذ 16 يوم
أبحاث
إطلاق العنان للذكاء الاصطناعي: إطار مبتكر لاختراق نماذج اللغة متعددة الوسائط باستخدام صور متعددة!
أركايف للذكاءمنذ 16 يوم
أبحاث
HiDe: إعادة التفكير في أسلوب التكبير في نماذج اللغات متعددة الوسائط العالية الدقة
أركايف للذكاءمنذ 16 يوم
أبحاث
تجاوز الحدود: تقنية Vision-OPD ترفع مستوى الفهم البصري في نماذج الذكاء الاصطناعي متعددة الوسائط!
أركايف للذكاءمنذ 17 يوم
أبحاث
ESI-Bench: خطوة جديدة نحو الذكاء المكاني المدمج الذي يغلق حلقة الإدراك-الفعل!
أركايف للذكاءمنذ 17 يوم
أبحاث
قناة المنطق الصريح: خطوة جديدة في تعزيز نماذج اللغات الكبيرة متعددة الوسائط
أركايف للذكاءمنذ 17 يوم
أبحاث
تعزيز كفاءة تدريب نماذج اللغات متعددة الوسائط من خلال تكييف الكثافة التدريبية!
أركايف للذكاءمنذ 17 يوم
كشف أسرار Qwen3-VL-Seg: ثورة في تقسيم المشاهد الناطقة بالعالم المفتوح!
أركايف للذكاءمنذ 25 يوم
1 / 2التالي →
