Ailoxa Logo

🏷️ #MLLMs

32 مقال

إحداث ثورة في الذكاء الاصطناعي: إطار MIND لتحسين التفكير متعدد الرؤى في نماذج اللغات الضخمة!
أبحاث

إحداث ثورة في الذكاء الاصطناعي: إطار MIND لتحسين التفكير متعدد الرؤى في نماذج اللغات الضخمة!

أركايف للذكاءمنذ 2 يوم
ثورة تكنولوجيا الذكاء الاصطناعي: PRISM لتقليل التكاليف والتعقيد في اختيار بيانات التعلم المتعددة الدلالات!
أبحاث

ثورة تكنولوجيا الذكاء الاصطناعي: PRISM لتقليل التكاليف والتعقيد في اختيار بيانات التعلم المتعددة الدلالات!

أركايف للذكاءمنذ 4 يوم
هل يمكن للذكاء الاصطناعي إتقان البحث البصري؟ اكتشافات ثورية مع VisualNeedle!
أبحاث

هل يمكن للذكاء الاصطناعي إتقان البحث البصري؟ اكتشافات ثورية مع VisualNeedle!

أركايف للذكاءمنذ 9 يوم
ثورة في فهم الفيديو: DynFrame الإطار الديناميكي القادر على الاستدلال المتكيف!
أبحاث

ثورة في فهم الفيديو: DynFrame الإطار الديناميكي القادر على الاستدلال المتكيف!

أركايف للذكاءمنذ 9 يوم
بين الرؤية والايمان: استكشاف انحياز اللغة في نماذج اللغات الضخمة مفتوحة المصدر
أبحاث

بين الرؤية والايمان: استكشاف انحياز اللغة في نماذج اللغات الضخمة مفتوحة المصدر

أركايف للذكاءمنذ 9 يوم
تصحيح الضبابية البصرية الناتجة عن تشتيت الانتباه: كسر الحواجز نحو تحسين النماذج متعددة الوسائط
أبحاث

تصحيح الضبابية البصرية الناتجة عن تشتيت الانتباه: كسر الحواجز نحو تحسين النماذج متعددة الوسائط

أركايف للذكاءمنذ 10 يوم
ابتكار PathMem: ثورة في تعزيز الذاكرة للذكاء الاصطناعي في علم الأمراض
أبحاث

ابتكار PathMem: ثورة في تعزيز الذاكرة للذكاء الاصطناعي في علم الأمراض

أركايف للذكاءمنذ 10 يوم
تحديث المعرفة في الذكاء الاصطناعي: التحسينات الثورية لنماذج البيانات متعددة الوسائط
أبحاث

تحديث المعرفة في الذكاء الاصطناعي: التحسينات الثورية لنماذج البيانات متعددة الوسائط

أركايف للذكاءمنذ 11 يوم
تحول الصورة: كيف يعزز CVSearch الذكاء البصري لنماذج اللغة متعددة الوسائط!
أبحاث

تحول الصورة: كيف يعزز CVSearch الذكاء البصري لنماذج اللغة متعددة الوسائط!

أركايف للذكاءمنذ 11 يوم
تحسين الفهم البصري في نماذج اللغة متعددة الوسائط عبر المهام المتولدة تقنيًا
أبحاث

تحسين الفهم البصري في نماذج اللغة متعددة الوسائط عبر المهام المتولدة تقنيًا

أركايف للذكاءمنذ 11 يوم
ابتكار ثوري: محرر متميز لتعديل نماذج اللغة متعددة الوسائط!
نماذج لغوية

ابتكار ثوري: محرر متميز لتعديل نماذج اللغة متعددة الوسائط!

أركايف للذكاءمنذ 14 يوم
نحو فهم أعمق: كيف يؤثر ضعف الإدراك على أداء نماذج اللغات المتعددة الوسائط؟
أبحاث

نحو فهم أعمق: كيف يؤثر ضعف الإدراك على أداء نماذج اللغات المتعددة الوسائط؟

أركايف للذكاءمنذ 14 يوم
كيف تؤثر رؤوس الانتباه في توازن الهلوسة الناتجة عن تعارض الحواس؟
أبحاث

كيف تؤثر رؤوس الانتباه في توازن الهلوسة الناتجة عن تعارض الحواس؟

أركايف للذكاءمنذ 16 يوم
إطلاق العنان للذكاء الاصطناعي: إطار مبتكر لاختراق نماذج اللغة متعددة الوسائط باستخدام صور متعددة!
أبحاث

إطلاق العنان للذكاء الاصطناعي: إطار مبتكر لاختراق نماذج اللغة متعددة الوسائط باستخدام صور متعددة!

أركايف للذكاءمنذ 16 يوم
HiDe: إعادة التفكير في أسلوب التكبير في نماذج اللغات متعددة الوسائط العالية الدقة
أبحاث

HiDe: إعادة التفكير في أسلوب التكبير في نماذج اللغات متعددة الوسائط العالية الدقة

أركايف للذكاءمنذ 16 يوم
تجاوز الحدود: تقنية Vision-OPD ترفع مستوى الفهم البصري في نماذج الذكاء الاصطناعي متعددة الوسائط!
أبحاث

تجاوز الحدود: تقنية Vision-OPD ترفع مستوى الفهم البصري في نماذج الذكاء الاصطناعي متعددة الوسائط!

أركايف للذكاءمنذ 17 يوم
ESI-Bench: خطوة جديدة نحو الذكاء المكاني المدمج الذي يغلق حلقة الإدراك-الفعل!
أبحاث

ESI-Bench: خطوة جديدة نحو الذكاء المكاني المدمج الذي يغلق حلقة الإدراك-الفعل!

أركايف للذكاءمنذ 17 يوم
قناة المنطق الصريح: خطوة جديدة في تعزيز نماذج اللغات الكبيرة متعددة الوسائط
أبحاث

قناة المنطق الصريح: خطوة جديدة في تعزيز نماذج اللغات الكبيرة متعددة الوسائط

أركايف للذكاءمنذ 17 يوم
تعزيز كفاءة تدريب نماذج اللغات متعددة الوسائط من خلال تكييف الكثافة التدريبية!
أبحاث

تعزيز كفاءة تدريب نماذج اللغات متعددة الوسائط من خلال تكييف الكثافة التدريبية!

أركايف للذكاءمنذ 17 يوم
كشف أسرار Qwen3-VL-Seg: ثورة في تقسيم المشاهد الناطقة بالعالم المفتوح!

كشف أسرار Qwen3-VL-Seg: ثورة في تقسيم المشاهد الناطقة بالعالم المفتوح!

أركايف للذكاءمنذ 25 يوم