Ailoxa Logo

🏷️ #فهم الفيديو

19 مقال

ReFoCUS: ثورة جديدة في تحسين فهم الفيديو باستخدام الذكاء الاصطناعي!
أبحاث

ReFoCUS: ثورة جديدة في تحسين فهم الفيديو باستخدام الذكاء الاصطناعي!

أركايف للذكاءمنذ 3 يوم
عندما تكون الإجابات مفقودة: كشف عجز نماذج الذكاء الاصطناعي في فهم الفيديو
أبحاث

عندما تكون الإجابات مفقودة: كشف عجز نماذج الذكاء الاصطناعي في فهم الفيديو

أركايف للذكاءمنذ 6 يوم
موس-فيديو: فهم الفيديو في الوقت الحقيقي باستخدام تقنيات الانتباه المتداخل
أبحاث

موس-فيديو: فهم الفيديو في الوقت الحقيقي باستخدام تقنيات الانتباه المتداخل

أركايف للذكاءمنذ 6 يوم
كيف تشكل البيانات نماذج الفيديو: رحلة مثيرة عبر فهم الفيديو
أبحاث

كيف تشكل البيانات نماذج الفيديو: رحلة مثيرة عبر فهم الفيديو

أركايف للذكاءمنذ 6 يوم
فهم الفيديوهات باستخدام نماذج اللغات الضخمة: رؤية إنسانية مثيرة للابتكار
أبحاث

فهم الفيديوهات باستخدام نماذج اللغات الضخمة: رؤية إنسانية مثيرة للابتكار

أركايف للذكاءمنذ 7 يوم
الإبداع بلا حدود: تعرفوا على StreamingVLM لفهم دقيق وفوري لتيارات الفيديو اللانهائية!
أبحاث

الإبداع بلا حدود: تعرفوا على StreamingVLM لفهم دقيق وفوري لتيارات الفيديو اللانهائية!

أركايف للذكاءمنذ 13 يوم
👁 1
ثورة في فهم الفيديو: DynFrame الإطار الديناميكي القادر على الاستدلال المتكيف!
أبحاث

ثورة في فهم الفيديو: DynFrame الإطار الديناميكي القادر على الاستدلال المتكيف!

أركايف للذكاءمنذ 19 يوم
اكتشاف الفيديو المستقبلي: كيف يُحول VideoTemp-o3 فهم الفيديو إلى تجربة تفاعلية مذهلة!
أبحاث

اكتشاف الفيديو المستقبلي: كيف يُحول VideoTemp-o3 فهم الفيديو إلى تجربة تفاعلية مذهلة!

أركايف للذكاءمنذ 21 يوم
ذاكرة بصرية عصرية: كيف تحقق الفهم العميق للفيديوهات الطويلة عبر تقنيات متطورة!
أبحاث

ذاكرة بصرية عصرية: كيف تحقق الفهم العميق للفيديوهات الطويلة عبر تقنيات متطورة!

أركايف للذكاءمنذ 27 يوم
VideoSEAL: ثورة في فهم الفيديوهات الطويلة من خلال فصل سلطة الإجابة
أبحاث

VideoSEAL: ثورة في فهم الفيديوهات الطويلة من خلال فصل سلطة الإجابة

أركايف للذكاءمنذ 1 شهر
تكنولوجيا فيديو رائدة: إعادة تعريف فهم الفيديو باستخدام أدوات متقدمة
أبحاث

تكنولوجيا فيديو رائدة: إعادة تعريف فهم الفيديو باستخدام أدوات متقدمة

أركايف للذكاءمنذ 1 شهر
HY-Himmel: التقنية الثورية لفهم الفيديوهات الطويلة عبر التصنيف المتداخل
أبحاث

HY-Himmel: التقنية الثورية لفهم الفيديوهات الطويلة عبر التصنيف المتداخل

أركايف للذكاءمنذ 1 شهر
GridProbe: ثورة جديدة في اختصار زمن المعالجة لفهم الفيديوهات الطويلة بـ VLMs
أبحاث

GridProbe: ثورة جديدة في اختصار زمن المعالجة لفهم الفيديوهات الطويلة بـ VLMs

أركايف للذكاءمنذ 1 شهر
استعد للثورة في فهم الفيديو: نموذج Response-G1 الذي يُعيد تشكيل المشهد!
أبحاث

استعد للثورة في فهم الفيديو: نموذج Response-G1 الذي يُعيد تشكيل المشهد!

أركايف للذكاءمنذ 1 شهر
نموذج تقييم المكافآت في فهم الفيديو: معيار قوي ونماذج مكافآت فعالة
نماذج لغوية

نموذج تقييم المكافآت في فهم الفيديو: معيار قوي ونماذج مكافآت فعالة

أركايف للذكاءمنذ 1 شهر
HERMES: ثورة جديدة في فهم الفيديوهات المتدفقة عبر الذاكرة الهرمية!
أبحاث

HERMES: ثورة جديدة في فهم الفيديوهات المتدفقة عبر الذاكرة الهرمية!

أركايف للذكاءمنذ 1 شهر
IMPACT-CYCLE: نظام مبتكر لإصلاح الأخطاء في فهم الفيديوهات الطويلة بذكاء اصطناعي
أبحاث

IMPACT-CYCLE: نظام مبتكر لإصلاح الأخطاء في فهم الفيديوهات الطويلة بذكاء اصطناعي

أركايف للذكاءمنذ 1 شهر
ابتكار ذاكرة متعددة الأنماط: كيف يحسن MM-Mem فهم الفيديوهات الطويلة بذكاء اصطناعي متطور!
أبحاث

ابتكار ذاكرة متعددة الأنماط: كيف يحسن MM-Mem فهم الفيديوهات الطويلة بذكاء اصطناعي متطور!

أركايف للذكاءمنذ 1 شهر
سمول في إل إم 2: ثورة في فهم الفيديو على جميع الأجهزة!
أبحاث

سمول في إل إم 2: ثورة في فهم الفيديو على جميع الأجهزة!

هاجينج فيسمنذ 16 شهر