Ailoxa Logo

🏷️ #معايير الذكاء الاصطناعي

15 مقال

DeskCraft: الثورة الجديدة في تقييم وكيل سطح المكتب والتعاون الذكي مع البشر!
أبحاث

DeskCraft: الثورة الجديدة في تقييم وكيل سطح المكتب والتعاون الذكي مع البشر!

أركايف للذكاءمنذ 1 يوم
مدخل جديد لثورة الذكاء الاصطناعي: MedCUA-Bench معيار مبتكر لوكلاء الكمبيوتر في المجال الطبي!
أبحاث

مدخل جديد لثورة الذكاء الاصطناعي: MedCUA-Bench معيار مبتكر لوكلاء الكمبيوتر في المجال الطبي!

أركايف للذكاءمنذ 1 يوم
TimeSage-MT: معيار ثوري لتقييم ذكاء الأنظمة في تحليل السلاسل الزمنية
أبحاث

TimeSage-MT: معيار ثوري لتقييم ذكاء الأنظمة في تحليل السلاسل الزمنية

أركايف للذكاءمنذ 2 يوم
PInVerify: معيار جديد يحقق معجزات التحقق من الكائنات في الذكاء الاصطناعي!
أبحاث

PInVerify: معيار جديد يحقق معجزات التحقق من الكائنات في الذكاء الاصطناعي!

أركايف للذكاءمنذ 3 يوم
DTBench: معيار جديد ومبتكر لاستخراج البيانات من الوثائق إلى الجداول!
أبحاث

DTBench: معيار جديد ومبتكر لاستخراج البيانات من الوثائق إلى الجداول!

أركايف للذكاءمنذ 3 يوم
PetroBench: معيار ثوري لتقييم نماذج اللغة الكبرى في هندسة البترول
أبحاث

PetroBench: معيار ثوري لتقييم نماذج اللغة الكبرى في هندسة البترول

أركايف للذكاءمنذ 7 يوم
فيريتريب: معيار مبتكر لتقييم وكلاء التخطيط السياحي في عالم الإنترنت الواسع
أبحاث

فيريتريب: معيار مبتكر لتقييم وكلاء التخطيط السياحي في عالم الإنترنت الواسع

أركايف للذكاءمنذ 7 يوم
ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!
أبحاث

ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!

أركايف للذكاءمنذ 8 يوم
SVFSearch: ثورة جديدة في بحث إطار الفيديو القصير في عالم الألعاب!
أبحاث

SVFSearch: ثورة جديدة في بحث إطار الفيديو القصير في عالم الألعاب!

أركايف للذكاءمنذ 16 يوم
SLEIGHT-Bench: كيف تتحدى هجمات التهرب أنظمة مراقبة الوكلاء الذكية؟
أبحاث

SLEIGHT-Bench: كيف تتحدى هجمات التهرب أنظمة مراقبة الوكلاء الذكية؟

أركايف للذكاءمنذ 16 يوم
PhyAVBench: ثورة في توليد الصوتيات المرهفة بين النص والصورة!
أبحاث

PhyAVBench: ثورة في توليد الصوتيات المرهفة بين النص والصورة!

أركايف للذكاءمنذ 16 يوم
اكتشف قوة الذكاء الاصطناعي: الـπ-Bench وتقييم الوكلاء الشخصيين الاستباقيين!
أبحاث

اكتشف قوة الذكاء الاصطناعي: الـπ-Bench وتقييم الوكلاء الشخصيين الاستباقيين!

أركايف للذكاءمنذ 20 يوم
ReasonAudio: ثورة في تقييم الذكاء الاصطناعي لتقنيات البحث بين النصوص والمحتوى الصوتي!
أبحاث

ReasonAudio: ثورة في تقييم الذكاء الاصطناعي لتقنيات البحث بين النصوص والمحتوى الصوتي!

أركايف للذكاءمنذ 28 يوم
هل تستطيع نماذج اللغة متعددة الوسائط قراءة ما هو مفقود؟ اكتشفوا الإجابة مع MMTR-Bench!
أبحاث

هل تستطيع نماذج اللغة متعددة الوسائط قراءة ما هو مفقود؟ اكتشفوا الإجابة مع MMTR-Bench!

أركايف للذكاءمنذ 1 شهر
ثورة الذكاء الاصطناعي: معيار جديد لتقييم الأعمال الحقلية بفضل FieldWorkArena!
أبحاث

ثورة الذكاء الاصطناعي: معيار جديد لتقييم الأعمال الحقلية بفضل FieldWorkArena!

أركايف للذكاءمنذ 1 شهر