🏷️ #معايير الذكاء الاصطناعي
15 مقال
أبحاث
DeskCraft: الثورة الجديدة في تقييم وكيل سطح المكتب والتعاون الذكي مع البشر!
أركايف للذكاءمنذ 1 يوم
أبحاث
مدخل جديد لثورة الذكاء الاصطناعي: MedCUA-Bench معيار مبتكر لوكلاء الكمبيوتر في المجال الطبي!
أركايف للذكاءمنذ 1 يوم
أبحاث
TimeSage-MT: معيار ثوري لتقييم ذكاء الأنظمة في تحليل السلاسل الزمنية
أركايف للذكاءمنذ 2 يوم
أبحاث
PInVerify: معيار جديد يحقق معجزات التحقق من الكائنات في الذكاء الاصطناعي!
أركايف للذكاءمنذ 3 يوم
أبحاث
DTBench: معيار جديد ومبتكر لاستخراج البيانات من الوثائق إلى الجداول!
أركايف للذكاءمنذ 3 يوم
أبحاث
PetroBench: معيار ثوري لتقييم نماذج اللغة الكبرى في هندسة البترول
أركايف للذكاءمنذ 7 يوم
أبحاث
فيريتريب: معيار مبتكر لتقييم وكلاء التخطيط السياحي في عالم الإنترنت الواسع
أركايف للذكاءمنذ 7 يوم
أبحاث
ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!
أركايف للذكاءمنذ 8 يوم
أبحاث
SVFSearch: ثورة جديدة في بحث إطار الفيديو القصير في عالم الألعاب!
أركايف للذكاءمنذ 16 يوم
أبحاث
SLEIGHT-Bench: كيف تتحدى هجمات التهرب أنظمة مراقبة الوكلاء الذكية؟
أركايف للذكاءمنذ 16 يوم
أبحاث
PhyAVBench: ثورة في توليد الصوتيات المرهفة بين النص والصورة!
أركايف للذكاءمنذ 16 يوم
أبحاث
اكتشف قوة الذكاء الاصطناعي: الـπ-Bench وتقييم الوكلاء الشخصيين الاستباقيين!
أركايف للذكاءمنذ 20 يوم
أبحاث
ReasonAudio: ثورة في تقييم الذكاء الاصطناعي لتقنيات البحث بين النصوص والمحتوى الصوتي!
أركايف للذكاءمنذ 28 يوم
أبحاث
هل تستطيع نماذج اللغة متعددة الوسائط قراءة ما هو مفقود؟ اكتشفوا الإجابة مع MMTR-Bench!
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة الذكاء الاصطناعي: معيار جديد لتقييم الأعمال الحقلية بفضل FieldWorkArena!
أركايف للذكاءمنذ 1 شهر
