🏷️ #تقييم الأنظمة
12 مقال
أبحاث
تحديث ثوري في تقييمات النظام الذكي: T1-Bench لرصد وكالات متعددة السيناريوهات
أركايف للذكاءمنذ 5 يوم
أبحاث
تحطيم قيود سلوك الآلات: الابتكار في تقييم الأنظمة متعددة الوكلاء
أركايف للذكاءمنذ 6 يوم
أبحاث
CounterFace: ثورة في دقة أنظمة التعرف على الوجوه بفضل مجموعة بيانات مبتكرة!
أركايف للذكاءمنذ 11 يوم
👁 1أبحاث
GLIDE: المكتبة الثورية لتقييم الأنظمة الذكية بدقة وموثوقية!
أركايف للذكاءمنذ 14 يوم
👁 1أبحاث
اكتشاف OpenSTBench: إطار تقييم مبتكر لقياس جودة ترجمة الكلام
أركايف للذكاءمنذ 14 يوم
أبحاث
ثورة في تقييم أنظمة الذكاء الاصطناعي: هل تساعدنا التقنية في التنظيم والتحليل؟
أركايف للذكاءمنذ 20 يوم
أبحاث
ثورة في تقييم الذكاء الاصطناعي الطبي: الكشف عن مخاطر الإجماع الخاطئ!
أركايف للذكاءمنذ 20 يوم
أبحاث
مؤشرات جديدة لتقييم أنظمة الذكاء الاصطناعي: كيف تُعزز عدم اليقين في صنع القرار
أركايف للذكاءمنذ 24 يوم
أبحاث
ثورة في تقييم ذكاء الآلة: هياكل بيئية قابلة للتحقق من استغلال المكافآت
أركايف للذكاءمنذ 24 يوم
أبحاث
STABLEVAL: الإطار الثوري لتقييم أنظمة الذكاء الاصطناعي بوعي الخلاف واستقرار النتائج!
أركايف للذكاءمنذ 1 شهر
أبحاث
إطلاق معيار موحد لتقييم عمليات معالجة الوثائق متعددة الوسائط في الذكاء الاصطناعي المؤسسي
أركايف للذكاءمنذ 1 شهر
أبحاث
اكتشاف HealthBench: معيار جديد يُعيد تشكيل مستقبل الذكاء الاصطناعي في الرعاية الصحية!
مدونة أوبن إيه آيمنذ 13 شهر
