🏷️ #التقييم
36 مقال
أبحاث
GSM-SEM: الإطار الثوري لتوليد تنويعات ذات دلالة لتعزيز قياس الذكاء الاصطناعي!
أركايف للذكاءمنذ 25 يوم
أبحاث
فهم سياسة سلامة المعلّقين: كيف تجعل التعلم الآلي أكثر أماناً وشفافية
أركايف للذكاءمنذ 28 يوم
أبحاث
اختبار الأدلة الجزئية: معيار جديد للتقييم في أنظمة الوكالة المحدودة
أركايف للذكاءمنذ 28 يوم
أبحاث
إعادة التفكير في فاعلية تقييم اكتشاف البيانات الخارجية من خلال التعلم العميق الدلالي
أركايف للذكاءمنذ 28 يوم
أبحاث
معيار موحد لتقييم طرق بناء الرسوم البيانية المعرفية والشبكات العصبية الرسومية!
أركايف للذكاءمنذ 28 يوم
أبحاث
نحو تحسين جودة وصف الصوت: أداة مبتكرة لتقييم المحللين البشريين ونماذج اللغة المرئية
أركايف للذكاءمنذ 28 يوم
أبحاث
TMD-Bench: منصة تقييم مبتكرة لتوليد الموسيقى والرقص بشكل متزامن!
أركايف للذكاءمنذ 1 شهر
أبحاث
STABLEVAL: الإطار الثوري لتقييم أنظمة الذكاء الاصطناعي بوعي الخلاف واستقرار النتائج!
أركايف للذكاءمنذ 1 شهر
نماذج لغوية
تجاوز الأعداد: كيف تقيم جودة تفكير نماذج اللغات الضخمة (LLMs) من خلال الهندسة والتوازن
أركايف للذكاءمنذ 1 شهر
أبحاث
إطلاق إطار شامل لتقييم الحوكمة المستمر للذكاء الاصطناعي في الأنظمة السريرية!
أركايف للذكاءمنذ 1 شهر
أبحاث
اختبارات الذكاء الاصطناعي: كيف أصبحت أداة التقييم الجديدة عبئًا على الأداء! 🚀
هاجينج فيسمنذ 1 شهر
أبحاث
تحليل قدرات النماذج الذكية ومخاطر استخدامها في الأسلحة البيولوجية
أركايف للذكاءمنذ 1 شهر
أبحاث
عالم الذكاء الاصطناعي: اختبارات الذكاء البصري تكشف أسرار قدرات نماذج اللغة متعددة الوسائط!
أركايف للذكاءمنذ 1 شهر
أبحاث
HINTBench: معيار جديد لتقييم مخاطر الذكاء الاصطناعي غير الهجومية
أركايف للذكاءمنذ 1 شهر
أدوات
أوراك: منصة جديدة لتقييم وتدريب وكلاء الذكاء الاصطناعي في عالم الألعاب
أركايف للذكاءمنذ 1 شهر
أبحاث
SEA-Eval: معيار ثوري لتقييم الوكلاء الذاتي التطور يتجاوز التقييم التقليدي
أركايف للذكاءمنذ 1 شهر
← السابق2 / 2
