🏷️ #التقييم
36 مقال
أبحاث
سير النظام الموحد: ثورة في إطار التجارب لفهم الكلام
أركايف للذكاءمنذ 3 يوم
أبحاث
طفرة جديدة في نماذج العالم: تقنية World Action Verifier تعيد تعريف الذكاء الاصطناعي
أركايف للذكاءمنذ 3 يوم
أبحاث
GPF-LiveNews: بروتوكول مثير لتقييم نماذج اللغة في إطار أحداث حية!
أركايف للذكاءمنذ 6 يوم
أبحاث
هل يمكن أن تجيب الأنظمة الذكية بشكل مختلف على نفس السؤال؟ اكتشفوا سر الاعتماد على المصادر المتعددة في الرعاية الصحية!
أركايف للذكاءمنذ 6 يوم
أدوات
إي-فالواتور: الأداة الثورية لتقييم موثوقية أنظمة الذكاء الاصطناعي
أركايف للذكاءمنذ 6 يوم
أبحاث
تحليل فعالية الاقتباسات: كيف يمكن تحسين دقة الإشارة في تقييم RAG
أركايف للذكاءمنذ 7 يوم
أبحاث
MatFormBench: الإطار الثوري لتقييم تصميم المواد المستهدف وتحسين الأداء
أركايف للذكاءمنذ 8 يوم
أبحاث
CityRep: معيار موحد لتقييم التمثيلات الحضرية عبر المدن والمهام والأساليب!
أركايف للذكاءمنذ 9 يوم
أبحاث
StakeBench: إطار ثوري لتقييم فهم اللغة على أساس التزام السوق!
أركايف للذكاءمنذ 9 يوم
أبحاث
فهم ذاكرتنا الوكيلة: تحليل هياكلها وقيودها عبر دراسة شاملة
أركايف للذكاءمنذ 13 يوم
أبحاث
كوك سكيل: المعيار الثوري لقياس معالجة التسلسلات في الذكاء الاصطناعي
أركايف للذكاءمنذ 15 يوم
أبحاث
توقع صعوبة الأسئلة الاختيارية: كيف يغير الذكاء الاصطناعي طريقة تقييم القدرات الدراسية؟
أركايف للذكاءمنذ 16 يوم
أبحاث
MANTA: الإطار الثوري لتقييم التفكير غير البشري والمواءمة في الذكاء الاصطناعي
أركايف للذكاءمنذ 16 يوم
نماذج لغوية
هل يمكن لنماذج اللغات الضخمة رفض الإجابة عن الأسئلة التي لا تعرفها؟ اكتشفوا قدرة الرفض المعرفي!
أركايف للذكاءمنذ 16 يوم
أبحاث
تجربة ثورية: تقييم دقة ChatGPT في ترميز بيانات التواصل عبر الفئات المختلفة!
أركايف للذكاءمنذ 16 يوم
أبحاث
ShopGym: الإطار المتكامل الذي يغير قواعد لعبة تقييم وكيل التجارة الإلكترونية!
أركايف للذكاءمنذ 17 يوم
أبحاث
اكتشاف أبعاد جديدة في الذكاء الاصطناعي: تحسين تقنيات AIVAT لتقليل التباين وزيادة الدقة!
أركايف للذكاءمنذ 20 يوم
أبحاث
تقييم شامل وتشخيص فشل وكلاء الذكاء الاصطناعي: ثورة في تحليل الأداء
أركايف للذكاءمنذ 20 يوم
أبحاث
تحسين نماذج اللغة الشاملة: خطوات ما بعد التدريب وتأثير التقييم الخالي من التحيز البصري
أركايف للذكاءمنذ 20 يوم
أبحاث
ريزد: إطار تقييم سلامة الذكاء الاصطناعي قبل التنفيذ لتحسين أنظمة الدعم القرار السريرية
أركايف للذكاءمنذ 21 يوم
1 / 2التالي →
