🏷️ #تقييم
179 مقال
أبحاث
إطلاق CreativityBench: معيار جديد لتقييم الإبداع في الذكاء الاصطناعي من خلال إعادة استخدام الأدوات!
أركايف للذكاءمنذ 29 يوم
أبحاث
تقييم الأنظمة المستقلة في الوقت الحقيقي تحت هجمات معادية: كيف نحقق الأمان في القيادة الذاتية؟
أركايف للذكاءمنذ 29 يوم
أبحاث
MCJudgeBench: الثورية في تقييم القضاة على مستوى القيود في تنفيذ التعليمات المتعددة!
أركايف للذكاءمنذ 29 يوم
أبحاث
iWorld-Bench: المنصة الثورية لتقييم نماذج العالم التفاعلية في الذكاء الاصطناعي!
أركايف للذكاءمنذ 29 يوم
روبوتات
RoboEval: ثورة في تقييم الأداء الروبوتي من خلال مقاييس شاملة ومباشرة
أركايف للذكاءمنذ 29 يوم
أبحاث
مؤشر GR-Ben: ثورة في تقييم نماذج المكافآت العملية في الذكاء الاصطناعي
أركايف للذكاءمنذ 1 شهر
أبحاث
اكتشاف الذكاء الاصطناعي الوكّي: ثغرات ومخاطر تتطلب إطار تقييم مبتكر!
أركايف للذكاءمنذ 1 شهر
أبحاث
مغامرة الذاكرة الذكية: تعرف على بروتوكول MEMAUDIT الثوري لتقييم الكتابة الطويلة الأمد!
أركايف للذكاءمنذ 1 شهر
أبحاث
إطلاق إطار CLEAR: كيف تؤثر الضوضاء والغموض على موثوقية النماذج اللغوية الكبيرة في الطب؟
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة تقييم الذكاء الاصطناعي: المبادئ التوجيهية لتجارب التحكم العشوائي
أركايف للذكاءمنذ 1 شهر
أبحاث
اكتشاف الحدود: منصة oMeBench لقياس قدرة نماذج اللغة في فهم آليات التفاعلات العضوية
أركايف للذكاءمنذ 1 شهر
أبحاث
هل يمكنك الوثوق بالاستثمارات المدعومة بالذكاء الاصطناعي؟ تعرف على قيمة ValueBlindBench!
أركايف للذكاءمنذ 1 شهر
أبحاث
سورج: إطار تقييم جديد لتحسين توليد الاستبيانات العلمية
أركايف للذكاءمنذ 1 شهر
أبحاث
من المختبر إلى العالم الحقيقي: تقييم التفكير البرمجي في مستوى المستودع
أركايف للذكاءمنذ 1 شهر
أبحاث
اكتشاف إمكانيات الذكاء الاصطناعي: MCP-Atlas يرفع مستوى الكفاءة في استخدام الأدوات
أركايف للذكاءمنذ 1 شهر
أبحاث
FinChain: المعلم الرمزي الجديد في تقييم التحليل المالي القابل للتحقق
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة التعليم: تقييم نماذج اللغة متعددة الوسائط لحل مشكلات طلاب STEM في الجامعات
أركايف للذكاءمنذ 1 شهر
أبحاث
إعادة التفكير في معايير الذكاء الاصطناعي في الرعاية الصحية: إطار MedCheck الثوري!
أركايف للذكاءمنذ 1 شهر
أبحاث
اكتشف Auto-ARGUE: ثورة جديدة في تقييم توليد التقارير المعتمدة على الذكاء الاصطناعي!
أركايف للذكاءمنذ 1 شهر
أبحاث
كيف يمكن لقضاة الذكاء الاصطناعي أن يتجاوزوا التحيز؟ دراسة شاملة لاستراتيجيات التخفيف من التحيز في نماذج القضاة!
أركايف للذكاءمنذ 1 شهر
