🏷️ #تقييم
179 مقال
أبحاث
تسليط الضوء على تأثيرات النماذج اللغوية الضخمة: إطار شفاف لتقدير الأداء
أركايف للذكاءمنذ 1 شهر
أبحاث
CyberCertBench: أداة مبتكرة لتقييم مهارات نماذج اللغة في أمن المعلومات
أركايف للذكاءمنذ 1 شهر
أبحاث
OMIBench: ثورة في تقييم القدرة الاستدلالية للنماذج البصرية اللغوية المتقدمة!
أركايف للذكاءمنذ 1 شهر
أبحاث
إطار عمل LLM كقاضي: تقييم الخيال الناتج عن نبرة المدخلات في نماذج اللغة والرؤية
أركايف للذكاءمنذ 1 شهر
نماذج لغوية
CulturALL: تحدي تقييم ذكاء النماذج اللغوية متعددة الثقافات واللغات!
أركايف للذكاءمنذ 1 شهر
أبحاث
ابتكار جديد: كيفية تعزيز الاكتشافات العلمية من خلال القياس المدعوم بالتقييم
أركايف للذكاءمنذ 1 شهر
أبحاث
مؤشر الدفاع السيبراني: تقييم مطاردة التهديدات باستخدام نماذج اللغة في عمليات الأمان
أركايف للذكاءمنذ 1 شهر
أبحاث
كيف تغيرت آراء مراجعة الأقران بفضل نماذج اللغات الضخمة؟
أركايف للذكاءمنذ 1 شهر
أبحاث
RepIt: الابتكار الذي يكشف عيوب نماذج اللغة في تقييم السلامة
أركايف للذكاءمنذ 1 شهر
أبحاث
دليل شامل لتقييم مساعدي الذكاء الاصطناعي: سحابيات مقابل محليين في استخراج السلاسل السببية
أركايف للذكاءمنذ 1 شهر
أبحاث
AlphaContext: ثورة في توليد السياقات النفسية لتقييم الإبداع
أركايف للذكاءمنذ 1 شهر
أبحاث
PRL-Bench: المعيار الشامل لقياس قدرات نماذج الذكاء الاصطناعي في أبحاث الفيزياء الرائدة
أركايف للذكاءمنذ 1 شهر
أبحاث
BAGEL: معيار جديد لتقييم معرفة نماذج اللغة حول الحياة الحيوانية
أركايف للذكاءمنذ 1 شهر
أدوات
تطوير ثوري: إطلاق vla-eval لتقييم نماذج الرؤية واللغة والعمل
أركايف للذكاءمنذ 1 شهر
أبحاث
ابتكار MTR-DuplexBench: تقييم شامل للمحادثات المتعددة للجولات في نماذج الكلام المزدوج
أركايف للذكاءمنذ 1 شهر
أبحاث
InfiniteScienceGym: معايير مبتكرة لتحليل علمي غير محدود
أركايف للذكاءمنذ 1 شهر
أبحاث
ما هو BenGER؟ منصة ويب مبتكرة لتقييم المهام القانونية الألمانية
أركايف للذكاءمنذ 1 شهر
أبحاث
تقييم نماذج التعلم الآلي المُشرف: المبادئ، التحديات، واختيار المقاييس الفعّالة
أركايف للذكاءمنذ 1 شهر
أبحاث
LongCoT: معيار جديد لقياس قدرة الذكاء الاصطناعي على التفكير العميق
أركايف للذكاءمنذ 1 شهر
أدوات
ثورة في تجربة المستخدم: Avenir-UX لتقييم واجهات المواقع بشكل آلي يغير قواعد اللعبة!
أركايف للذكاءمنذ 1 شهر
