🏷️ #تقييم

275 مقال

ابتكار جديد في تقييم إزالة الأجسام من الصور: PROVE يحسن الدقة الإدراكية

ابتكار جديد في تقييم إزالة الأجسام من الصور: PROVE يحسن الدقة الإدراكية

أركايف للذكاءمنذ 2 شهر

نماذج لغوية صغيرة خاصة: شركاء مثاليون في تصميم تقييمات التعليم!

نماذج لغوية صغيرة خاصة: شركاء مثاليون في تصميم تقييمات التعليم!

أركايف للذكاءمنذ 2 شهر

هل_agents جاهزون لتعليمنا؟ معايير جديدة لتقييم قدرة الوكلاء في التعليم

هل_agents جاهزون لتعليمنا؟ معايير جديدة لتقييم قدرة الوكلاء في التعليم

أركايف للذكاءمنذ 2 شهر

تقييم مبتكر للذكاء الاصطناعي: تعزيز الأداء عبر نماذج اللغة الكبيرة!

تقييم مبتكر للذكاء الاصطناعي: تعزيز الأداء عبر نماذج اللغة الكبيرة!

أركايف للذكاءمنذ 2 شهر

ثورة في تقييم نظم الحوار الطبية: نموذج آلي يضمن موثوقية التقييم!

ثورة في تقييم نظم الحوار الطبية: نموذج آلي يضمن موثوقية التقييم!

أركايف للذكاءمنذ 2 شهر

ثورة جديدة في تقنيات الذكاء الاصطناعي: منهج RTLC يعزز دقة نماذج اللغة الكبيرة دون تعديل!

ثورة جديدة في تقنيات الذكاء الاصطناعي: منهج RTLC يعزز دقة نماذج اللغة الكبيرة دون تعديل!

أركايف للذكاءمنذ 2 شهر

ثورة الذكاء الاصطناعي في العناية المركزة: كيف يُقيم RealICU قدرات نماذج اللغة العملاقة في تحليل البيانات الطويلة؟

ثورة الذكاء الاصطناعي في العناية المركزة: كيف يُقيم RealICU قدرات نماذج اللغة العملاقة في تحليل البيانات الطويلة؟

أركايف للذكاءمنذ 2 شهر

DisaBench: ثورة في تقييم مخاطر الإعاقات في نماذج اللغة!

DisaBench: ثورة في تقييم مخاطر الإعاقات في نماذج اللغة!

أركايف للذكاءمنذ 2 شهر

تعزيز موثوقية التقييم من خلال نموذج متعدد المستويات للمحكمين: خطوة نحو تحقيق العدالة في الذكاء الاصطناعي

تعزيز موثوقية التقييم من خلال نموذج متعدد المستويات للمحكمين: خطوة نحو تحقيق العدالة في الذكاء الاصطناعي

أركايف للذكاءمنذ 2 شهر

SGC-RML: تقييم موثوق وشامل لمرض باركنسون باستخدام تقنيات حديثة

SGC-RML: تقييم موثوق وشامل لمرض باركنسون باستخدام تقنيات حديثة

أركايف للذكاءمنذ 2 شهر

هل تستطيع نماذج اللغة الضخمة تقدير صعوبات الطلاب؟ دراسة جديدة تكشف عن تحديات ملائمة صعوبات التعلم مع الذكاء الاصطناعي

هل تستطيع نماذج اللغة الضخمة تقدير صعوبات الطلاب؟ دراسة جديدة تكشف عن تحديات ملائمة صعوبات التعلم مع الذكاء الاصطناعي

أركايف للذكاءمنذ 2 شهر

اكتشفوا GraphBench: النقلة النوعية في تقييم تعلم الرسوم البيانية!

اكتشفوا GraphBench: النقلة النوعية في تقييم تعلم الرسوم البيانية!

أركايف للذكاءمنذ 2 شهر

AU-Harness: الأداة المفتوحة لتقييم شامل لنماذج اللغة الصوتية

AU-Harness: الأداة المفتوحة لتقييم شامل لنماذج اللغة الصوتية

أركايف للذكاءمنذ 2 شهر

MECAT: معيار جديد ثوري لفهم الصوت مع دقة فائقة!

MECAT: معيار جديد ثوري لفهم الصوت مع دقة فائقة!

أركايف للذكاءمنذ 2 شهر

ثورة في تقييم نماذج الذكاء الاصطناعي: كيف يكشف تعدد الأجيال عن قيمة جديدة

ثورة في تقييم نماذج الذكاء الاصطناعي: كيف يكشف تعدد الأجيال عن قيمة جديدة

أركايف للذكاءمنذ 2 شهر

نموذج المكافأة المرتبطة بالتخطيط: ثورة في تقييم وكالات الذكاء الاصطناعي

نموذج المكافأة المرتبطة بالتخطيط: ثورة في تقييم وكالات الذكاء الاصطناعي

أركايف للذكاءمنذ 2 شهر

ابتكار المعايير التفاعلية: لقياس الذكاء الاصطناعي بطريقة جديدة ومذهلة

ابتكار المعايير التفاعلية: لقياس الذكاء الاصطناعي بطريقة جديدة ومذهلة

أركايف للذكاءمنذ 2 شهر

ProactBench: ثورة في تقييم الذكاء الاصطناعي من خلال التحفيز التفاعلي!

ProactBench: ثورة في تقييم الذكاء الاصطناعي من خلال التحفيز التفاعلي!

أركايف للذكاءمنذ 2 شهر

هل تقدر المعايير أداء نماذج اللغة الكبيرة بشكل كافٍ؟ اكتشاف الاستدلالات بدقة من خلال التقييمات البشرية!

هل تقدر المعايير أداء نماذج اللغة الكبيرة بشكل كافٍ؟ اكتشاف الاستدلالات بدقة من خلال التقييمات البشرية!

أركايف للذكاءمنذ 2 شهر

الذكاء الاصطناعي في الأبحاث: فائدة في الاستكشاف ومخاطر في الدقة!

الذكاء الاصطناعي في الأبحاث: فائدة في الاستكشاف ومخاطر في الدقة!

أركايف للذكاءمنذ 2 شهر

← السابق9 / 14التالي →