Ailoxa Logo

🏷️ #تقييم

178 مقال

شكرًا ل ChromaFlow: دراسة مبتكرة تكشف النقاب عن تحديات تقييم الوكلاء المدعومين بالأدوات
أبحاث

شكرًا ل ChromaFlow: دراسة مبتكرة تكشف النقاب عن تحديات تقييم الوكلاء المدعومين بالأدوات

أركايف للذكاءمنذ 21 يوم
ثورة في مقاييس تقييم نماذج الذكاء الاصطناعي: كيفية تشكيل الثقافة من خلال المعايير
أبحاث

ثورة في مقاييس تقييم نماذج الذكاء الاصطناعي: كيفية تشكيل الثقافة من خلال المعايير

أركايف للذكاءمنذ 21 يوم
هل_agents جاهزون لتعليمنا؟ معايير جديدة لتقييم قدرة الوكلاء في التعليم
أبحاث

هل_agents جاهزون لتعليمنا؟ معايير جديدة لتقييم قدرة الوكلاء في التعليم

أركايف للذكاءمنذ 21 يوم
تجارة الماشية: معيار متعدد الوكلاء لتقييم قدرات نماذج اللغة الكبيرة في استراتيجيات المقامرة والمساومة
أبحاث

تجارة الماشية: معيار متعدد الوكلاء لتقييم قدرات نماذج اللغة الكبيرة في استراتيجيات المقامرة والمساومة

أركايف للذكاءمنذ 21 يوم
نماذج لغوية صغيرة خاصة: شركاء مثاليون في تصميم تقييمات التعليم!
أبحاث

نماذج لغوية صغيرة خاصة: شركاء مثاليون في تصميم تقييمات التعليم!

أركايف للذكاءمنذ 21 يوم
ابتكار جديد في تقييم إزالة الأجسام من الصور: PROVE يحسن الدقة الإدراكية
أبحاث

ابتكار جديد في تقييم إزالة الأجسام من الصور: PROVE يحسن الدقة الإدراكية

أركايف للذكاءمنذ 21 يوم
تحسين وتقييم خرائط الخصائص التفسيرية للذكاء الاصطناعي: طُرق مبتكرة ونتائج مبهرة!
أبحاث

تحسين وتقييم خرائط الخصائص التفسيرية للذكاء الاصطناعي: طُرق مبتكرة ونتائج مبهرة!

أركايف للذكاءمنذ 21 يوم
DisaBench: ثورة في تقييم مخاطر الإعاقات في نماذج اللغة!
أبحاث

DisaBench: ثورة في تقييم مخاطر الإعاقات في نماذج اللغة!

أركايف للذكاءمنذ 22 يوم
ثورة الذكاء الاصطناعي في العناية المركزة: كيف يُقيم RealICU قدرات نماذج اللغة العملاقة في تحليل البيانات الطويلة؟
أبحاث

ثورة الذكاء الاصطناعي في العناية المركزة: كيف يُقيم RealICU قدرات نماذج اللغة العملاقة في تحليل البيانات الطويلة؟

أركايف للذكاءمنذ 22 يوم
ثورة جديدة في تقنيات الذكاء الاصطناعي: منهج RTLC يعزز دقة نماذج اللغة الكبيرة دون تعديل!
أبحاث

ثورة جديدة في تقنيات الذكاء الاصطناعي: منهج RTLC يعزز دقة نماذج اللغة الكبيرة دون تعديل!

أركايف للذكاءمنذ 22 يوم
تعزيز موثوقية التقييم من خلال نموذج متعدد المستويات للمحكمين: خطوة نحو تحقيق العدالة في الذكاء الاصطناعي
أبحاث

تعزيز موثوقية التقييم من خلال نموذج متعدد المستويات للمحكمين: خطوة نحو تحقيق العدالة في الذكاء الاصطناعي

أركايف للذكاءمنذ 22 يوم
تقييم مبتكر للذكاء الاصطناعي: تعزيز الأداء عبر نماذج اللغة الكبيرة!
أبحاث

تقييم مبتكر للذكاء الاصطناعي: تعزيز الأداء عبر نماذج اللغة الكبيرة!

أركايف للذكاءمنذ 22 يوم
ثورة في تقييم نظم الحوار الطبية: نموذج آلي يضمن موثوقية التقييم!
أبحاث

ثورة في تقييم نظم الحوار الطبية: نموذج آلي يضمن موثوقية التقييم!

أركايف للذكاءمنذ 22 يوم
طرق مبتكرة لتقدير التصنيفات: شروط تطبيق منهجية التقييم الحُكمية
أبحاث

طرق مبتكرة لتقدير التصنيفات: شروط تطبيق منهجية التقييم الحُكمية

أركايف للذكاءمنذ 24 يوم
الذكاء الاصطناعي في الأبحاث: فائدة في الاستكشاف ومخاطر في الدقة!
أبحاث

الذكاء الاصطناعي في الأبحاث: فائدة في الاستكشاف ومخاطر في الدقة!

أركايف للذكاءمنذ 24 يوم
SGC-RML: تقييم موثوق وشامل لمرض باركنسون باستخدام تقنيات حديثة
أبحاث

SGC-RML: تقييم موثوق وشامل لمرض باركنسون باستخدام تقنيات حديثة

أركايف للذكاءمنذ 24 يوم
هل تقدر المعايير أداء نماذج اللغة الكبيرة بشكل كافٍ؟ اكتشاف الاستدلالات بدقة من خلال التقييمات البشرية!
أبحاث

هل تقدر المعايير أداء نماذج اللغة الكبيرة بشكل كافٍ؟ اكتشاف الاستدلالات بدقة من خلال التقييمات البشرية!

أركايف للذكاءمنذ 24 يوم
ProactBench: ثورة في تقييم الذكاء الاصطناعي من خلال التحفيز التفاعلي!
أبحاث

ProactBench: ثورة في تقييم الذكاء الاصطناعي من خلال التحفيز التفاعلي!

أركايف للذكاءمنذ 24 يوم
ابتكار المعايير التفاعلية: لقياس الذكاء الاصطناعي بطريقة جديدة ومذهلة
أبحاث

ابتكار المعايير التفاعلية: لقياس الذكاء الاصطناعي بطريقة جديدة ومذهلة

أركايف للذكاءمنذ 24 يوم
نموذج المكافأة المرتبطة بالتخطيط: ثورة في تقييم وكالات الذكاء الاصطناعي
أبحاث

نموذج المكافأة المرتبطة بالتخطيط: ثورة في تقييم وكالات الذكاء الاصطناعي

أركايف للذكاءمنذ 24 يوم