Ailoxa Logo

🏷️ #معايير تقييم

23 مقال

Hedge-Bench: معيار جديد لتقييم أداء الوكلاء في مهام التحليل المالي المعقدة!
أبحاث

Hedge-Bench: معيار جديد لتقييم أداء الوكلاء في مهام التحليل المالي المعقدة!

أركايف للذكاءمنذ 1 يوم
Harness-Bench: ثورة في قياس تأثيرات الهياكل على نماذج الذكاء الاصطناعي في بيئات العمل الواقعية!
أبحاث

Harness-Bench: ثورة في قياس تأثيرات الهياكل على نماذج الذكاء الاصطناعي في بيئات العمل الواقعية!

أركايف للذكاءمنذ 7 يوم
ثورة جديدة في تقييم نماذج التنبؤ: كيف يمكن أن تغير المعايير الجديدة عالم الذكاء الاصطناعي؟
أبحاث

ثورة جديدة في تقييم نماذج التنبؤ: كيف يمكن أن تغير المعايير الجديدة عالم الذكاء الاصطناعي؟

أركايف للذكاءمنذ 7 يوم
اكتشاف معايير جديدة للقيادة الذاتية: Drive-P2D لتقييم الفهم واتخاذ القرار بشكل متكامل
أبحاث

اكتشاف معايير جديدة للقيادة الذاتية: Drive-P2D لتقييم الفهم واتخاذ القرار بشكل متكامل

أركايف للذكاءمنذ 8 يوم
هل تعاني الأنظمة الذكية من هلاوس غير متوقعة؟ اكتشفوا أحدث الحلول في تقييم الأداء!
أبحاث

هل تعاني الأنظمة الذكية من هلاوس غير متوقعة؟ اكتشفوا أحدث الحلول في تقييم الأداء!

أركايف للذكاءمنذ 9 يوم
OmniGUI: الثورة الجديدة في تقييم وكالات واجهة المستخدم الرسومية في بيئات الهواتف الذكية!
أبحاث

OmniGUI: الثورة الجديدة في تقييم وكالات واجهة المستخدم الرسومية في بيئات الهواتف الذكية!

أركايف للذكاءمنذ 15 يوم
ابتكار معايير دقيقة لتقييم شامل لنماذج الذكاء الاصطناعي!
أبحاث

ابتكار معايير دقيقة لتقييم شامل لنماذج الذكاء الاصطناعي!

أركايف للذكاءمنذ 15 يوم
👁 1
EgoCoT-Bench: خطوة ثورية في تقييم نماذج الذكاء الاصطناعي لفهم الفيديو من منظور ذاتي!
أبحاث

EgoCoT-Bench: خطوة ثورية في تقييم نماذج الذكاء الاصطناعي لفهم الفيديو من منظور ذاتي!

أركايف للذكاءمنذ 15 يوم
CAM-Bench: ثورة جديدة في قياس الذكاء الاصطناعي في الرياضيات التطبيقية
أبحاث

CAM-Bench: ثورة جديدة في قياس الذكاء الاصطناعي في الرياضيات التطبيقية

أركايف للذكاءمنذ 16 يوم
هل معايير تقييم المشفرات التلقائية النادرة موثوقة؟ اكتشف الحقيقة المذهلة!
أبحاث

هل معايير تقييم المشفرات التلقائية النادرة موثوقة؟ اكتشف الحقيقة المذهلة!

أركايف للذكاءمنذ 16 يوم
ألپس بنش: المعيار الثوري لتخصيص نماذج الذكاء الاصطناعي في الحوار الحقيقي!
نماذج لغوية

ألپس بنش: المعيار الثوري لتخصيص نماذج الذكاء الاصطناعي في الحوار الحقيقي!

أركايف للذكاءمنذ 23 يوم
ابتكار جديد في تصميم الدوائر: PostEDA-Bench يُحدث ثورة في تقييم أداء الذكاء الاصطناعي
أبحاث

ابتكار جديد في تصميم الدوائر: PostEDA-Bench يُحدث ثورة في تقييم أداء الذكاء الاصطناعي

أركايف للذكاءمنذ 24 يوم
بروكتيف موبايل: المعيار الثوري لتعزيز الذكاء الاستباقي على الأجهزة المحمولة!
أبحاث

بروكتيف موبايل: المعيار الثوري لتعزيز الذكاء الاستباقي على الأجهزة المحمولة!

أركايف للذكاءمنذ 24 يوم
استكشاف CrossCult-KIBench: معيار جديد لتحسين التفاعل الثقافي في نماذج اللغات الضخمة!
أبحاث

استكشاف CrossCult-KIBench: معيار جديد لتحسين التفاعل الثقافي في نماذج اللغات الضخمة!

أركايف للذكاءمنذ 27 يوم
iPhoneBlur: معيار متقدم لتقييم استعادة الصور المتأثرة بالتحركات على أجهزة الهاتف الذكي
أبحاث

iPhoneBlur: معيار متقدم لتقييم استعادة الصور المتأثرة بالتحركات على أجهزة الهاتف الذكي

أركايف للذكاءمنذ 27 يوم
AVA-Bench: معيار جديد لقياس القدرات البصرية للنماذج الأساسية للرؤية
أبحاث

AVA-Bench: معيار جديد لقياس القدرات البصرية للنماذج الأساسية للرؤية

أركايف للذكاءمنذ 29 يوم
ثورة التحقق من الحقائق: VeriTaS أول معيار ديناميكي لبرامج تقييم المعلومات المتعددة الأبعاد!
أبحاث

ثورة التحقق من الحقائق: VeriTaS أول معيار ديناميكي لبرامج تقييم المعلومات المتعددة الأبعاد!

أركايف للذكاءمنذ 1 شهر
RPC-Bench: ابتكار معيار دقيق لفهم البحوث العلمية يعيد تشكيل مستقبل النماذج اللغوية!
أبحاث

RPC-Bench: ابتكار معيار دقيق لفهم البحوث العلمية يعيد تشكيل مستقبل النماذج اللغوية!

أركايف للذكاءمنذ 1 شهر
ابتكار مقاييس تقييم جديدة للذكاء الاصطناعي: كيف يواجه الذكاء الاصطناعي تحديات العالم الحقيقي؟
أبحاث

ابتكار مقاييس تقييم جديدة للذكاء الاصطناعي: كيف يواجه الذكاء الاصطناعي تحديات العالم الحقيقي؟

أركايف للذكاءمنذ 1 شهر
DRBENCHER: هل يمكن لوكيلك التعرف على الكيانات واسترجاع خصائصها وإجراء الحسابات؟
أبحاث

DRBENCHER: هل يمكن لوكيلك التعرف على الكيانات واسترجاع خصائصها وإجراء الحسابات؟

أركايف للذكاءمنذ 1 شهر