Ailoxa Logo

🏷️ #التقييم

36 مقال

GSM-SEM: الإطار الثوري لتوليد تنويعات ذات دلالة لتعزيز قياس الذكاء الاصطناعي!
أبحاث

GSM-SEM: الإطار الثوري لتوليد تنويعات ذات دلالة لتعزيز قياس الذكاء الاصطناعي!

أركايف للذكاءمنذ 25 يوم
فهم سياسة سلامة المعلّقين: كيف تجعل التعلم الآلي أكثر أماناً وشفافية
أبحاث

فهم سياسة سلامة المعلّقين: كيف تجعل التعلم الآلي أكثر أماناً وشفافية

أركايف للذكاءمنذ 28 يوم
اختبار الأدلة الجزئية: معيار جديد للتقييم في أنظمة الوكالة المحدودة
أبحاث

اختبار الأدلة الجزئية: معيار جديد للتقييم في أنظمة الوكالة المحدودة

أركايف للذكاءمنذ 28 يوم
إعادة التفكير في فاعلية تقييم اكتشاف البيانات الخارجية من خلال التعلم العميق الدلالي
أبحاث

إعادة التفكير في فاعلية تقييم اكتشاف البيانات الخارجية من خلال التعلم العميق الدلالي

أركايف للذكاءمنذ 28 يوم
معيار موحد لتقييم طرق بناء الرسوم البيانية المعرفية والشبكات العصبية الرسومية!
أبحاث

معيار موحد لتقييم طرق بناء الرسوم البيانية المعرفية والشبكات العصبية الرسومية!

أركايف للذكاءمنذ 28 يوم
نحو تحسين جودة وصف الصوت: أداة مبتكرة لتقييم المحللين البشريين ونماذج اللغة المرئية
أبحاث

نحو تحسين جودة وصف الصوت: أداة مبتكرة لتقييم المحللين البشريين ونماذج اللغة المرئية

أركايف للذكاءمنذ 28 يوم
TMD-Bench: منصة تقييم مبتكرة لتوليد الموسيقى والرقص بشكل متزامن!
أبحاث

TMD-Bench: منصة تقييم مبتكرة لتوليد الموسيقى والرقص بشكل متزامن!

أركايف للذكاءمنذ 1 شهر
STABLEVAL: الإطار الثوري لتقييم أنظمة الذكاء الاصطناعي بوعي الخلاف واستقرار النتائج!
أبحاث

STABLEVAL: الإطار الثوري لتقييم أنظمة الذكاء الاصطناعي بوعي الخلاف واستقرار النتائج!

أركايف للذكاءمنذ 1 شهر
تجاوز الأعداد: كيف تقيم جودة تفكير نماذج اللغات الضخمة (LLMs) من خلال الهندسة والتوازن
نماذج لغوية

تجاوز الأعداد: كيف تقيم جودة تفكير نماذج اللغات الضخمة (LLMs) من خلال الهندسة والتوازن

أركايف للذكاءمنذ 1 شهر
إطلاق إطار شامل لتقييم الحوكمة المستمر للذكاء الاصطناعي في الأنظمة السريرية!
أبحاث

إطلاق إطار شامل لتقييم الحوكمة المستمر للذكاء الاصطناعي في الأنظمة السريرية!

أركايف للذكاءمنذ 1 شهر
اختبارات الذكاء الاصطناعي: كيف أصبحت أداة التقييم الجديدة عبئًا على الأداء! 🚀
أبحاث

اختبارات الذكاء الاصطناعي: كيف أصبحت أداة التقييم الجديدة عبئًا على الأداء! 🚀

هاجينج فيسمنذ 1 شهر
تحليل قدرات النماذج الذكية ومخاطر استخدامها في الأسلحة البيولوجية
أبحاث

تحليل قدرات النماذج الذكية ومخاطر استخدامها في الأسلحة البيولوجية

أركايف للذكاءمنذ 1 شهر
عالم الذكاء الاصطناعي: اختبارات الذكاء البصري تكشف أسرار قدرات نماذج اللغة متعددة الوسائط!
أبحاث

عالم الذكاء الاصطناعي: اختبارات الذكاء البصري تكشف أسرار قدرات نماذج اللغة متعددة الوسائط!

أركايف للذكاءمنذ 1 شهر
HINTBench: معيار جديد لتقييم مخاطر الذكاء الاصطناعي غير الهجومية
أبحاث

HINTBench: معيار جديد لتقييم مخاطر الذكاء الاصطناعي غير الهجومية

أركايف للذكاءمنذ 1 شهر
أوراك: منصة جديدة لتقييم وتدريب وكلاء الذكاء الاصطناعي في عالم الألعاب
أدوات

أوراك: منصة جديدة لتقييم وتدريب وكلاء الذكاء الاصطناعي في عالم الألعاب

أركايف للذكاءمنذ 1 شهر
SEA-Eval: معيار ثوري لتقييم الوكلاء الذاتي التطور يتجاوز التقييم التقليدي
أبحاث

SEA-Eval: معيار ثوري لتقييم الوكلاء الذاتي التطور يتجاوز التقييم التقليدي

أركايف للذكاءمنذ 1 شهر