Ailoxa Logo

🏷️ #التقييم

36 مقال

سير النظام الموحد: ثورة في إطار التجارب لفهم الكلام
أبحاث

سير النظام الموحد: ثورة في إطار التجارب لفهم الكلام

أركايف للذكاءمنذ 4 يوم
طفرة جديدة في نماذج العالم: تقنية World Action Verifier تعيد تعريف الذكاء الاصطناعي
أبحاث

طفرة جديدة في نماذج العالم: تقنية World Action Verifier تعيد تعريف الذكاء الاصطناعي

أركايف للذكاءمنذ 4 يوم
GPF-LiveNews: بروتوكول مثير لتقييم نماذج اللغة في إطار أحداث حية!
أبحاث

GPF-LiveNews: بروتوكول مثير لتقييم نماذج اللغة في إطار أحداث حية!

أركايف للذكاءمنذ 7 يوم
هل يمكن أن تجيب الأنظمة الذكية بشكل مختلف على نفس السؤال؟ اكتشفوا سر الاعتماد على المصادر المتعددة في الرعاية الصحية!
أبحاث

هل يمكن أن تجيب الأنظمة الذكية بشكل مختلف على نفس السؤال؟ اكتشفوا سر الاعتماد على المصادر المتعددة في الرعاية الصحية!

أركايف للذكاءمنذ 7 يوم
إي-فالواتور: الأداة الثورية لتقييم موثوقية أنظمة الذكاء الاصطناعي
أدوات

إي-فالواتور: الأداة الثورية لتقييم موثوقية أنظمة الذكاء الاصطناعي

أركايف للذكاءمنذ 7 يوم
تحليل فعالية الاقتباسات: كيف يمكن تحسين دقة الإشارة في تقييم RAG
أبحاث

تحليل فعالية الاقتباسات: كيف يمكن تحسين دقة الإشارة في تقييم RAG

أركايف للذكاءمنذ 8 يوم
MatFormBench: الإطار الثوري لتقييم تصميم المواد المستهدف وتحسين الأداء
أبحاث

MatFormBench: الإطار الثوري لتقييم تصميم المواد المستهدف وتحسين الأداء

أركايف للذكاءمنذ 9 يوم
CityRep: معيار موحد لتقييم التمثيلات الحضرية عبر المدن والمهام والأساليب!
أبحاث

CityRep: معيار موحد لتقييم التمثيلات الحضرية عبر المدن والمهام والأساليب!

أركايف للذكاءمنذ 10 يوم
StakeBench: إطار ثوري لتقييم فهم اللغة على أساس التزام السوق!
أبحاث

StakeBench: إطار ثوري لتقييم فهم اللغة على أساس التزام السوق!

أركايف للذكاءمنذ 10 يوم
فهم ذاكرتنا الوكيلة: تحليل هياكلها وقيودها عبر دراسة شاملة
أبحاث

فهم ذاكرتنا الوكيلة: تحليل هياكلها وقيودها عبر دراسة شاملة

أركايف للذكاءمنذ 14 يوم
كوك سكيل: المعيار الثوري لقياس معالجة التسلسلات في الذكاء الاصطناعي
أبحاث

كوك سكيل: المعيار الثوري لقياس معالجة التسلسلات في الذكاء الاصطناعي

أركايف للذكاءمنذ 16 يوم
توقع صعوبة الأسئلة الاختيارية: كيف يغير الذكاء الاصطناعي طريقة تقييم القدرات الدراسية؟
أبحاث

توقع صعوبة الأسئلة الاختيارية: كيف يغير الذكاء الاصطناعي طريقة تقييم القدرات الدراسية؟

أركايف للذكاءمنذ 17 يوم
MANTA: الإطار الثوري لتقييم التفكير غير البشري والمواءمة في الذكاء الاصطناعي
أبحاث

MANTA: الإطار الثوري لتقييم التفكير غير البشري والمواءمة في الذكاء الاصطناعي

أركايف للذكاءمنذ 17 يوم
هل يمكن لنماذج اللغات الضخمة رفض الإجابة عن الأسئلة التي لا تعرفها؟ اكتشفوا قدرة الرفض المعرفي!
نماذج لغوية

هل يمكن لنماذج اللغات الضخمة رفض الإجابة عن الأسئلة التي لا تعرفها؟ اكتشفوا قدرة الرفض المعرفي!

أركايف للذكاءمنذ 17 يوم
تجربة ثورية: تقييم دقة ChatGPT في ترميز بيانات التواصل عبر الفئات المختلفة!
أبحاث

تجربة ثورية: تقييم دقة ChatGPT في ترميز بيانات التواصل عبر الفئات المختلفة!

أركايف للذكاءمنذ 17 يوم
ShopGym: الإطار المتكامل الذي يغير قواعد لعبة تقييم وكيل التجارة الإلكترونية!
أبحاث

ShopGym: الإطار المتكامل الذي يغير قواعد لعبة تقييم وكيل التجارة الإلكترونية!

أركايف للذكاءمنذ 18 يوم
اكتشاف أبعاد جديدة في الذكاء الاصطناعي: تحسين تقنيات AIVAT لتقليل التباين وزيادة الدقة!
أبحاث

اكتشاف أبعاد جديدة في الذكاء الاصطناعي: تحسين تقنيات AIVAT لتقليل التباين وزيادة الدقة!

أركايف للذكاءمنذ 21 يوم
تقييم شامل وتشخيص فشل وكلاء الذكاء الاصطناعي: ثورة في تحليل الأداء
أبحاث

تقييم شامل وتشخيص فشل وكلاء الذكاء الاصطناعي: ثورة في تحليل الأداء

أركايف للذكاءمنذ 21 يوم
تحسين نماذج اللغة الشاملة: خطوات ما بعد التدريب وتأثير التقييم الخالي من التحيز البصري
أبحاث

تحسين نماذج اللغة الشاملة: خطوات ما بعد التدريب وتأثير التقييم الخالي من التحيز البصري

أركايف للذكاءمنذ 21 يوم
ريزد: إطار تقييم سلامة الذكاء الاصطناعي قبل التنفيذ لتحسين أنظمة الدعم القرار السريرية
أبحاث

ريزد: إطار تقييم سلامة الذكاء الاصطناعي قبل التنفيذ لتحسين أنظمة الدعم القرار السريرية

أركايف للذكاءمنذ 22 يوم