Ailoxa Logo

🏷️ #تقييم الأداء

97 مقال

نحو تحسن فعاليّة البحث عن الجيران الأقرب: ثورة في تقييم الذكاء الاصطناعي
أبحاث

نحو تحسن فعاليّة البحث عن الجيران الأقرب: ثورة في تقييم الذكاء الاصطناعي

أركايف للذكاءمنذ 1 يوم
كيف يمكن لنماذج اللغات الضخمة تحسين الأمان والموثوقية في المؤسسات؟
نماذج لغوية

كيف يمكن لنماذج اللغات الضخمة تحسين الأمان والموثوقية في المؤسسات؟

أركايف للذكاءمنذ 2 يوم
اختر بروتوكول الذكاء الاصطناعي الأمثل: ProtocolBench يكشف المعايير الخفية!
أبحاث

اختر بروتوكول الذكاء الاصطناعي الأمثل: ProtocolBench يكشف المعايير الخفية!

أركايف للذكاءمنذ 2 يوم
PolySpeech-100: معيار ثوري لفهم الكلام عبر 100 لغة ولهجة!
أبحاث

PolySpeech-100: معيار ثوري لفهم الكلام عبر 100 لغة ولهجة!

أركايف للذكاءمنذ 3 يوم
تحدي CodeGolf: تقييم مدهش لقدرات النماذج اللغوية في كتابة أكواد مختصرة!
أبحاث

تحدي CodeGolf: تقييم مدهش لقدرات النماذج اللغوية في كتابة أكواد مختصرة!

أركايف للذكاءمنذ 4 يوم
إعادة تعريف مطابقة النسخ: إطار موحد لمطابقة الوعي بالأجزاء في تقييم تقسيم بانوبتيك
أبحاث

إعادة تعريف مطابقة النسخ: إطار موحد لمطابقة الوعي بالأجزاء في تقييم تقسيم بانوبتيك

أركايف للذكاءمنذ 4 يوم
LH-Bench: تقييم مبتكر للذكاء الاصطناعي في مهام الأعمال اعتماداً على الخبرة
أبحاث

LH-Bench: تقييم مبتكر للذكاء الاصطناعي في مهام الأعمال اعتماداً على الخبرة

أركايف للذكاءمنذ 4 يوم
FEM-Bench: معيار جديد لتقييم قدرات النماذج اللغوية في إنتاج الأكواد العلمية
أبحاث

FEM-Bench: معيار جديد لتقييم قدرات النماذج اللغوية في إنتاج الأكواد العلمية

أركايف للذكاءمنذ 4 يوم
اختبار PTCG-Bench: هل تستطيع وكالات الذكاء الاصطناعي اتقان لعبة بطاقات بوكيمون؟
أبحاث

اختبار PTCG-Bench: هل تستطيع وكالات الذكاء الاصطناعي اتقان لعبة بطاقات بوكيمون؟

أركايف للذكاءمنذ 7 يوم
اكتشاف إمكانيات الذكاء الاصطناعي: اختبار تشخيصي لذكاء متعدد المصادر
أبحاث

اكتشاف إمكانيات الذكاء الاصطناعي: اختبار تشخيصي لذكاء متعدد المصادر

أركايف للذكاءمنذ 7 يوم
تقييم شامل لنماذج حراسة السلامة المفتوحة المصدر: كيف تختار الأفضل لحماية تطبيقات الذكاء الاصطناعي؟
أبحاث

تقييم شامل لنماذج حراسة السلامة المفتوحة المصدر: كيف تختار الأفضل لحماية تطبيقات الذكاء الاصطناعي؟

أركايف للذكاءمنذ 7 يوم
دفاعًا عن الخيال: DynSess يغير قواعد اللعبة في تقييم الروبوتات التفاعلية!
روبوتات

دفاعًا عن الخيال: DynSess يغير قواعد اللعبة في تقييم الروبوتات التفاعلية!

أركايف للذكاءمنذ 7 يوم
SPEED-Bench: المعيار الثوري لتسريع نماذج اللغة من خلال فك تشفير استباقي
أبحاث

SPEED-Bench: المعيار الثوري لتسريع نماذج اللغة من خلال فك تشفير استباقي

أركايف للذكاءمنذ 7 يوم
EgoBench: منصة جديدة ثورية لتقييم وكالات الذكاء الاصطناعي متعددة المهارات!
أبحاث

EgoBench: منصة جديدة ثورية لتقييم وكالات الذكاء الاصطناعي متعددة المهارات!

أركايف للذكاءمنذ 8 يوم
اكتشاف قوة الانتظار: أداة AsyncTool تقيم استجابة وظائف الذكاء الاصطناعي في سيناريوهات متعددة المهام!
أدوات

اكتشاف قوة الانتظار: أداة AsyncTool تقيم استجابة وظائف الذكاء الاصطناعي في سيناريوهات متعددة المهام!

أركايف للذكاءمنذ 8 يوم
هل تعكس المعايير التقليدية أداء نماذج الذكاء الاصطناعي؟ تعرف على RAMP لتقييم فعالية النماذج في أنظمة الإنتاج!
أبحاث

هل تعكس المعايير التقليدية أداء نماذج الذكاء الاصطناعي؟ تعرف على RAMP لتقييم فعالية النماذج في أنظمة الإنتاج!

أركايف للذكاءمنذ 8 يوم
ثورة جديدة في القانون الألماني: تقييم أنظمة الذكاء الاصطناعي في التفكير القانوني!
أبحاث

ثورة جديدة في القانون الألماني: تقييم أنظمة الذكاء الاصطناعي في التفكير القانوني!

أركايف للذكاءمنذ 8 يوم
فتح آفاق جديدة في البرمجة التنافسية: استراتيجيات متقدمة لتقييم الأداء بدقة وفعالية
أبحاث

فتح آفاق جديدة في البرمجة التنافسية: استراتيجيات متقدمة لتقييم الأداء بدقة وفعالية

أركايف للذكاءمنذ 8 يوم
ثورة الذكاء الاصطناعي: إطار مبتكر لتقييم مساهمات الفرق وحل النزاعات!
أبحاث

ثورة الذكاء الاصطناعي: إطار مبتكر لتقييم مساهمات الفرق وحل النزاعات!

أركايف للذكاءمنذ 9 يوم
استكشاف قدرات نماذج اللغة الكبيرة: معيار جديد للذكاء الاصطناعي في معالجة الصور النصية المعقدة
نماذج لغوية

استكشاف قدرات نماذج اللغة الكبيرة: معيار جديد للذكاء الاصطناعي في معالجة الصور النصية المعقدة

أركايف للذكاءمنذ 9 يوم