🏷️ #تقييم الأداء

163 مقال

كيف تؤثر أدوات التحكم على معتقدات الوكلاء الذكيين؟ اكتشاف جديد في علم الذكاء الاصطناعي!

كيف تؤثر أدوات التحكم على معتقدات الوكلاء الذكيين؟ اكتشاف جديد في علم الذكاء الاصطناعي!

أركايف للذكاءمنذ 14 يوم

CAGE-1: إطار تقييم التحكم والموثوقية لذكاء الأعمال الصناعي

CAGE-1: إطار تقييم التحكم والموثوقية لذكاء الأعمال الصناعي

أركايف للذكاءمنذ 14 يوم

إطار جبري موحد لتقييم أداء التصنيف: تطور جديد في عالم الذكاء الاصطناعي!

إطار جبري موحد لتقييم أداء التصنيف: تطور جديد في عالم الذكاء الاصطناعي!

أركايف للذكاءمنذ 14 يوم

كيفية قياس فعالية المهارات في نماذج الذكاء الاصطناعي: اكتشاف مقياس تغطية المهارات!

كيفية قياس فعالية المهارات في نماذج الذكاء الاصطناعي: اكتشاف مقياس تغطية المهارات!

أركايف للذكاءمنذ 14 يوم

تشخيص مبتكر لتقييم النماذج: استراتيجيات جديدة في التعلم المعزز

تشخيص مبتكر لتقييم النماذج: استراتيجيات جديدة في التعلم المعزز

أركايف للذكاءمنذ 14 يوم

معيار وكلاء أنظمة الطاقة: تقييم فوري لوكلاء الذكاء الاصطناعي في هندسة الطاقة الكهربائية!

معيار وكلاء أنظمة الطاقة: تقييم فوري لوكلاء الذكاء الاصطناعي في هندسة الطاقة الكهربائية!

أركايف للذكاءمنذ 18 يوم

PACE: الإطار الثوري لتقييم قدرات الذكاء الاصطناعي بكفاءة عالية

نماذج لغوية

PACE: الإطار الثوري لتقييم قدرات الذكاء الاصطناعي بكفاءة عالية

أركايف للذكاءمنذ 18 يوم

اكتشافات مذهلة: كيف تؤثر الهياكل الاجتماعية على أداء وكلاء الذكاء الاصطناعي؟

اكتشافات مذهلة: كيف تؤثر الهياكل الاجتماعية على أداء وكلاء الذكاء الاصطناعي؟

أركايف للذكاءمنذ 18 يوم

عقود ذكية لتفويض الذكاء الاصطناعي: كيف تحقق الفعالية الاقتصادية؟

عقود ذكية لتفويض الذكاء الاصطناعي: كيف تحقق الفعالية الاقتصادية؟

أركايف للذكاءمنذ 18 يوم

تحديات جديدة في نماذج الذكاء الاصطناعي الموسيقية: ما وراء ثنائية الجودة!

تحديات جديدة في نماذج الذكاء الاصطناعي الموسيقية: ما وراء ثنائية الجودة!

أركايف للذكاءمنذ 20 يوم

صندوق أدوات HealthAgentBench: معيار موحد لتقييم عوامل الذكاء الاصطناعي في بيئات الرعاية الصحية

صندوق أدوات HealthAgentBench: معيار موحد لتقييم عوامل الذكاء الاصطناعي في بيئات الرعاية الصحية

أركايف للذكاءمنذ 20 يوم

إعادة اختراع إدارة الأعمال: كيف توازن الأنظمة الذكية بين الاستقلالية والموثوقية؟

إعادة اختراع إدارة الأعمال: كيف توازن الأنظمة الذكية بين الاستقلالية والموثوقية؟

أركايف للذكاءمنذ 20 يوم

سكارف بنش: معيارية جديدة لتقييم وكلاء الذكاء الاصطناعي في ترحيل إطار عمل جافا للمؤسسات

سكارف بنش: معيارية جديدة لتقييم وكلاء الذكاء الاصطناعي في ترحيل إطار عمل جافا للمؤسسات

هاجينج فيسمنذ 20 يوم

CLQT: معيار مبتكر لإدارة المحافظ والاستثمار الذكي في عالم الذكاء الاصطناعي

CLQT: معيار مبتكر لإدارة المحافظ والاستثمار الذكي في عالم الذكاء الاصطناعي

أركايف للذكاءمنذ 21 يوم

SafePyramid: طفرة جديدة في تقييم سياسات الحماية في الذكاء الاصطناعي

SafePyramid: طفرة جديدة في تقييم سياسات الحماية في الذكاء الاصطناعي

أركايف للذكاءمنذ 21 يوم

RoAd-RL: المكتبة الموحدة التي تحول تجربة التعلم المعزز العدائي إلى مستوى جديد!

RoAd-RL: المكتبة الموحدة التي تحول تجربة التعلم المعزز العدائي إلى مستوى جديد!

أركايف للذكاءمنذ 21 يوم

KernelSight-LM: المحاكي الثوري لمستويات تنفيذ النماذج اللغوية الضخمة

KernelSight-LM: المحاكي الثوري لمستويات تنفيذ النماذج اللغوية الضخمة

أركايف للذكاءمنذ 21 يوم

TransXion: معيار جديد يتحدى طرق غسل الأموال بتقنيات متطورة

TransXion: معيار جديد يتحدى طرق غسل الأموال بتقنيات متطورة

أركايف للذكاءمنذ 25 يوم

StaminaBench: اختبار القدرة التحملية لوكلاء البرمجة عبر 100 جولة تفاعلية

StaminaBench: اختبار القدرة التحملية لوكلاء البرمجة عبر 100 جولة تفاعلية

أركايف للذكاءمنذ 1 شهر

WebSP-Eval: ثورة جديدة في تقييم أداء الوكلاء عبر الإنترنت في مهام الأمان والخصوصية!

WebSP-Eval: ثورة جديدة في تقييم أداء الوكلاء عبر الإنترنت في مهام الأمان والخصوصية!

أركايف للذكاءمنذ 1 شهر

← السابق2 / 9التالي →