🏷️ #تقييم

275 مقال

تحكم ذكي في تفاعل الإنسان مع نماذج اللغات الضخمة: أمان وسلوك مدني لا غنى عنه!

نماذج لغوية

تحكم ذكي في تفاعل الإنسان مع نماذج اللغات الضخمة: أمان وسلوك مدني لا غنى عنه!

أركايف للذكاءمنذ 1 شهر

تحديات تقييم نماذج اللغة الكبيرة في الرعاية الصحية: أين يكمن الخلل؟

تحديات تقييم نماذج اللغة الكبيرة في الرعاية الصحية: أين يكمن الخلل؟

أركايف للذكاءمنذ 1 شهر

تحديات جديدة في تقنيات تقييم الذكاء الاصطناعي: كيف تطور تقييم نماذج اللغات الضخمة؟

تحديات جديدة في تقنيات تقييم الذكاء الاصطناعي: كيف تطور تقييم نماذج اللغات الضخمة؟

أركايف للذكاءمنذ 1 شهر

تحليل النتائج: كيف تعزز المقارنات الثنائية دقة نماذج الذكاء الاصطناعي

تحليل النتائج: كيف تعزز المقارنات الثنائية دقة نماذج الذكاء الاصطناعي

أركايف للذكاءمنذ 1 شهر

الذكاء الاصطناعي في علوم الأعصاب: دراسة حالة تكشف عن إمكانيات وأوجه تحدٍ جديدة

الذكاء الاصطناعي في علوم الأعصاب: دراسة حالة تكشف عن إمكانيات وأوجه تحدٍ جديدة

أركايف للذكاءمنذ 1 شهر

UniQL: ثورة في تقييم تحويل النصوص إلى SQL عبر اللهجات المختلفة!

UniQL: ثورة في تقييم تحويل النصوص إلى SQL عبر اللهجات المختلفة!

أركايف للذكاءمنذ 1 شهر

تقييم مبتكر: كيف يمكن لوكلاء الذكاء الاصطناعي أن يصبحوا قضاةً فعالين؟

تقييم مبتكر: كيف يمكن لوكلاء الذكاء الاصطناعي أن يصبحوا قضاةً فعالين؟

أركايف للذكاءمنذ 1 شهر

اكتشاف عالم Emergence: منصة ثورية لتقييم استقلالية الوكلاء على المدى الطويل

اكتشاف عالم Emergence: منصة ثورية لتقييم استقلالية الوكلاء على المدى الطويل

أركايف للذكاءمنذ 1 شهر

استكشاف تأثير النماذج والتاريخ على تقييم نماذج اللغات الضخمة في الهندسة البرمجية: دراسة حديثة

استكشاف تأثير النماذج والتاريخ على تقييم نماذج اللغات الضخمة في الهندسة البرمجية: دراسة حديثة

أركايف للذكاءمنذ 1 شهر

استراتيجيات استثمار الذكاء الاصطناعي: كيف تقييم خوارزميات اتخاذ القرار يمكن أن يحسن أداء المحفظة الاستثمارية!

استراتيجيات استثمار الذكاء الاصطناعي: كيف تقييم خوارزميات اتخاذ القرار يمكن أن يحسن أداء المحفظة الاستثمارية!

أركايف للذكاءمنذ 1 شهر

تقييم كفاءة الذكاء الاصطناعي في تحليل الدراسات الوبائية: ماذا تكشف النتائج؟

تقييم كفاءة الذكاء الاصطناعي في تحليل الدراسات الوبائية: ماذا تكشف النتائج؟

أركايف للذكاءمنذ 1 شهر

اكتشف OpenHalDet: معيار موحد لكشف الأوهام في نماذج الذكاء الاصطناعي!

اكتشف OpenHalDet: معيار موحد لكشف الأوهام في نماذج الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر

SAGE: ثورة في إدارة وتقييم الذكاء الاصطناعي القابل للتطوير!

SAGE: ثورة في إدارة وتقييم الذكاء الاصطناعي القابل للتطوير!

أركايف للذكاءمنذ 1 شهر

PSEBench: معيار ثوري لتقييم نماذج اللغات الكبيرة في سلامة المرضى!

PSEBench: معيار ثوري لتقييم نماذج اللغات الكبيرة في سلامة المرضى!

أركايف للذكاءمنذ 1 شهر

ArcANE: كيفية الحفاظ على توازن الروح في شخصيات الذكاء الاصطناعي خلال السرد القصصي؟

نماذج لغوية

ArcANE: كيفية الحفاظ على توازن الروح في شخصيات الذكاء الاصطناعي خلال السرد القصصي؟

أركايف للذكاءمنذ 1 شهر

هل يمكنك تناول جرعة إضافية؟ تقييم قرارات نماذج اللغة الكبيرة تحت عدم اليقين الزمني في أسئلة جرعات الأدوية

هل يمكنك تناول جرعة إضافية؟ تقييم قرارات نماذج اللغة الكبيرة تحت عدم اليقين الزمني في أسئلة جرعات الأدوية

أركايف للذكاءمنذ 1 شهر

ثورة في الذكاء الاصطناعي: إطار العمل الذاتي التطور للأبحاث المعمقة!

ثورة في الذكاء الاصطناعي: إطار العمل الذاتي التطور للأبحاث المعمقة!

أركايف للذكاءمنذ 1 شهر

من الفكرة إلى التنفيذ: تصنيف العمليات وتقييم الأطر الداعمة لوكلاء تطوير البرمجيات الذكية

من الفكرة إلى التنفيذ: تصنيف العمليات وتقييم الأطر الداعمة لوكلاء تطوير البرمجيات الذكية

أركايف للذكاءمنذ 1 شهر

اكتشف مؤشرات المعرفة: الثورة الجديدة في تقييم نماذج اللغات الضخمة!

نماذج لغوية

اكتشف مؤشرات المعرفة: الثورة الجديدة في تقييم نماذج اللغات الضخمة!

أركايف للذكاءمنذ 1 شهر

تحدي CyberGym-E2E: منصة رائدة لتقييم قدرات الذكاء الاصطناعي في مجال الأمن السيبراني!

تحدي CyberGym-E2E: منصة رائدة لتقييم قدرات الذكاء الاصطناعي في مجال الأمن السيبراني!

أركايف للذكاءمنذ 1 شهر

← السابق5 / 14التالي →