🏷️ #تقييم

275 مقال

WISE: تقييم سماتي متقدم لدمج المعرفة العالمية في توليد الصور من النصوص

WISE: تقييم سماتي متقدم لدمج المعرفة العالمية في توليد الصور من النصوص

أركايف للذكاءمنذ 1 شهر

كيف يمكن لنماذج اللغة الكبيرة تحسين دقة الحكم؟ اكتشف السر وراء وقت الاستدلال المتوازن!

نماذج لغوية

كيف يمكن لنماذج اللغة الكبيرة تحسين دقة الحكم؟ اكتشف السر وراء وقت الاستدلال المتوازن!

أركايف للذكاءمنذ 1 شهر

كيف تؤثر بروتوكولات التسجيل على أداء الذكاء الاصطناعي في اتخاذ قرارات طبية معقدة؟

كيف تؤثر بروتوكولات التسجيل على أداء الذكاء الاصطناعي في اتخاذ قرارات طبية معقدة؟

أركايف للذكاءمنذ 1 شهر

معايير جديدة لتقييم نماذج اللغة: أداة CoEval تُحدث ثورة في الاستخدامات الخاصة!

معايير جديدة لتقييم نماذج اللغة: أداة CoEval تُحدث ثورة في الاستخدامات الخاصة!

أركايف للذكاءمنذ 1 شهر

ForeSci: معيار جديد لتقييم وكلاء الذكاء الاصطناعي في اتخاذ قرارات بحثية استشرافية مذهلة!

ForeSci: معيار جديد لتقييم وكلاء الذكاء الاصطناعي في اتخاذ قرارات بحثية استشرافية مذهلة!

أركايف للذكاءمنذ 1 شهر

قياس أداء التعلم المعزز: كيف يمكن للشهادات الذكية تغيير اللعبة؟

قياس أداء التعلم المعزز: كيف يمكن للشهادات الذكية تغيير اللعبة؟

أركايف للذكاءمنذ 1 شهر

اكتشاف قوة الذكاء الاصطناعي: تقييم التفاعل والتفكير في نماذج اللغات الضخمة

اكتشاف قوة الذكاء الاصطناعي: تقييم التفاعل والتفكير في نماذج اللغات الضخمة

أركايف للذكاءمنذ 1 شهر

تجاوز انحياز الحكم الإدراكي: نهج مبتكر لتدريب نماذج الذكاء الاصطناعي متعددة الوسائط

تجاوز انحياز الحكم الإدراكي: نهج مبتكر لتدريب نماذج الذكاء الاصطناعي متعددة الوسائط

أركايف للذكاءمنذ 1 شهر

انطلاقة جديدة في تقييم الذكاء الاصطناعي: BADGER يجمع بين العوامل الديناميكية والتقييم المحدد في استدلال الأعمال

انطلاقة جديدة في تقييم الذكاء الاصطناعي: BADGER يجمع بين العوامل الديناميكية والتقييم المحدد في استدلال الأعمال

أركايف للذكاءمنذ 1 شهر

ReasonBench: كيف يكشف عدم الاستقرار في نماذج الذكاء الاصطناعي عن تحديات جديدة!

ReasonBench: كيف يكشف عدم الاستقرار في نماذج الذكاء الاصطناعي عن تحديات جديدة!

أركايف للذكاءمنذ 1 شهر

استكشاف جودة العمليات: AgentProcessBench لتقييم فعالية وكالات استخدام الأدوات!

استكشاف جودة العمليات: AgentProcessBench لتقييم فعالية وكالات استخدام الأدوات!

أركايف للذكاءمنذ 1 شهر

تعزيز كفاءة نماذج اللغات الضخمة: كيف تختار الأفضل بذكاء! 🚀

تعزيز كفاءة نماذج اللغات الضخمة: كيف تختار الأفضل بذكاء! 🚀

أركايف للذكاءمنذ 1 شهر

ثورة في تصميم العمارة البرمجية: كيف تسهم مجموعة من الوكلاء الذكيين في إحداث تغيير حقيقي؟

ثورة في تصميم العمارة البرمجية: كيف تسهم مجموعة من الوكلاء الذكيين في إحداث تغيير حقيقي؟

أركايف للذكاءمنذ 1 شهر

اكتشافات مثيرة في دقة واستقرار نماذج اللغات الضخمة في المهام البرمجية

نماذج لغوية

اكتشافات مثيرة في دقة واستقرار نماذج اللغات الضخمة في المهام البرمجية

أركايف للذكاءمنذ 1 شهر

ثورة جديدة في تقييم توليد الوجوه المتحدثة بواسطة الصوت: تقييم متوازن زمنياً

ثورة جديدة في تقييم توليد الوجوه المتحدثة بواسطة الصوت: تقييم متوازن زمنياً

أركايف للذكاءمنذ 1 شهر

GenPT: ثورة جديدة في علم النفس باستخدام الفحص الاستدلالي الديناميكي!

GenPT: ثورة جديدة في علم النفس باستخدام الفحص الاستدلالي الديناميكي!

أركايف للذكاءمنذ 1 شهر

إطار عمل مبتكر لتقييم موثوقية نماذج الذكاء الاصطناعي في الرعاية الصحية!

إطار عمل مبتكر لتقييم موثوقية نماذج الذكاء الاصطناعي في الرعاية الصحية!

أركايف للذكاءمنذ 1 شهر

ثورة في تقييم الذكاء الاصطناعي السريري: اكتشافات جديدة تكشف عن إمكانيات خفية!

ثورة في تقييم الذكاء الاصطناعي السريري: اكتشافات جديدة تكشف عن إمكانيات خفية!

أركايف للذكاءمنذ 1 شهر

ثورة في علم الأحياء: تقييم الكيانات الحيوية بمساعدة الذكاء الاصطناعي

ثورة في علم الأحياء: تقييم الكيانات الحيوية بمساعدة الذكاء الاصطناعي

أركايف للذكاءمنذ 1 شهر

ثورة في تقييم الذكاء الاصطناعي: كيف يمكن لنموذج LLM أن يصبح قاضياً موثوقاً؟

ثورة في تقييم الذكاء الاصطناعي: كيف يمكن لنموذج LLM أن يصبح قاضياً موثوقاً؟

أركايف للذكاءمنذ 1 شهر

← السابق6 / 14التالي →