Ailoxa Logo

🏷️ #تقييم

176 مقال

اكتشف مؤشرات المعرفة: الثورة الجديدة في تقييم نماذج اللغات الضخمة!
نماذج لغوية

اكتشف مؤشرات المعرفة: الثورة الجديدة في تقييم نماذج اللغات الضخمة!

أركايف للذكاءمنذ 1 يوم
هل يمكنك تناول جرعة إضافية؟ تقييم قرارات نماذج اللغة الكبيرة تحت عدم اليقين الزمني في أسئلة جرعات الأدوية
أبحاث

هل يمكنك تناول جرعة إضافية؟ تقييم قرارات نماذج اللغة الكبيرة تحت عدم اليقين الزمني في أسئلة جرعات الأدوية

أركايف للذكاءمنذ 1 يوم
تحدي CyberGym-E2E: منصة رائدة لتقييم قدرات الذكاء الاصطناعي في مجال الأمن السيبراني!
أبحاث

تحدي CyberGym-E2E: منصة رائدة لتقييم قدرات الذكاء الاصطناعي في مجال الأمن السيبراني!

أركايف للذكاءمنذ 1 يوم
ثورة في الذكاء الاصطناعي: إطار العمل الذاتي التطور للأبحاث المعمقة!
أبحاث

ثورة في الذكاء الاصطناعي: إطار العمل الذاتي التطور للأبحاث المعمقة!

أركايف للذكاءمنذ 1 يوم
من الفكرة إلى التنفيذ: تصنيف العمليات وتقييم الأطر الداعمة لوكلاء تطوير البرمجيات الذكية
أبحاث

من الفكرة إلى التنفيذ: تصنيف العمليات وتقييم الأطر الداعمة لوكلاء تطوير البرمجيات الذكية

أركايف للذكاءمنذ 1 يوم
كيف تؤثر بروتوكولات التسجيل على أداء الذكاء الاصطناعي في اتخاذ قرارات طبية معقدة؟
أبحاث

كيف تؤثر بروتوكولات التسجيل على أداء الذكاء الاصطناعي في اتخاذ قرارات طبية معقدة؟

أركايف للذكاءمنذ 2 يوم
معايير جديدة لتقييم نماذج اللغة: أداة CoEval تُحدث ثورة في الاستخدامات الخاصة!
أبحاث

معايير جديدة لتقييم نماذج اللغة: أداة CoEval تُحدث ثورة في الاستخدامات الخاصة!

أركايف للذكاءمنذ 2 يوم
WISE: تقييم سماتي متقدم لدمج المعرفة العالمية في توليد الصور من النصوص
أبحاث

WISE: تقييم سماتي متقدم لدمج المعرفة العالمية في توليد الصور من النصوص

أركايف للذكاءمنذ 2 يوم
كيف يمكن لنماذج اللغة الكبيرة تحسين دقة الحكم؟ اكتشف السر وراء وقت الاستدلال المتوازن!
نماذج لغوية

كيف يمكن لنماذج اللغة الكبيرة تحسين دقة الحكم؟ اكتشف السر وراء وقت الاستدلال المتوازن!

أركايف للذكاءمنذ 2 يوم
اكتشاف قوة الذكاء الاصطناعي: تقييم التفاعل والتفكير في نماذج اللغات الضخمة
أبحاث

اكتشاف قوة الذكاء الاصطناعي: تقييم التفاعل والتفكير في نماذج اللغات الضخمة

أركايف للذكاءمنذ 3 يوم
ForeSci: معيار جديد لتقييم وكلاء الذكاء الاصطناعي في اتخاذ قرارات بحثية استشرافية مذهلة!
أبحاث

ForeSci: معيار جديد لتقييم وكلاء الذكاء الاصطناعي في اتخاذ قرارات بحثية استشرافية مذهلة!

أركايف للذكاءمنذ 3 يوم
قياس أداء التعلم المعزز: كيف يمكن للشهادات الذكية تغيير اللعبة؟
أبحاث

قياس أداء التعلم المعزز: كيف يمكن للشهادات الذكية تغيير اللعبة؟

أركايف للذكاءمنذ 3 يوم
انطلاقة جديدة في تقييم الذكاء الاصطناعي: BADGER يجمع بين العوامل الديناميكية والتقييم المحدد في استدلال الأعمال
أبحاث

انطلاقة جديدة في تقييم الذكاء الاصطناعي: BADGER يجمع بين العوامل الديناميكية والتقييم المحدد في استدلال الأعمال

أركايف للذكاءمنذ 3 يوم
إطار عمل مبتكر لتقييم موثوقية نماذج الذكاء الاصطناعي في الرعاية الصحية!
أبحاث

إطار عمل مبتكر لتقييم موثوقية نماذج الذكاء الاصطناعي في الرعاية الصحية!

أركايف للذكاءمنذ 3 يوم
GenPT: ثورة جديدة في علم النفس باستخدام الفحص الاستدلالي الديناميكي!
أبحاث

GenPT: ثورة جديدة في علم النفس باستخدام الفحص الاستدلالي الديناميكي!

أركايف للذكاءمنذ 3 يوم
اكتشافات مثيرة في دقة واستقرار نماذج اللغات الضخمة في المهام البرمجية
نماذج لغوية

اكتشافات مثيرة في دقة واستقرار نماذج اللغات الضخمة في المهام البرمجية

أركايف للذكاءمنذ 3 يوم
ثورة جديدة في تقييم توليد الوجوه المتحدثة بواسطة الصوت: تقييم متوازن زمنياً
أبحاث

ثورة جديدة في تقييم توليد الوجوه المتحدثة بواسطة الصوت: تقييم متوازن زمنياً

أركايف للذكاءمنذ 3 يوم
ثورة في تصميم العمارة البرمجية: كيف تسهم مجموعة من الوكلاء الذكيين في إحداث تغيير حقيقي؟
أبحاث

ثورة في تصميم العمارة البرمجية: كيف تسهم مجموعة من الوكلاء الذكيين في إحداث تغيير حقيقي؟

أركايف للذكاءمنذ 3 يوم
تعزيز كفاءة نماذج اللغات الضخمة: كيف تختار الأفضل بذكاء! 🚀
أبحاث

تعزيز كفاءة نماذج اللغات الضخمة: كيف تختار الأفضل بذكاء! 🚀

أركايف للذكاءمنذ 3 يوم
إطار تقييم قائم على الشخصيات لتحقيق التوافق المتعدد في الذكاء الاصطناعي التوليدي
أبحاث

إطار تقييم قائم على الشخصيات لتحقيق التوافق المتعدد في الذكاء الاصطناعي التوليدي

أركايف للذكاءمنذ 4 يوم