🏷️ #تقييم الأداء

162 مقال

ثورة جديدة في الذكاء الاصطناعي: Introducing DrawingVQA لتقييم القدرات الرسومية والنصية!

ثورة جديدة في الذكاء الاصطناعي: Introducing DrawingVQA لتقييم القدرات الرسومية والنصية!

أركايف للذكاءمنذ 15 ساعة

هل يمكن للذكاء الاصطناعي مواجهة الضغوط المتكررة؟ اكتشافات جديدة حول نماذج الرؤية واللغة!

هل يمكن للذكاء الاصطناعي مواجهة الضغوط المتكررة؟ اكتشافات جديدة حول نماذج الرؤية واللغة!

أركايف للذكاءمنذ 3 يوم

ثورة في تقييم أداء الوكلاء الذكيين: تعرف على MCPEvol-Bench

ثورة في تقييم أداء الوكلاء الذكيين: تعرف على MCPEvol-Bench

أركايف للذكاءمنذ 3 يوم

تقييم أمني مبتكر: كيف يؤثر التكلفة على أداء وكيل الأمن الهجومي والدفاعي؟

تقييم أمني مبتكر: كيف يؤثر التكلفة على أداء وكيل الأمن الهجومي والدفاعي؟

أركايف للذكاءمنذ 3 يوم

مفارقة البساطة: تفكيك الأسطورة حول استراتيجيات التوجيه وتقييم نماذج اللغة الكبيرة

مفارقة البساطة: تفكيك الأسطورة حول استراتيجيات التوجيه وتقييم نماذج اللغة الكبيرة

أركايف للذكاءمنذ 3 يوم

نقلة نوعية في نماذج تحويل النص إلى صوت: تحسين دقة التنفيذ عبر ملاحظات دقيقة

نماذج لغوية

نقلة نوعية في نماذج تحويل النص إلى صوت: تحسين دقة التنفيذ عبر ملاحظات دقيقة

أركايف للذكاءمنذ 4 يوم

STOCKTAKE: القياس بين الإدراك والعمل في نماذج اللغات الضخمة

STOCKTAKE: القياس بين الإدراك والعمل في نماذج اللغات الضخمة

أركايف للذكاءمنذ 4 يوم

إعادة التفكير في تقييم تطوير الهياكل التلقائية لوكلاء الذكاء الاصطناعي!

إعادة التفكير في تقييم تطوير الهياكل التلقائية لوكلاء الذكاء الاصطناعي!

أركايف للذكاءمنذ 5 يوم

اكتشاف ثورة جديدة في تصميم ألعاب الإيقاع: تقنية ChartGenEval تقدم معايير مبتكرة!

اكتشاف ثورة جديدة في تصميم ألعاب الإيقاع: تقنية ChartGenEval تقدم معايير مبتكرة!

أركايف للذكاءمنذ 5 يوم

ثورة في عالم الكروشيه: هل تستطيع نماذج الرؤية - اللغة الانتقال من الوصف إلى التنفيذ؟

ثورة في عالم الكروشيه: هل تستطيع نماذج الرؤية - اللغة الانتقال من الوصف إلى التنفيذ؟

أركايف للذكاءمنذ 5 يوم

BizFinBench.v2: النظام المبتكر لتقييم الأداء الموثوق لنماذج اللغات الضخمة في القطاع المالي!

BizFinBench.v2: النظام المبتكر لتقييم الأداء الموثوق لنماذج اللغات الضخمة في القطاع المالي!

أركايف للذكاءمنذ 6 يوم

اكتشف MM-ToolSandBox: الإطار الثوري لتقييم وكلاء أدوات الاتصال المرئي!

اكتشف MM-ToolSandBox: الإطار الثوري لتقييم وكلاء أدوات الاتصال المرئي!

أركايف للذكاءمنذ 6 يوم

البصمة الخفية: كيف يمكن لتخزين البيانات أن يصبح مقياسًا أساسيًا لتقييم وكيل نماذج اللغات الضخمة!

البصمة الخفية: كيف يمكن لتخزين البيانات أن يصبح مقياسًا أساسيًا لتقييم وكيل نماذج اللغات الضخمة!

أركايف للذكاءمنذ 6 يوم

إعادة تشكيل الذكاء الاصطناعي: أداة جديدة لتقييم قدرات النماذج اللغوية في هندسة البرمجيات العكسية!

إعادة تشكيل الذكاء الاصطناعي: أداة جديدة لتقييم قدرات النماذج اللغوية في هندسة البرمجيات العكسية!

أركايف للذكاءمنذ 7 يوم

تحدي AUTOPILOT VQA: قياس كفاءة نماذج الرؤية واللغة في فهم فيديوهات الكاميرات الميجانية

تحدي AUTOPILOT VQA: قياس كفاءة نماذج الرؤية واللغة في فهم فيديوهات الكاميرات الميجانية

أركايف للذكاءمنذ 10 يوم

استكشاف بيئات الذكاء الاصطناعي: تصميم تجريبي لتقييم نماذج الاكتشاف الذاتي

استكشاف بيئات الذكاء الاصطناعي: تصميم تجريبي لتقييم نماذج الاكتشاف الذاتي

أركايف للذكاءمنذ 12 يوم

شركات تتاجر بالموظفين مقابل توكنات! هل تحقق العائدات المرجوة؟

شركات تتاجر بالموظفين مقابل توكنات! هل تحقق العائدات المرجوة؟

أخبار الذكاء اليوميةمنذ 13 يوم

إطار جبري موحد لتقييم أداء التصنيف: تطور جديد في عالم الذكاء الاصطناعي!

إطار جبري موحد لتقييم أداء التصنيف: تطور جديد في عالم الذكاء الاصطناعي!

أركايف للذكاءمنذ 13 يوم

كيف تعيد معايير البرمجة تشكيل مستقبل النماذج اللغوية؟

كيف تعيد معايير البرمجة تشكيل مستقبل النماذج اللغوية؟

أركايف للذكاءمنذ 13 يوم

كيف يمكن لتقنيات الذكاء الاصطناعي تحسين تقويم أداء التمارين الرياضية؟

كيف يمكن لتقنيات الذكاء الاصطناعي تحسين تقويم أداء التمارين الرياضية؟

أركايف للذكاءمنذ 13 يوم

1 / 9التالي →