Ailoxa Logo

🏷️ #تقييم

179 مقال

ماركت بنش: تقييم وكلاء الذكاء الاصطناعي كمتعاملين في الأسواق
أبحاث

ماركت بنش: تقييم وكلاء الذكاء الاصطناعي كمتعاملين في الأسواق

أركايف للذكاءمنذ 1 شهر
تقييم رحلات المدن المستدامة: الذكاء الاصطناعي كقاضي وضرورة التعاون البشري!
أبحاث

تقييم رحلات المدن المستدامة: الذكاء الاصطناعي كقاضي وضرورة التعاون البشري!

أركايف للذكاءمنذ 1 شهر
STELLAR-E: ثورة جديدة في تقييم تطبيقات نماذج اللغات الضخمة!
أدوات

STELLAR-E: ثورة جديدة في تقييم تطبيقات نماذج اللغات الضخمة!

أركايف للذكاءمنذ 1 شهر
هل تهدد نماذج الذكاء الاصطناعي سلامة أبحاث الذكاء الاصطناعي؟
أبحاث

هل تهدد نماذج الذكاء الاصطناعي سلامة أبحاث الذكاء الاصطناعي؟

أركايف للذكاءمنذ 1 شهر
تعلم لغة بشكل مبتكر: إطار تعليمي شخصي مُعتمد على مناظرات الذكاء الاصطناعي!
أبحاث

تعلم لغة بشكل مبتكر: إطار تعليمي شخصي مُعتمد على مناظرات الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر
كيف تُغير نماذج اللغة الذكية طريقة تقييم الرياضيات؟ اكتشاف أخطاء تقييم التعلم بالإصلاح المفرط!
أبحاث

كيف تُغير نماذج اللغة الذكية طريقة تقييم الرياضيات؟ اكتشاف أخطاء تقييم التعلم بالإصلاح المفرط!

أركايف للذكاءمنذ 1 شهر
دراسة مثيرة: كيف تؤثر الهوية في تقييم نماذج الذكاء الاصطناعي متعدد الوكلاء؟
أبحاث

دراسة مثيرة: كيف تؤثر الهوية في تقييم نماذج الذكاء الاصطناعي متعدد الوكلاء؟

أركايف للذكاءمنذ 1 شهر
فيسكود بينش: ثورة في محاكاة المشاهد ثلاثية الأبعاد بفهم فيزيائي مبتكر!
أبحاث

فيسكود بينش: ثورة في محاكاة المشاهد ثلاثية الأبعاد بفهم فيزيائي مبتكر!

أركايف للذكاءمنذ 1 شهر
QEVA: المعيار الثوري لتقييم تلخيص الفيديوهات بلا مراجع
أبحاث

QEVA: المعيار الثوري لتقييم تلخيص الفيديوهات بلا مراجع

أركايف للذكاءمنذ 1 شهر
تقييم وكيل البحث في عالم متوازي: كيف نواجه تحديات الذكاء الاصطناعي؟
أبحاث

تقييم وكيل البحث في عالم متوازي: كيف نواجه تحديات الذكاء الاصطناعي؟

أركايف للذكاءمنذ 1 شهر
نحو تقييم شامل لنماذج الصوت واللغة: استعراض كامل للتطورات المستقبلية!
أبحاث

نحو تقييم شامل لنماذج الصوت واللغة: استعراض كامل للتطورات المستقبلية!

أركايف للذكاءمنذ 1 شهر
MermaidSeqBench: معيار جديد لتقييم توليد مخططات التتابع من اللغة الطبيعية!
أبحاث

MermaidSeqBench: معيار جديد لتقييم توليد مخططات التتابع من اللغة الطبيعية!

أركايف للذكاءمنذ 1 شهر
استراتيجيات ثورية لتقييم نماذج الذكاء الاصطناعي: مراجعة الأقران تضمن التميز!
نماذج لغوية

استراتيجيات ثورية لتقييم نماذج الذكاء الاصطناعي: مراجعة الأقران تضمن التميز!

أركايف للذكاءمنذ 1 شهر
إعادة تشكيل التنسيق الطارئ في نماذج اللغات الكبيرة: إطار تقييم مبتكر على أرشيف MoltBook
أبحاث

إعادة تشكيل التنسيق الطارئ في نماذج اللغات الكبيرة: إطار تقييم مبتكر على أرشيف MoltBook

أركايف للذكاءمنذ 1 شهر
ثورة في تقييم الحقائق: اكتشاف أداة AtomEval لتحديد الفساد المعلوماتي
أبحاث

ثورة في تقييم الحقائق: اكتشاف أداة AtomEval لتحديد الفساد المعلوماتي

أركايف للذكاءمنذ 1 شهر
إعادة التفكير في تقييم التفكير الرياضي: إطار عمل قوي لتقييم النماذج اللغوية الكبيرة
أبحاث

إعادة التفكير في تقييم التفكير الرياضي: إطار عمل قوي لتقييم النماذج اللغوية الكبيرة

أركايف للذكاءمنذ 1 شهر
إعادة تفكير في تقييم الذكاء الاصطناعي القابل للتفسير: تدقيق إنساني لقيم شابلي في البيئات عالية المخاطر
أبحاث

إعادة تفكير في تقييم الذكاء الاصطناعي القابل للتفسير: تدقيق إنساني لقيم شابلي في البيئات عالية المخاطر

أركايف للذكاءمنذ 1 شهر
تجاوز فخ الاتفاق: إشارات الدفاع لتقييم الذكاء الاصطناعي القائم على القوانين
أبحاث

تجاوز فخ الاتفاق: إشارات الدفاع لتقييم الذكاء الاصطناعي القائم على القوانين

أركايف للذكاءمنذ 1 شهر
ابتكار نظام تقييم مبتكر لتلخيص الاجتماعات باستخدام الذكاء الاصطناعي: تفاصيل مثيرة!
أبحاث

ابتكار نظام تقييم مبتكر لتلخيص الاجتماعات باستخدام الذكاء الاصطناعي: تفاصيل مثيرة!

أركايف للذكاءمنذ 1 شهر
OpenEstimate: ثورة في تقييم نماذج الذكاء الاصطناعي في مواجهة عدم اليقين!
أبحاث

OpenEstimate: ثورة في تقييم نماذج الذكاء الاصطناعي في مواجهة عدم اليقين!

أركايف للذكاءمنذ 1 شهر