🏷️ #تقييم

275 مقال

AuAu: معيار جديد لتقييم تحيزات الأنظمة اللغوية نحو الاستبداد!

أخلاقيات الذكاء الاصطناعي

AuAu: معيار جديد لتقييم تحيزات الأنظمة اللغوية نحو الاستبداد!

أركايف للذكاءمنذ 1 شهر

اكتشاف Mask-Proof: ثورة جديدة في تقييم إثباتات الرياضيات باستخدام نماذج الذكاء الاصطناعي!

اكتشاف Mask-Proof: ثورة جديدة في تقييم إثباتات الرياضيات باستخدام نماذج الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر

تجاوز الصواب: تعزيز الفهم المعماري في نماذج البرمجة عبر تقييم متدرج مع حكم آلي

نماذج لغوية

تجاوز الصواب: تعزيز الفهم المعماري في نماذج البرمجة عبر تقييم متدرج مع حكم آلي

أركايف للذكاءمنذ 1 شهر

نموذج الذكاء الاصطناعي: تقييم أولي لنقاط المخطوطات ودقتها في تقديم نتائج مراجعة الأقران!

نموذج الذكاء الاصطناعي: تقييم أولي لنقاط المخطوطات ودقتها في تقديم نتائج مراجعة الأقران!

أركايف للذكاءمنذ 1 شهر

إطار عمل استرجاع Agents للقيام بتقييم جودة البيانات بشكل مستقل وذكي

إطار عمل استرجاع Agents للقيام بتقييم جودة البيانات بشكل مستقل وذكي

أركايف للذكاءمنذ 1 شهر

تمثيل يومي: كيفية تقييم وكلاء البحث في مهام البحث اليومية بذكاء متطور!

تمثيل يومي: كيفية تقييم وكلاء البحث في مهام البحث اليومية بذكاء متطور!

أركايف للذكاءمنذ 1 شهر

ثورة جديدة في تقييم ذكاء الآلات: استراتيجيات مبتكرة لقياس التفكير الإجرائي!

ثورة جديدة في تقييم ذكاء الآلات: استراتيجيات مبتكرة لقياس التفكير الإجرائي!

أركايف للذكاءمنذ 1 شهر

تقييم مخصص للذكاء الاصطناعي: كيف نتنبأ بمخاطر رفض استجابات نموذج اللغة الطبية؟

تقييم مخصص للذكاء الاصطناعي: كيف نتنبأ بمخاطر رفض استجابات نموذج اللغة الطبية؟

أركايف للذكاءمنذ 1 شهر

تطوير ثوري في تقييم الصحة النفسية: استراتيجيات جديدة تعتمد على الذكاء الاصطناعي

تطوير ثوري في تقييم الصحة النفسية: استراتيجيات جديدة تعتمد على الذكاء الاصطناعي

أركايف للذكاءمنذ 1 شهر

CMI-RewardBench: ثورة في تقييم نماذج مكافآت الموسيقى من خلال التعليمات المتعددة الوسائط

CMI-RewardBench: ثورة في تقييم نماذج مكافآت الموسيقى من خلال التعليمات المتعددة الوسائط

أركايف للذكاءمنذ 1 شهر

WildIFEval: ثورة في فهم التعليمات المعقدة للذكاء الاصطناعي!

WildIFEval: ثورة في فهم التعليمات المعقدة للذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر

تحقيق الانتصار في أبحاث الذكاء الاصطناعي: كيفية تحسين قرارات الوكالات البحثية

تحقيق الانتصار في أبحاث الذكاء الاصطناعي: كيفية تحسين قرارات الوكالات البحثية

أركايف للذكاءمنذ 1 شهر

اكتشاف إمكانيات جديدة في الذكاء الاصطناعي مع نظام Embodied-BenchClaw الثوري!

اكتشاف إمكانيات جديدة في الذكاء الاصطناعي مع نظام Embodied-BenchClaw الثوري!

أركايف للذكاءمنذ 1 شهر

إطلاق IntElicit: إطار مبتكر لتقييم الإبداع في بيئة الحوار المتفاعل!

إطلاق IntElicit: إطار مبتكر لتقييم الإبداع في بيئة الحوار المتفاعل!

أركايف للذكاءمنذ 1 شهر

مقياس MobilityBench: معيار جديد لتقييم وكلاء تخطيط الطرق في سيناريوهات التنقل الواقعية

مقياس MobilityBench: معيار جديد لتقييم وكلاء تخطيط الطرق في سيناريوهات التنقل الواقعية

أركايف للذكاءمنذ 1 شهر

ابتكار آلي: تقييم إبداع نماذج اللغة عبر مهام مفتوحة بشكل ثوري!

ابتكار آلي: تقييم إبداع نماذج اللغة عبر مهام مفتوحة بشكل ثوري!

أركايف للذكاءمنذ 1 شهر

ثورة جديدة في علوم الأحياء: BioDivergence تكشف عن تعقيد التناقضات السياقية

ثورة جديدة في علوم الأحياء: BioDivergence تكشف عن تعقيد التناقضات السياقية

أركايف للذكاءمنذ 1 شهر

ثورة جديدة في تقييم النص إلى موسيقى: اكتشف كيف يغير DeRA-MOS القواعد!

ثورة جديدة في تقييم النص إلى موسيقى: اكتشف كيف يغير DeRA-MOS القواعد!

أركايف للذكاءمنذ 1 شهر

ثورة في عالم الرياضيات: ComBench معيار جديد لتقييم الذكاء الاصطناعي في المسائل التوافقية!

ثورة في عالم الرياضيات: ComBench معيار جديد لتقييم الذكاء الاصطناعي في المسائل التوافقية!

أركايف للذكاءمنذ 1 شهر

تحديات تقييم نماذج اللغة الكبيرة في الرعاية الصحية: أين يكمن الخلل؟

تحديات تقييم نماذج اللغة الكبيرة في الرعاية الصحية: أين يكمن الخلل؟

أركايف للذكاءمنذ 1 شهر

← السابق4 / 14التالي →