Ailoxa Logo

🏷️ #تقييم النماذج

42 مقال

هجمات مضادة فعالة على خوارزميات Bandit في الأبعاد العالية: كيف يمكن للهجمات الذكية تغيير سلوك النماذج!
أبحاث

هجمات مضادة فعالة على خوارزميات Bandit في الأبعاد العالية: كيف يمكن للهجمات الذكية تغيير سلوك النماذج!

أركايف للذكاءمنذ 1 يوم
اكتشاف AlgoVeri: معايير جديدة لتوليد الكود الموثوق في الخوارزميات الكلاسيكية
أبحاث

اكتشاف AlgoVeri: معايير جديدة لتوليد الكود الموثوق في الخوارزميات الكلاسيكية

أركايف للذكاءمنذ 1 يوم
الفجوة في موثوقية تدقيق المعايير: هل تستطيع أدوات الكشف عن تلوث البيانات مجاراة الواقع؟
أبحاث

الفجوة في موثوقية تدقيق المعايير: هل تستطيع أدوات الكشف عن تلوث البيانات مجاراة الواقع؟

أركايف للذكاءمنذ 2 يوم
TECCI: تحديات جديدة في تحرير الصور بفضل الذكاء الاصطناعي!
أبحاث

TECCI: تحديات جديدة في تحرير الصور بفضل الذكاء الاصطناعي!

أركايف للذكاءمنذ 3 يوم
إطلاق PReMISE: منهجية جديدة لتحسين تقييمات نماذج الذكاء الاصطناعي
نماذج لغوية

إطلاق PReMISE: منهجية جديدة لتحسين تقييمات نماذج الذكاء الاصطناعي

أركايف للذكاءمنذ 4 يوم
اتوم وورلد: معيار ثوري لتقييم التفكير المكاني في نماذج اللغات الضخمة بالمواد البلورية
أبحاث

اتوم وورلد: معيار ثوري لتقييم التفكير المكاني في نماذج اللغات الضخمة بالمواد البلورية

أركايف للذكاءمنذ 7 يوم
بيكيد: بنية تقييم معيارية تعزز إدارة صحة التنبؤ عبر مجالات متعددة
أبحاث

بيكيد: بنية تقييم معيارية تعزز إدارة صحة التنبؤ عبر مجالات متعددة

أركايف للذكاءمنذ 8 يوم
إطلاق معيار قياس جديد في اللغة الكورية: KVoiceBench وKOpenAudioBench وKMMAU للذكاء الاصطناعي
أبحاث

إطلاق معيار قياس جديد في اللغة الكورية: KVoiceBench وKOpenAudioBench وKMMAU للذكاء الاصطناعي

أركايف للذكاءمنذ 8 يوم
هل حان الوقت لتغيير مقاييس تقييم نماذج اللغة المنطوقة؟ اكتشافات جديدة قد تفاجئك!
أبحاث

هل حان الوقت لتغيير مقاييس تقييم نماذج اللغة المنطوقة؟ اكتشافات جديدة قد تفاجئك!

أركايف للذكاءمنذ 8 يوم
تحدي الذكاء الاصطناعي في عالم الحوسبة الكمية: بنية جديدة لتقييم نماذج اللغات الضخمة
أبحاث

تحدي الذكاء الاصطناعي في عالم الحوسبة الكمية: بنية جديدة لتقييم نماذج اللغات الضخمة

أركايف للذكاءمنذ 9 يوم
تكاليف خفية في التعلم المعزز: تحديات قياس المكاسب الحقيقية!
أبحاث

تكاليف خفية في التعلم المعزز: تحديات قياس المكاسب الحقيقية!

أركايف للذكاءمنذ 9 يوم
قواعد تقييم دقيقة لتحديد كمية عدم اليقين في الأنظمة الذكية!
أبحاث

قواعد تقييم دقيقة لتحديد كمية عدم اليقين في الأنظمة الذكية!

أركايف للذكاءمنذ 10 يوم
كيف تضمن الحكومات توافق الذكاء الاصطناعي؟ إطار عمل لمراقبة الامتثال المستمر!
أبحاث

كيف تضمن الحكومات توافق الذكاء الاصطناعي؟ إطار عمل لمراقبة الامتثال المستمر!

أركايف للذكاءمنذ 10 يوم
تحسين كفاءة التقييم: كيف تسهم تقنيات الاختيار الذكي للميزات في تقليص التكاليف
أبحاث

تحسين كفاءة التقييم: كيف تسهم تقنيات الاختيار الذكي للميزات في تقليص التكاليف

أركايف للذكاءمنذ 10 يوم
تقييم فعال من حيث التكلفة للنماذج باستخدام التعلم الميتا!
أبحاث

تقييم فعال من حيث التكلفة للنماذج باستخدام التعلم الميتا!

أركايف للذكاءمنذ 11 يوم
SDM: أداة قوية لتقييم قوة نماذج الذكاء الاصطناعي
أبحاث

SDM: أداة قوية لتقييم قوة نماذج الذكاء الاصطناعي

أركايف للذكاءمنذ 14 يوم
ثورة في تحرير الصور: DLEBench يقيم قدرة نماذج الذكاء الاصطناعي على تعديل الكائنات الصغيرة!
أبحاث

ثورة في تحرير الصور: DLEBench يقيم قدرة نماذج الذكاء الاصطناعي على تعديل الكائنات الصغيرة!

أركايف للذكاءمنذ 16 يوم
اكتشف MM-ToolBench: المعايير الجديدة لوكلاء الذكاء الاصطناعي في استخدام الأدوات المتعددة
أبحاث

اكتشف MM-ToolBench: المعايير الجديدة لوكلاء الذكاء الاصطناعي في استخدام الأدوات المتعددة

أركايف للذكاءمنذ 17 يوم
تسليط الضوء على أهمية ضبط الثقة في الذكاء الاصطناعي القابل للتفسير: كيف يؤثر إدراك محدوديات النماذج على المستخدمين العاديين؟
أبحاث

تسليط الضوء على أهمية ضبط الثقة في الذكاء الاصطناعي القابل للتفسير: كيف يؤثر إدراك محدوديات النماذج على المستخدمين العاديين؟

أركايف للذكاءمنذ 17 يوم
تحول مذهل في تقييم الذكاء الاصطناعي: تقنية Scales++ الثورية
أبحاث

تحول مذهل في تقييم الذكاء الاصطناعي: تقنية Scales++ الثورية

أركايف للذكاءمنذ 17 يوم