Ailoxa Logo

🏷️ #تقييم الأداء

97 مقال

اكتشاف وتحجيم انحياز القياس في نماذج اللغة الكبيرة: كيف نحسن الأداء في بيئات الإنتاج؟
أبحاث

اكتشاف وتحجيم انحياز القياس في نماذج اللغة الكبيرة: كيف نحسن الأداء في بيئات الإنتاج؟

أركايف للذكاءمنذ 10 يوم
فهم خريطة الذكاء الاصطناعي: الكشف عن ديناميكيات تصنيفات الأداء
أبحاث

فهم خريطة الذكاء الاصطناعي: الكشف عن ديناميكيات تصنيفات الأداء

أركايف للذكاءمنذ 10 يوم
AvalancheBench: ثورة في تقييم وكلاء البيانات المؤسسية من خلال استرداد العالم الكامن!
أدوات

AvalancheBench: ثورة في تقييم وكلاء البيانات المؤسسية من خلال استرداد العالم الكامن!

أركايف للذكاءمنذ 10 يوم
مهارات تعاقدية: إطار تصميم مبتكر لوكلاء الذكاء الاصطناعي في المؤسسات
أبحاث

مهارات تعاقدية: إطار تصميم مبتكر لوكلاء الذكاء الاصطناعي في المؤسسات

أركايف للذكاءمنذ 10 يوم
AgentAtlas: ثورة معايير تقييم وكالات نماذج اللغة الكبيرة
أبحاث

AgentAtlas: ثورة معايير تقييم وكالات نماذج اللغة الكبيرة

أركايف للذكاءمنذ 14 يوم
تقييم دقيق لمستوى المطالبات في الذكاء الاصطناعي: نقلة نوعية في القانون
أبحاث

تقييم دقيق لمستوى المطالبات في الذكاء الاصطناعي: نقلة نوعية في القانون

أركايف للذكاءمنذ 14 يوم
اكتشاف ثورة البرمجة: كيف يغير InteractScience جيل الأكواد العلمية التفاعلية؟
أبحاث

اكتشاف ثورة البرمجة: كيف يغير InteractScience جيل الأكواد العلمية التفاعلية؟

أركايف للذكاءمنذ 14 يوم
PRISM: معيار ثوري لتقييم المنطق الزمني المكاني في توليد الفيديو البرمجي
أبحاث

PRISM: معيار ثوري لتقييم المنطق الزمني المكاني في توليد الفيديو البرمجي

أركايف للذكاءمنذ 16 يوم
أحدث تقنيات التوجيه للذكاء الاصطناعي: تعرف على TwinRouterBench!
أبحاث

أحدث تقنيات التوجيه للذكاء الاصطناعي: تعرف على TwinRouterBench!

أركايف للذكاءمنذ 16 يوم
استراتيجيات تقطيع القانون الألماني: كيف تعزز الفهم والبحث القانوني؟
أبحاث

استراتيجيات تقطيع القانون الألماني: كيف تعزز الفهم والبحث القانوني؟

أركايف للذكاءمنذ 16 يوم
WARC-Bench: ثورة في تقييم أداء وكالات الذكاء الاصطناعي على الويب!
أبحاث

WARC-Bench: ثورة في تقييم أداء وكالات الذكاء الاصطناعي على الويب!

أركايف للذكاءمنذ 16 يوم
تقييم وكالات البحث العميقة: ثورة في استشارات الخبراء!
أبحاث

تقييم وكالات البحث العميقة: ثورة في استشارات الخبراء!

أركايف للذكاءمنذ 17 يوم
WebGameBench: ثورة في تقييم وكالات البرمجة عبر ألعاب الويب
أبحاث

WebGameBench: ثورة في تقييم وكالات البرمجة عبر ألعاب الويب

أركايف للذكاءمنذ 17 يوم
تقييم توافق العمر المعرفي في وكلاء الذكاء الاصطناعي التفاعلي: خطوة نحو الذكاء البشري!
أبحاث

تقييم توافق العمر المعرفي في وكلاء الذكاء الاصطناعي التفاعلي: خطوة نحو الذكاء البشري!

أركايف للذكاءمنذ 17 يوم
هل من الممكن أن تحقق النتائج النجاح بينما تفشل الانضباط؟ اكتشفوا كيف تؤثر التقييمات المستندة إلى الشروط الخفية!
أبحاث

هل من الممكن أن تحقق النتائج النجاح بينما تفشل الانضباط؟ اكتشفوا كيف تؤثر التقييمات المستندة إلى الشروط الخفية!

أركايف للذكاءمنذ 17 يوم
SCICONVBENCH: معيار ثوري لتحسين نماذج الذكاء الاصطناعي في العلوم الحاسوبية!
أبحاث

SCICONVBENCH: معيار ثوري لتحسين نماذج الذكاء الاصطناعي في العلوم الحاسوبية!

أركايف للذكاءمنذ 17 يوم
DBES: نظام مبتكر لتقييم التخصصات الخبيرة في نماذج Mixture-of-Experts
أبحاث

DBES: نظام مبتكر لتقييم التخصصات الخبيرة في نماذج Mixture-of-Experts

أركايف للذكاءمنذ 17 يوم
هل تختار حجماً مناسباً لنموذجك اللغوي؟ اكتشف كيف تؤثر الخيارات على الاستدامة والكفاءة!
نماذج لغوية

هل تختار حجماً مناسباً لنموذجك اللغوي؟ اكتشف كيف تؤثر الخيارات على الاستدامة والكفاءة!

أركايف للذكاءمنذ 17 يوم
فورمولا كود: ثورة في تحسين الشيفرة المصدرية باستخدام الذكاء الاصطناعي!
أبحاث

فورمولا كود: ثورة في تحسين الشيفرة المصدرية باستخدام الذكاء الاصطناعي!

أركايف للذكاءمنذ 18 يوم
كيف يمكن لمعايير تقييم نية الذكاء الاصطناعي أن تغير قواعد اللعبة في تطوير نماذج اللغة الكبيرة؟
أبحاث

كيف يمكن لمعايير تقييم نية الذكاء الاصطناعي أن تغير قواعد اللعبة في تطوير نماذج اللغة الكبيرة؟

أركايف للذكاءمنذ 21 يوم