🏷️ #تقييم

275 مقال

ثورة في علم الأحياء: تقييم الكيانات الحيوية بمساعدة الذكاء الاصطناعي

ثورة في علم الأحياء: تقييم الكيانات الحيوية بمساعدة الذكاء الاصطناعي

أركايف للذكاءمنذ 1 شهر

إطار تقييم قائم على الشخصيات لتحقيق التوافق المتعدد في الذكاء الاصطناعي التوليدي

إطار تقييم قائم على الشخصيات لتحقيق التوافق المتعدد في الذكاء الاصطناعي التوليدي

أركايف للذكاءمنذ 1 شهر

TRACE: تقييم عملية التفكير المنطقي في نماذج اللغة الكبيرة بطريقة جديدة!

نماذج لغوية

TRACE: تقييم عملية التفكير المنطقي في نماذج اللغة الكبيرة بطريقة جديدة!

أركايف للذكاءمنذ 1 شهر

JMed48k: المعيار الثوري لاختبار الترخيص الطبي في اليابان يقيّم نماذج الرؤية واللغة

JMed48k: المعيار الثوري لاختبار الترخيص الطبي في اليابان يقيّم نماذج الرؤية واللغة

أركايف للذكاءمنذ 1 شهر

قياس تمكين وكلاء نماذج اللغة: كيف يسهم الذكاء الاصطناعي في تعزيز الأداء الفعّال؟

قياس تمكين وكلاء نماذج اللغة: كيف يسهم الذكاء الاصطناعي في تعزيز الأداء الفعّال؟

أركايف للذكاءمنذ 1 شهر

SCDBench: معيار ثوري لفحص أدوات فك تجميع العقود الذكية المدعومة بالذكاء الاصطناعي

SCDBench: معيار ثوري لفحص أدوات فك تجميع العقود الذكية المدعومة بالذكاء الاصطناعي

أركايف للذكاءمنذ 1 شهر

مغامرات العقل: ساحة جديدة لتقييم التفكير الاجتماعي والاستراتيجي في نماذج اللغة المتعددة العملاء!

مغامرات العقل: ساحة جديدة لتقييم التفكير الاجتماعي والاستراتيجي في نماذج اللغة المتعددة العملاء!

أركايف للذكاءمنذ 1 شهر

إطار RAGe: ثورة في تقييم تطبيقات الذكاء الاصطناعي المعززة بالاسترجاع

إطار RAGe: ثورة في تقييم تطبيقات الذكاء الاصطناعي المعززة بالاسترجاع

أركايف للذكاءمنذ 1 شهر

كيف تعيد الذكاء الاصطناعي تشكيل التعليم العالي؟ نموذج رياضي لفهم الاستخدام الأخلاقي!

أخلاقيات الذكاء الاصطناعي

كيف تعيد الذكاء الاصطناعي تشكيل التعليم العالي؟ نموذج رياضي لفهم الاستخدام الأخلاقي!

أركايف للذكاءمنذ 1 شهر

ابتكار إطار موحد لتقييم قدرات الوكلاء في نماذج اللغات الضخمة

ابتكار إطار موحد لتقييم قدرات الوكلاء في نماذج اللغات الضخمة

أركايف للذكاءمنذ 1 شهر

MIRA: معايير مبتكرة لتحسين دقة المعلومات الطبية عبر اللغات

MIRA: معايير مبتكرة لتحسين دقة المعلومات الطبية عبر اللغات

أركايف للذكاءمنذ 1 شهر

معيار جديد لتقييم أنظمة الذكاء الاصطناعي! استكشف كيف يتم قياس كفاءة نماذج اللغات الضخمة كحكام

معيار جديد لتقييم أنظمة الذكاء الاصطناعي! استكشف كيف يتم قياس كفاءة نماذج اللغات الضخمة كحكام

أركايف للذكاءمنذ 1 شهر

لماذا يجب على مجتمع الذكاء الاصطناعي التخلي عن مصطلح "الباب الخلفي الإيجابي"؟

أخلاقيات الذكاء الاصطناعي

لماذا يجب على مجتمع الذكاء الاصطناعي التخلي عن مصطلح "الباب الخلفي الإيجابي"؟

أركايف للذكاءمنذ 1 شهر

استراتيجيات مبتكرة لتقييم الملخصات البحثية المُولّدة: كيف ستكون المستقبل!

استراتيجيات مبتكرة لتقييم الملخصات البحثية المُولّدة: كيف ستكون المستقبل!

أركايف للذكاءمنذ 1 شهر

فجوة المراقبة والتحكم: لماذا لا تكفي نماذج الذكاء الاصطناعي لاستجابة فعالة

فجوة المراقبة والتحكم: لماذا لا تكفي نماذج الذكاء الاصطناعي لاستجابة فعالة

أركايف للذكاءمنذ 1 شهر

RepoMirage: هل يمكن لوكلاء البرمجيات فهم سياق المستودعات البرمجية؟

RepoMirage: هل يمكن لوكلاء البرمجيات فهم سياق المستودعات البرمجية؟

أركايف للذكاءمنذ 1 شهر

Verus-SpecGym: بيئة مبتكرة لتقييم تحويل المواصفات بدقة!

Verus-SpecGym: بيئة مبتكرة لتقييم تحويل المواصفات بدقة!

أركايف للذكاءمنذ 1 شهر

TowerMind: بيئة جديدة للألعاب الدفاعية تثبت قوة نماذج اللغات الكبيرة كعملاء ذكيين!

TowerMind: بيئة جديدة للألعاب الدفاعية تثبت قوة نماذج اللغات الكبيرة كعملاء ذكيين!

أركايف للذكاءمنذ 1 شهر

ثورة جديدة في الذكاء الاصطناعي: تقييم واقعية الفيزياء في نماذج الفيديو من النصوص!

ثورة جديدة في الذكاء الاصطناعي: تقييم واقعية الفيزياء في نماذج الفيديو من النصوص!

أركايف للذكاءمنذ 1 شهر

كشف النقاب عن ChaosBench-Logic v2: تقييم تفكير LLMs في الأنظمة الديناميكية

كشف النقاب عن ChaosBench-Logic v2: تقييم تفكير LLMs في الأنظمة الديناميكية

أركايف للذكاءمنذ 1 شهر

← السابق7 / 14التالي →