Ailoxa Logo

🏷️ #سلامة الذكاء الاصطناعي

50 مقال

تحديات ومعايير: ماذا تعرف عن سلامة نماذج اللغات الضخمة (LLM)؟
أبحاث

تحديات ومعايير: ماذا تعرف عن سلامة نماذج اللغات الضخمة (LLM)؟

أركايف للذكاءمنذ 18 يوم
ضمان سلامة الذكاء الاصطناعي: هل يمكن السيطرة على المخاطر الخارجية؟
أبحاث

ضمان سلامة الذكاء الاصطناعي: هل يمكن السيطرة على المخاطر الخارجية؟

أركايف للذكاءمنذ 22 يوم
ATBench: منصة جديدة لقياس سلامة وكفاءة الوكلاء الذكيين!
أبحاث

ATBench: منصة جديدة لقياس سلامة وكفاءة الوكلاء الذكيين!

أركايف للذكاءمنذ 22 يوم
نموذج التفريغ الآمن: ثورة في التحكم بالسلامة في نماذج النصوص
أبحاث

نموذج التفريغ الآمن: ثورة في التحكم بالسلامة في نماذج النصوص

أركايف للذكاءمنذ 24 يوم
اكتشاف ThinkSafe: الابتكار الثوري في تحسين سلامة نماذج التفكير!
نماذج لغوية

اكتشاف ThinkSafe: الابتكار الثوري في تحسين سلامة نماذج التفكير!

أركايف للذكاءمنذ 25 يوم
فهم سياسة سلامة المعلّقين: كيف تجعل التعلم الآلي أكثر أماناً وشفافية
أبحاث

فهم سياسة سلامة المعلّقين: كيف تجعل التعلم الآلي أكثر أماناً وشفافية

أركايف للذكاءمنذ 28 يوم
الدفاع الذكي: كيف يحمي نموذج الذكاء الاصطناعي نفسه من التعديلات الضارة؟
أبحاث

الدفاع الذكي: كيف يحمي نموذج الذكاء الاصطناعي نفسه من التعديلات الضارة؟

أركايف للذكاءمنذ 28 يوم
سلامة الذكاء الاصطناعي المتجسد: استكشاف المخاطر والتحديات الأمنية
أبحاث

سلامة الذكاء الاصطناعي المتجسد: استكشاف المخاطر والتحديات الأمنية

أركايف للذكاءمنذ 29 يوم
تحكم الذكاء الاصطناعي: إطار عمل جديد لفهم الحدود والسيطرة غير القابلة للعكس!
أخلاقيات الذكاء الاصطناعي

تحكم الذكاء الاصطناعي: إطار عمل جديد لفهم الحدود والسيطرة غير القابلة للعكس!

أركايف للذكاءمنذ 1 شهر
REFUSALGUARD: كيفية تعزيز أمان نماذج الذكاء الاصطناعي دون التأثير على أدائها
أبحاث

REFUSALGUARD: كيفية تعزيز أمان نماذج الذكاء الاصطناعي دون التأثير على أدائها

أركايف للذكاءمنذ 1 شهر
نماذج التفكير الكبيرة: الرؤية الآمنة من خلال تعزيز اتخاذ قرارات السلامة
أبحاث

نماذج التفكير الكبيرة: الرؤية الآمنة من خلال تعزيز اتخاذ قرارات السلامة

أركايف للذكاءمنذ 1 شهر
تحقيق التوازن المثالي: ابتكار LLM-VA للتغلب على تحديات الذكاء الاصطناعي!
أبحاث

تحقيق التوازن المثالي: ابتكار LLM-VA للتغلب على تحديات الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر
كشف الأسرار: تقييم سلامة 20 نموذجاً لغوياً ضخماً بطريقة مبتكرة!
أبحاث

كشف الأسرار: تقييم سلامة 20 نموذجاً لغوياً ضخماً بطريقة مبتكرة!

أركايف للذكاءمنذ 1 شهر
تقييم سلامة نماذج اللغة الكبيرة في التحكم بالروبوتات الصحية: نتائج مثيرة!
روبوتات

تقييم سلامة نماذج اللغة الكبيرة في التحكم بالروبوتات الصحية: نتائج مثيرة!

أركايف للذكاءمنذ 1 شهر
كيف تضمن الشركات الكبرى سلامة نماذج الذكاء الاصطناعي؟ تعرف على تقارير المخاطر الداخلية!
أخلاقيات الذكاء الاصطناعي

كيف تضمن الشركات الكبرى سلامة نماذج الذكاء الاصطناعي؟ تعرف على تقارير المخاطر الداخلية!

أركايف للذكاءمنذ 1 شهر
اكتشاف معايير السلامة الوكيلة من إشارات الخطر الأحادية: كيف تؤسس نماذج الذكاء الاصطناعي قواعد سلوك آمنة؟
أبحاث

اكتشاف معايير السلامة الوكيلة من إشارات الخطر الأحادية: كيف تؤسس نماذج الذكاء الاصطناعي قواعد سلوك آمنة؟

أركايف للذكاءمنذ 1 شهر
هل تهدد نماذج الذكاء الاصطناعي سلامة أبحاث الذكاء الاصطناعي؟
أبحاث

هل تهدد نماذج الذكاء الاصطناعي سلامة أبحاث الذكاء الاصطناعي؟

أركايف للذكاءمنذ 1 شهر
مخاطر خفية: اكتشاف التحديات الجديدة لنماذج اللغات الضخمة
أبحاث

مخاطر خفية: اكتشاف التحديات الجديدة لنماذج اللغات الضخمة

أركايف للذكاءمنذ 1 شهر
الذكاء الاصطناعي والتحولات الاقتصادية: هل نحن في عصر الكارثة أم الازدهار؟
أبحاث

الذكاء الاصطناعي والتحولات الاقتصادية: هل نحن في عصر الكارثة أم الازدهار؟

أركايف للذكاءمنذ 1 شهر
تحسين دقيق لنماذج اللغة الكبيرة مع التركيز على السلامة: تقنية مبتكرة تحمي من المحتوى الضار!
أبحاث

تحسين دقيق لنماذج اللغة الكبيرة مع التركيز على السلامة: تقنية مبتكرة تحمي من المحتوى الضار!

أركايف للذكاءمنذ 1 شهر