🏷️ #سلامة الذكاء الاصطناعي
50 مقال
أبحاث
ثغرات زمن الاستنتاج: كيف تتحدى نماذج الذكاء الاصطناعي السلامة أثناء التوليد؟
أركايف للذكاءمنذ 23 ساعة
أبحاث
AICompanionBench: أولى الخطوات نحو سلامة التفاعل بين البشر والذكاء الاصطناعي!
أركايف للذكاءمنذ 23 ساعة
أخلاقيات الذكاء الاصطناعي
الإخفاقات المثيرة في سلامة نماذج الذكاء الاصطناعي: كيف تؤثر المجالات المختلفة على الثقة؟
أركايف للذكاءمنذ 23 ساعة
أبحاث
دليل توليد السيناريوهات للذكاء الاصطناعي: ضمانات الأمان المثلى لتعلم التعزيز
أركايف للذكاءمنذ 23 ساعة
أبحاث
هل نماذج اللغات الضخمة (LLMs) آمنة؟ دراسة مثيرة تكتشف جوانب غامضة في سلوك الذكاء الاصطناعي!
أركايف للذكاءمنذ 23 ساعة
أبحاث
كيف يؤثر تعديل نماذج اللغة الضخمة على سلامتها؟ تحليل جديد يغير اللعبة!
أركايف للذكاءمنذ 1 يوم
أبحاث
درع قوي لضمان السلامة في التعلم المعزز: التطور الجديد!
أركايف للذكاءمنذ 2 يوم
أبحاث
MESA: تحسين سلامة نماذج Mixture-of-Experts من خلال الخبرة اللامركزية!
أركايف للذكاءمنذ 2 يوم
أبحاث
تحديات السلامة في لغات الموارد المنخفضة: هل المشكلة في الأداء أم التمثيل؟
أركايف للذكاءمنذ 2 يوم
أبحاث
المستقبل في الذكاء الاصطناعي: كيف تكشف الإشارات عن سلوك الرفض في نماذج اللغات الضخمة؟
أركايف للذكاءمنذ 7 يوم
أبحاث
SkillSafetyBench: تقييم أمان الوكلاء في مواجهة هجمات المهارات!
أركايف للذكاءمنذ 7 يوم
أخلاقيات الذكاء الاصطناعي
إلينوي: تشريعات رائدة لضمان سلامة الذكاء الاصطناعي في أمريكا!
وايردمنذ 8 يوم
أبحاث
تعلم المنهجية: كيف تعزز أمان نماذج الذكاء الاصطناعي بتقنيات جديدة!
أركايف للذكاءمنذ 8 يوم
أبحاث
ثورة في تقييمات الذكاء الاصطناعي: اكتشفوا تقنية LURE وتأثيرها المذهل!
أركايف للذكاءمنذ 8 يوم
أبحاث
الحرب الخفية في عالم الذكاء الاصطناعي: كيف يمكن لنماذج اللغة الكبيرة تجاوز يقظة الإنسان الإدراكية؟
أركايف للذكاءمنذ 8 يوم
أبحاث
اكتشاف المخاطر: GT-HarmBench يقيّم سلامة الذكاء الاصطناعي من خلال نظرية الألعاب
أركايف للذكاءمنذ 10 يوم
أبحاث
CRAFT: تحوُّل ثوري في سلامة نظم الذكاء الاصطناعي بفضل التعلم من التمثيلات الخفية
أركايف للذكاءمنذ 15 يوم
أخلاقيات الذكاء الاصطناعي
تحذير من موظفين سابقين في OpenAI: سجلات أمان xAI قد تعرقل طرح SpaceX للاكتتاب العام!
وايردمنذ 16 يوم
أبحاث
التذكر بشكل أفضل، مع مخاطر أكبر: التحديات الأمنية لوكلاء الذكاء الاصطناعي المجهزين بالذاكرة
أركايف للذكاءمنذ 16 يوم
أبحاث
هل تتفوق نماذج اللغة المتعددة الأنماط في الأمان؟ اكتشافات جديدة حول انهيار هندسة الأمان
أركايف للذكاءمنذ 16 يوم
1 / 3التالي →
