Ailoxa Logo

🏷️ #أمان الذكاء الاصطناعي

80 مقال

STRIDE-AI: الإطار الثوري لتقييم أمان الذكاء الاصطناعي التوليدي
أخلاقيات الذكاء الاصطناعي

STRIDE-AI: الإطار الثوري لتقييم أمان الذكاء الاصطناعي التوليدي

أركايف للذكاءمنذ 17 يوم
تحذير هام: زيادة خطر هجمات حقن الأوامر في وكيل الذكاء الاصطناعي بسبب السعي لتوضيح الغموض
أبحاث

تحذير هام: زيادة خطر هجمات حقن الأوامر في وكيل الذكاء الاصطناعي بسبب السعي لتوضيح الغموض

أركايف للذكاءمنذ 17 يوم
تحليل قوة نماذج الرؤية واللغة: كيف تؤثر ضغوطات الرموز البصرية على صمودها ضد الهجمات الشرسة؟
أبحاث

تحليل قوة نماذج الرؤية واللغة: كيف تؤثر ضغوطات الرموز البصرية على صمودها ضد الهجمات الشرسة؟

أركايف للذكاءمنذ 17 يوم
تحكم آمن في نماذج الذكاء الاصطناعي: استكشاف تقنية Graph-Regularized Sparse Autoencoders
أبحاث

تحكم آمن في نماذج الذكاء الاصطناعي: استكشاف تقنية Graph-Regularized Sparse Autoencoders

أركايف للذكاءمنذ 18 يوم
ابتكار بصمة مضادة للتكرار: تعزيز كشف نماذج الذكاء الاصطناعي بكفاءة فائقة
أبحاث

ابتكار بصمة مضادة للتكرار: تعزيز كشف نماذج الذكاء الاصطناعي بكفاءة فائقة

أركايف للذكاءمنذ 18 يوم
هجوم تسميم الحالات الخفية: كيف تهدد نماذج Mamba اللغوية؟
أبحاث

هجوم تسميم الحالات الخفية: كيف تهدد نماذج Mamba اللغوية؟

أركايف للذكاءمنذ 21 يوم
EVA: إطار مبتكر لتعزيز الأمان في نماذج الذكاء الاصطناعي ضد هجمات الاختراق!
أبحاث

EVA: إطار مبتكر لتعزيز الأمان في نماذج الذكاء الاصطناعي ضد هجمات الاختراق!

أركايف للذكاءمنذ 21 يوم
تقييم حديث لأمان نماذج اللغات الضخمة: كيف تتعرض للهجمات المتكررة؟
أبحاث

تقييم حديث لأمان نماذج اللغات الضخمة: كيف تتعرض للهجمات المتكررة؟

أركايف للذكاءمنذ 22 يوم
إهمال النفي: كيف تفشل نماذج الذكاء الاصطناعي في تعلم النفي أثناء التدريب!
أبحاث

إهمال النفي: كيف تفشل نماذج الذكاء الاصطناعي في تعلم النفي أثناء التدريب!

أركايف للذكاءمنذ 22 يوم
أفق أمان الذكاء الاصطناعي: كيف تساهم نماذج اللغات الكبيرة في سلامة الأنظمة الذكية؟
أبحاث

أفق أمان الذكاء الاصطناعي: كيف تساهم نماذج اللغات الكبيرة في سلامة الأنظمة الذكية؟

أركايف للذكاءمنذ 22 يوم
إصدار ثوري في توليد الصور: تقنية SPOT لرفاهية الأمان في التطبيقات الذكية
أدوات

إصدار ثوري في توليد الصور: تقنية SPOT لرفاهية الأمان في التطبيقات الذكية

أركايف للذكاءمنذ 22 يوم
تحليل الشخصية الكامن: تعزيز الأمان دون الحاجة للإشارة إلى المخاطر
أبحاث

تحليل الشخصية الكامن: تعزيز الأمان دون الحاجة للإشارة إلى المخاطر

أركايف للذكاءمنذ 24 يوم
تحقق من الاحتواء: ضمانات أمان الذكاء الاصطناعي المستقلة عن المحاذاة
أبحاث

تحقق من الاحتواء: ضمانات أمان الذكاء الاصطناعي المستقلة عن المحاذاة

أركايف للذكاءمنذ 24 يوم
معايير إعادة الإنتاج: ضرورة لدعم ادعاءات أمان الذكاء الاصطناعي في نيوريبس
أبحاث

معايير إعادة الإنتاج: ضرورة لدعم ادعاءات أمان الذكاء الاصطناعي في نيوريبس

أركايف للذكاءمنذ 24 يوم
ميتس: ثورة في اختراق نماذج اللغات الضخمة باستخدام استراتيجية التعلم الذاتي
أبحاث

ميتس: ثورة في اختراق نماذج اللغات الضخمة باستخدام استراتيجية التعلم الذاتي

أركايف للذكاءمنذ 24 يوم
ابتكار ثوري: تحسين حمايات نماذج اللغة الكبيرة للكشف عن هجمات الاختراق
أبحاث

ابتكار ثوري: تحسين حمايات نماذج اللغة الكبيرة للكشف عن هجمات الاختراق

أركايف للذكاءمنذ 24 يوم
هل يمكن لـ Consensus Sampling أن تجعل الذكاء الاصطناعي أكثر أمانًا؟
أبحاث

هل يمكن لـ Consensus Sampling أن تجعل الذكاء الاصطناعي أكثر أمانًا؟

أركايف للذكاءمنذ 24 يوم
CachePrune: تقنية مبتكرة لحماية نماذج اللغة الكبيرة من هجمات التعليمات غير المباشرة!
أبحاث

CachePrune: تقنية مبتكرة لحماية نماذج اللغة الكبيرة من هجمات التعليمات غير المباشرة!

أركايف للذكاءمنذ 24 يوم
خطط مثيرة: كيف تُدير نماذج اللغة الكبيرة (LLMs) الأفكار وتتلاعب بالإيقاع!
أبحاث

خطط مثيرة: كيف تُدير نماذج اللغة الكبيرة (LLMs) الأفكار وتتلاعب بالإيقاع!

أركايف للذكاءمنذ 24 يوم
انفثينك: ثورة في أمان نماذج اللغة من خلال التفكير الاستباقي!
أبحاث

انفثينك: ثورة في أمان نماذج اللغة من خلال التفكير الاستباقي!

أركايف للذكاءمنذ 25 يوم