Ailoxa Logo

🏷️ #أمان

127 مقال

التحليل الأمني لتوجيه نماذج Mixtral MoE: هل تسهم الزناديات في سلامة الذكاء الاصطناعي؟
أبحاث

التحليل الأمني لتوجيه نماذج Mixtral MoE: هل تسهم الزناديات في سلامة الذكاء الاصطناعي؟

أركايف للذكاءمنذ 10 يوم
تجديد التفكير في الذكاء الاصطناعي: إعادة المحاولة مقابل إعادة العينة
أبحاث

تجديد التفكير في الذكاء الاصطناعي: إعادة المحاولة مقابل إعادة العينة

أركايف للذكاءمنذ 10 يوم
تحصينات الذكاء الاصطناعي: كيف نحمي نماذج اللغة الضخمة من التهديدات المتطورة؟
أبحاث

تحصينات الذكاء الاصطناعي: كيف نحمي نماذج اللغة الضخمة من التهديدات المتطورة؟

أركايف للذكاءمنذ 10 يوم
استكشف KYA: الطبقة الثقة المستقلة للأنظمة الذاتية الموثوقة!
أبحاث

استكشف KYA: الطبقة الثقة المستقلة للأنظمة الذاتية الموثوقة!

أركايف للذكاءمنذ 10 يوم
تكنولوجيا جديدة تُحدث ثورة في أمان الحوار مع نماذج اللغات الضخمة: تعرف على SafeCtrl-RL!
أبحاث

تكنولوجيا جديدة تُحدث ثورة في أمان الحوار مع نماذج اللغات الضخمة: تعرف على SafeCtrl-RL!

أركايف للذكاءمنذ 10 يوم
اختراق سلسلة التفكير: كيف يمكن لنماذج التفكير المطولة أن تفقد قدرتها على الرفض؟
أخلاقيات الذكاء الاصطناعي

اختراق سلسلة التفكير: كيف يمكن لنماذج التفكير المطولة أن تفقد قدرتها على الرفض؟

أركايف للذكاءمنذ 10 يوم
MCPXKIT: أداة شاملة لتحليل أمان بروتوكولات نماذج السياق
أبحاث

MCPXKIT: أداة شاملة لتحليل أمان بروتوكولات نماذج السياق

أركايف للذكاءمنذ 10 يوم
كيف تعزز الذكاء الاصطناعي الأمان في إدارة مرض السكري؟ اكتشافات مثيرة في التعلم المعزز الآمن!
أبحاث

كيف تعزز الذكاء الاصطناعي الأمان في إدارة مرض السكري؟ اكتشافات مثيرة في التعلم المعزز الآمن!

أركايف للذكاءمنذ 10 يوم
تحديد عدم اليقين في نماذج اللغات الضخمة: الابتكار الذي سيحدث ثورة في الأمان!
أبحاث

تحديد عدم اليقين في نماذج اللغات الضخمة: الابتكار الذي سيحدث ثورة في الأمان!

أركايف للذكاءمنذ 10 يوم
هجوم GradingAttack: كشف ثغرات الأمان في وكلاء التقييم التعليمي المعتمدين على نماذج اللغة العملاقة
أبحاث

هجوم GradingAttack: كشف ثغرات الأمان في وكلاء التقييم التعليمي المعتمدين على نماذج اللغة العملاقة

أركايف للذكاءمنذ 11 يوم
التحكم الذاتي في عملاء الذكاء الاصطناعي: أحدث الابتكارات في الحوكمة من أجل الأداء المستدام!
أخلاقيات الذكاء الاصطناعي

التحكم الذاتي في عملاء الذكاء الاصطناعي: أحدث الابتكارات في الحوكمة من أجل الأداء المستدام!

أركايف للذكاءمنذ 14 يوم
تحقيق أمان موثوق في نماذج اللغة الكبيرة: كيف يمكننا تحقيق توازن بين السلوك الآمن ونوايا المستخدم؟
أبحاث

تحقيق أمان موثوق في نماذج اللغة الكبيرة: كيف يمكننا تحقيق توازن بين السلوك الآمن ونوايا المستخدم؟

أركايف للذكاءمنذ 14 يوم
هل تهدد تقنيات الذكاء الاصطناعي جودة وأمان البرمجيات؟ دراسة جديدة عن إعادة هيكلة الكود بلغة بايثون
أبحاث

هل تهدد تقنيات الذكاء الاصطناعي جودة وأمان البرمجيات؟ دراسة جديدة عن إعادة هيكلة الكود بلغة بايثون

أركايف للذكاءمنذ 14 يوم
تحذير من استخدام الذكاء الاصطناعي في إزالة قناع الوجه: خطر التفريط في الهوية!
أخلاقيات الذكاء الاصطناعي

تحذير من استخدام الذكاء الاصطناعي في إزالة قناع الوجه: خطر التفريط في الهوية!

أركايف للذكاءمنذ 14 يوم
هجوم مُوجَّه نحو نماذج الذكاء الاصطناعي: كيف تكشف دراسة جديدة عن ثغرات خطيرة!
أبحاث

هجوم مُوجَّه نحو نماذج الذكاء الاصطناعي: كيف تكشف دراسة جديدة عن ثغرات خطيرة!

أركايف للذكاءمنذ 16 يوم
ثورة جديدة في الذكاء الاصطناعي: إطار التفكير المُوجه بلغة الشيفرة لحل مشكلات نماذج الرؤية واللغة!
أبحاث

ثورة جديدة في الذكاء الاصطناعي: إطار التفكير المُوجه بلغة الشيفرة لحل مشكلات نماذج الرؤية واللغة!

أركايف للذكاءمنذ 16 يوم
الدفاع المتطور ضد هجمات الحقن النصي: تقنية ESLD تُحدث ثورة في أمان الذكاء الاصطناعي
أبحاث

الدفاع المتطور ضد هجمات الحقن النصي: تقنية ESLD تُحدث ثورة في أمان الذكاء الاصطناعي

أركايف للذكاءمنذ 16 يوم
هارمونيك أتاك: تقنية مبتكرة لإزالة العلامات المائية من الصوتيات المستندة للذكاء الاصطناعي
أبحاث

هارمونيك أتاك: تقنية مبتكرة لإزالة العلامات المائية من الصوتيات المستندة للذكاء الاصطناعي

أركايف للذكاءمنذ 16 يوم
هل تستطيع نماذج القيادة المبنية على الذكاء الاصطناعي تعزيز نزاهة التفكير؟ تحليل جديد يعزز الأمان في تسلسل الأسباب!
أبحاث

هل تستطيع نماذج القيادة المبنية على الذكاء الاصطناعي تعزيز نزاهة التفكير؟ تحليل جديد يعزز الأمان في تسلسل الأسباب!

أركايف للذكاءمنذ 17 يوم
هجمات الاختراق الشائكة: خطر جديد يهدد نماذج الذكاء الاصطناعي الكبيرة!
أبحاث

هجمات الاختراق الشائكة: خطر جديد يهدد نماذج الذكاء الاصطناعي الكبيرة!

أركايف للذكاءمنذ 17 يوم