في خطوة جريئة ومميزة، أطلق [باحثون](/tag/باحثون) نموذجًا جديدًا يُدعى Babel، يكشف عن [ثغرات](/tag/ثغرات) [أمان](/tag/أمان) هائلة موجودة في [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) ([LLMs](/tag/llms)). على الرغم من الجهود المتواصلة لتأمين هذه النماذج، إلا أنها لا تزال عرضة لهجمات التخطي، مما يثير تساؤلات جدية حول موثوقيتها.

الأساليب الحالية المستخدمة في هذا المجال غالبًا ما تعتمد على قوالب حدسية أو [تجارب](/tag/تجارب) شاملة، مما يفتقر إلى [الفهم العميق](/tag/الفهم-العميق) للآليات الداخلية وكفاءة الاستعلام. وهنا يأتي دور [نموذج](/tag/نموذج) Babel ليكشف عن عيب جوهري في [آليات](/tag/آليات) [الأمان](/tag/الأمان) الخاصة بنماذج [اللغة](/tag/اللغة) الضخمة، حيث يعتمد [التأمين](/tag/التأمين) على مجموعة صغيرة من [رؤوس الانتباه](/tag/رؤوس-[الانتباه](/tag/الانتباه)) الموزعة بشكل فضفاض. هذا يعني أن معظم [الفضاء](/tag/الفضاء) التمثيلي يظل تحت [المراقبة](/tag/المراقبة) الضعيفة.

لتأكيد هذا الاكتشاف، طور الباحثون نموذجًا رياضيًا يكافح لفهم الحدود الدقيقة بين التعتيم الفعال للسياقات النصية وشرح السلوكيات المسجلة في سياق [هجمات](/tag/هجمات) التخطي.

حسب هذا النموذج، تم تقديم [تخطيط](/tag/تخطيط) [جديد](/tag/جديد) يُدعى Babel، وهو إطار [هجوم](/tag/هجوم) أسود الصندوق يهدف إلى [استغلال](/tag/استغلال) [الفجوة](/tag/الفجوة) الموجودة في [الأمان](/tag/الأمان) من خلال [عينة](/tag/عينة) شاملة من [أساليب](/tag/أساليب) التعتيم، مما يضمن [تحقيق](/tag/تحقيق) [هجمات](/tag/هجمات) تخطي موثوقة وعالية النجاح دون الحاجة للوصول إلى [البيانات](/tag/البيانات) الداخلية للنموذج.

أظهرت [التقييمات](/tag/التقييمات) الشاملة على [نماذج](/tag/نماذج) تجارية متقدمة أن Babel قد حقق نسب [نجاح](/tag/نجاح) غير مسبوقة في الهجمات. على وجه الخصوص، زادت نسبة [نجاح](/tag/نجاح) الهجمات على [نموذج GPT](/tag/[نموذج](/tag/نموذج)-gpt)-[4o](/tag/4o) من 41.33% إلى 82.67%، وعلى [Claude](/tag/claude)-3-5-haiku من 38.33% إلى 78.33%، وذلك في متوسط 40 استعلامًا. هذا التطور ليس فقط يوضح التحديات المستمرة في مجال [أمان](/tag/أمان) الذكاء الاصطناعي، بل يقدم أيضًا منهجية فاعلة للبحوث المتعلقة بأمان [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة).

ما رأيكم في هذه الثورة في عالم [أمن](/tag/أمن) [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي)؟ هل تعتقدون أن [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) بحاجة لتعزيز [الأمان](/tag/الأمان)؟ شاركونا في [التعليقات](/tag/التعليقات).