في الآونة الأخيرة، باتت نماذج اللغات الضخمة (Large Language Models) تتجاوز كونها محركات توليد محدودة، لتتحول إلى وكلاء (Agents) ذات صلاحيات تنفيذ واسعة. لكن هذا الانتقال يحمل في طياته تحديات أمنية ضخمة، تهدد استقرار أنظمة الذكاء الاصطناعي. يعاني أمان الذكاء الاصطناعي من أزمة عميقة، حيث تعتمد هياكل الدفاع الحالية بشكل كبير على اعتبارات سلوكية تجريبية وموارد تحكم احتمالية، وهي آليات تثبت أنها غير كافية لتوفير حدود أمان حقيقية عندما تواجه الهجمات المعقدة التي تفكك الرموز الدلالية.

في هذا السياق، قدمت دراسة جديدة نموذجًا أمنيًا مبتكرًا يركز على القيود الأساسية للتفكير المنطقي، حيث يعيد فهم كيفية تعامل الوكلاء مع العمليات. من خلال تقديم إطار عمل يسمى "الإجراءات المقيدة بالبرهان القابل للتنفيذ" (ePCA)، تسعى هذه الاستراتيجية إلى إلغاء الثقة الدلالية في اللغة الطبيعية، مما يجبر الوكلاء على تحويل نواياهم بدقة إلى قيود رياضية منطقية قبل القيام بأية عمليات فعلية.

تظهر التقييمات التجريبية التي أجريت على أنظمة ديناميكية معقدة أن آلية التحقق الرسمية التي تم تطويرها تحقق معدل نجاح صفري للهجمات ومعدل إيجابيات كاذبة صفري أيضًا، مع زمن استجابة حسابية منخفض للغاية.

تقدم هذه الأبحاث أساسًا رسميًا مشروطًا تحت افتراضات نظام محددة، ونموذجًا هندسيًا لبناء الأساس الدفاعي اللازم للأنظمة الذكية في المستقبل.

تتوالى الابتكارات في مجال أمن الذكاء الاصطناعي، مما يثير تساؤلات شتى حول كيفية تطور هذه التقنية وكفاءة التدابير المتخذة لحمايتها. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.