في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المتطور، لا تزال [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models) - [LLM](/tag/llm)) تواجه [تحديات](/tag/تحديات) كبيرة تتعلق بالسلامة والأمن، خاصة فيما يتعلق بهجمات الاختراق التي تؤدي إلى استجابات غير آمنة. في هذا السياق، تم تقديم مفهوم "حراسة ما قبل النموذج" كحلّ مبتكر لتحسين عملية [التدقيق](/tag/التدقيق) في [سلامة](/tag/سلامة) المدخلات قبل استدعاء [النماذج](/tag/النماذج) المستهدفة.

تعمل الحراسة ما قبل النموذج على مراجعة المدخلات (prompts) قبل تفعيل النماذج، ولكن الاعتماد على هذه المدخلات فقط يؤدي إلى معدلات عالية من [الأخطاء](/tag/الأخطاء) السلبية، حيث لا يتم [اكتشاف](/tag/اكتشاف) [هجمات الاختراق](/tag/[هجمات](/tag/هجمات)-الاختراق) بشكل صحيح. ومن هنا تظهر أهمية الحراسة ما بعد النموذج، التي تقوم بتدقيق كل من المدخلات واستجابات النموذج المستهدف، لكن، يعاني هذا الأسلوب من [تكاليف حسابية](/tag/[تكاليف](/tag/تكاليف)-حسابية) مرتفعة، بما في ذلك زيادة استخدام [التوكنات](/tag/التوكنات) ووقت المعالجة، لأنها تعمل بعد [استنتاج](/tag/استنتاج) النموذج.

تقدم الورقة البحثية تصميمًا مبتكرًا للحماية يستفيد من قابلية انتقال [هجمات الاختراق](/tag/[هجمات](/tag/هجمات)-الاختراق) من [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) إلى [النماذج](/tag/النماذج) الأصغر (Small Language [Models](/tag/models) - SLM). أظهرت [التجارب](/tag/التجارب) أن استجابات [النماذج](/tag/النماذج) الأصغر تعكس تبعات [السلامة](/tag/السلامة) للنماذج الكبيرة؛ أي أنه عند استخدام مدخل [اختراق](/tag/اختراق) مصمم لنموذج لغوي كبير، من المرجح أن يتم [تحفيز](/tag/تحفيز) [نموذج لغوي صغير](/tag/[نموذج](/tag/نموذج)-لغوي-صغير) لإنتاج استجابة غير متوافقة.

استنادًا إلى هذا الملاحظة، يعمل [التصميم](/tag/التصميم) الجديد على [استغلال](/tag/استغلال) [الاستنتاج](/tag/الاستنتاج) التكهنّي (speculative inference) مع [النماذج](/tag/النماذج) الأصغر لابتكار مجموعة من الاستجابات المسودة. ثم يتم إدخال المدخل الأصلي وهذه المسودات إلى الحراس الحاليين لتوقع سلامتها. أظهرت النتائج أن هذا [التصميم](/tag/التصميم) يقلل من معدل [الأخطاء](/tag/الأخطاء) السلبية للحراس ما قبل النموذج ويقدم بديلاً أقل تكلفة مقارنةً بالحراس ما بعد النموذج.

بهذه الطريقة، نكون قد ألقينا نظرة على [مستقبل](/tag/مستقبل) [حماية [النماذج](/tag/النماذج) اللغوية](/tag/[حماية](/tag/حماية)-[النماذج](/tag/النماذج)-اللغوية) في زمن [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي). تتعدد الحلول والتقنيات، ولكن تبقى أهمية [السلامة](/tag/السلامة) والأمن دائمًا في المقدمة. ما رأيكم في هذه التطورات المذهلة؟ شاركونا في [التعليقات](/tag/التعليقات).