تعد [حواجز الأمان](/tag/حواجز-[الأمان](/tag/الأمان)) جزءًا أساسيًا من [نظم الذكاء الاصطناعي](/tag/نظم-الذكاء-الاصطناعي) الحديثة، لكن طريقة [عمل](/tag/عمل) هذه الحواجز تتغير بسرعة مع [تطور](/tag/تطور) [التطبيقات](/tag/التطبيقات). في ظل استحداث [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) (Large Language [Models](/tag/models)) كمساعدين مخصصين، أصبح من الضروري تحديد [سياسات](/tag/سياسات) [الأمان](/tag/الأمان) في وقت [الاستنتاج](/tag/الاستنتاج) حسب رغبات المستخدمين أو الشروط التنظيمية.
هذا الانتقال يتطلب استجابة ديناميكية، حيث يجب أن تتكيف الحواجز [الأمان](/tag/الأمان) مع [السياسات](/tag/السياسات) المتغيرة في الوقت الحقيقي دون الحاجة لإعادة [تدريب النموذج](/tag/[تدريب](/tag/تدريب)-النموذج). ولكن هناك توتر أساسي هنا: يتطلب الحكم بدقة على [سياقات](/tag/سياقات) [السياسات](/tag/السياسات) المعقدة قدرة على التفكير، بينما يتطلب النشر العملي ردود أفعال سريعة.
لذا، نقدم لكم [نموذج](/tag/نموذج) حرس [السياسات](/tag/السياسات) الكامنة ([LPG](/tag/lpg))، وهو إطار [عمل](/tag/عمل) مبتكر يمكنه أن يتعلم [التفكير](/tag/التفكير) الدلالي الكامن حول [سياسات ديناميكية](/tag/[سياسات](/tag/سياسات)-[ديناميكية](/tag/ديناميكية)). يقوم [LPG](/tag/lpg) بضغط عملية [التفكير](/tag/التفكير) المطلوبة لتفسير النوايا وتأصيل [السياسات](/tag/السياسات) إلى حالات مستمرة تحت إشراف دلالات ذات صلة بالقرار.
عند وقت الاستنتاج، يوفر [نموذج](/tag/نموذج) [LPG](/tag/lpg) حكمًا شاملًا مرتبطًا بعدد قليل من بنود [السياسات](/tag/السياسات) المُنتهكة، محافظًا على [قابلية التدقيق](/tag/قابلية-[التدقيق](/tag/التدقيق)) تجنبًا لفقدان الوقت في [التفكير](/tag/التفكير) الصريح.
أظهرت النتائج على [مقاييس](/tag/مقاييس) حواجز [السياسات](/tag/السياسات) أن النموذج [LPG](/tag/lpg)-4B حقق [دقة](/tag/دقة) [أمان](/tag/أمان) متوسطة تصل إلى 84.5% و77.9% في [قياس](/tag/قياس) F1، مع ضغط عملية [التفكير](/tag/التفكير) إلى 10 [رموز](/tag/رموز) كامنة فقط، متفوقًا بذلك على أقوى [النماذج الديناميكية](/tag/[النماذج](/tag/النماذج)-الديناميكية) وبسرعة تشغيل تفوق 11 مرة مقارنة بنموذج Qwen3-4B-Thinking.
للاستزادة، يمكنكم الاطلاع على [الكود](/tag/الكود) والبيانات المتاحة على المنصة: [صفحة النموذج]. هل تعتقد أن هذه التطورات ستحدث ثورة في [أمان](/tag/أمان) [نظم الذكاء الاصطناعي](/tag/نظم-الذكاء-الاصطناعي)؟ دعونا نعرف آراءكم.
نموذج حرس السياسات الكامنة: التوازن بين الكفاءة والتفكير السياساتي في نظم الذكاء الاصطناعي
الكشف عن نموذج حرس السياسات الكامنة (LPG) الذي يحدث ثورة في أمن أنظمة الذكاء الاصطناعي. يمكن لهذا النموذج التكيف مع سياسات السلامة المتغيرة بسرعة دون الحاجة لإعادة التدريب.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
