أصبح الذكاء الاصطناعي جزءًا أساسيًا من العديد من الصناعات، ولكن تحديات ضبط الأمان في نماذج اللغات الضخمة (Large Language Models) لا تزال قائمة. يتبع نظام الأمان التقليدي في هذه النماذج نموذجًا موحدًا (one-size-fits-all)، مما يعني أن نفس سياسة الرفض تُطبق على جميع المستخدمين والسياقات. ورغم أن هذا النموذج يضمن أمانًاً عامًا، إلا أنه يقيد المساعدة المقدمة للمحترفين المعتمدين في مجالاتهم المتخصصة.
في ضوء هذه التحديات، تم تقديم إطار Palette الجديد، الذي يعد ابتكارًا في هذا المجال. يتيح Palette إمكانية استرخاء سياسة الرفض بشكل انتقائي في المجالات المعتمدة دون التضحية بالأمان العام. يتم تحديد اتجاه الرفض من خلال بحث متعدد الأهداف (multi-objective search) ويُدمج في النموذج عبر تكيف خفيف.
كما يدعم Palette التكوين الموديولاري (modular composition)، مما يسمح بتعلم ضوابط الأمان الخاصة بالمجالات بشكل مستقل ودمجها عبر دمج المعلمات، وهذا يمكّن من الحصول على تفويض متعدد المجالات عند الطلب، بدون الحاجة لإعادة تدريب النموذج.
أظهرت التجارب التي أجريت عبر أربعة معايير للأمان ونماذج متعددة من نماذج اللغات الضخمة (LLMs) ونماذج اللغات المرئية (VLMs) أن Palette يوفر تحكمًا دقيقًا في الأمان دون التضحية بالمنفعة العامة. يقدم Palette مسارًا عمليًا نحو نماذج أصيلة تتكيف مع احتياجات محترفين متنوعين، مما يعزز من كفاءة استخدام الذكاء الاصطناعي في قطاعات متعددة.
Palette: الإطار المتكامل لضبط أمان نماذج الذكاء الاصطناعي بخطوات مرنة وفعالة!
يقدم إطار Palette طريقة مبتكرة لضبط أمان نماذج الذكاء الاصطناعي، مما يسمح بتجاوز الرفض العام المعتمد على كل الطلبات. تتيح هذه التقنية الجديدة مزيدًا من المرونة للممارسين المحترفين في تخصصاتهم، مما يزيد من كفاءة الاستخدام.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
