في عالم الذكاء الاصطناعي، أصبحت العلامات المائية تقنية واعدة تساعد في تتبع مؤلفي المحتوى الذي تُنتجه نماذج اللغة الكبيرة (Large Language Models). واحدة من أكثر الاستراتيجيات جاذبية في هذا المجال هي طريقة KGW، نظرًا لمرونتها وكفاءتها في توليد اللغة الطبيعية. لكن، وكما أظهرت الدراسات، فإن فعالية هذه الطريقة تتراجع بشكل ملحوظ في البيئات ذات المتوسطات المنخفضة مثل توليد الشفرات والتفكير الرياضي.
تعتبر عملية تقسيم المفردات العشوائي إحدى الخطوات الأساسية في طريقة KGW، إذ تساهم في ضبط اختيار الرموز (tokens) وفقًا لتفضيلات معينة. أظهرت أبحاثنا أن توزيع احتمالية التوقع للرمز التالي يلعب دورًا حاسمًا في تحديد مقدار التعديل الذي يمكن إدخاله على اختيار الرموز، وبالتالي التأثير على فعالية العلامة المائية. أطلقنا على هذه الخاصية اسم "قوة العلامة المائية"، حيث تحدد الحدود الدنيا لقوة العلامة المائية استنادًا إلى توزيع احتمالية الرمز التالي.
ومع ذلك، وجدنا أن إعادة تصميم خوارزمية تقسيم المفردات يمكن أن ترفع هذه الحدود الدنيا. نقدم في هذا البحث تقنية جديدة تُعرف بـSSG (Sort-then-Split by Groups)، التي تقوم بتقسيم المفردات إلى مجموعتين متوازنتين من حيث اللوجيت (logit). تساهم هذه التصميم في رفع الحدود الدنيا لقوة العلامة المائية لكل توقع رمز، مما يؤدي إلى تحسين اكتشاف العلامة المائية.
أظهرت التجارب التي أُجريت على مجموعات بيانات توليد الشفرات والتفكير الرياضي فعالية تقنية SSG بشكل ملحوظ، مما يبشر بآفاق جديدة لاستخدام العلامات المائية في الذكاء الاصطناعي. هل أنتم مستعدون لمعرفة المزيد حول هذه التطورات المثيرة في تقنية العلامات المائية؟
كيف تعزز تقنية SSG قوة العلامة المائية في نماذج اللغة الكبيرة؟
تمثل تقنية SSG تقدمًا جديدًا في مجال العلامات المائية لنماذج اللغة الكبيرة، حيث يعزز من قدرة تتبع المؤلف بطرق جديدة. اكتشف كيف يمكن لهذه التقنية رفع مستوى فعالية العلامة المائية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
