في عالم الذكاء الاصطناعي، أصبحت العلامات المائية تقنية واعدة تساعد في تتبع مؤلفي المحتوى الذي تُنتجه نماذج اللغة الكبيرة (Large Language Models). واحدة من أكثر الاستراتيجيات جاذبية في هذا المجال هي طريقة KGW، نظرًا لمرونتها وكفاءتها في توليد اللغة الطبيعية. لكن، وكما أظهرت الدراسات، فإن فعالية هذه الطريقة تتراجع بشكل ملحوظ في البيئات ذات المتوسطات المنخفضة مثل توليد الشفرات والتفكير الرياضي.

تعتبر عملية تقسيم المفردات العشوائي إحدى الخطوات الأساسية في طريقة KGW، إذ تساهم في ضبط اختيار الرموز (tokens) وفقًا لتفضيلات معينة. أظهرت أبحاثنا أن توزيع احتمالية التوقع للرمز التالي يلعب دورًا حاسمًا في تحديد مقدار التعديل الذي يمكن إدخاله على اختيار الرموز، وبالتالي التأثير على فعالية العلامة المائية. أطلقنا على هذه الخاصية اسم "قوة العلامة المائية"، حيث تحدد الحدود الدنيا لقوة العلامة المائية استنادًا إلى توزيع احتمالية الرمز التالي.

ومع ذلك، وجدنا أن إعادة تصميم خوارزمية تقسيم المفردات يمكن أن ترفع هذه الحدود الدنيا. نقدم في هذا البحث تقنية جديدة تُعرف بـSSG (Sort-then-Split by Groups)، التي تقوم بتقسيم المفردات إلى مجموعتين متوازنتين من حيث اللوجيت (logit). تساهم هذه التصميم في رفع الحدود الدنيا لقوة العلامة المائية لكل توقع رمز، مما يؤدي إلى تحسين اكتشاف العلامة المائية.

أظهرت التجارب التي أُجريت على مجموعات بيانات توليد الشفرات والتفكير الرياضي فعالية تقنية SSG بشكل ملحوظ، مما يبشر بآفاق جديدة لاستخدام العلامات المائية في الذكاء الاصطناعي. هل أنتم مستعدون لمعرفة المزيد حول هذه التطورات المثيرة في تقنية العلامات المائية؟