في عالم الذكاء الاصطناعي، تعد العلامات المائية أداة حيوية لتعزيز الاستخدام المسؤول لنماذج اللغات الضخمة (Large Language Models - LLMs). تقنيات العلامات المائية التقليدية إما تضع إشارة تُشير إلى أن النص مولد من LLM (العلامات المائية صفرية البت) أو ترمز لرسائل أكثر تعقيدًا (العلامات المائية متعددة البتات). ولكن، على الرغم من أن هناك العديد من الطرق الحديثة التي تتيح إضافة عدة بتات للنص دون التأثير على توقعات الجملة اللاحقة، إلا أنها لا تزال تعتمد بشكل كبير على مبادئ التصميم من الإعدادات الصفرية.

هنا تأتي ArcMark، الابتكار الجديد الذي يُعد قفزة نوعية في هذا المجال. يتيح ArcMark تضمين معلومات متعددة البايت في النص، مركّزًا على إمكانية تضمين معلومات مثل هوية المستخدم الذي أرسل الطلب، إصدار النموذج المستخدم، وحتى النص نفسه.

تتناول ArcMark هذه التحديات من خلال صياغة مشكلة العلامات المائية الخالية من التشويه كمشكلة ترميز قناة، وتطوير سعة قناة معلوماتية تحدد الحدود الأساسية لتضمين المعلومات في مخرجات LLM بطريقة خالية من التشويه. وبفضل هذه الصيغة، تتفوق ArcMark على العلامات المائية الأخرى من حيث دقة الإعادة، حتى عند مواجهة هجمات تكون فيها التعديلات مستهدفة على نص LLM.

أظهرت الدراسات أن مخرجات ArcMark لا يمكن تمييزها عن النصوص غير المحملة بعلامات مائية من حيث الصعوبة وجودة المهام النهائية. ختامًا، تبشر ArcMark بمستقبل مشرق للتقنيات التي تعتمد على الذكاء الاصطناعي وتعزز الاستخدام المسؤول لها.