مع التطور السريع لنماذج اللغات الضخمة (Large Language Models) في السنوات الأخيرة، بدأ القلق يرتفع بشأن استخدامها في الغش، انتشار المعلومات المغلوطة، وعمليات التأثير الآلي. ولذا، يبرز الحاجة الضرورية لنظم الكشف المكافحة لهذه المشكلات.
تشير الأبحاث الأخيرة إلى أن التمثيلات العصبية لأسلوب الكتابة تعتبر فعالة للكشف، وتتميز بقدرتها على التصدي للهجمات الخبيثة التي تهزم معظم أنظمة الكشف الموجودة.
ومع ذلك، تعتمد الأنظمة الحالية للكشف المعتمدة على الأسلوب على علامات الملكية في التدريب، مما يحد من دقتها إلى نماذج عدديّة محدودة في مجال الاستدلال. في هذه الدراسة المبتكرة، يتم تعلم ميزات الأسلوب التمييزي بشكل غير مراقب من خلال تدريب مشفر أسلوب (Style Encoder) لإعادة بناء نص مكتوب بواسطة إنسان من بارافراز (Paraphrase) تم إنشاؤه بواسطة الخوارزمية.
أيضًا، يتم تثبيت المرمز الدلالي (Semantic Encoder) أثناء التدريب، مما يساعد مشفر الأسلوب على التقاط الخصائص غير الدلالية اللازمة لعملية الإعادة.
تم تقييم التمثيلات المتعلمة من خلال استراتيجيتين للكشف: كاشف يستند إلى عدد قليل من الأمثلة وكاشف ذاتي عميق قائم على أسلوب مجمع البيانات (DeepSVDD).
وأظهرت النتائج عبر مجموعة من المعايير أن الأسلوب المتبع يماثل أو يتفوق على جميع القواعد الأساسية في الإعداد بعدد قليل من الأمثلة، وفي حالة عدم وجود أي أمثلة يكون تنافسيًا مع المصنفات ذات الإشراف الكامل على البيانات الاختبارية، بينما يتمتع بقدرة أفضل على التعميم مع نماذج اللغات الضخمة غير المعروفة.
وعلاوة على ذلك، فإن التمثيلات المستخلصة يمكن أن تتجاوز الحاجة إلى الكشف، حيث أنها تعمم على مهام لم يسبق رؤيتها، وتحقق أداءًا تنافسيًا في التحقق من الملكية والتفريق بين الأنماط الدقيقة، رغم عدم تدريبها مسبقًا على أي من الأهداف.
هذا التقدم التقني يعد خطوة مبتكرة نحو تعزيز فعالية رصد النصوص الناتجة عن الذكاء الاصطناعي وفتح آفاق جديدة في مقاومة التلاعب بالمعلومات. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
اكتشف كيف يمكن لتعلم تمثيل الأسلوب غير المراقب تعزيز رصد النصوص الناتجة عن الذكاء الاصطناعي!
تقدم دراسة جديدة طرقاً فعالة لرصد النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي من خلال تعلم تمثيل الأسلوب دون الحاجة إلى علامات الملكية. هذا التطور يعد خطوة مهمة لمواجهة قضايا مثل الاحتيال والمعلومات المغلوطة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
