في العصر الرقمي المتسارع، أصبح التعرف على مصدر المحتوى الناتج عن أنظمة الذكاء الاصطناعي (AI) مسألة محورية. مع ازدياد الاعتماد على واجهات برمجة التطبيقات (APIs) الخاصة بنماذج اللغات الضخمة (LLMs)، تواجه التطبيقات تحديًا كبيرًا في تحديد أي نموذج أنتج استجابة معينة. هنا يأتي دور إطار READER (Robust Evidence-based Authorship Decoding via Extracted Representations) كحل مبتكر للتعامل مع هذه المعضلة.

تدرس هذه الدراسة "أصول استجابات LLM الديناميكية"، حيث تسعى لتحديد مصدر النموذج من خلال استجابات مستندة إلى استعلامات متغيرة، بدلاً من الاعتماد على مجموعة إدخالات ثابتة. يواجه هذا النهج صعوبة لأن دلالة الاستعلامات تتفوق على النص، مما يجعل آثار المؤلف الخاصة بالنموذج ضعيفة وغير متسقة عند السطح.

إطار READER يعالج هذا التحدي بفعالية. يعتمد على نموذج مخصص كمؤشر لقراءة الأدلة المخفية عن المؤلف، مما يتيح له تحويل استجابات "الصندوق الأسود" إلى فضاء تنشيط بديل. ويقوم بتصفية الحالات الزمنية الخاصة بالاستجابة، ويستخدم تقنية تراكم الأدلة البايزية، مما يعني جمع الأدلة من عدة استجابات لتعزيز الثقة في النتائج.

في اختبارات على مجموعة بيانات Agent500 المكونة من 50 استعلاماً مختلفاً، حقق READER دقة تتراوح بين 31.0% و42.4% للاستجابة الواحدة، و70.0% و84.0% عند استخدام 50 استجابة. هذه النتائج الرائعة تؤكد تفوق READER على تقنيات تحليل المؤلفين التقليدية.

تقدم الدراسة دليلاً قوياً على أن الهياكل المؤلفية يمكن اكتشافها في نماذج اللغات الضخمة المجمدة، مما يُظهر إمكانية تحويل هذه الهياكل إلى تقدير موثوق عبر استعلامات متعددة.