في ورقة بحثية جديدة نُشرت على arXiv، تركز الأبحاث على التوافق الخاص والموثوق لنماذج اللغة (Language Models) من منظور نظري، حيث تم تحديد حدود جديدة للفجوة غير المثلى في السيناريوهات المختلفة سواء كانت غير متصلة أو متصلة. بالنظر إلى علامات التفضيل في ظل قيود الخصوصية و/أو الفساد العدائي، تتم دراسة تفاعلات مميزة بين الخصوصية والفساد من منظورين مختلفين، وهما "الخصوصية أولاً" و"الفساد أولاً".

وفي إطار التركيز على الخصوصية فقط، أظهرت النتائج أن استخدام خوارزمية مبنية على الخسارة اللوغاريتمية (Log Loss) مع أسلوب تقدير الحد الأقصى الاحتمالي (MLE) يمكن أن يصل إلى معدلات قريبة من المثالية، وهو ما يتناقض مع الفهم التقليدي للموضوع. وفي سياق التعامل مع الخصوصية والفساد معًا، ثبت أن الخوارزميات الموجودة بالفعل تقدم ضمانات أقوى، سواء من حيث مستوى الفساد أو معايير الخصوصية، مما كان معروفًا سابقًا، مما يؤدي إلى تحسين الحدود في حالة الفساد فقط.

علاوة على ذلك، تُعتبر هذه الدراسة الأولى التي تقدم سلسلة من النتائج للتوافق الخاص والموثوق في البيئة المتصلة، وهي إمكانية تعززها ضمانات جديدة للتقارب الموحد (Uniform Convergence) للخسارة اللوغاريتمية وخسارة المربع (Square Loss) تحت تأثير الخصوصية والفساد. هذه النتائج تفتح آفاقًا جديدة وتطبيقات ممتدة في مجالات نظرية التعلم والإحصاءات.