في عالم البيانات الضخم، يعتمد العديد من الباحثين على الوصول المركز إلى البيانات الفردية لاستنتاج التأثيرات السببية. إلا أن الواقع يشير إلى أن البيانات غالبًا ما تكون موزعة عبر عدة مواقع، مما يعقد مسألة المركزية لأسباب قد تتعلق بالخصوصية أو القانونية أو اللوجستية.

هنا تدخل تقنية التعلم الفيدرالي (Federated Learning) لتقدم حلاً مبتكرًا حيث يمكن تقدير التأثيرات العلاجية المتوسطة (Average Treatment Effect - ATE) من بيانات رصدية موزعة، من خلال تبادل الإحصائيات المجمعة بدلاً من البيانات الفردية. وهذا يعني أن إعداد بياناتك الخاصة يمكن أن يتم بحماية الخصوصية.

نقدم الآن طريقة جديدة لتقدير نقاط الاستجابة (propensity scores) من خلال المتوسط المرجح الفيدرالي للنقاط المحلية باستخدام أوزان العضوية (Membership Weights - MW)، والتي تُعرَّف على أنها احتمالات العضوية بالموقع بناءً على المتغيرات الخاصة. يمكن تقدير أوزان العضوية بمرونة باستخدام نماذج التصنيف العادية أو غير العادية، مما يمنح الباحثين خيارات متعددة.

تستخدم هذه النقاط الناتجة لبناء تقديرات خاصة بالتعلم الفيدرالي مثل تقديرات الوزن العكسي بناءً على العوامل (Federated Inverse Propensity Weighting - Fed-IPW) وتقديرات مُعزّزة (Augmented IPW - Fed-AIPW). وإذا كانت الطرق التقليدية مثل التحليل البيني (meta-analysis) تعاني عند وقوع أي عدم تطابق، فإن نهج التعلم الفيدرالي يستغل التباين في تكليف العلاج عبر المواقع لتحسين التداخل.

الأبحاث النظرية والتجارب على بيانات محاكاة وأخرى من العالم الحقيقي تُظهر فوائد واضحة لهذه الطريقة الجديدة بالمقارنة مع التحليل البيني والطرق المماثلة. لذا، يعد هذا التوجه ثورة في تحليل البيانات اللامركزية وفتح آفاق جديدة في مجال الاستدلال السببي.