في عالم [البيانات](/tag/البيانات) الكبير، تعتبر TailedTS خطوة كبيرة للأمام في [فهم](/tag/فهم) الأنماط السلوكية لمستخدمي شبكة ويكيبديا. تم إعداد هذه المجموعة الضخمة من [البيانات](/tag/البيانات) لتكون بمثابة اختبار صارم لنماذج [التنبؤ](/tag/التنبؤ) بالسلاسل الزمنية (Time Series Forecasting [Models](/tag/models)) في ظروف غير تقليدية تتسم بالوزن الثقيل، وعند تواجد مشكلات مثل الزيادة في الصفحات غير المشاهدة.

تتضمن [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) TailedTS حوالي 24.69 مليار نقطة [بيانات](/tag/بيانات) تغطي تقريباً 3 ملايين صفحة فريدة شهرياً، مما يجعلها واحدة من أكبر [قواعد البيانات](/tag/قواعد-[البيانات](/tag/البيانات)) المتاحة وتحفظ بتنسيق Apache Parquet الفعال. تكشف [الأبحاث](/tag/الأبحاث) أن [حركة المرور](/tag/حركة-المرور) على [ويكيبيديا](/tag/ويكيبيديا) [تتبع](/tag/تتبع) توزيعاً يبدو أنه يتناسب مع [قانون](/tag/قانون) القوة، حيث تمثل 5% من الصفحات أكثر من 70% من إجمالي المشاهدات، مما يوفر [بيئة](/tag/بيئة) طبيعية لاختبار [قوة](/tag/قوة) [النماذج](/tag/النماذج) في مواجهة [التقلبات](/tag/التقلبات) الشديدة.

إحدى [الابتكارات](/tag/الابتكارات) الرئيسية التي تقدمها TailedTS هي إطار [عمل](/tag/عمل) لتحديد دورية [الحركة](/tag/الحركة) (Periodicity Quantification Framework) يعتمد على [الانحدار](/tag/الانحدار) التلقائي الفائق، والذي يكشف أن الصفحات الأكثر مشاهدة تتمتع ببنية دورية أضعف مقارنةً بالصفحات الأقل مشاهدة. لهذه الحقيقة تداعيات مباشرة على كيفية [تخصيص](/tag/تخصيص) الخوادم وتوقعات [حركة المرور](/tag/حركة-المرور) على المنصات الرقمية الضخمة.

علاوة على ذلك، توفر TailedTS مجموعة من [المعايير](/tag/المعايير) القياسية للتنبؤ، يتم تقييمها باستخدام مجموعة متنوعة من دوال الخسارة غير غاوسية. وقد أظهرت النتائج أن مقدرات Gaussian التقليدية تتدهور بشكل كبير عند التعامل مع الفئات ذات [الحركة](/tag/الحركة) العالية، بينما توفر البدائل الأكثر [قوة](/tag/قوة) مكاسب متسقة [عبر](/tag/عبر) جميع [مقاييس](/tag/مقاييس) [الحركة](/tag/الحركة).

يمكن الوصول إلى [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) TailedTS للجمهور على الرابط https://doi.org/10.5281/zenodo.17070469، مما يجعلها [أداة](/tag/أداة) [قيمة](/tag/قيمة) للمشاريع البحثية المستقبلية في هذا المجال.