في عالم [البيانات](/tag/البيانات) الكبير، تعتبر TailedTS خطوة كبيرة للأمام في [فهم](/tag/فهم) الأنماط السلوكية لمستخدمي شبكة ويكيبديا. تم إعداد هذه المجموعة الضخمة من [البيانات](/tag/البيانات) لتكون بمثابة اختبار صارم لنماذج [التنبؤ](/tag/التنبؤ) بالسلاسل الزمنية (Time Series Forecasting [Models](/tag/models)) في ظروف غير تقليدية تتسم بالوزن الثقيل، وعند تواجد مشكلات مثل الزيادة في الصفحات غير المشاهدة.
تتضمن [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) TailedTS حوالي 24.69 مليار نقطة [بيانات](/tag/بيانات) تغطي تقريباً 3 ملايين صفحة فريدة شهرياً، مما يجعلها واحدة من أكبر [قواعد البيانات](/tag/قواعد-[البيانات](/tag/البيانات)) المتاحة وتحفظ بتنسيق Apache Parquet الفعال. تكشف [الأبحاث](/tag/الأبحاث) أن [حركة المرور](/tag/حركة-المرور) على [ويكيبيديا](/tag/ويكيبيديا) [تتبع](/tag/تتبع) توزيعاً يبدو أنه يتناسب مع [قانون](/tag/قانون) القوة، حيث تمثل 5% من الصفحات أكثر من 70% من إجمالي المشاهدات، مما يوفر [بيئة](/tag/بيئة) طبيعية لاختبار [قوة](/tag/قوة) [النماذج](/tag/النماذج) في مواجهة [التقلبات](/tag/التقلبات) الشديدة.
إحدى [الابتكارات](/tag/الابتكارات) الرئيسية التي تقدمها TailedTS هي إطار [عمل](/tag/عمل) لتحديد دورية [الحركة](/tag/الحركة) (Periodicity Quantification Framework) يعتمد على [الانحدار](/tag/الانحدار) التلقائي الفائق، والذي يكشف أن الصفحات الأكثر مشاهدة تتمتع ببنية دورية أضعف مقارنةً بالصفحات الأقل مشاهدة. لهذه الحقيقة تداعيات مباشرة على كيفية [تخصيص](/tag/تخصيص) الخوادم وتوقعات [حركة المرور](/tag/حركة-المرور) على المنصات الرقمية الضخمة.
علاوة على ذلك، توفر TailedTS مجموعة من [المعايير](/tag/المعايير) القياسية للتنبؤ، يتم تقييمها باستخدام مجموعة متنوعة من دوال الخسارة غير غاوسية. وقد أظهرت النتائج أن مقدرات Gaussian التقليدية تتدهور بشكل كبير عند التعامل مع الفئات ذات [الحركة](/tag/الحركة) العالية، بينما توفر البدائل الأكثر [قوة](/tag/قوة) مكاسب متسقة [عبر](/tag/عبر) جميع [مقاييس](/tag/مقاييس) [الحركة](/tag/الحركة).
يمكن الوصول إلى [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) TailedTS للجمهور على الرابط https://doi.org/10.5281/zenodo.17070469، مما يجعلها [أداة](/tag/أداة) [قيمة](/tag/قيمة) للمشاريع البحثية المستقبلية في هذا المجال.
ثورة البيانات: TailedTS، مجموعة بيانات رائدة لتنبؤ السلاسل الزمنية وتحليل دورية التصفح!
تقدم TailedTS مجموعة بيانات ضخمة مستمدة من مشاهدات صفحات ويكيبيديا، تم تصميمها لاختبار نماذج التنبؤ بالسلاسل الزمنية في ظروف غير تقليدية. تكشف الدراسات أن الصفحات ذات المشاهدات العالية تعاني من بنية دورية أضعف، مما يؤثر على استراتيجيات توزيع الخوادم.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
