في القرن الحادي والعشرين، أصبحت لغة البيانات الطبيعية محورية لفهم واستيعاب المعلومات. بيد أن معظم البيانات المعروفة والمهارات تتبع توزيعات تأخذ شكل قانون القوة، حيث تظهر قلة من الأنماط في غالبية البيانات. بينما يعتقد الكثيرون أن إعادة توزيع أو تنسيق البيانات لتكون أكثر توازناً سيساعد النماذج على التعلم بشكل أفضل، إلا أن البحث الجديد يكشف عن نتيجة غير متوقعة: فالتدريب على توزيعات قانون القوة يتفوق بشكل مستمر على التدريب باستخدام توزيعات متساوية في نطاق واسع من مهام التفكير التكويني، مثل تتبع الحالات والعمليات الحسابية متعددة الخطوات.

للكشف عن أسباب هذه الميزة، قمنا بتقديم مهمة بسيطة لتكوين المهارات، وأثبتنا أن التعلم تحت توزيعات قانون القوة يتطلب بيانات تدريب أقل بكثير. يكشف تحليلنا النظري أن عينة قانون القوة تتسبب في خلق عدم تماثل مفيد يحسن من مشهد فقدان الدقة الشاذ. هذا يسمح للنماذج باكتساب أولاً التكوينات الشائعة للمهارات مع تعقيد بيانات منخفض، مما يكون نقطة انطلاق لتعزيز تعلم المهارات النادرة. تقدم نتائجنا منظوراً بديلاً حول ما يعتبر توزيع بيانات فعال لتدريب النماذج.