في العقد الماضي، كانت البيانات الكبيرة من المحركات الرئيسية لنجاح نماذج الذكاء الاصطناعي المتقدم. لكن، ما الذي يحدث عندما تتحول عملية بناء النماذج من الاعتماد على البيانات المتاحة إلى خلق البيانات بشكل نشط لبناء هذه النماذج؟ هذه النقطة الحرجة تُعرف بـ "البيانات المفرطة" (Hyper-Datafication) التي تحمل في طياتها آثاراً كبيرة على المجتمع. \n\nتركز الدراسة الأخيرة على تكاليف الاستدامة المرتبطة بالبيانات الكبيرة في الذكاء الاصطناعي من منظور بيئي واقتصادي واجتماعي. من خلال تحليل حوالي 550,000 مجموعة بيانات من منصة Hugging Face، تسلط الأضواء على نمو التخزين واستهلاك الطاقة وعالم ثقافي غير متوازن. كما تم جمع ردود نوعية من عمال البيانات في كينيا لتسليط الضوء على المخاطر المرتبطة بالعمل في هذه الصناعة. \n\nتظهر النتائج أن البيانات المفرطة لا تؤدي فقط إلى زيادة استهلاك الموارد، بل تعيد توزيع الأعباء البيئية والمخاطر العمالية إلى الدول النامية والثقافات غير الممثلة. من أجل مواجهة هذه التحديات، نقدم مجموعة من التوصيات المعروفة باسم "إثباتات البيانات" (Data PROOFS) التي تشمل الملكية والانفتاح والوعي بالموارد. لذلك، تدعو هذه الدراسة الباحثين والمجتمع الأوسع إلى الانتباه لهذه التكاليف التي قد يتم تجاهلها في مجال الذكاء الاصطناعي المتقدم.