في عالم التنبؤ الجوي، يعد التقييم الدقيق للنماذج أمرًا حيويًا لضمان استخدامها بموثوقية في التطبيقات الواقعية. ومع ذلك، يعتمد معظم المعايير الحالية على منتجات إعادة التحليل مثل ERA5، التي تُنتج من خلال تجميع البيانات المتأخرة، مما يؤدي إلى عدم توافق بين الأداء المعياري والتنبؤات الجوية الحقيقية. هنا، نقدم لكم RealBench، المعيار الجديد في مجال الذكاء الاصطناعي لتوقعات الطقس الذي يركز على التقييم الواقعي تحت الظروف التشغيلية.
تتميز RealBench بوجود مجموعة اختبارات خارج نطاق التوزيع تمتد حتى عام 2025، مما يساعد على تجنب تسرب البيانات ويلتقط الأنماط الجوية الحديثة. ويعتمد هذا المعيار على مصادر بيانات متعددة، بما في ذلك تحليلات تشغيلية سريعة ومجموعة واسعة من الملاحظات الجوية المباشرة من أكثر من 10,000 محطة، مما يتيح تقييمًا مباشرًا بمقابل القياسات الجوية الواقعية.
لكن الأهم، أن RealBench يقدم إطار تقييم شامل للأحداث المناخية الشديدة، مثل موجات الحر، وهجمات البرد، والأعاصير الاستوائية، باستخدام مقاييس مخصصة تعكس أولويات التنبؤ الواقعية أفضل. تكشف نتائج التقييم عن تفاوتات كبيرة بين المقاييس المستندة إلى إعادة التحليل والأداء في العالم الحقيقي، خاصة فيما يتعلق بالأحداث القاسية.
من خلال تسليط الضوء على القيود الموجودة في المعايير الحالية، يضع هذا العمل أسسًا أكثر دقة وملاءمة تشغيلية لتقييم نماذج التنبؤ الجوي، مما يهيئ الطريق لتطوير أنظمة جديدة ومتقدمة في مجال الذكاء الاصطناعي. يمكنكم الاطلاع على تنفيذ المعيار على GitHub من خلال هذا الرابط.
RealBench: ثورة في تقييم نماذج التنبؤ الجوي في ظل الظروف التشغيلية والتحديات القاسية!
تقدم RealBench معيارًا حديثًا لتقييم نماذج التنبؤ الجوي، مما يمكنها من العمل تحت ظروف تشغيلية واقعية وتحديات الطقس القاسية. يهدف هذا المعيار إلى سد الفجوة بين الأداء النظري والتطبيق العملي للتنبؤات الجوية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
