Les prévisions météorologiques globales à moyen terme sont essentielles à la prise de décision dans de nombreux domaines sociaux et économiques. Les prévisions météorologiques numériques traditionnelles utilisent des ressources de calcul accrues pour améliorer la précision des prévisions, mais n'utilisent pas directement les données météorologiques historiques pour améliorer le modèle sous-jacent.
Nous présentons ici "GraphCast", une méthode basée sur l'apprentissage automatique et entraînée directement à partir de données de réanalyse. Elle prédit des centaines de variables météorologiques, sur 10 jours à une résolution de 0,25° au niveau mondial, en moins d'une minute. GraphCast surpasse de manière significative les systèmes déterministes opérationnels les plus précis sur 90 % des 1 380 objectifs de vérification, et ses prévisions permettent d'améliorer la prévision des événements graves, notamment le suivi des cyclones tropicaux, les rivières atmosphériques et les températures extrêmes. GraphCast constitue une avancée majeure dans le domaine des prévisions météorologiques précises et efficaces, et contribue à concrétiser les promesses de l'apprentissage automatique pour la modélisation de systèmes dynamiques complexes.
Conclusions
Les compétences et l'efficacité des prévisions de GraphCast comparées à celles de HRES montrent que les méthodes MLWP sont désormais compétitives par rapport aux méthodes traditionnelles de prévision météorologique. En outre, les performances de GraphCast en matière de prévision d'événements graves, pour lesquels il n'a pas été directement formé, démontrent sa robustesse et son potentiel de valeur ajoutée en aval. Nous pensons qu'il s'agit là d'un tournant dans le domaine des prévisions météorologiques, qui ouvre de nouvelles voies pour renforcer l'étendue des décisions prises par les individus et les industries en fonction des conditions météorologiques, en rendant les prévisions bon marché plus précises, plus accessibles et adaptées à des applications spécifiques.
Avec 36,7 millions de paramètres, GraphCast est un modèle relativement petit par rapport aux normes modernes de ML, choisi pour maintenir l'empreinte mémoire à un niveau raisonnable. Alors que HRES est publié avec une résolution de 0,1°, 137 niveaux et des pas de temps allant jusqu'à 1 heure, GraphCast a fonctionné avec une résolution latitude-longitude de 0,25°, 37 niveaux verticaux et des pas de temps de 6 heures, en raison de la résolution native de 0,25° des données d'entraînement d'ERA5 et des défis techniques liés à l'intégration de données à plus haute résolution sur le matériel informatique.
En général, GraphCast doit être considéré comme une famille de modèles, dont la version actuelle est la plus grande que nous puissions intégrer dans le cadre des contraintes techniques actuelles, mais qui a le potentiel de s'étendre bien plus loin à l'avenir avec des ressources de calcul plus importantes et des données à plus haute résolution.

L'une des principales limites de notre approche réside dans la manière dont l'incertitude est traitée. Nous nous sommes concentrés sur les prévisions déterministes et les avons comparées au HRES, mais l'autre pilier de l'IFS du CEPMMT, le système de prévision d'ensemble, ENS, est particulièrement important pour quantifier la probabilité d'événements extrêmes et lorsque la compétence de la prévision diminue à des échéances plus lointaines. La non-linéarité de la dynamique météorologique signifie qu'il y a une incertitude croissante à plus long terme, qui n'est pas bien prise en compte par une seule prévision déterministe. ENS résout ce problème en générant de multiples prévisions stochastiques, qui se rapprochent d'une distribution prédictive des conditions météorologiques futures, mais la génération de multiples prévisions est coûteuse. En revanche, l'objectif d'apprentissage MSE de GraphCast l'encourage à brouiller spatialement ses prévisions en présence d'incertitude, ce qui peut ne pas être souhaitable pour certaines applications où il est important de connaître les probabilités de queue, ou conjointes, des événements. L'élaboration de prévisions probabilistes qui modélisent l'incertitude de manière plus explicite, à l'instar des prévisions d'ensemble, constitue une prochaine étape cruciale.
Il est important de souligner que le MLWP piloté par les données repose essentiellement sur de grandes quantités de données et sur leur qualité qui, dans le cas des modèles entraînés sur la réanalyse, dépend de la fidélité des PNT. Par conséquent, les sources de données riches et de haute qualité telles que les archives MARS du CEPMMT sont inestimables. Notre approche ne doit pas être considérée comme un remplacement des méthodes traditionnelles de prévision météorologique, qui ont été développées pendant des décennies, testées rigoureusement dans de nombreux contextes réels et qui offrent de nombreuses caractéristiques que nous n'avons pas encore explorées. Notre travail doit plutôt être interprété comme une preuve que MLWP est capable de relever les défis des problèmes de prévision du monde réel et qu'il a le potentiel de compléter et d'améliorer les meilleures méthodes actuelles.
Au-delà des prévisions météorologiques, GraphCast peut ouvrir de nouvelles voies pour d'autres problèmes importants de prévision géo-spatio-temporelle, notamment le climat et l'écologie, l'énergie, l'agriculture, l'activité humaine et biologique, ainsi que d'autres systèmes dynamiques complexes. Nous pensons que les simulateurs appris, formés sur des données riches et réelles, seront essentiels pour faire progresser le rôle de l'apprentissage automatique dans les sciences physiques.
Partager