TEEMLEAP - A new TEstbed for Exploring Machine LEarning in Atmospheric Prediction

Projektbeschreibung

Trotz stetiger Verbesserung der numerischen Wettervorhersagemodelle weisen diese immer noch systematische Fehler auf, die durch vereinfachte Darstellungen physikalischer Prozesse, Annahmen über lineares Verhalten und die Herausforderungen, alle verfügbaren Beobachtungsdaten zu integrieren, verursacht werden. Wetterdienste in aller Welt erkennen nun, dass die Beseitigung dieser Defizite durch den Einsatz künstlicher Intelligenz (KI) die Disziplin in den nächsten Jahrzehnten revolutionieren könnte. Dies erfordert ein grundlegendes Umdenken, das die Meteorologie viel stärker mit der Mathematik und Informatik verzahnt. TEEMLEAP wird diesen Kulturwandel durch eine Kooperation von Wissenschaftlern der KIT-Zentren Klima und Umwelt und MathSEE fördern, indem ein idealisiertes Testbed zur Erforschung des maschinellen Lernens in der Wettervorhersage eingerichtet wird. Im Gegensatz zu Wetterdiensten, welche sich naturgemäß auf Verbesserungen der numerischen Vorhersagemodelle in ihrer vollen Komplexität konzentrieren, beabsichtigt TEEMLEAP die Einsatzmöglichkeiten und den Nutzen von KI in diesem Testbed entlang der gesamten Prozesskette der Wettervorhersage zu evaluieren. Die Prozesskette wird im Testbed aus folgenden Elementen bestehen:

Abb. 1: Prozesskette in der Wettervorhersage (nach Dueben et al. 2021).

  1. Beobachtungen: Da Beobachtungen räumlich und zeitlich sehr heterogen verfügbar sind, werden für das Testbed Pseudo-Radiosonden-Beobachtungen aus ERA5 Reanalyse-Daten des Europäischen Zentrums für mittelfristige Wettervorhersage (ECMWF) generiert.
  2. Datenassimilation: Für die Assimilation der Pseudo-Radiosonden-Beobachtungen wird  das 3D-Var Assimilationssystem "BaCy" des Deutschen Wetterdienstes (DWD) zum Einsatz kommen und somit die Anfangsbedingungen für die eigentliche numerische Wettervorhersage generieren.
  3. Numerische Integration: Um den Testbed Ansatz in der Zukunft in ein operationell laufendes Wettervorhersagesystem übertragen zu können, werden globale Simulationen mit dem ICON Modell des DWD durchgeführt.
  4. Postprocessing: Die Simulationen werden in Bezug auf nutzerrelevante Größen wie der Windgeschwindigkeit, Temperatur und Niederschlag in Bodennähe evaluiert. Noch vorhandene systematische Fehler in diesen Größen werden durch statistische Verfahren korrigiert.

Insgesamt wird das Testbed Antworten auf die grundsätzliche Frage liefern, ob wir in Zukunft versuchen sollten, datengetriebene Ansätze in physikalische Modelle zu integrieren, oder ob Lernarchitekturen unter Berücksichtigung physikalischer Randbedingungen ein vielversprechenderer und effizienterer Ansatz sind.

 

Referenzen:

Dueben, P., Modigliani, U., Geer, A., Siemen, S., Pappenberger, F., Bauer, P., Brown, A., Palkovic, M., Raoult, B., Wedi, N. & Baousis, V. (2021). Machine learning at ECMWF: A roadmap for the next 10 years. ECMWF, 878, https://doi.org/10.21957/ge7ckgm