Skip to content

Vorgehensweise

Einbezogen wurden die Daten der Schadstoffe Kohlenmonoxid (CO), Schwefelwasserstoff (H2S), Stickstoffmonoxid (NO), Stickstoffdioxid (NO2), Ozon (O3), Feinstaub in der Variante PM 2.5 sowie Schwefeldioxid (SO2). Nicht berücksichtigt wurden die Daten über Feinstaub PM10 und die BTX-Schadstoffe.

Daten

Insgesamt enthält der hier analysierte Datensatz 62.679.002 Messpunkte. Die ursprünglich im Ecxel-Format vorliegenden Daten wurden automatisiert zuerst ins CSV-Format und anschließend in das InfluxDB Line Format konvertiert.

Schadstoff Anzahl Messpunkte
NO2 14579393
NO 14170581
H2S 2042104
CO 5241855
O3 9269412
PM25 2863975
SO2 14511682

Analyse

Die Daten im Line-Format wurden in InfluxDB 2 importiert. InfluxDB ist eine auf Zeitreihen spezialisierte NoSQL-Datenbank die Visualisierungen und Analysen zeitlicher Daten ermöglicht:

Anschließend wurden die meisten Analysen in Python unter Zuhilfenahme diverser Packages erstellt:

  • Pandas Dataframe
  • Folium Maps
  • Matplotlib