Vorgehensweise
Einbezogen wurden die Daten der Schadstoffe Kohlenmonoxid (CO), Schwefelwasserstoff (H2S), Stickstoffmonoxid (NO), Stickstoffdioxid (NO2), Ozon (O3), Feinstaub in der Variante PM 2.5 sowie Schwefeldioxid (SO2). Nicht berücksichtigt wurden die Daten über Feinstaub PM10 und die BTX-Schadstoffe.
Daten
Insgesamt enthält der hier analysierte Datensatz 62.679.002 Messpunkte. Die ursprünglich im Ecxel-Format vorliegenden Daten wurden automatisiert zuerst ins CSV-Format und anschließend in das InfluxDB Line Format konvertiert.
| Schadstoff | Anzahl Messpunkte |
|---|---|
| NO2 | 14579393 |
| NO | 14170581 |
| H2S | 2042104 |
| CO | 5241855 |
| O3 | 9269412 |
| PM25 | 2863975 |
| SO2 | 14511682 |
Analyse
Die Daten im Line-Format wurden in InfluxDB 2 importiert. InfluxDB ist eine auf Zeitreihen spezialisierte NoSQL-Datenbank die Visualisierungen und Analysen zeitlicher Daten ermöglicht:

Anschließend wurden die meisten Analysen in Python unter Zuhilfenahme diverser Packages erstellt:
- Pandas Dataframe
- Folium Maps
- Matplotlib