Explorative Datenanalyse¶

Für fünf Kraftwerke¶

No description has been provided for this image
No description has been provided for this image

Rückläufige Zählerstände¶

Beobachtung¶

  • Einzelne Zählerstände sinken plötzlich – einmal über zwei aufeinanderfolgende Stunden
  • 55 von 5000 Messungen, entspricht ~1%

Mögliche Ursachen¶

  • Übertragungsfehler: die aktuellsten Zählerstände aus dem Cache werden zuerst gesendet
    • die Messwerte kommen in falscher Reihenfolge an, aus [0, 1, 10, 11] wird [0, 10, 1, 11]
    • doch in diesen Daten kündigt kein positiver Sprung den negativer Sprung an
  • Importfehler: nachträglich eingefügte Werte überschreiben korrekte Messwerte

Konsequenz für Analyse¶

  • Rückläufige Zählerstände sind physikalisch nicht plausibel
  • Verfälschen abgeleitete Kenngrößen wie Produktionsleistung

→ Datenpunkte mit fallendem Zählerstand werden konsequent entfernt

No description has been provided for this image

Hypothese: Gleicher Kraftwerkstyp¶

Die Verteilungen der Stundenproduktionen zeigen starke Ähnlichkeit sowohl

  • im Bereich der Grundlast bis 50 MWh als auch
  • bei den 44 Spitzenwerten über 50MWh (ca. 1%).

Statistische Tests zeigen keine signifikanten Unterschiede zwischen den Kraftwerken.

Es ist plausibel, dass es sich bei den fünf Kraftwerken um denselben Kraftwerkstyp handelt.

No description has been provided for this image

Leistungsverlauf über den Tag hinweg¶

  1. Konstante Basisproduktion

    • Geringe, stabile Werte deuten auf gleichmäßige Grundlastversorgung hin.
  2. Zwei Leistungsspitzen

    • Höhere Messwerte treten bevorzugt morgens (7–9 Uhr) und abends (17–18 Uhr) auf.
    • Das Muster passt zu typischen Nachfrage-Hochlasten.
      → Spricht eher für reale Verbrauchsspitzen als für Übertragungs- oder Importfehler
      (aber nicht eindeutig).
No description has been provided for this image

Fazit¶

Muster:

  • Basislast der Kraftwerke bei ca. 20 MW
  • Wiederkehrende Spitzen zwischen 7–9 Uhr & 17–18 Uhr
  • Keine eindeutige Abhängigkeit von Strompreis oder Außentemperatur erkennbar
    möglicherweise bedingt durch Lastverträge oder Einsatz im Regelenergiemarkt

Potenzielle Probleme:

  • Rücksprünge in Zählerständen bei ca. 1 % der Datenpunkte

Methodik¶

Tools:

  • Python (pandas, scipy, matplotlib, seaborn)
  • Jupyter Notebook zur reproduzierbaren Analyse
  • API‑Zugriffe für Strompreis- und Wetterdaten

Methodik:

  • Anomalieerkennung rückläufiger Zählerstände
  • Histogramme für die Verteilung der Deltas
  • Statistische Tests (ANOVA, Kruskal-Wallis)
  • Zeitliche Profile (Stundenverlauf, Tagesverlauf)

Dashboard¶

Tools:

  • BigQuery: Daten in der Cloud
  • dbt: Pipelines für die Analyse
  • Looker: Dashboard

Elemente:

  • Control: Auswahl des Kraftwerks
  • KPIs: Grundlast, Spitzenlast, Quote an Spitzenwerten und rückläufigen Zählerständen
    Leistung über die Tage hinweg und über die Stunden des letzten Tages
  • Vorhersage: Durchschnittswert dieser Stunde des Tages (SARIMA erkennt keinen Trend)

Link zum Dashboard