Achtung, nicht verwechseln: Korrelation und Kausalität

Es ist so eine Sache mit den täglichen Entscheidungen. Oft müssen aus Zusammenhängen Ableitungen erstellt werden. Und dies auch, wenn zwischen den Sachverhalten kein Zusammenhang besteht. Fehlerquellen gibt es genug. Wichtig ist, die richtigen Fragen zu stellen und mehrwertstiftende Quellen zu verwenden. Wird darauf verzichtet, besteht die Gefahr zu dilettieren.

Holen wir hierzu kurz aus: Korrelation ist ein Zusammenhang; eine Beziehung zwischen zwei Variablen. Das bedeutet: zwei Datensätze verhalten sich ähnlich. Schauen wir uns hierzu die Grafik an: Sie zeigt Suchanfragen (blau) und Kinobesuche (orange) zu einem Film. Die beiden Kurven verhalten sich ähnlich, das heißt sie korrelieren.

Die Grafik lässt vermuten, dass ein Anstieg der Suchanfragen zu einem Anstieg der Kinobesuche führt und umgekehrt. Deshalb erscheint es sinnvoll, in den Sachverhalt – die grafische Darstellung – das Prinzip von Ursache und Wirkung, also Kausalität, hineinzuinterpretieren.

Das wäre aber voreilig. Bei der Beziehung der blauen und der orangefarbenen Kurve kann es sich um eine Ursache-Wirkungs-Beziehung handeln. Dann würde man von Kausalität sprechen. Genauso gut kann es aber auch sein, dass die beiden Kurven unabhängig voneinander steigen und fallen. Stattdessen kann es eine dritte Variable geben, die sowohl die Suchanfragen als auch die Kinobesuche beeinflusst. In manchen Fällen lässt sich diese dritte Variable bestimmen. Dann spricht man von Koinzidenz.

Hier könnte man sich vorstellen, dass das Wetter sowohl Suchanfragen als auch Kinobesuche beeinflusst. Schlechtes Wetter könnte dann zu einem Anstieg der Suchanfragen und der Kinobesuche führen und gutes Wetter zu einem Abfall.

Das wohl bekannteste Beispiel für eine Scheinkorrelation, also eine Korrelation ohne Kausalität, ist der Zusammenhang zwischen der Anzahl an Störchen und der Geburtenrate. In manchen Regionen korrelieren diese beiden. Tatsächlich ist die Anzahl der Störche aber nicht Ursache der Geburtenrate oder umgekehrt. Vielmehr gibt es eine dritte Variable, die sich auf die beiden anderen auswirkt: die Ländlichkeit der Region. Je ländlicher eine Region ist, desto mehr Störche und Geburten gibt es dort.

In der Realität kann es aber auch sein, dass sich kein Zusammenhang finden lässt oder dass es gar keinen Zusammenhang gibt! Es ist auch möglich, dass eine Korrelation nur über einen gewissen Zeitraum besteht.

Je mehr Mengen an Daten ausgewertet werden, desto wahrscheinlicher ist es, eine Korrelation zu finden; nämlich Zeitreihen, die sich ähneln und doch nichts miteinander zu tun haben. Weist eine Variable in einem Datensatz einen statistisch signifikanten Effekt auf, so ist das sicherlich ein Zeichen für Korrelation, aber nicht zwangsläufig für Kausalität. Korrelationen liefern also lediglich einen ersten Hinweis, dass ein kausaler Zusammenhang bestehen könnte.

Das reine Analysieren von Daten ist heutzutage keine Schwierigkeit mehr. Vielmehr müssen die richtigen Fragen gestellt werden, um eine Kausalität aufzudecken. Nur so können operative und strategische Entscheidungen getroffen werden.

Das bedeutet, dass zunächst überlegt werden muss, welche Aussage durch eine Datenanalyse belegt oder überprüft werden soll. Es bedeutet aber auch, dass man sich gewahr sein muss, was zu untersuchen ist, dass die richtigen Quellen vorhanden sind und die richtigen Ableitungen getroffen werden können.

Deshalb muss im nächsten Schritt ermittelt werden, welche Daten dazu benötigt werden. Im Storchbeispiel ergibt es also keinen Sinn, die Geburtenrate mit der Storchpopulation überhaupt in Verbindung zu bringen. Vielmehr müssen andere Faktoren wie die Ländlichkeit einer Region in Augenschein genommen werden. Dafür braucht man Daten über die Storchpopulation und die Ländlichkeit der betrachteten Regionen.

Erst jetzt ergibt eine Analyse der erfassten Daten Sinn. Damit können Aussagen über eine bestehende Kausalität getroffen werden.

Conclusio

Erstens ist es anders und zweitens als man denkt. Deshalb scheitern auch viele eigentlich gut realisierte Aktivitäten, Businesspläne oder Strategien. Nicht immer können Ursachen mit Wirkungen, Lösungen mit Wirkungen oder … mit Wirkungen in einen Zusammenhang gebracht oder richtig abgeschätzt werden. Auch müssen Wendungen in den Rahmenparametern einbezogen werden. Ein Vorwand muss von einem Einwand unterschieden werden. Nur wer die richtigen Fragen stellt, findet die richtigen Lösungen.

 

 

_____________________________________________________ _________________

In eigener Sache: https://www.linkedin.com/pulse/spartacoalert-geht-den-start-axel-oppermann/ .

Wir möchten Deine Aufmerksamkeit heute auf einen neuen Service richten: spartaco|alert

spartaco|alert hilft dir, Content zu von Dir definierten Themen aufzuspüren; und dies im besten Fall im Kontext. In einem unverfälschten, smoothen und minimalistischen Prozess bekommst Du eine Übersicht über die neuesten Erwähnungen von Namen, Begriffen, Keywords oder Themen.

spartaco|alert geht an den Start

Axel Oppermann
Axel Oppermann ist seit über 15 Jahren als IT-Marktanalyst tätig. Aktuell arbeitet er für das Beratungs- und Analystenhaus Avispador als Analyst. Axel schreibt bei Denkhandwerker über Trends und nachhaltige Entwicklungen.