Was ist eine falsche Korrelation? (Definition und Beispiele) • BUOM

29. Oktober 2021

Falsche Korrelationen können in der Statistik auftreten, wenn zwei oder mehr Variablen in einem kausalen Zusammenhang zueinander stehen. Allerdings haben diese Arten von Korrelationen selten eine wahre Ursache und Wirkung, auch wenn dies scheinbar der Fall ist. Darüber hinaus können falsche Korrelationen Ihnen helfen, die Eigenschaften und das Verhalten eines Datensatzes besser zu verstehen. In diesem Artikel werden wir anhand einiger Beispiele untersuchen, was eine falsche Korrelation ist, wie sie mit der Kausalität zusammenhängt und wie man eine falsche Korrelation identifiziert, um diesen statistischen Zusammenhang besser zu verstehen.

Was ist eine falsche Korrelation?

Eine falsche Korrelation in der Statistik ist eine Beziehung zwischen zwei Variablen, die scheinbar eine Ursache-Wirkungs-Beziehung darstellt, es aber nicht ist. Kausalität beschreibt eine Ursache-Wirkungs-Beziehung zwischen zwei Variablen, wobei eine Variable etwas bewirkt, das sich direkt auf die andere auswirkt. Bei einer Scheinkorrelation handelt es sich jedoch oft um einen scheinbaren Kausalzusammenhang zwischen zwei Variablen, der zufällig ist oder auf einen dritten Störfaktor zurückzuführen ist, der beide Variablen beeinflusst.

Wenn Sie beispielsweise feststellen, dass sowohl die Kosten für die Hochschulbildung als auch die Lebenshaltungskosten steigen, bedeutet diese Veränderung beider Variablen nicht unbedingt, dass zwischen ihnen ein Ursache-Wirkungs-Zusammenhang besteht. Das bedeutet, dass steigende Lebenshaltungskosten nicht unbedingt der Grund für höhere Studiengebühren an Hochschulen sind. In diesem Beispiel könnten Sie die Veränderung beider Kosten auf eine steigende Inflation oder andere makroökonomische Faktoren zurückführen, was zu einer falschen Korrelation mit einem Störfaktor führt.

Auch wenn Scheinkorrelationen einen Verbindungsfaktor zu haben scheinen, bedeuten Korrelationen nicht immer einen Kausalzusammenhang. Um besser zu verstehen, wie in statistischen Studien falsche Korrelationen entstehen können, ist es wichtig, den Unterschied zwischen Korrelation und Kausalität zu verstehen.

Korrelation vs. Kausalität

In der Statistik können Sie die Beziehungen und das Verhalten mehrerer Variablen analysieren, um Ihre Forschung besser zu verstehen. Die Beziehungen, die in diesem Sinne zwischen Variablen entstehen, sind korrelativ oder kausal und können direkt miteinander in Zusammenhang stehen oder überhaupt keinen tatsächlichen Zusammenhang haben:

Korrelation

Korrelation ist ein Maß für die Richtung und Größe von zwei oder mehr Variablen in einem Datensatz. Das bedeutet, dass sich bei der Betrachtung statistischer Modelle eine Variable ändert oder sich in eine bestimmte Richtung bewegt, dann ändert sich auch die andere Variable. Wenn dieses Verhalten zwischen Variablen in Studien auftritt, gehen Statistiker davon aus, dass eine Korrelation oder Beziehung zwischen den Stichproben besteht. In jeder Studie können drei Haupttypen von Korrelationen auftreten:

  • Positive Korrelationen stellen eine positive Änderung einer Variablen aufgrund einer anderen dar.

  • Negative Korrelationen stellen eine negative Änderung einer Variablen aufgrund einer anderen dar.

  • Eine Korrelation von Null bedeutet, dass zwischen zwei oder mehr Variablen kein offensichtlicher Zusammenhang besteht.

Wenn falsche Korrelationen auftreten, kann es so lange so aussehen, als handele es sich um eine beliebige Art von Korrelation, bis Sie die falsche Korrelation in der Stichprobe identifizieren und feststellen, was sie verursacht.

Kausalität

Ursache-Wirkungs-Beziehungen sind grundsätzlich Ursache-Wirkungs-Beziehungen. Dies bedeutet, dass eine oder mehrere Variablen andere Variablen direkt beeinflussen, um ein Ergebnis zu verursachen. Ein gutes Beispiel für Ursache und Wirkung ist ein sinkendes Boot. Wenn ein Boot ein Loch hat, verursacht das Loch ein Leck, und das Leck führt dazu, dass sich das Boot mit Wasser füllt und schließlich sinkt. Zu den in diesem Beispiel beteiligten Variablen gehören Boot, Grube und Wasser.

Das Loch im Boot wirkt sich direkt auf die Zunahme der eindringenden Wassermenge aus und führt zu einer negativen Veränderung des Auftriebs des Bootes. Diese Ursache-Wirkungs-Beziehung ist ein einfaches Beispiel, aber es ist wichtig zu verstehen, dass man einem Faktor, der sich direkt auf eine Variable auswirkt, Kausalität zuschreiben kann. Korrelationsbeziehungen verknüpfen lediglich zwei oder mehr Variablen miteinander, um eine mögliche Beziehung zu bilden.

Worauf deuten falsche Korrelationen hin?

Eine falsche Korrelation kann Aufschluss über die Beziehungen zwischen verschiedenen Datenpunkten in einer Stichprobe geben. Wenn Statistiker Stichproben analysieren, um Theorien und Hypothesen zu testen, suchen sie nach Ursache-Wirkungs-Beziehungen zwischen den getesteten Variablen. Wenn sich falsche Korrelationen bilden, können Statistiker beurteilen, ob die Beziehung zwischen zwei oder mehr Variablen auf Zufall oder auf das Ergebnis eines dritten Störfaktors zurückzuführen ist.

So erkennen Sie eine falsche Korrelation

Fachleute, die im Rahmen ihrer Karriere Daten analysieren, sind in ihrer Forschung ständig auf der Suche nach Beziehungen zwischen Variablen. Dies erfordert die Verwendung unterschiedlicher Ansätze zur Erkennung und Berücksichtigung von Fehlkorrelationen. Zu den verschiedenen Methoden, mit denen Statistiker, Datenanalysten und andere Forscher nach falschen Korrelationen suchen, gehören:

1. Sicherstellung angemessener Stichprobengrößen

Datenexperten müssen sicherstellen, dass sie angemessene Stichprobengrößen erhalten. Wenn die Stichprobengröße zu klein ist, ist die Wahrscheinlichkeit größer, dass falsche Korrelationen vorliegen, da einfach nicht genügend Daten vorhanden sind, um ein umfassenderes Bild des Verhaltens der Stichproben zu zeichnen. Diese Art von Szenario kann zu scheinbar zusammenhängenden Ereignissen führen, wenn sich die Daten in einer größeren Stichprobe möglicherweise anders verhalten.

2. Datenauswertung für beliebige Endpunkte

Bei einigen Arten von Forschung, beispielsweise in der medizinischen oder pharmazeutischen Forschung, zeigen Endpunkte an, ob die getesteten Ergebnisse nützlich sind. Willkürliche Endpunkte sind Ergebnisse oder Ergebnisse, die scheinbar keine Ursache haben oder auf andere Weise nicht mit dem Verhalten der Studienvariablen in Zusammenhang stehen. Wenn diese Szenarien eintreten, handelt es sich wahrscheinlich um einen falschen Zusammenhang.

3. Steuerung externer Variablen

Wenn Statistiker Studien, Versuche oder andere Experimente entwerfen, berücksichtigen sie alle Faktoren, die sich auf die Variablen in der Stichprobe auswirken können. Wenn ein Statistiker Daten analysiert, bewertet er diese Faktoren, um zu verstehen, wie sie sich auf die Daten auswirken. Das Verständnis, wie externe Faktoren die von ihnen untersuchten Daten beeinflussen, kann Statistikern dabei helfen, festzustellen, ob Beziehungen zwischen dem Verhalten von Variablen realisierbare Korrelationen oder Scheinkorrelationen sind.

Diese drei Ansätze können Statistikern, Datenwissenschaftlern und anderen Analysten dabei helfen, falsche Korrelationen zu identifizieren, um wahre Beziehungen zwischen Variablen zu analysieren.

Beispiele für falsche Korrelation

Außerhalb strenger statistischer Studien können falsche Korrelationen recht häufig auftreten. Einige falsche Korrelationen können jedoch konsistent und mit einem hohen Maß an Genauigkeit auftreten, selbst wenn die Ereignisse oder Stichproben nicht miteinander in Zusammenhang stehen. Hier sind einige Beispiele für falsche Korrelationen zu alltäglichen Ereignissen:

Beispiel 1

Nehmen wir an, die Grafik zeigt einen steigenden Trend beim Verkauf von Virtual-Reality-Spielen und eine steigende Zahl von Studenten, die in einem bestimmten Jahr einen Master of Technology-Abschluss abschließen. Es ist davon auszugehen, dass aufgrund des studentischen Interesses und der Beschäftigung mit der Virtual-Reality-Technologie mehr Menschen einen Abschluss in Technologie haben.

Dies wird jedoch zu einer falschen Korrelation, wenn Benutzer von VR-Spielen in demselben Jahr, in dem die Zahl der Ingenieurabsolventen zunimmt, Oberstufenschüler sind. Der Störfaktor Alter mildert den Zusammenhang, da es unwahrscheinlich ist, dass Oberstufenschüler gleichzeitig einen Master-Abschluss anstreben.

Beispiel 2

Ein weiteres Beispiel für eine falsche Korrelation ist die Beziehung zwischen erhöhten Ticketverkäufen für Wasserparks und den Eisverkäufen im Supermarkt. Obwohl beide Verkaufszahlen steigen, ist es unwahrscheinlich, dass gestiegene Eisverkäufe in Supermärkten zu höheren Umsätzen in Freizeitparks führen. Ebenso ist es unwahrscheinlich, dass ein Anstieg des Ticketverkaufs für Freizeitparks auf einen Anstieg des Eisverkaufs zurückzuführen ist. In diesem Szenario gibt es noch einen dritten verwirrenden Faktor.

Wenn diese Studie im Sommer durchgeführt wird, ist es wahrscheinlich, dass der Grund für den Umsatzanstieg in beiden Fällen die Hitze ist. Wärmere Temperaturen im Sommer könnten wahrscheinlich der Grund dafür sein, dass mehr Menschen Eintrittskarten für Wasserparks sowie kalte Leckereien wie Eis in ihren Supermärkten kaufen.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert