was es ist und Beispiele • BUOM

28. Oktober 2021

Viele Unternehmen nutzen Regressionsanalyse Vorhersagen einer kontinuierlichen abhängigen Variablen aus einer Reihe unabhängiger Variablen. Datenanalysten und Finanzexperten nutzen die Regressionsanalyse, um die Stärke von Prädiktoren zu bestimmen, einen Effekt vorherzusagen oder Trends vorherzusagen. Eine der ersten Berechnungen der Regressionsanalyse ist die Summe der Quadrate.

In diesem Artikel besprechen wir, was die Quadratsumme ist, die Formel für die Quadratsumme, wie man die Summe der Quadrate berechnet und verschiedene Arten von Quadratsummen sowie eine Beispielrechnung.

Was ist die Summe der Quadrate?

Die Quadratsumme (SS) ist ein Werkzeug, das Statistiker und Wissenschaftler verwenden, um die Gesamtabweichung eines Datensatzes von seinem Mittelwert abzuschätzen. Dieses statistische Tool zeigt, wie gut Daten zu seinem Modell passen, insbesondere in der Regressionsanalyse.

Als eines der wichtigsten Ergebnisse der Regressionsanalyse wird SS verwendet, um die Variationen in den Daten so anzuzeigen, dass eine kleinere Quadratsumme ein besseres Modell und eine größere Quadratsumme ein kleineres Modell anzeigt. Je kleiner oder größer die Summe, desto weniger oder mehr einzelne Datenpunkte weichen vom Mittelwert ab. Wenn die Summe Null ist, passt Ihr Modell perfekt.

Finanzberater können SS beispielsweise verwenden, um die Varianz täglicher Aktienkurse zu berechnen. Wenn SS eine große Zahl ist, bedeutet dies, dass der Aktienkurs stark vom Durchschnitt abweicht, was auf Marktinstabilität hinweist. Wenn SS eine kleine Zahl ist, bedeutet dies, dass der Aktienkurs eine kleine Abweichung vom Durchschnitt aufweist, was auf Marktstabilität hinweist. Die Quadratwurzel der Summe der Quadrate ist StandardabweichungDies ist auch eine nützliche Nummer für Finanzberater.

Formel für die Summe der Quadrate

Die Quadratsummenformel ist eine mathematische Methode, um das Modell zu finden, das am wenigsten von den Daten abweicht. Es ist nützlich zu beachten, dass Fachleute die Summe der Quadrate manchmal als „Variation“ bezeichnen. Hier ist die Formel zur Ermittlung der Gesamtsumme der Quadrate, die gebräuchlichste Version dieser Berechnung:

\mathrm{TSS}=\sum_{i=1}^{n}(y_{i}-\bar{y})^{2}

In dieser Gleichung:

  • Yi = i-tes Mitglied in der Menge

  • ȳ = Durchschnitt aller Elemente in der Menge

So berechnen Sie die Summe der Quadrate

Hier sind die Schritte, die Sie befolgen können, um die Summe der Quadrate zu berechnen:

1. Zählen Sie die Anzahl der Messungen

Der Buchstabe „n“ steht für Stichprobengrößewas auch die Anzahl der Dimensionen ist.

2. Berechnen Sie den Durchschnitt

Der Mittelwert ist das arithmetische Mittel der Stichprobe. Dazu addieren Sie alle Messungen und dividieren durch die Stichprobengröße n.

3. Subtrahieren Sie jeden Messwert vom Durchschnitt

Wenn Ihre Zahlen über dem Durchschnitt liegen, ergeben sie eine negative Zahl, und das ist in Ordnung. Sie sollten eine Reihe von n einzelnen Abweichungen vom Mittelwert haben.

4. Quadrieren Sie die Differenz jeder Messung zum Durchschnitt

Das Ergebnis der Quadrierung einer Zahl ist immer positiv. Wenn Sie also im letzten Schritt negative Zahlen hatten, sind diese jetzt positiv. Sie sollten am Ende eine Reihe von n positiven Zahlen erhalten.

5. Addiere die Quadrate und dividiere durch (n-1)

In diesem letzten Schritt sollten Sie Ihre Quadratsumme haben. Diese Quadratsumme ist die Standardvarianz für Ihre Stichprobengröße.

Beispiel einer Quadratsumme

Hier ist ein Beispielproblem, das den oben beschriebenen Schritten folgt, um die Summe der Quadrate der Zahlen 2, 4 und 6 zu lösen:

1. Zählen

Zählen Sie die Anzahl der Messungen. Die Anzahl der Messungen ist die Stichprobengröße und wird mit dem Buchstaben „n“ bezeichnet.

n = 3

2. Berechnen

Addieren Sie alle Messungen und dividieren Sie durch die Stichprobengröße, um den Durchschnitt zu ermitteln.

(2+4+6)/3 = 12/3 = 4

3. Subtrahieren

Subtrahieren Sie jede Messung vom Durchschnitt.

4 – 2 = 2

4 – 4 = 0

4 – 6 = -2

4. Quadrat

Quadrieren Sie die Differenz jeder Messung vom Mittelwert, um eine Reihe von n positiven Zahlen zu erhalten.

22 = 4

02 = 0

(-2)2 = 4

5.Hinzufügen

Addieren Sie die Quadrate, um die Summe der Quadrate, auch Standardvarianz genannt, für Ihre Stichprobengröße zu ermitteln.

4 + 0 + 4 = 8

Arten der Quadratsumme

Es gibt drei Haupttypen von Quadratsummen: Gesamtquadratsumme, Regressionsquadratsumme und Residualquadratsumme. Hier ist eine kurze Beschreibung jedes Typs:

Gesamtsumme der Quadrate

Die oben gezeigte Formel für die Gesamtsumme der Quadrate gibt Aufschluss darüber, wie groß die Variation in der abhängigen Variablen ist, und quantifiziert die Gesamtvariation in der Stichprobe.

Manchmal sind die tatsächlichen Quadrate die Gesamtsumme der Quadrate entlang der Regressionslinie des Diagramms. Ein Diagramm, beispielsweise eine Regressionslinie in einem Diagramm, ist optional, bietet jedoch eine visuelle Darstellung der Berechnung und erleichtert so das Verständnis. In anderen Fällen ist die Formel y = Y – ȳ die Gesamtsumme der Quadrate.

Regressionssumme der Quadrate

Die Quadratsumme der Regression gibt an, ob das Regressionsmodell die simulierten Daten gut darstellt. Die Quadratsumme wird komplexer, wenn Profis sie zur Berechnung der Quadratsumme in der Regressionsanalyse verwenden. Aufgrund dieser Komplexität führen Fachleute diese Berechnung nur sehr selten manuell durch. Stattdessen verwenden sie Computerprogramme, um die Ergebnisse zu berechnen.

Bei der Berechnung der Regressionsquadratsumme weist eine höhere Regressionsquadratsumme darauf hin, dass das Modell nicht gut zu den Daten passt. Eine kleinere Regressionsquadratsumme zeigt an, dass das Modell gut zu den Daten passt.

Restquadratsumme

Die Restquadratsumme zeigt, wie viel Varianz in der abhängigen Variablen Ihr Modell nicht erklärt. Es misst die Variation von Fehlern in einem Regressionsmodell, das heißt, es zeigt das Ausmaß der Variation in der abhängigen Variablen. Dies ist die Summe der Quadrate der Differenzen zwischen dem tatsächlichen Y-Wert und dem vorhergesagten Y-Wert.

Bei der Berechnung der Restquadratsumme weist eine kleinere Restquadratsumme darauf hin, dass das Regressionsmodell die Daten besser erklärt. Eine höhere Regressionsquadratsumme weist darauf hin, dass das Regressionsmodell die Daten nicht gut erklärt.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert