Lineare Regression: Ein umfassender Leitfaden • BUOM

1. Juli 2021

In der Statistik ist die lineare Regression eine Möglichkeit, die Beziehung zwischen zwei Variablen zu untersuchen. Wenn Ihr Job die Verwendung von Statistiken im Tagesgeschäft umfasst, wird sich das Erlernen der linearen Regression wahrscheinlich positiv auf Ihre berufliche Leistung auswirken. Zu wissen, was lineare Regression ist und wofür sie eingesetzt werden kann, kann ein guter Karriereschritt sein, erfordert aber Forschung und Übung. In diesem Artikel besprechen wir, was lineare Regression ist, ihre Hauptanwendungen, lineare Regressionsgleichungen, Ausreißer in der linearen Regression und geben ein Beispiel für lineare Regression.

Was ist lineare Regression?

Die lineare Regression ist eine Methode zur Ermittlung einer linearen Beziehung zwischen Variablen. Es wird normalerweise verwendet, wenn versucht wird, den Wert einer Variablen basierend auf dem Wert einer anderen zu bestimmen. Die bekannte Variable wird als unabhängige oder erklärende Variable bezeichnet, und die Variable, die Sie vorhersagen möchten, wird als abhängige oder Antwortvariable bezeichnet.

Es gibt zwei Haupttypen der linearen Regression:

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

  • Einfache lineare Regression: Verwendet eine unabhängige Variable, um zu versuchen, das Ergebnis einer abhängigen Variablen vorherzusagen.

  • Multiple lineare Regression: Verwendet zwei oder mehr unabhängige Variablen, um zu versuchen, das Ergebnis einer abhängigen Variablen vorherzusagen.

Wenn Sie eine einfache lineare Regression durchführen, treffen Sie bestimmte Annahmen über die Ihnen vorliegenden Daten. Sie sind:

  • Homogenität der Varianz: Die vorhergesagte Fehlerrate unterscheidet sich nicht signifikant für alle Werte der unabhängigen Variablen.

  • Unabhängigkeit der Beobachtungen: Alle Beobachtungen im Datensatz wurden mit statistisch gültigen Stichprobenmethoden ohne versteckte Beziehungen zwischen ihnen gesammelt.

  • Normalität: Es liegt eine Normalverteilung der Daten vor

  • Lineare Beziehung zwischen Variablen: Bei der linearen Regression wird davon ausgegangen, dass eine lineare Beziehung zwischen den unabhängigen und abhängigen Variablen besteht, was bedeutet, dass die Linie durch die Datenpunkte gerade ist.

Anwendungen der linearen Regression

Die lineare Regression wird in vielen Bereichen eingesetzt und hat viele praktische Anwendungen. Es wird hauptsächlich auf zwei Arten verwendet:

  • Wenn der Zweck seiner Verwendung darin besteht, die Entwicklung einer Variablen vorherzusagen oder die Fehlerquote zu verringern, wird es normalerweise verwendet, um ein Vorhersagemodell mit einem beobachteten Datensatz zu vergleichen, der Antwortwerte und unabhängige Variablen enthält. Wenn nach der Erstellung des Modells zusätzliche Werte der erklärenden Variablen ohne entsprechende Antwortwerte identifiziert werden, wird typischerweise ein Vorhersagemodell für die Prognose verwendet.

  • Wenn der Zweck der Verwendung der linearen Regression darin besteht, die Änderung einer Antwortvariablen anzuzeigen, die durch eine Änderung der erklärenden Variablen verursacht werden kann, kann diese analysiert werden, um die Stärke der Beziehung zwischen den unabhängigen Variablen und den Antwortvariablen zu bestimmen. Auf diese Weise wird häufig festgestellt, ob bestimmte Erklärungs- und Antwortvariablen in einem linearen Zusammenhang zueinander stehen.

Felder, in denen die lineare Regression am häufigsten verwendet wird:

  • Statistik: Kommt aus der Statistik und wird in der statistischen Modellierung verwendet, um Beziehungen zwischen abhängigen und unabhängigen Variablen aus verschiedenen Datensätzen darzustellen.

  • Maschinelles Lernen: Dieses relativ neue Gebiet nutzt ebenfalls lineare Regression, hauptsächlich für die prädiktive Modellierung, mit dem ultimativen Ziel, Modellfehler so weit wie möglich zu begrenzen.

  • Finanzen: Finanzexperten analysieren den linearen Zusammenhang zwischen den Preisen von Rohstoffen und den Aktienkursen von Unternehmen, die mit den entsprechenden Rohstoffen handeln.

  • Vertrieb: Vertriebsprofis analysieren die Beziehungen zwischen verschiedenen Variablen, um zukünftige Verkäufe vorherzusagen.

Lineare Regressionsgleichung

Einfache lineare Regressionsgleichung:

Y = a + bX + i

Multiple lineare Regressionsgleichung:

Y = a + b1 x 1 + b2 x 2 + b3 x 3 + … + b + u

Wo:

Y = abhängige (oder Antwort-)Variable

X = unabhängige (oder erklärende) Variable

b = Steigung (oder Steilheit der Diagrammlinie)

a = Schnittpunkt (oder dort, wo die Linie die Achse schneidet)

u = Regressionsresiduum (oder vertikaler Abstand zwischen dem Datenpunkt und der Regressionslinie)

Was ist die Regression der kleinsten Quadrate?

Die Regression der kleinsten Quadrate ist eine Art Regressionsanalyse, die darauf abzielt, die Linie zu bestimmen, die am besten zu einem Datensatz passt. Dabei handelt es sich um die Linie durch das Streudiagramm der Datenpunkte, die die Beziehung zwischen den entsprechenden Punkten am besten zeigt. Es wird häufig in der linearen Regressionsanalyse verwendet, um die geometrische Gleichung für die entsprechende Linie zu bestimmen. Eine einfache Regressionsanalyse erzeugt eine gerade Linie, während eine multivariable Regression möglicherweise eine Kurve erzeugt.

Ausreißer in der linearen Regression

Statistische Ausreißer sind Datenpunkte, die erheblich von anderen Beobachtungen abweichen. Sie können durch eine anomale Variabilität im Datensatz verursacht werden, können aber auch darauf hinweisen, dass irgendwo in den Berechnungen ein Fehler vorliegt. Sie können die Ergebnisse erheblich beeinflussen, daher ist die korrekte Identifizierung ihres Ursprungs für die Genauigkeit der Regression von entscheidender Bedeutung.

Die beiden wichtigsten Methoden zur Erkennung von Ausreißern bei der Entwicklung linearer Regressionsmodelle sind:

  • Mahalanobis-Distanz: Beinhaltet die Messung der Distanz zwischen einem ausgewählten Punkt (P) und einer Verteilung (D). Es soll den Abstand zwischen P und dem Mittelwert D messen, berechnet als Anzahl der Standardabweichungen.

  • Hebelwirkung: Hebelwirkung wird häufig in der Regressionsanalyse verwendet und ist eine Möglichkeit, den Abstand zwischen den Werten der unabhängigen Variablen einer Beobachtung und anderen Beobachtungen zu messen.

Verwandt**: (Was sagt Ihnen die Regressionsanalyse?**)( Karriereberatung/Karriereentwicklung/Was-sagt-Ihnen die Regressionsanalyse?)

Beispiel einer linearen Regression

Betrachten Sie dieses Beispiel einer einfachen linearen Regression:

Sie können die lineare Regression verwenden, um die Beziehung zwischen dem Alter eines bestimmten Autos und seinem prognostizierten Verkaufspreis zu bestimmen. Typischerweise sinkt der Preis eines Autos mit zunehmendem Alter allmählich, was bedeutet, dass ein negativer Zusammenhang zwischen dem Preis des Autos (Y) und seinem Alter (X) besteht. Indem wir den Zusammenhang zwischen dem Alter eines Autos und seinem Preis in den vergangenen Jahren analysieren, können wir ein Modell erstellen und vorhersagen, wie sich der Preis in den kommenden Jahren verändern wird.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert