So berechnen Sie das Bestimmtheitsmaß • BUOM
Bestimmtheitsmaß (CoD) = r^2, wobei r = Korrelationskoeffizient.
Inferenzstatistiken messen die Wahrscheinlichkeiten des Eintretens von Ereignissen. Dieser Bereich der mathematischen Analyse ist auf viele Berufsfelder anwendbar, in denen Fachleute statistische Analysen verwenden, um Wahrscheinlichkeiten und Korrelationen zu messen. Das Bestimmtheitsmaß ist eine der statistischen Messungen, die zum Verständnis möglicher Korrelationen zwischen Variablen erforderlich sind. In diesem Artikel besprechen wir, was das Bestimmtheitsmaß ist, wie man das Bestimmtheitsmaß berechnet und worauf es anwendbar ist, anhand eines Beispiels zum besseren Verständnis.
Was ist das Bestimmtheitsmaß?
Das Bestimmtheitsmaß ist ein statistisches Maß, das bewertet, wie sich Änderungen einer Variablen auf Änderungen einer anderen Variablen auswirken. Es ist ein Maß für die Variation, die in y auftritt, wenn sich x in einem linearen Regressionsmodell ändert. Mathematisch gesehen ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten, der die Beziehung oder Korrelation zweier Variablen misst.
Der Korrelationskoeffizient ersetzt die Variable r und das Bestimmtheitsmaß ist das Quadrat von r oder r**2. Um das Bestimmtheitsmaß zu ermitteln, quadrieren Sie einfach den Korrelationskoeffizienten. Der resultierende Wert reicht von null bis eins, den Sie in einen Prozentsatz umwandeln, um zu erklären, wie viel der Änderung in y auf Änderungen in x zurückzuführen ist.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
So berechnen Sie das Bestimmtheitsmaß
Führen Sie die folgenden Schritte aus, um das Bestimmtheitsmaß mithilfe des Korrelationskoeffizienten zu ermitteln:
1. Bestimmen Sie den Korrelationskoeffizienten
Bestimmen Sie bei der Schätzung des Bestimmtheitsmaßes den Korrelationskoeffizienten r. In den meisten Fällen verwenden Statistiker und Datenanalysten Computerberechnungen, um den Korrelationskoeffizienten zu ermitteln, wenn sie Variationen in Datensätzen messen. Wenn Sie den Korrelationskoeffizienten noch nicht kennen, können Sie ihn mithilfe der folgenden Formel manuell berechnen:
ð = (NΣxy – (Σx)(Σy)) / √(NΣx2 – (Σx)2) Икс (NΣy2 – (Σy)2)
2. Wenden Sie die Korrelationskoeffizientenformel an
Wenn Sie die Korrelationskoeffizientenformel verwenden, ersetzen Sie die Datenwerte durch die Variablen N, x und y, wobei N die Anzahl der Datenwertepaare ist, die Sie haben, und die Variable Σ die Summationsfunktion definiert. Das bedeutet, dass Σxy die Summe der Produkte von x- und y-Werten ist, Σx die Summe von x-Werten ist und Σy die Summe von y-Werten ist. Der Koeffizient Σx2 ist die Summe der Quadrate der x-Werte und Σy**2 ist die Summe der Quadrate der y-Werte.
Angenommen, ein Datenanalyst berechnet den Korrelationskoeffizienten mithilfe der Formel und erhält r = (166) / (346) = 0,39. Dies bedeutet, dass der Korrelationskoeffizient 0,39 beträgt.
3. Quadrieren Sie den Korrelationskoeffizienten
Sobald Sie den Korrelationskoeffizienten haben, quadrieren Sie das Ergebnis. Sie können auch abschätzen, wie stark die Beziehung zwischen Ihren Variablen ist, indem Sie den absoluten Wert von r nehmen, wobei größere Werte auf eine stärkere Korrelation hinweisen. Um den Wert von r zu quadrieren, multiplizieren Sie den Wert mit sich selbst. Wenn der Korrelationskoeffizient beispielsweise r = -0,35 ist, ergibt die Quadrierung dieses Wertes das Bestimmtheitsmaß:
r2 = (-0,35)(-0,35) = 0,1225
4. Bewerten Sie die Ergebnisse
Wandeln Sie das Bestimmtheitsmaß in einen Prozentsatz um und werten Sie die Daten aus. Wandeln Sie das geschätzte Verhältnis von 0,1225 in einen Prozentsatz um, um 12,25 % zu erhalten. Die Analyse dieses Prozentsatzes zeigt, dass 12,25 % Ihrer Datenwerte beim Plotten Ihrer Daten entlang der entsprechenden Regressionslinie erscheinen. Ein höheres Bestimmtheitsmaß bedeutet, dass mehr Ihrer Daten entlang der Regressionslinie erfasst werden, was zu einer stärkeren Beziehung zwischen Ihren Beobachtungen führt. Ein Koeffizient von eins bedeutet, dass die Regressionslinie 100 % der Daten enthält, und ein Koeffizient von null bedeutet, dass die Linie keine Daten enthält.
Verwendung des Bestimmtheitsmaßes
Das Bestimmtheitsmaß ist ein wichtiger Wert für die Erstellung eines Regressionsdiagramms, da es die Wahrscheinlichkeit angibt, dass sich Datenwerte in zukünftigen Messungen wiederholen. Es zeigt auch die Stärke der Korrelation zwischen Variablen an, die für eine Reihe von Datenverarbeitungsprozessen wichtig sein kann, darunter:
Die Finanzanalyse
Das Bestimmtheitsmaß kann bei der Analyse der Korrelation zwischen Änderungen von Finanzindikatoren wichtig sein. Viele Analysten betrachten beispielsweise Korrelationsbeziehungen, um die Wahrscheinlichkeit zukünftiger Einnahmen, Ausgaben und anderer Investitionsindikatoren zu bestimmen. Das Finanzmanagement bei Aktien hängt oft von der Datenanalyse ab, die Fachleuten dabei hilft, mögliche Ergebnisse bei Investitionen in verschiedene Wertpapiere einzuschätzen.
Wirtschaftsanalyse
Unternehmenswachstum und -entwicklung sind wichtige Kennzahlen, die mithilfe von Statistiken verfolgt werden. Bei der Messung von Wachstumsraten können Geschäftsexperten beispielsweise die Korrelationsbeziehungen zwischen Strategien und Ergebnissen analysieren, um Praktiken zu identifizieren, die im Laufe der Zeit zu einem prozentualen Wachstum führen. Geschäftsausgaben sind eine weitere Anwendung der statistischen Analyse, die sich auf Korrelationsmessungen stützen kann, wobei das Bestimmtheitsmaß Unternehmen die Bereiche zeigen kann, in denen die höchsten Kosten anfallen.
Medizinische Forschung
Gesundheitswesen und Medizin sind in der klinischen Forschung häufig auf Datenanalysen angewiesen. Beispielsweise können Pharmaforscher das Bestimmtheitsmaß verwenden, um Unterschiede in den Änderungen zwischen Arzneimitteldosierung und Patientenreaktion zu messen. Informationen aus dem Bestimmtheitsmaß können Ärzte auch bei der Anwendung neuer Therapien und bei der Erstellung von Prognosen nutzen. Obwohl ein Koeffizient die Stärke einer Korrelation beschreiben kann, sind zur Bestimmung der Kausalität andere Faktoren erforderlich.
Wirtschaft
Statistiken und Datenanalysen sind ein wesentlicher Bestandteil wirtschaftlicher Anwendungen wie der Messung der Bevölkerungsdemografie, der Wirtschaftsausgaben und des Wirtschaftswachstums. In diesem Bereich werden Korrelationskoeffizienten verwendet, um Muster zwischen Variablen zu identifizieren, wobei der Bestimmtheitskoeffizient Ökonomen dabei helfen kann, die Stärke verschiedener Korrelationen zwischen Wirtschaftsaktivitäten zu messen. Importe und Exporte sind ein Bereich, in dem dieser Wahrscheinlichkeitsfaktor angewendet werden kann, da Ökonomen die relative Korrelation zwischen Anstiegen und Rückgängen des Einkommens aus importierten und exportierten Gütern bestimmen können.
Technische Analyse
Lineare Regression und statistische Analyse sind auch in technischen Anwendungen wie Datenwissenschaft, Computerprogrammierung und maschinellem Lernen wichtig. Datenwissenschaftler können beispielsweise Wahrscheinlichkeitsstatistiken verwenden, um Algorithmen zu erstellen, die in maschinellen Lernsystemen mit größter Wahrscheinlichkeit die gewünschten Ergebnisse liefern. In diesem Fall kann das Bestimmtheitsmaß Datenwissenschaftlern dabei helfen, die Leistung ihrer linearen Regressionsmodelle zu messen. Bei höheren Verhältnissen ist es wahrscheinlich, dass maschinelle Lernsysteme kleine Unterschiede zwischen der gewünschten Ausgabe und der anfänglichen Eingabe aufweisen.
Beispiel für ein Bestimmtheitsmaß
Ein Datenwissenschaftler, der ein lineares Regressionsmodell berechnet, möchte den Grad der Variabilität zwischen einer unabhängigen Eingabe und einer abhängigen Ausgabe bestimmen. Mithilfe des Korrelationskoeffizienten zur Bestimmung von r2 verwendet der Datenwissenschaftler die Formel:
ð = (NΣxy – (Σx)(Σy)) / √(NΣx2 – (Σx)2) Икс (NΣy2 – (Σy)2)
Um den r-Wert von 0,79 zu ermitteln. Der Wissenschaftler quadriert diesen Wert mit der Notation CoD = r2, um (0,79) (0,79) = 0,6241 zu erhalten. Durch die Auswertung dieser Metrik stellt der Datenwissenschaftler fest, dass sie 62,41 % der Eingaben ausmacht, die zum Ergebnis beitragen, und dass es sich bei 37,59 % um nicht realisierte Daten handelt. Bei dieser Art von Anwendung kann ein Datenwissenschaftler die Parameter des linearen Regressionsmodells anpassen, um die Korrelationsrate so zu erhöhen, dass sie näher bei 1,00 oder 100 % liegt.