So berechnen Sie die Varianz in Excel (mit Schritten und Beispielen) • BUOM
Microsoft Excel bietet umfangreiche Werkzeuge und Funktionen zur Datenanalyse und statistischen Auswertung. Eine häufige Funktion ist die Varianz, die je nach Art der gemessenen Daten mit den Befehlen VAR.P und VAR.S berechnet werden kann.
Beim Anwenden von Varianzformeln in Excel ist es wichtig, die richtige Formel entweder für die Stichprobe oder die gesamte Grundgesamtheit anzuwenden. In diesem Artikel besprechen wir, was Varianz in der Statistik ist, gängige Funktionen, die Sie in Excel verwenden können, und wie Sie die Varianz in Excel berechnen, anhand von Beispielen, die Ihnen helfen.
Was ist Varianz in der Statistik?
Varianz ist ein Maß für die Variation in der Statistik und zeigt an, wie weit die einzelnen Punkte in einem Datensatz voneinander entfernt sind. Durch die Messung der Streuung können Sie auch feststellen, wie weit die Datenwerte vom Mittelwert entfernt sind. Dabei handelt es sich um den Durchschnittswert zur Beschreibung einer bestimmten Stichprobe oder eines Populationsparameters. In der Mathematik quadriert man die Differenzen zwischen Datenwerten und dem Mittelwert und bildet den Durchschnitt dieser quadrierten Differenzen, um die Varianz zu ermitteln.
Varianztypen
Sie können die Varianz für die gesamte Grundgesamtheit oder für eine Stichprobe der Grundgesamtheit messen, und jede Art von Varianzmetrik verwendet in Excel eine eigene Funktion:
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Populationsvarianz: Die Populationsvarianz misst die gesamte Population und verwendet die Befehlsfunktion VAR.P() in Excel, um die Varianz zu berechnen, wobei Text und boolesche Daten ignoriert werden.
Stichprobenvarianz. Die Stichprobenvarianz ist die Variation einer Grundgesamtheitsstichprobe und verwendet die Befehlsfunktion VAR.S() in Excel, um die Varianz zu berechnen, ohne Text und boolesche Daten zu berücksichtigen.
Varianzmessungen für boolesche und Texteingaben. Sie können Stichprobenvarianz und Populationsvarianz messen, wobei Sie auch textliche und logische Argumente bewerten möchten. Excel verwendet VARA() für die Stichprobenvarianz und VARPA() für die Populationsvarianz, wenn Sie boolesche und Texteingaben wie „Wahr = 1, Falsch = 0“ oder „Eingabe = Null“ haben.
So berechnen Sie die Varianz in Excel für die Grundgesamtheit
Die folgenden Schritte zeigen, wie Sie die Varianz in Excel berechnen, wenn Sie die gesamte Grundgesamtheit schätzen:
1. Geben Sie Ihre Daten ein und organisieren Sie sie
Importieren Sie Ihre Daten in eine leere Excel-Tabelle und organisieren Sie sie entsprechend Ihren Bewertungsanforderungen.
Angenommen, ein Professor gibt die Klassennoten für eine Hausarbeit ein. Die Klasse repräsentiert die gesamte Bevölkerung und der Professor organisiert Spalte A für die Namen der Schüler und Spalte B für die Noten. Ein Datenwissenschaftler, der Algorithmen für maschinelles Lernen untersucht, kann eine Vielzahl von Eingabe- und Organisationsmethoden zur Varianzanalyse verwenden, da sein Datensatz groß sein kann.
In beiden Beispielen ist die Funktion VAR.P erforderlich, da sie die Varianz für die gesamte Grundgesamtheit berechnet.
2. Erstellen Sie eine separate Zelle für die Formel
Verwenden Sie eine separate Spalte und Zelle, um den Funktionsbefehl einzugeben. Im Beispiel der Prüfungsergebnisse des Professors könnten sie eine Zelle in Spalte C oder D verwenden, um die Varianzberechnung aufzulisten. Nachdem Sie die Zelle ausgewählt haben, die Sie für die Befehlsfunktion verwenden möchten, beschriften Sie die Spalte für Ihre Berechnung zur Verdeutlichung mit „Varianz“.
3. Geben Sie die Funktion VAR.P ein
Wählen Sie in der Spalte, die Sie „Varianz“ nennen, eine Zelle aus und geben Sie eine Befehlsfunktion für die Populationsvarianz ein. Geben Sie Zellnamen mit der Syntax =VAR.P(cell:cell) ein.
Nehmen wir als Beispiel an, dass frühere Prüfungsergebnisse in den Zellen B2 bis B207 angezeigt werden. Wenn der Professor in Zelle C2 eine Formel eingibt, ergibt sich als Syntax =VAR.P(B2:B207).
4. Bewerten Sie die Ergebnisse
Abhängig von der Art der durchgeführten Datenanalyse kann die Schätzung der Populationsvarianz auf mehrere Faktoren hinweisen. Wenn die Varianz größer ist, deutet dies darauf hin, dass die Daten weiter vom Mittelwert entfernt sind. Ein niedrigerer Wert zeigt an, dass die Daten näher am Mittelwert liegen. Eine Nullvarianz gibt an, dass die Datenpunkte einen Wert haben, der dem Mittelwert entspricht.
So berechnen Sie die Stichprobenvarianz in Excel
Führen Sie die folgenden Schritte aus, um die Stichprobenvarianz in Excel zu berechnen:
1. Wählen Sie eine Grundgesamtheitsstichprobe aus
Die Verwendung der VAR.S-Funktion erfordert eine kleinere Stichprobe aus der Grundgesamtheit.
An einer weiterführenden Schule mit 1.500 Oberstufenschülern könnte ein Lehrer beispielsweise eine Zufallsstichprobe von 150 Testergebnissen auswählen, um Testtrends zu ermitteln. Wenn Sie eine Probengruppe auswählen, geben Sie die Daten in ein neues Excel-Arbeitsblatt ein.
2. Organisieren Sie Ihre Daten in einer Tabelle
Sortieren Sie die Beispieldaten in der Tabelle anhand der entsprechenden Spalten, Zellen und Beschriftungen. Mit dem vorherigen Beispiel können Lehrer 150 Beispielnoten organisieren, indem sie nur eine Spalte für die Anonymität oder zwei Spalten für die Auflistung der Schülernamen und ihrer entsprechenden Noten verwenden. Mithilfe der Sortierfunktionen von Excel können Sie Ihre Daten auch in aufsteigender oder absteigender Reihenfolge anordnen.
3. Wählen Sie eine separate Zelle für die Formel aus
Wählen Sie unter der neuen Spalte die Zelle für die Befehlsfunktion aus.
In einer Stichprobe mit 150 Punkten wählen Lehrer eine Zelle in Spalte D aus, um die Formel einzugeben. Benennen Sie die neue Spalte „Varianz“, um die Funktion vom Rest Ihrer Daten zu unterscheiden.
4. Geben Sie die VAR.S-Funktion ein.
Geben Sie mithilfe der Syntax =VAR.S(cell:cell) eine Befehlsfunktion für die Zellen ein, die Sie auswerten.
Angenommen, Sie verfolgen die Tagestemperatur ein Jahr lang und möchten die Abweichung für zwei bestimmte Monate ermitteln. Wenn sich die Daten für einen der Monate in den Zellen B2 bis B32 und die Daten für den anderen Monat in den Zellen C2 bis C33 befinden, geben Sie die Befehlsformel als =VAR.S(B2:B32;C2:C33)* ein. *.
5. Schätzen Sie die Stichprobenvarianz
Bei der Untersuchung sehr großer Populationen ist die Stichprobenvarianz integral, da sie eine Schätzung von Parametern liefert, die für die gesamte Population gültig sein können. Daher kann Ihnen die Schätzung der Stichprobenvarianz detaillierte Einblicke in die Muster und das Verhalten der von Ihnen untersuchten Variablen im Aggregat geben.
Wie bei der Populationsvarianz deutet eine kleinere Varianz darauf hin, dass die Stichprobendaten näher am Stichprobenmittelwert liegen, während eine größere Varianz darauf hinweist, dass die Stichprobendaten weiter vom Stichprobenmittelwert entfernt sind. Die Nullvarianz zeigt immer noch Datenwerte an, die dem Stichprobenmittelwert entsprechen.
Die Bedeutung von Varianzberechnungen
Varianz ist eine wichtige Statistik, da sie Informationen für verschiedene Datenanalysethemen liefert und nützlich ist, wenn:
Fehlerraten messen: Varianz ist wichtig für das Verständnis von Fehlerraten bei der Schätzung von Statistiken. Die Fehlerrate misst, wie wahrscheinlich es ist, dass die Nullhypothese falsch ist.
Ursachen für Abweichungen identifizieren. Die Berechnung der Variation ist auch wichtig, um zu verstehen, was große Variationen in einem Datensatz verursacht. Beispielsweise kann die Feststellung, dass Faktoren wie Alter und Geschlecht die Körpergröße eines Erwachsenen beeinflussen, dabei helfen, Beispieldaten für weitere Analysen zu organisieren.
Berechnung des Variationskoeffizienten. Die Varianz liefert ein Ergebnis, das zur Bestimmung des Variationskoeffizienten verwendet werden kann. Dieser Indikator ist wichtig für das Verständnis der Beziehung zwischen Variablen in verschiedenen Datensätzen.
Bewerten von Unterschieden zwischen Variablen: Varianzberechnungen können auch entscheidend sein, um zu verstehen, wie sich verschiedene Populationen unterscheiden. Viele Analysten nutzen die Varianz, um Unterschiede in der Finanzleistung, Vertriebsleistung und Betriebsleistung in einem Geschäftsumfeld zu verstehen.
Ermitteln der Homogenität für die parametrische Schätzung: Varianz ist ein Maß, das für die Inferenzstatistik gilt, daher sind keine Parameter erforderlich, um sie zu ermitteln. Obwohl es sich bei der Varianz um eine nichtparametrische Berechnung handelt, kann sie zur Festlegung von Kriterien für die Durchführung parametrischer Schätzungen über Gruppen hinweg verwendet werden.
Beispiele
Betrachten Sie die folgenden Beispiele für die Berechnung der Varianz mit den Funktionsbefehlen VAR.P und VAR.S:
Beispiel für Bevölkerungsstreuung
Ein Lehrer möchte die Varianz der Prüfungsergebnisse seiner Klasse berechnen. Die Klasse repräsentiert die gesamte Grundgesamtheit, daher verwendet die Lehrerin die VAR.P-Funktion in ihrer Excel-Tabelle. Indem sie in Spalte A die Namen der Schüler, in Spalte B 9 Punkte und in Spalte C eine Formel eingibt, berechnet sie die Varianz wie folgt:
ABC Student 1 95 =VAR.P(B2:B10) = 58,09876543 Student 2 88 Student 3 73 Student 4 79 Student 5 84 Student 6 98 Student 7 92 Student 8 86 Student 9 80
Beispiel für eine Abweichung
Ein Umweltwissenschaftler möchte die Veränderungen des pH-Werts von Wasser in den letzten sechs Monaten abschätzen. Da die Bevölkerungsdaten etwa 182 Tage pH-Werte enthalten, entnimmt der Wissenschaftler für jeden Monat, in dem er die Wasserqualität überwacht, eine Probe eines Wertes.
Der Wissenschaftler gibt seine Daten in eine Tabellenkalkulation ein und berechnet mithilfe der VAR.S-Funktion die Varianz der Probendaten. Mit Monaten in Spalte A, pH-Daten in Spalte B und Varianzfunktion in Spalte C ergibt die Berechnung das folgende Ergebnis:
Probenmonat pH-Abweichung März 5,5 =VAR.S(B2:B7) = 0,224 April 6,1 Mai 6,8 Juni 6,6 Juli 5,9 August 6,3
Bitte beachten Sie, dass keines der in diesem Artikel genannten Unternehmen mit Indeed verbunden ist.