Der vollständige Leitfaden zum Verständnis der deskriptiven Statistik • BUOM

22. Februar 2021

Statistik ist eine Form der Mathematik, die sich mit der Sammlung, Organisation und Interpretation von Daten befasst. Es gibt zwei Arten von Statistiken, die Sie zum Lesen, Analysieren und Verstehen von Daten verwenden können: deskriptive Statistiken und inferenzielle Statistiken. In diesem Artikel besprechen wir alles, was Sie über deskriptive Statistik wissen müssen, einschließlich der verschiedenen Typen und des Unterschieds zwischen deskriptiver und inferenzieller Statistik.

Was sind deskriptive Statistiken?

Deskriptive Statistiken sind ein Mittel, um Daten auf sinnvolle und nützliche Weise zusammenzufassen und zu beschreiben. Beschreibende Statistiken werden nur verwendet, um Daten so darzustellen, dass sie leicht zu lesen und Muster zu finden sind. Beim Zusammenfassen von Daten werden häufig mehrere verschiedene Arten deskriptiver Statistiken gleichzeitig verwendet, um ein vollständiges Bild der zusammengefassten Daten zu erhalten. Deskriptive Statistiken sind wichtig, weil sie eine Möglichkeit bieten, große Datenmengen auf leicht verständliche Weise darzustellen.

Gängige Arten deskriptiver Statistiken

Es gibt drei Haupttypen der deskriptiven Statistik:

  • Frequenzmessungen

  • Maße der zentralen Tendenz

  • Maße der Streuung oder Variation

Frequenzmessungen

Häufigkeitsmaße sind statistische Maße, die dazu dienen, die Werte in einem Datensatz zusammenzufassen und sie leichter verständlich zu machen. Sie können Häufigkeitsmetriken als Tabelle, Grafik oder Diagramm darstellen. Der Hauptzweck von Häufigkeitsmetriken besteht darin, die Anzeige von Informationen in einem Datensatz zu erleichtern. Häufigkeitsmessungen nehmen einen unorganisierten Datensatz und gruppieren alle ähnlichen Datenwerte so, dass Sie die Daten auf einen Blick analysieren können.

Wenn Sie beispielsweise die Anzahl der Schüler anzeigen möchten, die bei einem Test die einzelnen Buchstabennoten erhalten haben, können Sie eine Tabelle verwenden, um die Häufigkeit der Noten von AF darzustellen. Eine Klasse mit 25 Schülern erzielte folgende Punkte: 100, 88, 93, 64, 76, 42, 55, 87, 99, 92, 100, 73, 56, 99, 98, 100, 84, 81, 83, 100, 100 , 92, 64, 69 und 70. Die Häufigkeitstabelle für diese Schätzungen würde wie folgt aussehen:

Klasse Anzahl der Schüler A 11 B 5 C 3 D 3 F 3

Maße der zentralen Tendenz

Maße der zentralen Tendenz sind statistische Maße, die einen einzelnen Wert verwenden, um die Mitte eines Datensatzes darzustellen. Das Grundkonzept hinter Messungen der zentralen Tendenz besteht darin, dass es einen Wert gibt, der den gesamten Datensatz am besten zusammenfassen kann. Dieser Wert ist irgendwie zentral mit dem Gesamtdatensatz verknüpft. Es gibt drei Maße für die zentrale Tendenz: Mittelwert, Median und Modus.

Meinen

Der Mittelwert, auch „Mittelwert“ genannt, ist das am häufigsten verwendete Maß für die zentrale Tendenz. Sie wird berechnet, indem die Summe aller Zahlen im Datensatz ermittelt und die Summe durch die Gesamtzahl der Zahlen dividiert wird. Der Hauptvorteil eines Durchschnitts besteht darin, dass er alle Zahlen im Datensatz berücksichtigt. Es ist jedoch wichtig zu wissen, dass der Durchschnitt sehr empfindlich auf Ausreißer reagiert.

Beispielsweise können Sie Ihr Gehalt anhand eines Durchschnitts mit den Gehältern anderer Fachkräfte in derselben Position wie Sie vergleichen. Sie sammeln Gehaltsinformationen von neun Fachleuten in derselben Position wie Sie. Endgültige Gehälter: 38.000 $, 41.000 $, 45.000 $, 43.000 $, 47.000 $, 50.000 $, 55.000 $, 15.000 $ und 75.000 $. Ihr Gehalt beträgt 52.000 Dollar. Sie beginnen damit, die Summe aller Gehälter zu ermitteln (38 + 41 + 45 + 43 + 47 + 50 + 55 + 15 + 75 + 52 = 461). Dann dividieren Sie die Summe der Werte durch die Gesamtzahl der Werte in der Menge (461/10 = 46,1). Das durchschnittliche Gehalt für Ihre Position beträgt 46,1.000 US-Dollar.

Median

Der Median ist der Wert, der in der Mitte des Datensatzes liegt. Der Hauptvorteil des Medians besteht darin, dass er weniger empfindlich auf Ausreißer reagiert als der Mittelwert. Sie wird berechnet, indem alle Zahlen in einem Datensatz in der Reihenfolge vom kleinsten zum größten angeordnet werden und dann die Zahl ermittelt wird, die in der Mitte des Satzes liegt. Wenn Ihr Datensatz eine ungerade Anzahl von Werten enthält, suchen Sie einfach die einzelne Zahl, die in der Mitte des Satzes liegt. Wenn Ihr Datensatz jedoch eine gerade Anzahl von Werten aufweist, müssen Sie die beiden Werte in der Mitte ermitteln und dann den Durchschnitt dieser beiden Werte ermitteln, um den Median zu berechnen.

Anhand des gleichen Beispiels wie für den Mittelwert beschließen Sie, auch den Median zu ermitteln. Sie beginnen damit, die Werte in Ihrem Datensatz vom kleinsten zum größten zu ordnen: 15.000 $, 38.000 $, 41.000 $, 43.000 $, 45.000 $, 47.000 $, 50.000 $, 52.000 $, 55.000 $ und 75.000 $. Dann finden Sie in der Mitte des Datensatzes zwei Zahlen: 45.000 $ und 47.000 $. Schließlich finden Sie den Durchschnitt der beiden Zahlen in der Mitte des Datensatzes (45 + 47 = 92; 92/2 = 46). Das durchschnittliche Gehalt für Ihre Position beträgt 46.000 US-Dollar.

Modus

Der Modus ist der Wert in einem Datensatz, der am häufigsten vorkommt. Sie wird berechnet, indem alle übereinstimmenden Werte gruppiert werden und dann die Gruppe ermittelt wird, die die meisten Werte enthält. Der Hauptvorteil des Modus besteht darin, dass Sie sowohl numerische als auch nominelle Werte vergleichen können, während Mittelwert und Median nur numerische Werte vergleichen können. Nominalwerte sind Daten, die nicht durch eine Zahl dargestellt werden, wie zum Beispiel Farben und Formen. Es ist jedoch wichtig zu wissen, dass ein Datensatz möglicherweise keinen Modus hat, wenn keine zwei Werte im Datensatz übereinstimmen.

Beispielsweise verfügt die Gehaltsgruppe, die in den Mittelwert- und Median-Beispielen verwendet wird, über keinen Modus, da alle Gehälter unterschiedliche Werte haben. Wenn Ihr Gehalt jedoch 50.000 US-Dollar statt 52.000 US-Dollar betragen würde, wären 50.000 US-Dollar in Mode, da dies der Gehaltswert ist, der in der Gruppe am häufigsten vorkommt.

Maße der Streuung oder Variation

Streuungs- oder Variationsmaße, auch Streumaße genannt, sind statistische Messungen, die zur Darstellung der Variabilität in einem Datensatz verwendet werden. Es gibt drei Maße für die Streuung oder Variation: Bereich, Varianz und Standardabweichung.

Reichweite

Der Bereich ist eine deskriptive Statistikmessung, die die Differenz zwischen dem höchsten und niedrigsten Wert in einem Datensatz darstellt. Der Bereich wird berechnet, indem einfach der kleinste Wert in einem Datensatz vom größten Wert im selben Datensatz subtrahiert wird. Die in den Beispielen verwendete Gehaltsspanne für Mittelwert und Median beträgt beispielsweise 60.000 US-Dollar (75 – 15 = 60).

Standardabweichung

Die Standardabweichung ist ein statistisches Maß für die Varianz oder Streuung zwischen dem Mittelwert eines Datensatzes und jedem einzelnen Wert im Datensatz. Eine niedrige Standardabweichung weist darauf hin, dass die Werte im Datensatz tendenziell nahe am Mittelwert des Datensatzes liegen, während eine höhere Standardabweichung darauf hinweist, dass die Werte im Datensatz über einen größeren Bereich variieren.

Streuung

Varianz ist ein statistisches Maß für den durchschnittlichen Abstand zwischen jedem Wert und dem Mittelwert. Die Varianz wird berechnet, indem das Quadrat der Standardabweichung ermittelt wird. Dispersionsformel:

Varianz = (Standardabweichung) im Quadrat

Beschreibende Statistik vs. Inferenzstatistik

Der Hauptunterschied zwischen deskriptiven Statistiken und inferenziellen Statistiken besteht darin, was Sie mit den Daten tun können. Während Sie mit der deskriptiven Statistik Informationen nur so zusammenfassen und darstellen können, dass Sie Muster in den Daten erkennen können, können Sie mit der inferenziellen Statistik die Daten weiter analysieren und daraus Vorhersagen und Schlussfolgerungen ziehen. Mithilfe der Inferenzstatistik können Sie die in der deskriptiven Statistik zusammengefassten Informationen verwenden, um auf der Grundlage einer Datenstichprobe aus dieser Population Verallgemeinerungen über eine interessierende Population vorzunehmen. Deskriptive Statistiken basieren auf quantitativen Analysen, während inferenzielle Statistiken auf Wahrscheinlichkeitstheorie basieren.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert