5 grundlegende Statistiktools und wie man das richtige auswählt • BUOM

Daten können Menschen helfen, Muster und Anomalien in ihrem persönlichen und beruflichen Leben zu verstehen. Mit einfachen Statistiktools können Sie diese Trends und Ausnahmen leichter finden. Es ist wichtig zu wissen, wie diese Tools funktionieren, damit Sie Forschungsergebnisse verstehen, Ihre eigene Forschung durchführen und Daten richtig interpretieren können. In diesem Artikel besprechen wir, wann Sie die wichtigsten Statistiktools verwenden können, welche fünf am häufigsten verwendet werden und geben Tipps für die Auswahl eines Tools für Ihre Situation.

Wozu dienen grundlegende statistische Tools?

Grundlegende statistische Tools helfen dabei, Informationen zu interpretieren und nutzbar zu machen. Sie können grundlegende Statistiktools verwenden, um jede Art von Geschäftsdaten zu analysieren und zu verstehen, von Verkaufsberichten über Materialpreise bis hin zu Marktprognosen. Einige statistische Tools helfen Ihnen, Trends zu erkennen und Vorhersagen über zukünftige Verkäufe oder Ursache-Wirkungs-Beziehungen zu treffen. Andere Tools helfen Ihnen beim Durchsuchen großer Datenmengen, wenn Sie nicht wissen, wo Sie als Nächstes suchen sollen.

Finanzexperten können grundlegende statistische Tools verwenden, um die Leistung eines Unternehmens zu verstehen, während Marketingexperten sie zur Durchführung von Kunden- oder Benutzerumfragen nutzen können. Produktentwickler können Kundenreaktionen auf aktuelle Produkte analysieren, und Manager oder Geschäftsinhaber können diese Art der Analyse nutzen, um strategische Pläne und Maßnahmen zu unterstützen. Menschen in akademischen oder Forschungsbereichen verwenden häufig statistische Tools, um menschliche, tierische und materielle Handlungen und Reaktionen zu verstehen.

5 grundlegende Statistiktools

Hier sind fünf grundlegende statistische Analysetools und geeignete Situationen für deren Verwendung:

1. Rückschritt

Regression ist eine Methode zum Vergleichen zweier Variablen, bei denen eine unabhängig ist und die andere oder die anderen von der ersten Variablen abhängen. Abhängig davon, wie viele Variablen Sie analysieren, gibt es unterschiedliche Regressionsmethoden. Sobald eine Regression anhand eines Datensatzes berechnet wurde, können zukünftige Ergebnisse basierend auf den Werten der unabhängigen Variablen vorhergesagt werden. Die Regression konzentriert sich auf Trends. Daher ist es wichtig, die Regressionsanalyse mit der Befragung und Analyse aller Ausreißerdatenpunkte zu kombinieren, die weit von Ihren Erwartungen entfernt sind.

Y = a + mx + e

Wann:

Y = unabhängige Variable

a = Y-Achsenabschnitt, Y-Wert, wenn X = 0

m = Steigung der Datenlinie

x = abhängige Variable

e = Fehlerterm, der bei der Prognose mithilfe der Regressionsformel verwendet wird

Beispiel: The Better Bakery versucht vorherzusagen, wie viele Donuts sie verkaufen werden, wenn sie wissen, wie viele sie ausstellen. Die unabhängige Variable ist die Anzahl der angezeigten Donuts und die verkaufte Menge ist die abhängige Variable. Sie verkaufen keine Donuts, es sei denn, sie werden ausgestellt, daher ist ihr „a“-Wert Null. Am Donnerstag wurden 48 Donuts ausgestellt und 36 verkauft. Am Freitag wurden 60 Donuts ausgestellt und 45 verkauft. Durch die Anwendung der Formel auf beide Tage können sie die Steigung der Donut-Regression verstehen:

Donnerstag: 48 Donuts angezeigt = 0 + (mx 36)

Freitag: 60 = 0 + (mx 45)

In beiden Gleichungen ist m = 0,75, sodass die Bäckerei dies in der Gleichung verwenden kann, um vorherzusagen, wie viele Donuts sie in Zukunft verkaufen wird.

2. Berechnung des Durchschnitts

Der Mittelwert einer Datenmenge, auch Durchschnitt genannt, kann hilfreich sein, um zu verstehen, wie Daten in einer Datenmenge angeordnet sind und wo Zahlen am häufigsten vorkommen. Dies funktioniert am besten, wenn Sie versuchen, sich einen allgemeinen Überblick über die Größe einer einzelnen Transaktion oder eines einzelnen Ereignisses zu verschaffen. Die Kombination des Durchschnitts mit anderen Informationen, etwa dem Modus und dem Bereich des Datensatzes, kann dabei helfen, den Durchschnitt besser zu verstehen. Formel zur Berechnung des Durchschnitts:

(Summe aller Datenpunkte im Satz) / (Anzahl der Datenpunkte im Satz) = Mittelwert des Datensatzes

Beispiel: September Sales and Distribution tätigte tagsüber fünf Verkäufe im Gesamtwert von 3.000 $, 5.500 $, 2.000 $, 4.000 $ und 6.500 $. Um den durchschnittlichen Umsatz für diesen Tag zu berechnen, addieren sie die Verkäufe und dividieren durch fünf:

(3.000 $ + 5.500 $ + 2.000 $ + 4.000 $ + 6.500 $) / 5 = Durchschnitt oder Durchschnitt

21.000 $ / 5 = 4.200 $ = Durchschnitt jedes Verkaufs pro Tag.

3. Standardabweichung

Die Standardabweichung misst, wie Daten über einen Bereich verteilt sind. In einem Datensatz mit einer großen Standardabweichung sind die Datenpunkte über einen großen Bereich verstreut, während in einem Datensatz mit einer kleinen Standardabweichung die meisten Daten in Clustern zusammengefasst sind. Die Standardabweichung kann am nützlichsten sein, wenn die Daten eine angemessene Streuung aufweisen und es nicht zu viele Ausreißer gibt. Für die Berechnung der Standardabweichung gibt es zwei Formeln, je nachdem, ob Sie nur eine Datenstichprobe oder den gesamten Datensatz für die gesamte Grundgesamtheit haben.

с = √((Σ(xi – Mittelwert aller x-Werte)2) / (N – 1))

Wann:

s = Stichprobenstandardabweichung

xi = beobachtete Werte von 1 bis N

N = Anzahl der Beobachtungen

Beispiel: Mouse Greenhouse misst, wie sich der Verkauf von Düngersäcken über 12 Sommerwochen verändert. Sie berechnen die Standardabweichung ihrer wöchentlichen Verkäufe im Laufe des Sommers, indem sie zunächst den Durchschnitt ihrer wöchentlichen Verkäufe berechnen.

Dann subtrahieren sie für die Anzahl der Verkäufe für jede Woche, xi in der Formel, den Durchschnitt von der Gesamtsumme dieser Woche und quadrieren das Ergebnis. Sie nehmen die Summe all dieser Quadrate, dividieren sie durch die Anzahl der Beobachtungen minus eins, in diesem Fall 11. Sie ziehen daraus die Quadratwurzel und ermitteln ihre Standardabweichung, die für diese Stichprobe sechs beträgt. Das bedeutet, dass die Anzahl der verkauften Düngersäcke den größten Teil des Sommers über nur sechs von ihrem durchschnittlichen wöchentlichen Umsatz entfernt sein wird.

4. Bestimmen der Stichprobengröße

Bei der Bestimmung der Stichprobengröße werden geeignete Daten für die Analyse aus einer großen Menge ausgewählt. Mit der richtigen Probengröße können Sie die gleichen Ergebnisse erzielen wie mit der Analyse der gesamten Probe, sie ist jedoch effizienter, da weniger Verarbeitung erforderlich ist. Bei der Berechnung der Stichprobengröße sind folgende Faktoren zu berücksichtigen:

  • Gesamtpopulationsgröße: Dies ist die maximale Größe aller möglichen Daten. Wenn Sie Ihre Studie abgeschlossen haben, ist Ihre Gesamtpopulation die Anzahl der Datenpunkte oder Antworten, die Sie erhalten haben, und wenn Sie eine Studie planen, ist Ihre Gesamtpopulation die maximal mögliche Anzahl an Datenpunkten.

  • Fehlerquote: Bestimmt, wie viele Fehler Sie bei Ihrer Recherche machen möchten.

  • Konfidenzniveau: Dies ist die prozentuale Wahrscheinlichkeit, dass Ihre Ergebnisse, beispielsweise der berechnete Mittelwert, innerhalb des wahren Mittelwerts des gesamten Datensatzes liegen. Sobald Sie das erforderliche Konfidenzniveau ermittelt haben, das in der Regel 90 % oder höher beträgt, verwenden Sie die Tabelle, um den Z-Score zu ermitteln, der dem von Ihnen gewählten Konfidenzniveau entspricht.

  • Standardabweichung: Dies ist der Betrag der erwarteten Varianz in Ihren Daten.

Stichprobengröße = (z-Score2 x Standardabweichung x (1 – Standardabweichung)) / Fehler**2**

5. Hypothesen testen

Das Testen von Hypothesen ist ein Prozess, mit dem festgestellt wird, ob Daten eine bestimmte Hypothese stützen. Sie können einen Hypothesentest durchführen, indem Sie zunächst feststellen, welche spezifische Formel Ihrer Meinung nach wahr ist. Dieses erwartete Ergebnis wird zu Ihrer ersten Hypothese oder H1. Das unerwartete Ergebnis ist die Nullhypothese oder H0. Es ist wichtig zu beachten, dass die Formeln für Hypothesentests davon abhängen, was Sie analysieren und testen. Hypothesen können beispielsweise spezifische Formeln sein, die zwei Variablen miteinander in Beziehung setzen, sodass einige numerische Ergebnisse darauf hinweisen, dass H1 wahr ist, während andere direkt zeigen, dass H0 wahr ist.

H0: A ≠ B

H1: A = B

Wann:

A = Daten über den Wert oder die Variable, die der Statistiker untersucht.

B = Vorhersagen des Forschers

Beispiel: Smooth Storage Solutions geht davon aus, dass ihre Kunden ihre größten Miet-Lkw für Transporte über 100 Meilen nutzen. Daher ist dies ihre erste Hypothese:

H1: Durchschnittliche Kilometerleistung > 100 Meilen pro Fahrt

Eine Nullhypothese wäre jeder Umstand, in dem sie falsch sind:

H0: durchschnittliche Laufleistung

Sie überprüfen den Kilometerzähler ihrer Lkw vor und nach jeder Lkw-Vermietung und stellen fest, dass alle Fahrten mindestens 200 Meilen lang waren. Sie haben also Grund zu der Annahme, dass ihre erste Hypothese richtig ist.

Tipps zur Auswahl eines einfachen Statistiktools

Hier sind einige Tipps und Überlegungen zur Auswahl eines grundlegenden Statistiktools:

Betrachten Sie die Phase der Datenerfassung

Wenn Sie eine Studie nur entwerfen, um etwas Bestimmtes herauszufinden, können Sie ein Tool wie die Bestimmung der Stichprobengröße verwenden, um zu entscheiden, wie viele Umfragen oder Experimente durchgeführt werden sollen. Andere Tools wie Regression oder Mittelwertbildung sind unterschiedliche Methoden zur Analyse bereits erfasster Daten. Wenn Sie gerade dabei sind, Informationen zu sammeln, sollten Sie die Festlegung einer Stichprobengröße in Erwägung ziehen, um festzustellen, ob Sie über genügend Daten verfügen, um zuverlässige Ergebnisse zu erhalten, oder versuchen Sie, eine frühe Regressionsanalyse durchzuführen, um spätere Daten zu vergleichen und zu sehen, ob Ihre neuen Informationen früher vorliegen Modelle.

Berücksichtigen Sie die Größe Ihrer Daten

Einige Tools eignen sich besser für große Datenmengen. Wenn Sie über eine Kundenbefragung oder wöchentliche Verkaufsdaten verfügen, verwenden Sie möglicherweise andere Tools, als wenn Sie vier Ergebnisse für jedes Geschäftsquartal oder zwei verschiedene Produkte vergleichen würden. Wenn Sie sich nicht sicher sind, welche Tools für größere oder kleinere Mengen am besten geeignet sind, können Sie sich ähnliche Studien ansehen, die Ihre Institution oder Ihr Unternehmen in der Vergangenheit durchgeführt hat, um Methoden und Ergebnisse zu vergleichen.

Untersuchen Sie jedes Werkzeug vor der Verwendung

Obwohl es sich hierbei um die gebräuchlichsten und nützlichsten Tools in der Statistik handelt, ist es wichtig, vor der Verwendung genau zu verstehen, wie sie funktionieren. Wenn Sie beispielsweise wissen, ob Sie die Stichprobenstandardabweichung oder die Populationsstandardabweichung verwenden sollten, können Sie besser verstehen, wie Sie Ihre Ergebnisse interpretieren. Sie können auch mehr darüber erfahren, welche Tools geeignet sind, indem Sie an einem Statistikkurs teilnehmen oder sich von einem Kollegen über die Erwartungen und Verfahren Ihres Unternehmens bei der Verwendung statistischer Analysen informieren.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert