So berechnen Sie Teststatistiken (mit Typen und Beispielen) • BUOM

In der Statistik führen Forscher verschiedene Tests durch, um Daten zu analysieren. Abhängig vom gewünschten Ergebnis können die Daten eine von vielen Teststatistiken anzeigen. Diese Teststatistiken sind das Ergebnis spezieller Analysen, die Sie bei der Untersuchung der Daten durchführen. In diesem Artikel schauen wir uns an, was eine Teststatistik ist, welche Arten von Teststatistiken es gibt und wie man eine Teststatistik anhand der beiden häufigsten Werte berechnet. Außerdem stellen wir hilfreiche FAQs für weitere Informationen zur Verfügung.

Was ist Teststatistik?

Eine Teststatistik misst die Genauigkeit der vorhergesagten Datenverteilung im Verhältnis zur Nullhypothese, die Sie bei der Analyse von Datenproben verwenden. Die Statistik hängt davon ab, welche Datenanalysemethode Sie verwenden, und zeigt, wie genau Ihre Daten der vorhergesagten Verteilung für den von Ihnen durchgeführten spezifischen Test entsprechen. Die Verteilung der Daten berücksichtigt die Häufigkeit, mit der Beobachtungen bei der Durchführung statistischer Tests auftreten, und zeigt zentrale Tendenzen und Variationen.

Da es verschiedene statistische Tests gibt, die zur Analyse der Datenverteilung verwendet werden können, variieren die grundlegenden Maße für Trend und Varianz je nach Art der Hypothese, die Sie für einen bestimmten Test vorhersagen. Um die verschiedenen Teststatistiken besser zu verstehen, ist es wichtig, zwischen Null- und Alternativhypothese zu unterscheiden:

  • Nullhypothese: Diese Hypothese geht davon aus, dass die Mittelwerte zweier verschiedener Stichprobengruppen gleich sind. Bei der Durchführung statistischer Tests besteht das Ziel darin, entweder die Nullhypothese abzulehnen oder zu beweisen, dass sie richtig ist.

  • Alternative Hypothese: Alternative Hypothesen legen nahe, dass es einen signifikanten Unterschied zwischen den beiden Stichproben gibt und dass Unterschiede zwischen den Gruppen zu ungleichen Mittelwerten führen. Wenn Sie bei der statistischen Analyse zu einer Alternativhypothese gelangen, kann dies bedeuten, dass Sie die Nullhypothese ablehnen.

Arten von Teststatistiken

Die folgenden Teststatistiken sind einige der häufigsten Anwendungen, die Datenwissenschaftler bei der Durchführung statistischer Analysen verwenden:

T-Wert

Ein T-Wert ist eine Art Teststatistik, die durch die Durchführung von T-Tests oder Regressionstests ermittelt wird. Um einen t-Wert zu schätzen, muss die Nullhypothese getestet werden, wenn die Mittelwerte beider Teststichproben gleich sind. Wenn Sie einen T-Test oder ein Regressionsresiduum durchführen und feststellen, dass die Mittelwerte nicht gleich sind, lehnen Sie die Nullhypothese für die Alternativhypothese ab. Sie können den t-Wert mithilfe des allgemeinen t-Tests mithilfe der Formel berechnen:

t = (X‾ – μ0) / (s / √n) wobei X‾ der Stichprobenmittelwert, μ0 der Populationsmittelwert, s die Stichprobenstandardabweichung und n die Stichprobengröße ist.

Z-Score

Der Z-Score ist eine weitere gängige Teststatistik, bei der die Nullhypothese davon ausgeht, dass die Mittelwerte zweier Grundgesamtheiten gleich sind. Diese Metrik geht über den t-Wert hinaus, der nur eine Stichprobe der Bevölkerung testet. Der Z-Score ist auch wichtig für die Berechnung der Wahrscheinlichkeit, dass ein Datenwert innerhalb der Normalverteilung für einen bestimmten Standard auftritt. Dadurch können Sie zwei Z-Werte aus unterschiedlichen Stichprobengruppen mit unterschiedlichen Standardabweichungen und Mittelwerten vergleichen. Um den Z-Wert zu erhalten, können Sie die Formel verwenden:

z = (X – μ)/σ, wobei X die Rohdaten oder die Schätzung darstellt, μ der Mittelwert der Grundgesamtheit und σ die Standardabweichung der Grundgesamtheit ist.

P-Wert

Der p-Wert in einem statistischen Test hilft zu bestimmen, ob die Nullhypothese abgelehnt oder unterstützt werden sollte. Dabei handelt es sich um ein Maß, das die Nullhypothese ablehnt und sich auf den Alphawert, den kritischen Wert und die Wahrscheinlichkeit stützt. Die Messung eines niedrigeren p-Werts deutet auf die Ablehnung der Nullhypothese hin, während ein höherer p-Wert auf stärkere Belege für die Nullhypothese hinweist.

Der p-Wert ist ein Maß für die Wahrscheinlichkeit und verwendet Freiheitsgrade und eine Schätzung basierend auf dem Alpha-Wert des t-Tests. Nehmen Sie die Stichprobengröße n und subtrahieren Sie eins, um den Freiheitsgrad (n – 1) zu erhalten. Durch den Vergleich des Ergebnisses mit dem entsprechenden Alpha-Wert erhalten Sie eine Schätzung des p-Werts. Es ist wichtig zu beachten, dass p-Werte von den Ergebnissen der T-Tests abhängen und sich je nach T-Statistik ändern können.

F-Wert

Der f-Wert ist eine Teststatistik, die mithilfe der Varianzanalyse (ANOVA) ermittelt werden kann. Dieser statistische Test misst die Differenz der Mittelwerte zweier oder mehrerer unabhängiger Stichproben. Der f-Wert gibt die Signifikanz der Mittelwertunterschiede an und gibt an, ob der Unterschied zwischen den Gruppen einen Zusammenhang herstellt. Wenn der f-Wert größer oder gleich der Variation zwischen den Gruppen ist, ist die Nullhypothese wahr. Wenn der f-Wert kleiner als die Variation zwischen den Stichprobengruppen ist, wird die Nullhypothese abgelehnt. Die Berechnung des f-Werts hängt von komplexen Berechnungen ab, die viele Datenwissenschaftler mithilfe von Computersoftware durchführen.

X2-Wert

Der X2-Wert wird aus nichtparametrischen Korrelationstests ermittelt, die messen, ob ein kausaler Zusammenhang zwischen Variablen besteht. Dieser Wert kann Ihnen auch sagen, ob die Beziehung bereits die beiden Variablen darstellt, die Sie in der statistischen Analyse verwenden möchten. Diese Teststatistik ist nützlich, wenn Sie Variablen für den Test in der Regressionsanalyse vorbereiten, da die Nullhypothese für den X2-Wert auf unabhängige Stichproben hinweist.

So berechnen Sie Teststatistiken

Verwenden Sie die folgenden Schritte, um die Gesamtteststatistik aus Z-Tests und T-Tests zu berechnen:

1. Finden Sie die ursprünglichen Bevölkerungsschätzungen.

Angenommen, Sie möchten einen Z-Test durchführen, um festzustellen, ob die Mittelwerte zweier Grundgesamtheiten gleich sind. Um einen Z-Score zu berechnen, ermitteln Sie die Rohwerte für beide Populationen, die Sie bewerten. Nehmen wir als Beispiel an, dass der Rohwert, mit dem Sie Populationen vergleichen, 95 beträgt. Sie sollten diesen Wert in der Z-Score-Formel durch Folgendes ersetzen:

z = (95) – m) / p

2. Berechnen Sie die Standardabweichung der Grundgesamtheit

Ermitteln Sie die Standardabweichung der geschätzten Population. Ermitteln Sie die Standardabweichung, indem Sie die Quadratwurzel der Varianz ziehen. Wenn Sie beispielsweise eine Varianz von 64 für einen Datensatz haben, beträgt die Standardabweichung acht, da die Quadratwurzel von 64 = 8 ist. Sobald Sie die Standardabweichung gefunden haben, fügen Sie sie in die Z-Score-Formel ein. Ersetzen Sie unter Verwendung der ursprünglichen Schätzung aus dem vorherigen Beispiel die Standardabweichung von 16 durch die Variable σ in der Formel:

g = (95) – μ) / 16

3. Berechnen Sie den Grundgesamtheitsmittelwert

Ermitteln Sie den Mittelwert der Grundgesamtheit, indem Sie alle Datenwerte addieren und diese Summe durch die Anzahl der Datenwerte in der Grundgesamtheit dividieren. Dieser Wert ersetzt die Variable μ in der Formel. Nehmen wir zum Beispiel an, Sie haben alle Datenpunkte in Ihrer Grundgesamtheit gezählt und eine Summe von 18.346 erhalten. Wenn Sie 468 Werte im Datensatz haben, ergibt das einen Mittelwert von 39,2. Die Anwendung dieses Werts auf die Z-Score-Formel mit den Werten aus dem vorherigen Beispiel führt zu folgendem Ergebnis:

d = (95 – 39,2) / 16 = 3,4875

4. Schätzen Sie den Z-Score

Der Z-Score gibt Auskunft über die Verteilung der Daten innerhalb der untersuchten Population. Es zeigt an, um wie viele Standardabweichungen die Datenpunkte vom Mittelwert abweichen. Wenn Sie eine Standardabweichung von Null haben, bedeutet das, dass der von Ihnen getestete Rohwert dem Mittelwert entspricht. Ein positiver Z-Score zeigt an, dass der Rohwert über dem Durchschnitt liegt, und ein negativer Z-Score zeigt an, dass der Rohwert unter dem Durchschnitt liegt.

5. Wenden Sie die T-Test-Formel an

Sie können einen T-Test verwenden, um eine Stichprobe einer größeren Grundgesamtheit aus früheren Z-Tests auszuwerten. Bestimmen Sie mithilfe der t-Wert-Formel die Stichprobengröße, den Stichprobenmittelwert und die Stichprobenstandardabweichung. Angenommen, Sie haben eine Stichprobengröße von 50, einen Stichprobenmittelwert von 17 und eine Standardabweichung von 3,5 für die Stichprobe. Wenn der Grundgesamtheitsmittelwert 78 beträgt, wenden Sie die T-Score-Formel an, um Folgendes zu erhalten:

t = (X‾ – µ0) / (s / √n) =

t = (17 – 78) / (3,5 / √50) = (-61 / 24.745) = -2.465

6. Interpretieren Sie die Ergebnisse

Die Interpretation der T-Test-Ergebnisse ergibt einen T-Wert von -2,465. Ein negativer t-Wert kann auf eine Änderung einer Variablen aufgrund einer Richtungsänderung einer anderen hinweisen. Dieser Richtungswechsel kann auch auf einen Mangel an statistischer Signifikanz bei den Unterschieden zwischen den verschiedenen getesteten Proben hinweisen. Es ist auch wichtig zu ermitteln, ob für die Art der Daten, die Sie auswerten, zusätzliche statistische Tests erforderlich sind. Beispielsweise können Z-Tests und T-Tests für die Analyse von Prüfungsergebnissen effektiv sein, während die Schätzung von F-Werten die Durchführung mehrerer Arten von Varianzanalysen erfordern kann.

Häufig gestellte Fragen zur Teststatistik

Schauen wir uns einige häufig gestellte Fragen zur Teststatistik an:

Wie bestimmen Sie, welcher statistische Test durchgeführt werden soll?

Ein wichtiger Gesichtspunkt bei der Auswahl des durchzuführenden statistischen Tests ist die Hypothese. Mithilfe der Nullhypothese für verschiedene Teststatistiken können Sie feststellen, ob die von Ihnen gemessenen Daten mit der Art der Nullhypothese übereinstimmen, die Sie testen müssen. Wenn Sie beispielsweise den Variationsunterschied zwischen zwei Stichproben messen möchten, können Sie sehen, welche Nullhypothese Ihre Daten unterstützen würden. In diesem Fall ist die ANOVA zum Erhalten eines f-Werts möglicherweise am besten geeignet, da ihre Nullhypothese das unterstützt, was Sie in den Daten ermitteln möchten.

Welche Arten von T-Tests gibt es?

Abhängig von der Art der Variablen, die Sie untersuchen, können Sie drei Haupttypen von T-Tests durchführen. Wenn beispielsweise eine einzelne Stichprobengruppe ausgewertet wird, vergleicht ein gepaarter t-Test den Stichprobenmittelwert über einen bestimmten Zeitraum oder über einen bestimmten Zeitraum. Ein weiterer T-Test für einzelne Gruppen ist der Einstichproben-T-Test, der Stichprobenmittelwerte mit Standardwerten vergleicht. Bei der Untersuchung zweier Stichprobengruppen ist der Zwei-Stichproben-t-Test besser geeignet, da er die Durchführung mehrerer paarweiser Tests für verschiedene Gruppen ermöglicht.

Was bedeutet die Standardnormalverteilung eines Datensatzes?

Eine Standardverteilung ist eine Situation, in der die Standardabweichung der Grundgesamtheit eins und der Mittelwert null ist. Wenn Sie eine Normalverteilung messen, konvertieren Sie die Rohdaten in Z-Scores, die Ihnen sagen, wie viele Standardabweichungen Ihre Daten vom Mittelwert Null entfernt sind. Mit anderen Worten: Die normale Standardverteilung ist eine Metrik, die Sie mit Ihren Z-Scores in einem Datensatz vergleichen können.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert