Как рассчитать тестовую статистику (с типами и примерами)

В статистике исследователи проводят различные тесты для анализа данных. В зависимости от результата, который ищут исследователи, данные могут отображать одну из многих тестовых статистических данных. Эти тестовые статистические данные являются результатом специального анализа, который вы выполняете при изучении данных. В этой статье мы рассмотрим, что такое тестовая статистика, какие существуют типы тестовой статистики и как рассчитать тестовую статистику, используя два наиболее распространенных значения, а также полезные ответы на часто задаваемые вопросы для получения дополнительной информации.

Что такое тестовая статистика?

Тестовая статистика измеряет точность предсказанного распределения данных относительно нулевой гипотезы, которую вы используете при анализе выборок данных. Статистика зависит от того, какой метод анализа данных вы используете, и показывает, насколько точно ваши данные соответствуют предсказанному распределению для конкретного теста, который вы выполняете. Распределение данных учитывает частоту, с которой происходят наблюдения при выполнении статистических тестов, и показывает центральную тенденцию и вариацию.

Поскольку существуют различные статистические тесты, которые можно использовать для анализа распределения данных, основные показатели тенденции и дисперсии различаются в зависимости от типа гипотезы, которую вы прогнозируете для определенного теста. Чтобы лучше понять различную тестовую статистику, важно различать, что такое нулевая и альтернативная гипотезы:

  • Нулевая гипотеза: эта гипотеза предполагает, что средние значения двух различных групп выборок равны. При выполнении статистических тестов целью становится либо отвергнуть нулевую гипотезу, либо доказать ее правильность.

  • Альтернативная гипотеза: Альтернативные гипотезы предполагают, что между двумя выборками существует значительная разница, а различия между группами приводят к неравным средним значениям. Если вы пришли к альтернативной гипотезе во время статистического анализа, это может означать отклонение нулевой гипотезы.

Типы тестовой статистики

Следующие тестовые статистические данные являются одними из распространенных приложений, которые специалисты по данным используют при выполнении статистического анализа:

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Т-значение

T-значение — это один из типов тестовой статистики, полученный в результате выполнения либо t-тестов, либо регрессионных тестов. Оценка t-значения требует проверки нулевой гипотезы, когда средние значения обеих тестовых выборок равны. Если вы выполняете t-тест или регрессионный остаток и обнаруживаете, что средние значения не равны, вы отвергаете нулевую гипотезу для альтернативной гипотезы. Вы можете рассчитать t-значение, используя общий t-критерий по формуле:

t = (X‾ – μ0) / (s / √n), где X‾ — среднее значение выборки, μ0 — среднее значение генеральной совокупности, s — стандартное отклонение выборки, а n — размер выборки.

Z-значение

Z-значение — это еще одна распространенная тестовая статистика, где нулевая гипотеза предполагает, что средние значения двух совокупностей равны. Эта метрика выходит за рамки t-значения, которое проверяет только выборку населения. Z-оценка также важна для расчета вероятности появления значения данных в пределах нормального распределения для конкретного стандарта. Это позволяет сравнивать два значения z из разных групп образцов с различными стандартными отклонениями и средними значениями. Чтобы получить значение z, вы можете использовать формулу:

z = (X – μ) / σ, где X представляет необработанные данные или оценку, μ — среднее значение генеральной совокупности, а σ — стандартное отклонение для генеральной совокупности.

P-значение

Значение p в статистическом тесте помогает определить, следует ли отклонить или поддержать нулевую гипотезу. Это показатель, который опровергает нулевую гипотезу и опирается на альфа-значение, критическое значение и вероятность. Измерение меньшего значения p предполагает отклонение нулевой гипотезы, тогда как более высокое значение p указывает на более сильные доказательства в поддержку нулевой гипотезы.

Значение p является мерой вероятности и использует степень свободы и оценку на основе альфа-значения t-критерия. Взяв размер выборки n, вычтите единицу, чтобы получить степень свободы (n – 1). Сравнение результата с соответствующим альфа-уровнем дает вам оценку p-значения. Важно отметить, что p-значения зависят от результатов, которые дают вам t-тесты, и могут меняться в зависимости от различных t-статистик.

F-значение

Значение f — это тестовая статистика, которую можно получить с помощью дисперсионного анализа (ANOVA). Этот статистический тест измеряет разницу в средних значениях для двух или более независимых выборок. Значение f показывает значимость средних различий, указывая на то, образует ли разница между группами взаимосвязь. Если f-значение больше или равно вариации между группами, нулевая гипотеза верна. Если f-значение меньше вариации между группами выборки, нулевая гипотеза отклоняется. Вычисление f-значения зависит от сложных вычислений, которые многие специалисты по данным выполняют с помощью компьютерного программного обеспечения.

Значение X2

Значение X2 получено из непараметрических корреляционных тестов, которые измеряют наличие причинно-следственной связи между переменными. Это значение также может сказать вам, отображают ли уже отношения две переменные, которые вы хотите использовать в статистическом анализе. Эта тестовая статистика становится полезной при подготовке переменных для тестирования в регрессионном анализе, поскольку нулевая гипотеза для значения X2 указывает на независимые выборки.

Как рассчитать тестовую статистику

Используйте следующие шаги, чтобы вычислить общую тестовую статистику из z-тестов и t-тестов:

1. Найдите исходные оценки населения.

Предположим, вы хотите выполнить z-тест, чтобы определить, равны ли средние значения двух совокупностей. Чтобы рассчитать z-оценку, найдите необработанные оценки для обеих групп населения, которые вы оцениваете. В качестве примера предположим, что исходный балл равен 95, с которым вы сравниваете популяции. Вы должны заменить это значение в формуле z-показателя следующим образом:

z = (95) – μ) / σ

2. Рассчитайте стандартное отклонение населения

Найдите стандартное отклонение оцениваемой совокупности. Найдите стандартное отклонение, вычислив квадратный корень из дисперсии. Например, если у вас есть дисперсия 64 для набора данных, стандартное отклонение будет равно восьми, потому что квадратный корень из 64 = 8. Когда вы найдете стандартное отклонение, подставьте его в формулу z-оценки. Используя исходную оценку из предыдущего примера, замените стандартное отклонение 16 на переменную σ в формуле:

г = (95) – мк) / 16

3. Рассчитайте среднее значение населения

Найдите среднее значение совокупности, сложив все значения данных и разделив эту сумму на количество значений данных в совокупности. Это значение заменяет переменную μ в формуле. Например, предположим, что вы подсчитали все точки данных в своей совокупности и получили сумму 18 346. Если у вас есть 468 значений в наборе данных, это дает вам среднее значение 39,2. Применение этого значения к формуле z-показателя со значениями из предыдущего примера приводит к следующему результату:

г = (95 – 39,2) / 16 = 3,4875

4. Оцените z-значение

Оценка z-показателя говорит вам о распределении данных в пределах изучаемой вами совокупности. Он показывает, на сколько стандартных отклонений от среднего значения разнесены точки данных. Если у вас есть стандартное отклонение, равное нулю, это означает, что необработанная оценка, которую вы тестируете, равна среднему значению. Положительное значение z показывает, что необработанная оценка выше среднего, а отрицательное значение z показывает, что необработанная оценка меньше среднего.

5. Примените формулу t-теста

Вы можете использовать t-тест для оценки выборки большей совокупности из предыдущих z-тестов. Применяя формулу t-значения, определите размер выборки, среднее значение выборки и стандартное отклонение выборки. Предполагая, что у вас есть размер выборки 50, среднее значение выборки 17 и стандартное отклонение 3,5 для выборки. Если среднее значение населения равно 78, примените формулу t-показателя, чтобы получить:

t = (X‾ – µ0) / (s / √n) =

t = (17 – 78) / (3,5 / √50) = (-61 / 24,745) = -2,465

6. Интерпретируйте результаты

Интерпретация результатов t-теста дает вам t-значение -2,465. Отрицательное значение t может указывать на изменение одной переменной из-за изменения направления другой. Это изменение направления также может показать отсутствие статистической значимости различий между различными тестируемыми образцами. Также важно определить, нужны ли дополнительные статистические тесты для типа данных, которые вы оцениваете. Например, z-критерий и t-критерий могут быть эффективными для анализа результатов экзаменов, в то время как для оценки f-значения может потребоваться выполнение нескольких типов дисперсионного анализа.

Часто задаваемые вопросы о тестовой статистике

Рассмотрим несколько часто задаваемых вопросов о тестовой статистике:

Как определить, какой статистический тест следует выполнить?

Важным соображением при выборе статистического теста для выполнения является гипотеза. Использование нулевой гипотезы для различных тестовых статистических данных может помочь вам определить, соответствуют ли измеряемые данные типу нулевой гипотезы, необходимой для проверки. Например, если вы хотите измерить разницу в вариации между двумя выборками, вы можете посмотреть, какая нулевая гипотеза поддержит ваши данные. В этом случае дисперсионный анализ для получения f-значения может быть наиболее подходящим, поскольку его нулевая гипотеза поддерживает то, что вы пытаетесь определить в данных.

Какие существуют t-тесты?

Существует три основных типа t-тестов, которые вы можете выполнить, в зависимости от типа изучаемых переменных. Например, при оценке одной выборочной группы с помощью парного t-критерия сравнивается выборочное среднее за определенный период времени или через заданное время. Еще один t-тест для отдельных групп — это одновыборочный t-критерий, который сравнивает выборочные средние значения со стандартными значениями. При исследовании двух выборочных групп больше подходит двухвыборочный t-критерий, так как он позволяет выполнять несколько парных тестов для разных групп.

Что означает стандартное нормальное распределение набора данных?

Стандартное распределение представляет собой ситуацию, в которой стандартное отклонение совокупности равно единице, а среднее значение равно нулю. При измерении нормального распределения вы конвертируете необработанные данные в z-значения, которые сообщают вам, на сколько стандартных отклонений от среднего нуля ваши данные. Другими словами, нормальное стандартное распределение — это метрика, которую вы можете сравнить с вашими z-значениями в наборе данных.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *