Как рассчитать статистическую значимость (плюс что это такое и почему это важно)

22 февраля 2021 г.

Если вы пытаетесь определить эффективность чего-либо, подумайте о расчете статистической значимости. Хотя он известен тем, что его преподают в курсовых работах по статистике, его можно использовать в самых разных отраслях, включая бизнес. В этой статье мы определяем статистическую значимость, ее важность и способы ее расчета вручную.

Что такое статистическая значимость?

Статистическая значимость относится к вероятности того, что взаимосвязь между двумя или более переменными не вызвана случайностью. По сути, это способ доказать надежность определенной статистики. Его двумя основными компонентами являются размер выборки и размер эффекта. При использовании статистической проверки гипотез результат набора данных может считаться статистически значимым, если вы достигли определенного уровня уверенности в результате. При проверке статистической гипотезы это означает, что гипотеза вряд ли возникла при наличии нулевой гипотезы. Согласно нулевой гипотезе между рассматриваемыми переменными нет связи.

Почему важна статистическая значимость?

Что касается бизнеса, статистическая значимость важна, потому что она помогает вам понять, что внесенные вами изменения можно положительно отнести к различным показателям. Например, если вы недавно внедрили новое приложение, чтобы повысить эффективность работы вашего офиса, статистическая значимость дает вам уверенность в том, что оно оказало положительное влияние на общий рабочий процесс вашей компании. То есть влияние приложения было статистически значимым и приносило пользу. Если окажется, что приложение не было статистически значимым, это означает, что ваши деловые деньги и приложение находятся под угрозой. Обязательно измерьте статистическую значимость каждого результата, чтобы получить более полный расчет и результат.

Чтобы помочь вам принимать бизнес-решения в будущем, рассмотрите возможность использования релевантности для бизнеса наряду со статистической значимостью. Это гарантирует, что ваши решения не будут основываться только на статистической значимости.

Как рассчитать статистическую значимость

Вычисление статистической значимости довольно обширно, если вы рассчитываете ее вручную, и поэтому ее обычно рассчитывают с помощью калькулятора. Однако, если вы рассчитаете его вручную, это поможет вам более полно понять концепцию. Вот шаги для расчета статистической значимости:

  1. Создайте нулевую гипотезу.

  2. Создайте альтернативную гипотезу.

  3. Определить уровень значимости.

  4. Определите тип теста, который вы будете использовать.

  5. Выполните анализ мощности, чтобы узнать размер выборки.

  6. Рассчитайте стандартное отклонение.

  7. Используйте стандартную формулу ошибки.

  8. Определите t-показатель.

  9. Найдите степени свободы.

  10. Используйте Т-таблицу.

1. Создайте нулевую гипотезу

Первым шагом в вычислении статистической значимости является определение вашей нулевой гипотезы. Ваша нулевая гипотеза должна утверждать, что нет существенной разницы между наборами данных, которые вы используете. Имейте в виду, что вам не нужно верить в нулевую гипотезу.

2. Создайте альтернативную гипотезу

Затем создайте альтернативную гипотезу. Как правило, ваша альтернативная гипотеза противоположна вашей нулевой гипотезе, поскольку она утверждает, что на самом деле существует статистически значимая связь между вашими наборами данных.

3. Определите уровень значимости

Ваш следующий шаг включает в себя определение уровня значимости или, скорее, альфы. Это относится к вероятности отклонения нулевой гипотезы, даже если она верна. Обычная альфа составляет 0,05 или пять процентов.

4. Определите тип теста, который вы будете использовать

Далее вам нужно определить, будете ли вы использовать односторонний или двусторонний тест. В то время как критическая область распределения односторонняя в одностороннем тесте, она двусторонняя в двустороннем тесте. Другими словами, односторонние тесты анализируют взаимосвязь между двумя переменными в одном направлении, а двусторонние тесты анализируют взаимосвязь между двумя переменными в двух направлениях. Если используемый образец попадает в одностороннюю критическую область, альтернативная гипотеза считается истинной.

5. Выполните анализ мощности, чтобы узнать размер вашей выборки.

Затем вам нужно будет провести анализ мощности, чтобы определить размер выборки. Анализ мощности включает размер эффекта, размер выборки, уровень значимости и статистическую мощность. Для этого шага рассмотрите возможность использования калькулятора. Этот тип анализа позволяет увидеть размер выборки, необходимый для определения эффекта данного теста с определенной долей уверенности. Другими словами, это позволит вам узнать, какой размер выборки подходит для определения статистической значимости. Например, если размер вашей выборки окажется слишком маленьким, это не даст вам точного результата.

6. Рассчитайте стандартное отклонение

Далее вам нужно рассчитать стандартное отклонение. Для этого вы будете использовать следующую формулу:

стандартное отклонение = √((∑|x−μ|^ 2) / (N-1))

куда:

∑ = сумма данных

х = отдельные данные

μ = среднее значение данных для каждой группы

N = общая выборка

Выполнение этого расчета позволит вам узнать, как распределить ваши измерения относительно среднего или ожидаемого значения. Если у вас есть более одной группы выборки, вам также необходимо определить дисперсию между группами выборки.

7. Используйте стандартную формулу ошибки

Далее вам нужно будет использовать стандартную формулу ошибки. Для наших целей предположим, что у вас есть два стандартных отклонения для ваших двух групп. Стандартная формула ошибки выглядит следующим образом:

стандартная ошибка = √((s1/N1) + (s2/N2))

куда:

s1 = стандартное отклонение вашей первой группы

N1 = размер выборки группы

s2 = стандартное отклонение вашей второй группы

N2 = размер выборки второй группы

8. Определить t-показатель

Для следующего шага вам нужно найти t-оценку. Уравнение для этого выглядит следующим образом:

t = ((µ1–µ2) / (sd))

куда:

t = t-оценка

µ1 = среднее значение группы

µ2 = среднее значение второй группы

sd = стандартная ошибка

9. Найдите степени свободы

Далее вам нужно определить степени свободы. Формула для этого следующая:

степеней свободы = (s1 + s2) – 2

куда:

s1 = образцы группы 1

s2 = образцы группы 2

10. Используйте Т-таблицу

Наконец, вы рассчитаете статистическую значимость, используя t-таблицу. Начните с просмотра левой стороны ваших степеней свободы и найдите свою дисперсию. Затем идите вверх, чтобы увидеть p-значения. Сравните p-значение с уровнем значимости или, скорее, с альфой. Помните, что значение р менее 0,05 считается статистически значимым.

Примеры статистической значимости

Рассмотрим следующие примеры статистической значимости:

Пример 1

Допустим, вы хотите привлечь больше клиентов в свой бизнес, поэтому решили запустить рекламную кампанию. При этом вы учитываете, сколько рекламы должно быть сделано в печати и сколько должно быть сделано в цифровом формате. Вы полагаетесь на прошлые рекламные кампании, чтобы спрогнозировать, сколько вам понадобится каждой из них. Если вы определите, что ваше p-значение выше 0,05 или 5%, вы получите результат, который не является статистически значимым. Это означает, что вероятность того, что взаимосвязь между двумя типами рекламы была оставлена ​​на волю случая, превышает 5%. Таким образом, этот результат указывает на то, что нецелесообразно использовать предыдущую рекламную кампанию в качестве ориентира.

Пример 2

Далее, предположим, вы создали новый дизайн веб-сайта компании в надежде привлечь больше клиентов. Вы определили, что после внедрения нового веб-сайта произошло статистически значимое увеличение числа клиентов. Ваш расчет статистической значимости дал p-значение 3% или 0,03. Учитывая, что он ниже 0,05, это статистически значимый результат, означающий, что увеличение количества клиентов не было случайным.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *