Как рассчитать P-значение в Excel, используя два метода
Математики, физики и другие специалисты работают с данными, чтобы узнать об общих тенденциях и рассчитать вероятности и статистику. Проверка этих наборов данных на статистическую дисперсию и измерение того, насколько два набора данных различаются по сравнению друг с другом, может стать важным шагом в понимании ваших данных.
Р-значение — это метод, который можно использовать для измерения разницы между ожидаемым результатом значений и наблюдаемым результатом значений. В этой статье мы обсудим, что такое p-значение, рассмотрим функции Excel, связанные с p-значением, и рассмотрим два метода его вычисления в Excel с примерами.
Что такое p-значение?
P-значение, или значение вероятности, является статистической мерой того, является ли стандартное отклонение или среднее значение установленного распределения данных больше, меньше или равно наблюдаемым значениям. Когда вы вычисляете p-значение, чем ниже результат вычисления, тем более статистически значима измеренная вами точка данных. Это означает, что данные с большей вероятностью подтверждают, что нулевая гипотеза ложна, а альтернативная гипотеза верна, если:
Значимость: измеренная разница между ожидаемым результатом и фактическим результатом в статистике.
Нулевая гипотеза: Гипотеза по умолчанию утверждает, что существует нулевая (нулевая) вариация между ожидаемым результатом и измеренными данными.
Альтернативная гипотеза: Гипотеза, выдвигаемая при наличии статистической разницы между ожидаемыми и наблюдаемыми результатами.
Ниже приведены общепринятые измерения статистической значимости в Excel:
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Незначительно: более 0,10
Незначительно значимо: меньше или равно 0,10 и больше 0,05.
Значимый: меньше или равно 0,05
Функции Excel, связанные с p-значением
В базовую программу Excel включена одна функция, которую можно использовать для расчета p-значения. Чтобы использовать функцию, вы можете ввести формулу:
=T.TEST(массив 1, массив 2, решка, тип)
Где:
T.Test – это имя функции
Массив 1 — это диапазон ячеек первого набора данных.
Массив 2 — это диапазон ячеек второго набора данных.
Хвосты – это количество хвостов распределения
Тип — это тест, который вы хотите выполнить
Последние два элемента списка выше, хвосты и тип, имеют правила, которые вы должны помнить при использовании функции. Для решек существуют односторонние распределения, и в этом случае вы должны ввести в формулу «1», и двусторонние распределения, в которых вы должны ввести в формулу «2». Вы можете использовать двусторонние тесты для данных, которые следуют нормальному распределению, также называемому “гауссовой кривой”, и вы можете использовать одностороннее распределение для других типов распределений.
Раздел типа формулы относится к нескольким видам анализа p-значения, которые вы можете выполнить:
Равная дисперсия для двух выборок: тип теста p-значения, который можно использовать для измерения средних значений обеих выборок данных с предположением, что их дисперсии близки к равным.
Неравная дисперсия для двух выборок: тип теста p-значения, который можно использовать для измерения средних значений обеих выборок данных с предположением, что их дисперсии различны.
Парный: тип теста p-значения, который можно использовать для измерения средних значений двух связанных наборов данных. Например, набор данных, включающий зависимую и независимую переменную, например количество продаж по сравнению со значениями продаж того же продукта.
Как рассчитать p-значение в Excel
Ниже приведены два метода расчета p-значения в Excel. Каждый метод дает одинаковый результат, но первый дает больше контроля над данными, а второй более эффективен:
Как найти p-значение с помощью инструмента t-test из «Пакета инструментов для анализа»
Использование инструмента t-test из «Пакета инструментов анализа» имеет два основных аспекта: загрузка дополнительной программы и последующий запуск теста. Ниже приведены шаги, которые вы можете использовать, чтобы помочь вам рассчитать p-значение с помощью этого метода. Чтобы скачать инструменты:
Нажмите «Файл» в списке вкладок на ленте в верхней части страницы.
Нажмите «Параметры» на боковой панели в левом нижнем углу окна.
Нажмите «Надстройки» на боковой панели в левом нижнем углу окна.
Выберите «Надстройки Excel», чтобы открыть окно дополнений к Excel.
Нажмите «Перейти», чтобы запустить окно надстроек Excel.
Проверьте «Пакет анализа», чтобы выбрать программы с функциями t-теста.
Нажмите «ОК», чтобы добавить новые инструменты в программу Excel.
После установки новых инструментов анализа данных вы можете выполнить следующие шаги, чтобы рассчитать p-значение:
Введите образцы данных в электронную таблицу Excel.
Щелкните вкладку «Данные» на ленте в верхней части программы Excel.
Щелкните значок «Анализ данных» в группе «Анализ».
Выберите «t-тест: два образца в паре для средних значений» и нажмите «ОК».
Введите диапазоны ячеек, в которых вы сохранили две выборки данных, в поля с пометками «Диапазон переменной 1» и «Диапазон переменной 2».
Оставьте поле «Гипотезированная средняя разница» пустым.
Установите флажок «Ярлыки», если ваши данные содержат ярлыки.
Введите альфа-значение в поле с надписью «Альфа».
Выберите, где вы хотите, чтобы ваши данные отображались, используя раздел «Параметры вывода».
Как найти p-значение с помощью функции T.TEST
Использование функции T.TEST, которая входит в базовую программу для Excel, может быть проще, особенно если у вас уже есть подготовленная информация. Ниже приведены шаги, которые вы можете использовать для расчета p-значения с помощью функции T.TEST:
Введите образцы данных в электронную таблицу Excel.
Соберите количество хвостов и тип t-теста, который вы хотите выполнить.
Используйте формулу =T.TEST(массив 1, массив 2, хвосты, тип.)
Например, если у вас есть один набор данных в ячейках с B2 по B15, а другой — в ячейках с C2 по C15, вы можете ввести одностороннюю функцию следующим образом:
=Т.ТЕСТ(B2:B15, C2:C15, 1, 1)
Вы также можете ввести двустороннюю функцию как:
=Т.ТЕСТ(B2:B15, C2:C15, 2, 1)
Примеры расчета p-значения в Excel
Ниже приведены два примера расчета p-значения в Excel:
Пример использования инструмента t-test из «Пакета инструментов анализа» после установки
Используя два набора выборочных данных ниже, вы можете запустить t-тест для расчета p-значения с помощью инструмента t-test:
Пример один: {12, 32, 23}
Второй образец: {14, 11, 95}
Сначала вставьте данные в электронную таблицу Excel. Например, в таблице ниже показаны два набора данных:
А Б 1 12 14 2 32 11 3 23 95
После того, как вы введете образцы данных в электронную таблицу, вы можете выбрать вкладку «Данные» и выбрать параметр «Анализ данных» в группе «Анализ», который откроет окно с параметрами, которые вы можете выбрать. В этом окне вы можете выбрать параметр «t-Test: два образца в паре для средних значений», чтобы открыть диалоговое окно.
В поле «Переменная 1» введите диапазон ячеек A1:A3. В поле «Переменная 2» введите диапазон ячеек B2:B3. Для этих данных не было меток, поэтому флажок «Ярлыки» можно не устанавливать. Для этих данных вы можете ввести альфа-значение 0,05 в поле «Альфа». Наконец, вы можете ввести диапазон ячеек для данных, которые будут отображаться, используя формат $C1$C3, чтобы обеспечить видимость данных. Этот тест дает значение 0,11, что является статистически незначимым.
Пример использования функции Т.ТЕСТ
Вы также можете рассчитать p-значение, используя функцию T.Test. Ниже приведен пример выполнения этого расчета с использованием этого метода:
Пример один: {43, 15, 36}
Второй образец: {37, 1023, 2}
Сначала вставьте данные из образцов в электронную таблицу Excel. Ниже приведена таблица, в которой показаны эти данные:
А Б 1 43 37 2 15 1023 3 36 2
=Т.ТЕСТ(A1:A3, B1:B3, 1, 1)
Это дает вам p-значение 0,22, что статистически незначимо, а это означает, что нулевая гипотеза, вероятно, верна.
Обратите внимание, что ни одна из компаний или продуктов, упомянутых в этой статье, не связана с компанией Indeed.