Часто задаваемые вопросы: что такое эмпирическое правило в логической статистике?
Логическая статистика фокусируется на вероятности событий, происходящих на основе данных наблюдений. В этом поле статистики также применяются принципы, которые определяют, как вы рассчитываете различные показатели в функциях вероятности. Эмпирическое правило — это один из принципов, которому часто следуют аналитики данных и статистики при структурировании параметров для исследований и анализа. В этой статье мы обсудим, что такое эмпирическое правило, как его использовать для вероятности, как рассчитать стандартное отклонение в соответствии с правилом и какие поля часто реализуют правило для статистического анализа.
Что такое эмпирическое правило?
Эмпирическое правило или правило трех сигм — это принцип, согласно которому почти все данные наблюдений в пределах нормального распределения должны находиться в пределах первых трех стандартных отклонений от среднего значения данных. Предполагая нормальное распределение данных вокруг среднего значения, вычисление эмпирической вероятности приводит к кривой нормального распределения, где вершина «колокола» является средним значением данных. Поскольку кривая наклонена вниз с обеих сторон, левая сторона графика представляет отрицательные стандартные отклонения, а правая сторона предполагает положительные стандартные отклонения. Используя это правило, стандартные отклонения следуют правилу «68-95-99,7», где:
Стандартные отклонения от нуля до одного содержат 68% данных для значений (0 – (-1)) и (0 – 1)
Одно-два стандартных отклонения содержат 95% данных для значений ((-1) – (-2)) и (1 – 2)
Два-три стандартных отклонения имеют 99,7% данных для значений ((-2) – (-3)) и (2 – 3)
Как использовать эмпирическое правило?
Это правило обычно используется при расчете эмпирической вероятности происходящих наблюдений, потому что эмпирический принцип всегда предполагает нормальное распределение. Таким образом, вы можете использовать правило для расчета кривой нормального распределения, где ваши данные попадают в каждое стандартное отклонение, поскольку оно следует правилу 68-95-99,7. В качестве примера предположим, что вы записываете свой пульс в состоянии покоя в течение семи дней. Согласно правилу эмпирической вероятности средняя частота сердечных сокращений находится в верхней части кривой, где:
Стандартное отклонение среднего равно нулю
34% частоты сердечных сокращений находятся в пределах (0 – (-1)) и (0 – 1) стандартных отклонений.
13,5% частоты сердечных сокращений находятся в пределах ((-1) – (-2)) и (1 – 2) стандартных отклонений.
2,35% частоты сердечных сокращений находятся в пределах ((-2) – (-3)) и (2 – 3) стандартных отклонений.
Если вы хотите рассчитать вероятность того, что ваш сердечный ритм попадет в определенный диапазон, вы можете построить график среднего значения и разделить кривую на стандартные отклонения в соответствии с правилом.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Как эмпирическое правило применяется в профессиональных областях?
Правило эмпирической вероятности одинаково применимо ко многим приложениям, поскольку это эффективный инструмент для оценки будущих результатов на основе данных, которые вы собираете в результате повторных наблюдений. Рассмотрим, как несколько профессий применяют эмпирические правила вероятности:
Финансы и бухгалтерский учет: финансовые аналитики часто применяют эмпирический принцип при создании прогнозов, поскольку они могут отслеживать финансовую историю и использовать статистический анализ для определения средних значений, стандартных отклонений и эмпирической вероятности для установления целей прибыльности.
Маркетинговая аналитика. Маркетинговые аналитики могут оценивать эмпирическую вероятность стратегий, которые они реализуют в кампаниях, используя данные о потребителях, чтобы прогнозировать будущие тенденции, которые могут помочь им улучшить интеграцию своих стратегий.
Здравоохранение: клинические исследователи часто используют эмпирическую вероятность в медицинских исследованиях, которые помогают специалистам в области здравоохранения понять потенциальные результаты таких вещей, как методы лечения и новые лекарства.
Образование: академические специалисты также применяют эмпирические правила для оценки результатов обучения учащихся и стандартизированные оценки для установления прогностических критериев, которые можно использовать для сравнения будущих результатов.
Технология: многие приложения в области данных и информатики полагаются на логическую статистику и эмпирическую вероятность для выполнения таких проектов, как создание автоматизированных систем, тестирование компьютерных программ и создание программного обеспечения.
Что такое нормальное распределение?
Нормальное распределение или распределение Гаусса относится к симметричному распределению данных относительно среднего значения. Это статистика вероятности, которая показывает, что больше наблюдений происходит ближе к среднему, чем дальше от среднего. Это распределение создает кривую колокола, когда вы строите график функции вероятности. В статистике нормальное распределение всегда предполагает такой разброс данных. Таким образом, применение правила эмпирической вероятности требует, чтобы любые данные, которые вы собираете, соответствовали этому параметру распределения.
Как определить стандартное отклонение?
Выполните следующие действия, чтобы рассчитать стандартное отклонение набора данных:
1. Найдите среднее значение
Вычислите среднее или среднее значение вашего набора данных. Это значение также появляется в верхней части кривой нормального распределения. Например, вычисление среднего значения набора данных {1,12, 1,34, 1,57, 1,89, 2,09} дает среднее значение (8,01/5) = 1,6.
2. Вычтите среднее значение из каждого значения
Получив среднее значение, найдите разницу между этим значением и каждым значением в вашем наборе данных. Вычитание дает вам новые значения, которые вы возьмете в квадрат позже. В примере набора данных и среднего значения 1,6 вычитание среднего значения из каждого значения дает {-0,48, -0,26, -0,03, 0,29, 0,49}.
3. Сократите каждую разницу
После того, как вы вычтете среднее значение из всех значений в выборке, возведите каждое из них в квадрат. Возводя число в квадрат, возведите его в степень двойки. Для примера набора данных возведение в квадрат каждой разницы дает {0,23, 0,06, 0,0009, 0,24}.
4. Найдите среднее значение квадратов разностей
Когда вы получите свои результаты, рассчитайте среднее значение каждого значения, которое вы возвели в квадрат. Это дает вам новое среднее значение, из которого вы берете стандартное отклонение. Вычисление приведенных в примере значений в квадрате дает новое среднее значение 0,53.
5. Вычислите квадратный корень из нового среднего
Стандартное отклонение должно находиться в пределах первых трех стандартных отклонений среднего исходного набора данных в соответствии с эмпирическим принципом. Чтобы определить это, возьмите квадратный корень из среднего значения, которое вы получили на предыдущем шаге. Использование примера 0,53 дает стандартное отклонение 0,73, которое появляется в пределах первых трех положительных стандартных отклонений от среднего значения.
Что является примером эмпирического правила?
Профессор хочет использовать правило эмпирической вероятности, чтобы определить, как результаты тестов распределяются в пределах кривой нормального распределения. Профессор находит среднее значение тестов и вычисляет стандартное отклонение. Если средний балл равен 80, а стандартное отклонение равно единице, кривая нормального распределения устанавливает:
80 как центр кривой
Первые три стандартных отклонения между (0–3) содержат баллы {81, 82, 83}.
Первые три стандартных отклонения между (0 – (-3)) содержат баллы {79, 78, 77}.
Поскольку первые три стандартных отклонения представляют собой правило 68-95-99,7, профессор определяет, что 68% экзаменов получают оценку от 79 до 81, 95% экзаменов получают оценку от 78 до 82 и 99,7% экзаменов получают оценку. между 77 и 83. Это означает, что вероятность получения на следующем экзамене 78,5 баллов составляет 95%.