Что такое выборочное распределение? Определение, факторы и типы
30 сентября 2021 г.
Статистические данные часто собираются и оцениваются, чтобы помочь компании узнать больше о своем рынке, продуктах или процессах. Распределение выборки, статистический инструмент, помогает рассчитать вероятность события путем повторной выборки небольшой группы субъектов, а не выборки всего населения. В этой статье мы объясним, что такое выборочное распределение, как оно используется и какие факторы влияют на его расчет.
Основные выводы
Выборочное распределение — это статистическая концепция, основанная на повторной выборке, проводимой внутри группы или «населения».
Распределение выборки изображается в виде графика, обычно имеющего форму колоколообразной кривой, на основе данных выборки.
Существует три типа выборочного распределения: среднее, пропорциональное и T-выборочное распределение.
Распределение выборки обычно использует для построения центральную предельную теорему.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Что такое выборочное распределение?
Выборочное распределение — это статистика, которая определяет вероятность события на основе данных небольшой группы в большой совокупности. Его основная цель состоит в том, чтобы установить репрезентативные результаты небольших выборок сравнительно большей совокупности. Поскольку совокупность слишком велика для анализа, выбирается меньшая группа и повторно отбирается или анализируется. Собранные данные или статистика используются для расчета вероятного возникновения или вероятности события.
Использование выборочного распределения упрощает процесс получения выводов или выводов о больших объемах данных.
Понимание распределения выборки
Идея выборочного распределения заключается в том, что когда у вас есть большой объем данных (собранных из большой группы), значение статистики из случайных выборок небольшой группы будет информировать вас о значении этой статистики для всей группы. отображается на графике, значения любой заданной статистики в случайных выборках образуют нормальное распределение, из которого вы можете делать выводы.
Каждая выбранная случайная выборка будет иметь различное значение, присвоенное изучаемой статистике. Например, если вы случайным образом выбираете данные три раза и определяете среднее или среднее значение для каждой выборки, все три средних значения, скорее всего, будут разными и попадут где-то на графике. Это изменчивость. Вы делаете это много раз, и в конечном итоге данные, которые вы рисуете, должны выглядеть как кривая колокола. Этот процесс представляет собой выборочное распределение.
Факторы, влияющие на распределение выборки
Изменчивость выборочного распределения может быть измерена либо стандартным отклонением, также называемым «стандартная ошибка среднего», или население дисперсия, в зависимости от контекста и выводов, которые вы пытаетесь сделать. Обе они представляют собой математические формулы, которые измеряют разброс точек данных по отношению к среднему значению.
На изменчивость выборочного распределения влияют три основных фактора. Они есть:
Число, наблюдаемое в популяции: эта переменная представлена значением «N». Это мера наблюдаемой активности в данной группе данных.
Число, наблюдаемое в образце: эта переменная представлена «n». Это мера наблюдаемой активности в случайной выборке данных, которая является частью большей группы.
Метод выбора выборки: то, как были отобраны выборки, может объяснить изменчивость в некоторых случаях.
Типы дистрибутивов
В статистике существует три стандартных типа выборочных распределений.
1. Выборочное распределение среднего
Наиболее распространенным типом выборочного распределения является среднее. Основное внимание уделяется вычислению среднего значения каждой выборочной группы, выбранной из совокупности, и построению точек данных. На графике показано нормальное распределение, где центр представляет собой среднее значение выборочного распределения, которое представляет собой среднее значение всей совокупности.
2. Выборочное распределение доли
Это распределение выборки фокусируется на пропорциях населения. Отбираются образцы и рассчитываются их пропорции. Среднее значение пропорций выборки из каждой группы представляет собой долю всего населения.
3. T-распределение
T-распределение — это выборочное распределение, включающее небольшую совокупность или такую, о которой мало что известно. Он используется для оценки среднего значения совокупности и других статистических данных, таких как доверительные интервалы, статистические различия и линейная регрессия. Т-распределение использует t-показатель для оценки данных, которые не подходят для нормального распределения.
Формула для t-показателя: t = [ x – μ ] / [ s / sqrt( n ) ]
В формуле «x» — это среднее значение выборки, а «μ» — среднее значение генеральной совокупности и означает стандартное отклонение.
Центральная предельная теорема
Центральная предельная теорема помогает в построении выборочного распределения. Теорема говорит, что нормальное распределение зависит от размера выборки. По мере увеличения количества групп выборки количество переменных или стандартная ошибка уменьшается.
Чтобы определить, достаточно ли велика ваша выборочная группа, рассмотрите следующее:
Требования к точности: самые точные выборочные распределения имеют достаточно выборок средних данных для создания кривой нормального распределения. Чем ближе к нормальному распределению визуализация выглядит на графике, тем точнее. Чем больше данных, тем лучше для точности выборочных распределений.
Форма исходной совокупности: если исходная совокупность очень похожа на кривую нормального распределения, потребуется меньше выборок для построения формы в выборочном распределении.
Исследователи данных обычно утверждают, что от 30 до 50 точек данных достаточно, чтобы получить правильное нормальное распределение. Однако если совокупность аномальна, например, так или иначе перекошена, потребуется больше выборок, чтобы получить желаемый результат от выборочного распределения.
Прочитайте больше: Как рассчитать необходимый размер выборки для вашего опроса или исследования