Что такое систематическая выборка? (Определение и примеры)
Когда вы изучаете большую совокупность или группу, важно иметь выборочную совокупность, репрезентативную для целого. Точная выборка может привести к результатам, которые будут более информативными и лучше применимыми к бизнес-деятельности, такой как маркетинг и продажи. Систематическая выборка — это один из способов создания случайной выборки, которая может дать репрезентативные результаты. В этой статье мы объясним, что такое систематическая выборка, покажем, как создать выборку с помощью этого метода, обсудим оптимальные условия для его использования, рассмотрим некоторые его преимущества и недостатки и приведем примеры.
Определение систематического отбора проб
Систематическая выборка — это метод вероятностной выборки, при котором вы определяете членов своей выборки на основе случайной начальной точки и интервала выборки или постоянного расстояния между точками. В данном случае под расстоянием понимается количество людей, отсчитанное от предыдущего. Например, представьте, что у вас есть список из 100 человек, с которыми вы можете взять интервью. Случайной отправной точкой является третий человек, а интервал выборки равен 10. Вы бы начали с опроса третьего человека в списке. Следующим интервьюируемым будет десятый человек после этого — тринадцатый человек в списке — и так далее.
Чтобы использовать систематическую выборку, вы должны выбрать целевую совокупность на основе характеристик, подходящих для функции проводимого вами исследования. Например, если вы проводите исследование рынка для компании, которая продает одежду для скейтбординга, вы можете ориентироваться на городских или пригородных подростков, которые катаются на скейтборде. Систематическая выборка работает лучше всего, когда вы знаете размер выборки. Учитывая параметры этого метода, указание общего числа людей для выбора является полезной основой для формирования выборки.
Как создать выборку, используя систематическую выборку
Чтобы создать выборку с использованием метода систематической выборки, выполните следующие действия:
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Определите свое население. В идеале члены вашей выборки должны обладать характеристиками, подходящими для вашего исследования.
Определите идеальный размер выборки. Размер выборки – это количество людей из всего населения. Он должен быть достаточно большим, чтобы получить репрезентативные результаты, но достаточно маленьким, чтобы его можно было осуществить.
Присвойте номер каждому члену аудитории. Например, если ваше население состоит из 800 человек, первым человеком в списке будет один, а последним — 800.
Определите интервал выборки. Чтобы вычислить идеальный интервал выборки, разделите размер совокупности на размер выборки, округлив частное в меньшую сторону, если это не целое число. Например, если размер вашей выборки составляет 90 человек в популяции из 1000 человек, интервал выборки будет равен 11, а не 11,1.
Случайным образом выберите начальную точку. Для выполнения этого шага может помочь использование генератора случайных чисел.
Выберите членов выборки в соответствии с интервалом выборки. Если ваша начальная точка равна пяти, а ваш интервал выборки равен 10, первый член вашей выборки будет пятью, ваш второй будет 15, ваш третий будет 25 и так далее.
Когда следует использовать систематическую выборку?
Систематическая выборка является эффективным методом выборки, который можно использовать при любом или всех следующих обстоятельствах:
Вы знаете численность населения
Количество людей в совокупности, которую вы хотите включить в выборку, является важным фактором для определения интервала выборки, поэтому важно работать с полным набором данных, например со списком всех потенциальных членов. Например, если вы планируете опросить или опросить всех людей, живущих в определенном районе, вы можете легко определить полный список людей, которые там живут. С другой стороны, гораздо сложнее предсказать количество людей, которые могут войти в магазин в определенный день.
Ваше население велико
Большие популяции помогают обеспечить более статистически значимые результаты, предоставляя большее количество идей. Наличие большего количества данных для интерпретации увеличивает вероятность уникальных ответов и снижает риск систематической ошибки. Например, в популяции из 50 000 человек выборка каждого десятого человека позволяет собрать ответы от 5 000 участников, в то время как популяция в 500 человек с тем же интервалом выборки даст 50 участников. Вероятность получения кластеров общих мнений уменьшается с увеличением числа участников, поэтому группа из 5000 человек имеет больший потенциал для получения точных результатов.
У вашего населения нет шаблона
Отсутствие значимых общих характеристик между интервалами вашей совокупности увеличивает вероятность случайности в вашей выборке и, следовательно, точность ваших результатов. Например, алфавитный список из 2000 имен был бы идеальным для систематической выборки, потому что нет оснований полагать, что люди в списке имеют какие-либо предубеждения, связанные с их именами.
Напротив, представьте, что вы хотите опросить сотрудников компании, чтобы узнать их мнение о корпоративной культуре. У вас есть список, в котором сотрудники упорядочиваются по командам. Каждая команда состоит из 10 человек, при этом руководитель каждой команды указан первым. В этом случае интервал выборки, равный 11, может привести к систематической ошибке, поскольку вы будете опрашивать только руководителей, которые могут иметь иное представление о культуре труда, чем их младшие.
Преимущества систематического отбора проб
Систематическая выборка привлекательна для исследователей, поскольку она дает ряд преимуществ по сравнению с другими методами выборки. Это включает:
Простота
Интервалы выборки следуют базовой математической формуле, в которой вы делите целевую совокупность на определенный размер выборки. Простота является желательной характеристикой, поскольку она снижает вероятность искажения набора данных в результате сложной модификации. В результате систематическая выборка может дать точные и значимые результаты.
Применимость
Пока вы работаете с полным набором данных без закономерностей, вы можете применять систематическую выборку для создания эффективной репрезентативной выборки. Напротив, другие методы выборки, такие как стратифицированная выборка, которая требует разделения членов на подгруппы, могут потребовать узкого круга обстоятельств, которым могут соответствовать не все совокупности.
Случайность
При условии, что между интервалами в популяции не существует закономерностей, существует высокая вероятность получения действительно случайной выборочной популяции. Случайность имеет важное значение в выборке, потому что она помогает предотвратить предвзятость за счет включения мнений самых разных людей. Систематическая выборка может помочь достичь этого разнообразия, потому что она выбирает одинаково из каждой области набора данных.
Проблемы использования систематической выборки
Есть также некоторые опасения по поводу систематического отбора проб, которые влияют на его практичность в качестве метода отбора проб. Это включает:
Неполные наборы данных
При использовании систематической выборки исследователи исходят из предположения, что размер популяции поддается количественному измерению. Когда существуют определенные данные о численности популяции, размер поддается измерению, но некоторые популяции могут не соответствовать этому критерию. Если общее количество популяции невозможно определить, исследователи должны сначала приблизить популяцию, прежде чем применять формулу для определения интервала выборки. В этом случае целостность результатов зависит от точности аппроксимации.
Возможность предвзятости
Как уже упоминалось, для получения случайной выборки идеальна организация без шаблонов. Однако, если закономерности существуют, это может привести к искажению результатов. Например, вы можете захотеть опросить всех жителей многоквартирного дома об их жилищных условиях, и вы рассчитываете интервал выборки, равный 21. Однако, если на этаже 20 квартир, причем первые две и две последние квартиры соответствуют более крупным угловые квартиры, результаты не учитывают мнение тех, кто живет в меньших, возможно, менее привлекательных квартирах.
Возможность манипулирования данными
При систематической выборке существует возможность манипулирования данными для получения результата. Исследователи потенциально могут манипулировать данными несколькими способами, например, устанавливая свои собственные отправные точки или выбирая неточный размер выборки. Если такие манипуляции произойдут, результаты будут подлежать тщательному анализу и не будут репрезентативными для населения.
Примеры систематического отбора проб
Рассмотрим следующие примеры, чтобы получить более четкое представление о систематической выборке:
Пример первый
Вы проводите опрос сотрудников сети ресторанов об условиях труда. В национальном масштабе сеть насчитывает 20 000 сотрудников. Вы составляете список всех их имен, организованных в алфавитном порядке, чтобы исключить любые шаблоны, и решаете, что 10% всего населения — 2000 сотрудников — является репрезентативным размером выборки. Чтобы определить интервал выборки, вы делите 20 000 на 2 000, чтобы получить частное 10. Затем вы используете генератор случайных чисел, чтобы выбрать начальную точку, равную восьми. Таким образом, начиная с восьмого сотрудника в списке, вы отправляете опрос каждому десятому сотруднику.
Пример второй
Фабрика ручек проводит контроль качества образцов своих ручек, чтобы убедиться, что они не имеют дефектов. Фабрика стабильно выпускает 100 000 шариковых ручек каждый день. Поскольку проверка большей выборки ручек остается рентабельной, размер выборки составляет 15% от всех произведенных ручек, что составляет 15 000 ручек. Разделение общего результата на размер выборки равно примерно 6,66, поэтому интервал выборки равен шести. Группа контроля качества случайным образом начинает с двенадцатого станка и после этого проводит проверку качества на каждом шестом станке.
Пример третий
Компания по производству кроссовок хочет провести опрос о мнении потребителей о бренде. Он решает определить свое население на основе количества людей, которые подписываются на информационный бюллетень компании, что составляет 23 421 человек. Исследователи выбирают размер выборки в 2300 человек, что составляет примерно 10% населения, округляя до ближайшей сотни. Это число, разделенное на 2300, равно 10,18, которое округляется до 10. Исследователи организуют список подписчиков в алфавитном порядке и случайным образом генерируют начальную точку 10. Оттуда они отсчитывают каждого десятого подписчика.
Позже становится очевидным, что в методологии были недостатки. Например, у всех представителей населения была общая закономерность в том, что они достаточно хорошо отзывались о компании, чтобы подписаться на ее информационный бюллетень. Это может указывать на предвзятость результатов. Кроме того, присутствовал элемент манипуляции с данными, так как исследователи решили округлить население в меньшую сторону.