Часто задаваемые вопросы: что такое описательная статистика? (с примерами)
26 августа 2021 г.
Описательная статистика применяется во многих различных приложениях. Компании, финансовые специалисты и аналитики данных полагаются на эту форму статистики для оценки различных показателей. Кроме того, если вы хотите наблюдать за различными характеристиками набора данных, описательная статистика предоставит вам инструменты, необходимые для организации ваших данных. В этой статье мы отвечаем на несколько часто задаваемых вопросов по описательной статистике, в том числе о том, что это такое, кто ее использует и какие типы измерений можно проводить с помощью описательной статистики.
Что такое описательная статистика?
Описательная статистика использует меры центральной тенденции для обобщения всей совокупности или выборочного набора данных. Этот тип статистики также дает представление об изменчивости или разбросе значений, беря эти меры из набора данных. Используя эти измерения, описательная статистика сосредотачивается на присвоении характеристик и конкретных параметров набору данных.
Кто использует описательную статистику?
Многие приложения в таких областях, как финансы, информатика, здравоохранение и бизнес, полагаются на описательную статистику. Несколько ролей, которые вы можете ожидать от работы с этими областями математики, включают:
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Аналитики данных
Аналитики данных — это профессионалы, которые полагаются на описательную статистику в своей повседневной работе. Они работают с различными типами данных, собирая и анализируя информацию, чтобы получить представление о конкретных темах исследования. Таким образом, описательная статистика является важным методом для аналитиков данных, позволяющим визуализировать необработанные данные таким образом, чтобы другим было легче их интерпретировать. При анализе необработанных данных аналитики отслеживают дескрипторы, обобщающие ключевые сведения о значениях, которые могут лучше показать отношения между точками данных.
Финансовые аналитики
Финансовые аналитики и инвесторы часто измеряют вариацию и основную тенденцию для анализа прибыльных инвестиционных возможностей. Биржевые маклеры, например, часто измеряют средние значения, дисперсию, максимальные и минимальные значения, чтобы определить акции, которые, скорее всего, принесут доход. Управляющие активами также являются профессионалами в области инвестиций, которые применяют описательную статистику для прогнозирования доходов своих клиентов.
Медицинские исследователи
В области медицины описательная статистика необходима для обобщения результатов фармацевтических исследований, результатов лечения и других приложений, связанных с медицинскими исследованиями. Возможность преобразовывать необработанные данные в осмысленные интерпретации позволяет исследователям в различных областях медицины поддерживать инновации и достижения в таких приложениях, как диагностика и лечение. Описательная статистика также необходима для анализа и понимания результатов, которые потенциальные медицинские приложения могут иметь для пациентов.
Инженеры
Инженеры многих специальностей часто используют описательную статистику для определения параметров различных проектов. Например, в гражданском строительстве инженер может полагаться на описательную статистику, чтобы спроектировать наиболее жизнеспособную структуру для своего клиента. Инженеры-программисты также применяют описательную статистику для разработки и реализации алгоритмов в программных приложениях. Инженеры в области естественных наук, такие как инженеры-биохимики, могут также использовать описательную статистику для проверки проектов, включающих химические и биологические процессы.
Программисты
Программисты в области машинного обучения используют описательную статистику для оценки данных, на которые опирается контролируемая система машинного обучения. Программисты анализируют наборы данных, чтобы определить наиболее точные алгоритмы для достижения желаемых результатов, которые они вводят в систему. Поскольку описательная статистика суммирует данные для интерпретации, программисты могут определить жизнеспособные подходы к организации и управлению данными кодирования в среде машинного обучения.
Бизнес-аналитики
Бизнес-аналитики используют описательную статистику для анализа различных процессов в своих организациях. Продажи, маркетинг и составление бюджета требуют статистической информации для принятия важных решений. Например, описательная аналитика в маркетинге может дать представление о средних расходах клиентов, покупательских тенденциях и успешных вариантах продуктов. Использование описательной статистики таким образом полезно для предприятий, чтобы получить представление о методах увеличения доходов и прибыльности.
В чем разница между дедуктивной и описательной статистикой?
Описательная статистика фокусируется только на преобразовании необработанных данных в измерения, которые предоставляют информацию о свойствах данной выборки данных. Как правило, вы берете меньшую выборку из большей совокупности и группируете эти данные в соответствии с различными описательными показателями. Этот процесс анализа и визуализации данных на графике не принимает во внимание какие-либо обобщения и не делает никаких выводов из данных. Напротив, логическая статистика стремится делать выводы и делать выводы о населении на основе случайной выборки населения.
Поскольку вы, по сути, проверяете гипотезу с помощью выводов о выборочном наборе данных, статистика выводов также требует определенных измерений для обеспечения точности. Коэффициент ошибки измеряет вероятность того, что гипотеза окажется неверной, а доверительный интервал представляет собой диапазон значений, между которыми может оказаться население. Логическая статистика также использует регрессионный анализ для проверки взаимосвязей между зависимыми и независимыми переменными, чтобы вычислить корреляционные и причинно-следственные связи.
Какие типы измерений существуют в описательной статистике?
В статистических подходах есть меры, которые вы можете предпринять, чтобы узнать больше о наборе данных. В описательной статистике различают четыре основных типа показателей:
1. Центральная тенденция
Центральная тенденция важна для описательной статистики, поскольку она включает в себя важную информацию о наборе данных. Важным показателем в этом типе измерения является среднее или среднее значение. Хотя понимание того, как точки данных собираются в медиану и повторяются в режимах, важно, применение среднего значения к выборке особенно полезно для центральной тенденции. Аналитики данных, желающие понять наиболее распространенный ответ на опрос, будут измерять среднее значение набора данных. Затем медиана и мода могут показать аналитикам места на графике, где значения собираются больше всего и какие значения имеют тенденцию повторяться.
2. Позиция
Измерения положения дают расположение точек данных в наборе по отношению друг к другу. Измерения позиций в описательной статистике ранжируют значения данных в соответствии с ранжированием квартилей и процентилей. Использование позиции в описательной статистике становится необходимым при сравнении значений данных со стандартизированной метрикой, такой как результаты тестов.
3. Частота
Частота представляет скорость, с которой конкретное значение данных встречается в наборе данных. Этот тип измерения полезен в приложениях, регистрирующих бинарные результаты, например опрос с ответами «да» и «нет». Частота также подсчитывает значения, встречающиеся в заданном наборе данных. Расчет процентов, ставок или отношений из набора данных в описательной статистике часто требует измерения частоты.
4. Вариант
Вариация описательной статистики измеряет разброс точек в наборе данных. Этот спред может рассказать вам о диапазоне, который представляет собой разницу между максимальной и минимальной точками данных. Показатели вариации также включают стандартное отклонение, которое показывает разницу между наблюдаемыми данными и средним значением данных. Показатели вариации важны при измерении того, насколько разнесены точки данных в наборе. Если значения настолько разбросаны, что это влияет на среднее значение, дисперсия в описательной статистике показывает, где этот эффект проявляется в данных.
Каковы некоторые примеры описательной статистики?
Для дополнительного понимания работы с четырьмя типами измерений в описательной статистике в приведенных ниже примерах показано, как применять каждую меру для примерного набора данных экзаменационных баллов {66,3, 65, 66,7, 63, 72, 89,4, 77,1, 72, 34, 72, 79.2, 83}:
Меры центральной тенденции пример
Измерение центральной тенденции требует упорядочения значений в наборе данных от наименьшего к наибольшему. Используя экзаменационные баллы {66,3, 65, 66,7, 63, 72, 89,4, 77,1, 72, 34, 72, 79,2, 83}, расположив значения в порядке {34, 63, 65, 66,3, 66,7, 72, 72, 72, 77.1, 79.2, 83, 89.4}. После того, как значения расположены в числовом порядке, вы можете принять каждую меру центральной тенденции как:
Среднее: сложите все значения вместе и разделите на количество значений в наборе. Используя экзаменационные баллы, это дает (34 + 63 + 65 + 66,3 + 66,7 + 72 + 72 + 72 + 77,1 + 79,2 + 83 + 89,4) ÷ 12 = 839,7 ÷ 12 = 69,975 = 70.
Медиана: Медиана — это значение, которое находится в центре набора данных. Поскольку на экзамене 12 баллов, медиана становится средним значением двух значений в центре, в результате чего получается (72 + 72) ÷ 2 = 72.
Режим: режим представляет значение в наборе, которое встречается чаще всего. В примерных экзаменационных баллах 72 — это мода.
Пример положения измерения
Используя описательную статистику, вы можете определить позиции экзаменационных баллов при построении этих значений на графике. Нахождение ранга процентиля требует знания процентиля значения, а ранг квартиля использует межквартильный диапазон для присвоения позиций экзаменационным баллам в каждой четверти набора. Нахождение процентилей и квартилей в этом случае приведет к:
Процентильный ранг: Процентильный ранг показывает процент оценок, попадающих на определенный балл или ниже него. Поскольку существует 12 экзаменационных баллов, процентиль 65 баллов будет находиться в пределах 25-го процентиля, а балл 79,2 будет в пределах 75-го процентиля.
Квартильный ранг: нахождение межквартильного диапазона дает 12,5, что описывает разницу между оценками в 75-м и 25-м квартилях. При применении статистических формул для ранжирования квартилей это показывает, что первый квартиль заканчивается на 65,65, второй квартиль заканчивается на 72, третий квартиль заканчивается на 78,15 и четвертый квартиль заканчивается на 89,4.
Пример измерения частоты
Измерение частоты значения в наборе данных включает в себя вычисление процента случаев появления определенного значения. Используя режим экзаменационных баллов, вы можете рассчитать скорость, с которой 72 балла выпадают из каждых 12 экзаменационных баллов. Поскольку 72 балла встречаются три раза из 12, частота измеряется как (3 повторных балла) ÷ (12 баллов) = 0,25, или 25% частота появления 72 баллов на экзамене.
Пример меры вариации
Дисперсия и разброс необходимы для понимания того, насколько далеко друг от друга отличаются результаты экзаменов. Используя формулы для расчета диапазона и стандартного отклонения, вы можете применить дисперсию к экзаменационным баллам {34, 63, 65, 66,3, 66,7, 72, 72, 72, 77,1, 79,2, 83, 89,4} следующим образом:
Диапазон: найдите минимальное и максимальное значения и вычтите разницу. Максимальный балл в наборе — 89,4, а самый низкий — 34, в результате чего получается диапазон (89,4 — 34) = 55,4.
Стандартное отклонение: стандартное отклонение говорит вам о среднем интервале разброса между значениями. Чтобы найти стандартное отклонение экзаменационных баллов, вычислите квадраты разностей каждого значения и найдите среднее значение этих значений, в результате чего получится (1296 + 49 + 25 + 13,69 + 10,89 + 4 + 4 + 4 + 50,41 + 84,64 + 169). + 376,36) ÷ 12 = (2086) ÷ 12 = 173.
Максимум и минимум: наивысший балл в наборе является максимальным, а самый низкий балл в наборе — минимальным. Таким образом, максимальное значение для примера набора данных составляет 89,4, а минимальное — 34.