Определение числовых данных: типы и характеристики
Числовые данные — это информация в числовой форме, например, прибыль, количество посетителей и проданная продукция. Предприятия могут использовать эти данные для определения степени удовлетворенности клиентов, отслеживания коэффициентов рентабельности и тестирования продуктов. Измерение этих данных без эмоциональной предвзятости также может помочь компаниям создавать продукты и услуги, учитывающие рынок. В этой статье мы обсудим числовые данные, включая их подтипы, характеристики и их сравнение с категориальными данными.
Что такое числовые данные?
Числовые данные или количественные данные — это процесс, который использует статистику для измерения и преобразования письменных числовых цифр в пригодные для использования данные, которые всегда встречаются в числовой форме, а не в виде слов или фраз. Поскольку эти данные лучше всего извлекать из чисел, они наиболее полезны для получения такой информации, как рост, вес и размеры стопы. Математические операции, такие как сложение и вычитание, также могут манипулировать числовыми данными для создания графиков, диаграмм и диаграмм.
Типы числовых данных
Вот два основных типа числовых данных, которые следует учитывать:
Дискретные данные
Дискретные данные — это любые данные, которые вы считаете и можете разделить на более мелкие части, где каждый элемент имеет уникальное значение. Поскольку наборы данных принимают только определенные значения, характерные для измеряемых данных, убедитесь, что эти значения дискретны или фиксированы. Например, если бортпроводник хочет записать общее количество подростков на рейсе, он должен включить в список всех молодых людей определенной возрастной группы.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Исследователи могут пойти еще дальше и разделить дискретные данные на два типа списков, называемых конечными и бесконечными. Конечный список имеет определенное начало и конец, тогда как бесконечный список бесконечен и не имеет четкого начала или конца. Гистограммы часто представляют этот тип данных и используются для демонстрации таких данных, как ежемесячная прибыль или количество участников конференции.
Непрерывные данные
Наборы непрерывных данных содержат бесконечный набор значений по сравнению с фиксированным набором значений дискретных данных и могут содержать множество чисел, которые могут меняться со временем, в зависимости от того, что измеряется. Например, дневные температуры часто колеблются в зависимости от времени суток, географического положения и времени года.
Характеристики числовых данных
Вот некоторые характеристики числовых данных:
Легко манипулировать: этот тип данных позволяет легче манипулировать числовыми данными, используя базовую арифметическую математическую формулу, которая включает сложение, вычитание, умножение и деление.
Обычно перечисляются и оцениваются: исследователи могут оценивать неточные числовые данные, такие как средний балл. Например, если средний балл учащегося равен 3,456712, но его необходимо округлить до двух знаков, он будет равен 3,46.
Обычно устойчивые интервалы: разница между каждым интервалом на числовой шкале данных постоянна. Например, разница между 50 и 60 долларами такая же, как разница между 60 и 70 долларами, то есть разница между ними составляет 10 долларов.
Легко анализируется: исследователи используют логические и описательные статистические методы для анализа числовых данных. Например, владельцы бизнеса используют статистический анализ для отслеживания тенденций продаж.
Легко визуализируется: для визуализации числовых данных используются различные методы. Точечные диаграммы, гистограммы, точечные диаграммы и гистограммы являются наиболее распространенными визуализациями, используемыми с числовыми данными.
Категориальные и числовые данные
В отличие от числовых данных, которые представляют числа, категориальные данные представляют группы или категории. Категориальные данные, также известные как качественные данные, представляют собой описательный способ выражения информации с использованием языка, а не чисел. Примеры категорийных данных могут включать вкусы мороженого, цвет волос, пол и национальность. Вот некоторые различия между категориальными и числовыми данными:
Шкала данных
Категориальные данные не имеют стандартной шкалы измерения, а четкие характеристики позволяют разделить категориальные данные на группы. Примеры категориальных шкал данных включают «да» или «нет» и числа, такие как опросы. Цифровые шкалы имеют стандартную шкалу, основанную на числовой прямой. Числовая шкала может иметь четко определенные начальную и конечную точки или быть бесконечной.
Дескрипторы
Категориальные данные используют дескрипторы естественного языка, такие как «наиболее вероятно» или «часто», а в некоторых наборах используются числовые значения, например 1 для женатых и 2 для холостых. Однако категориальные данные не поддаются вычислению. Наборы числовых данных используют конкретные числа и поддаются вычислению. Примеры наборов числовых данных включают стоимость в долларах, размер прибыли и количество сотрудников.
Структура
Категориальные наборы данных бывают неструктурированными или полуструктурированными. Наборы неструктурированных данных являются качественными и не используют статистический анализ. Полуструктурированные наборы данных имеют несколько последовательных характеристик, но не имеют жесткой структуры, необходимой для анализа в реляционной базе данных. Например, поисковые системы используют индексирование для создания полуструктурированных категориальных наборов данных, облегчающих поиск в Интернете. Наборы числовых данных имеют структуру. Электронные таблицы и другие базы данных структурируют числовые данные, обеспечивая возможность математических операций и быстрый доступ к информации.
Визуализация
Круговые и гистограммы могут сделать категориальные данные видимыми путем сопоставления типов категорий графиков с количеством каждой категории. Например, столбчатая диаграмма может отображать количество мармеладок каждого цвета в пакете, чтобы предоставить категориальные данные. Диаграммы рассеивания, диаграммы стеблей и листьев, точечные диаграммы и гистограммы могут сделать числовые данные видимыми. Эти методы визуализации показывают отношения между переменными данных и трендами данных. Например, точечная диаграмма может отображать средние температуры за год для отображения числовых данных.
Методы сбора
Важно понимать, какой процесс использовать при сборе данных. Оба имеют свой собственный метод сбора информации и использования этих данных. Вы можете собирать категориальные данные для опросов и анкет, которые включают открытые вопросы или вопросы с несколькими вариантами ответов. Вы можете собирать числовые данные, используя математические методы, чтобы получить конкретный счет или узнать температуру снаружи.
Анализ данных
Важно отметить, что с категориальными данными методы статистического анализа не работают. Даже если числа используются для представления категорий, они не имеют реальной математической ценности. Например, в опросах удовлетворенности гостей может использоваться числовая шкала от 1 до 5, однако эти числа не поддаются вычислению. Однако числовые данные можно вычислить, чтобы получить фактическое количество проверенных данных.
Использование данных
Исследователи бизнеса используют категориальные данные, чтобы понять мнение потребителей и собрать личную информацию, такую как возраст, годовой доход и размер семьи. Однако числовые данные используются для разработки статистики посредством расчетов. Врачи также собирают числовые данные, когда измеряют показатели жизнедеятельности пациента.
Примеры числовых данных
Вот несколько примеров числовых данных:
Перепись населения США
Федеральное правительство проводит полный учет всех жителей Соединенных Штатов, используя числовые данные, собранные в ходе переписи населения. Это позволяет правительству понять общую численность населения страны и демографическую разбивку. Перепись также помогает правительствам штатов и местным органам власти принимать соответствующие экономические решения для людей, живущих в их районе. Перепись также является примером дискретных числовых данных.
Время
Время — хороший пример непрерывных числовых данных. Если вы измеряете в годах, днях, часах, минутах или секундах, время всегда имеет числовое значение и может состоять из отдельных более мелких частей. Создание расписания между проектами, установка будильника или автоматические платежи по счету — это измерения времени, используемого ежедневно.