Что такое показатели качества данных? (плюс типы и использование)

10 сентября 2021 г.

Многие представители бизнеса, например менеджеры по продажам и руководители высшего звена, используют показатели качества данных, чтобы повысить производительность своей команды и добиться лучших результатов. Существует несколько типов метрик качества данных, и каждый из них предназначен для различных целей. Изучение метрик качества данных может помочь вам использовать их в своих командах. В этой статье мы обсудим определение метрик качества данных, опишем, как их можно использовать, и перечислим несколько типов, которые обычно используются в компаниях.

Что такое показатели качества данных?

Метрики качества данных — это индикаторы, которые можно использовать для оценки качества данных. Они часто предсказывают качество данных и могут дать сигнал к действию. Вы можете применять показатели качества данных в различных секторах, включая здравоохранение, науку, финансы, технологии и страхование.

Как используются показатели качества данных?

Вот список из трех способов использования метрик качества данных с объяснением каждого использования:

Чтобы установить целевые показатели качества данных

Возможно, вы захотите установить целевое значение качества данных после внутреннего аудита или жалобы клиента. Цель может помочь вам измерить успех инициативы по обеспечению качества данных за определенный период времени. Например, предположим, что ваш отдел обслуживания клиентов получает ряд жалоб от клиентов на неверную адресную информацию. Затем вы можете решить поставить перед собой цель улучшить качество адресов на 20 % в течение следующего квартала.

Для оценки качества данных

Вы можете выполнить оценку качества данных, изучив исторические записи и проанализировав имеющуюся у вас информацию о ваших клиентах и ​​ваших бизнес-процессах с течением времени. Этот обзор может выявить потенциальные проблемы и пути улучшения качества данных. Вы также можете настроить систему измерения для сбора и анализа данных о качестве имеющихся у вас данных.

Чтобы повысить ожидания клиентов в отношении обслуживания

Установив четкие целевые показатели качества данных, вы можете проинформировать свой персонал службы поддержки клиентов о проблемах качества данных, с которыми они могут регулярно сталкиваться. Чем лучше вы подготовлены, тем лучше вы сможете удовлетворить потребности клиентов. Например, вы можете сократить количество звонков в службу поддержки клиентов, связанных с информацией об адресе и учетной записи, установив цель по сокращению числа клиентов, сообщающих неверный адрес.

Типы показателей качества данных

Вот список нескольких типов метрик качества данных с описанием каждого типа:

Показатели точности

Эти показатели помогут вам оценить точность ваших данных. Точность данных — это мера того, насколько близко ваши данные соответствуют реальным фактам, которые они представляют. Чем более точными данными вы владеете, тем лучше вы сможете понять эту информацию. К таким типам показателей относятся:

  • Точность: этот показатель определяет долю фактических элементов данных, которые вы записываете или сохраняете. Например, если у вас есть 100 сотрудников, но вы записываете данные только о 80 сотрудниках, точность составляет 80 %.

  • Отзыв: Отзыв — это мера того, сколько элементов в списке существует и сколько из них имеет отношение к конкретным видам анализа. Вы можете рассчитать его как отношение между количеством правильных элементов и общим количеством элементов, соответствующих критериям, которые вы установили для сопоставления результатов.

  • Процентиль: Процентиль — это мера вероятности того, что значение в вашем наборе данных достигнет целевых значений. Например, если 90 % значений данных находятся в пределах одного процентиля выше или ниже целевого значения, вы можете определить, что ваши данные точны.

  • Стандартное отклонение: стандартное отклонение — это мера того, насколько большие или малые все значения в наборе отличаются от своего среднего или среднего значения.

Показатели целостности

Метрики целостности помогают оценить целостность ваших данных. Высокая целостность данных позволяет выполнять более точный анализ, позволяя лучше соответствовать ожиданиям ваших клиентов. Меры добросовестности включают в себя:

  • Аудит транзакций: Аудит транзакций измеряет, сколько транзакций не соответствуют всем определенным правилам. Например, если клиент заходит в страховую компанию и заполняет заявку, не указывая номер телефона, но позже получает телефонный звонок от компании, запрашивающей номер, приложение может иметь ошибку в процессе ввода данных.

  • Нулевые значения: Нулевые значения показывают, сколько значений в вашем наборе данных являются неполными или пустыми. Эта оценка может помочь вам определить области вашего процесса, где вы можете предоставить дополнительные рекомендации и обучение, чтобы гарантировать, что значения, которые вы собираете и анализируете, являются полными и точными.

  • Отсутствующие точки данных. Отсутствующие точки данных показывают, сколько отдельных случаев или записей не содержат всех необходимых элементов данных для определенного атрибута.

Показатели согласованности

Метрики согласованности помогают оценить, согласуются ли значения в вашем наборе данных со значениями, которые вы ранее записали и сохранили. Непротиворечивость позволяет улучшить качество данных, гарантируя неизменность всех данных. Эти меры включают:

  • Согласованность данных. Согласованность дат измеряет, сколько дат в наборе данных выходит за пределы их исторического диапазона.

  • Числовая согласованность. Числовая согласованность измеряет, сколько значений в наборе данных отличается от ожидаемого диапазона.

Показатели полноты

Метрики полноты помогают оценить полноту ваших данных. Полнота данных — это мера того, насколько данный набор данных является полным, точным и репрезентативным. Вы можете использовать эту оценку, чтобы выявить потенциальные пробелы в ваших данных и определить, как заполнить эти пробелы. Меры полноты включают:

  • Минимальное количество вхождений. Минимальное количество вхождений измеряет, сколько значений в наборе данных имеют меньше заданного количества вхождений.

  • Максимальное время задержки: Максимальное время задержки измеряет время между возникновением события и его записью в вашей системе.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *