Как рассчитать процентиль шаг за шагом (и примеры)

При оценке тестов или других наборов важных значений исходного числа не обязательно достаточно, чтобы связать оценки друг с другом. Вы можете набрать 75 баллов на экзамене в колледже, но это говорит только о вашей оценке, а не о том, как она соотносится с оценками ваших одноклассников. Это когда процентили полезны. Чтобы получить полное представление о своем балле, вам необходимо соотнести его с другими, чтобы определить, выше, ниже или равен ваш балл среднему баллу за этот тест среди ваших одноклассников. В этой статье мы обсудим, как определяются процентили и как их вычислять.

Что такое процентиль?

Процентиль — это термин, используемый в статистике для выражения того, как оценка сравнивается с другими оценками в том же наборе. Хотя стандартного определения процентиля технически не существует, обычно его представляют как процент значений, которые находятся ниже определенного значения в наборе оценок данных.

Процентили обычно используются для представления значений тестов, основанных на нормах (в которых среднее значение определяется путем сравнения набора результатов в одной и той же группе), в виде процентной доли оценок, которые ниже среднего значения набора. Например, ребенок мужского пола в возрасте 12 лет с весом 130 фунтов находится на 90-м процентиле веса для мальчиков этого возраста, что указывает на то, что он весит более 90 процентов других 12-летних мальчиков.

В статистических терминах существует три отдельных определения процентиля. Они есть:

  1. Больше, чем: k-й процентиль — это наименьшая оценка в наборе данных, превышающая процент (k) оценок. Например, если k = 0,25, вы попытаетесь определить наименьшую оценку, превышающую 25 % оценок в наборе данных.

  2. Больше или равно: k**th процентиль — это наименьшая оценка в наборе данных, которая больше или равна проценту (k) оценок. Например, если k = 0,25, вам нужно искать значение, которое больше или равно 25% баллов.

  3. Средневзвешенное значение: в этом методе k-й процентиль представляет собой средневзвешенное значение процентилей, рассчитанных в двух приведенных выше определениях. Этот метод позволяет более аккуратно округлять числа и определяет медиану набора как 50-й процентиль.

Чем полезен процентиль?

Процентили полезны, поскольку они могут сказать вам, как одно значение сравнивается с другими значениями в наборе данных. Как правило, если значение n находится в k-м процентиле, то n больше, чем k**% значений в наборе. Одним из наиболее распространенных примеров, чтобы выразить это, является просмотр тестовых результатов. Вычисление того, где находится ваша оценка в наборе данных (ваша оценка и оценки других тестируемых), может помочь вам понять, как ваша оценка сравнивается с остальными оценками.

Другой пример — отслеживание веса детей по сравнению с другими детьми того же возраста. Это может помочь вам определить, попадает ли вес вашего ребенка в допустимый диапазон для его возраста, или вам нужно предпринять шаги, чтобы помочь ему набрать или сбросить вес, чтобы приблизиться к среднему весу.

Процентильные условия

Процентили также можно использовать для разделения набора данных на части для измерения дисперсии и определения среднего значения (известного как центральная тенденция). Определенные значимые процентили обозначаются своими собственными терминами. Вот некоторые:

медиана

50-й процентиль, при котором половина значений набора данных выше 50-го процентиля, а половина — ниже.

Квартиль

Значения, которые разбивают набор данных на кварталы на основе процентилей.

  • Первый квартиль называется Q1 или нижним квартилем. Это значение представляет собой 25-й процентиль, в котором нижняя четверть значений находится ниже 25-го процентиля, а три четверти выше его.

  • Второй квартиль, или Q2, представляет собой значение на 50-м процентиле. Это медиана набора данных.

  • Q3, третий квартиль, называется «верхним квартилем» и представляет собой значение 75-го процентиля, что означает, что только 25% значений в наборе выше этого значения.

Межквартильный диапазон

Используется для измерения дисперсии значений, предназначен для отображения средней половины данных. Одна четверть значений данных находится выше этого числа, а одна четверть — ниже. IQR рассчитывается путем нахождения разницы между первым и третьим квартилями (Q3 – Q1). Чем больше IQR, тем больше разброс значений.

Как рассчитать процентиль

Выполните следующие шаги, чтобы рассчитать k-й процентиль:

  1. Ранжируйте значения в наборе данных в порядке от наименьшего к наибольшему.

  2. Умножьте k (проценты) на n (общее количество значений в наборе данных). Это индекс. В следующих шагах вы будете ссылаться на это как на положение значения в вашем наборе данных (первое, второе, третье…).

  3. Если индекс не является круглым числом, округлите его вверх (или вниз, если он ближе к меньшему числу) до ближайшего целого числа.

  4. Используйте ранжированный набор данных, чтобы найти свой процентиль. Обратитесь к значению, которое коррелирует с номером индекса, определенным на шаге 3. Поскольку значение для k-го процентиля должно быть больше, чем значения, предшествующие индексу, следующим ранжированным значением будет k-й процентиль. Точно так же при использовании метода «больше или равно» шаги 1–3 остаются прежними, но на этот раз мы будем включать значение индекса. Затем вычисляется k-й процентиль, взяв среднее значение индекса в вашем наборе данных и следующее ранжированное значение.

Пример расчета процентиля

Используя приведенный ниже набор данных, вот пример расчета 60-го процентиля:

  1. Расположите значения в наборе данных в порядке от наименьшего к наибольшему, как показано ниже.

  2. Рассчитать индекс. Чтобы найти 60-й процентиль, используя приведенный ниже набор данных, умножьте k (0,6) на n (8), чтобы получить индекс 4,8.

  3. Округлите индекс до ближайшего целого числа (5).

  4. Чтобы вычислить процентиль по методу «больше чем», считайте значения в наборе данных от наименьшего к наибольшему, пока не достигнете числа, занимающего 5-е место, как определено на шаге 3. Поскольку значение для 60-го процентиля должно быть больше, чем первое пять значений, 6-е ранжированное значение будет k-м (60-м) процентилем. В этом наборе данных это значение равно 67.

  5. При использовании метода «больше или равно» шаги 1–3, описанные выше, остаются прежними, но на этот раз мы включим в этот набор данных значение пятого ранга, или 56. Затем вычисляется k-й (60-й) процентиль, взяв среднее значение этого значения в вашем наборе данных (56) и следующее ранжированное значение (67). (56 + 67) / 2 = 61,5

Существует несколько методов, которые можно использовать для расчета процентиля, и эти шаги демонстрируют один из самых простых способов сделать это.

Процентильный диапазон

Диапазон процентилей выражается как разница между любыми двумя указанными процентилями. В этом примере будет использоваться диапазон процентилей 10-90. Чтобы найти диапазон 10-90 процентилей набора выборочных данных выше, выполните следующие действия:

1. Выполните шаги, описанные выше, чтобы рассчитать 10-й процентиль.

  • (0,1 x 8)=0,8 (округлить до 1)

  • K=33 (больше) и k=30 (больше или равно)

  • Средний. (33 + 30) / 2 = 31,5

2. Найдите 90-й процентиль, следуя описанным выше шагам.

  • (0,9 х 8)=7,2 (округлить до 7)

  • K=72 (больше), k=68 (больше или равно)

  • Среднее (72 + 68) / 2 = 70

3. Вычтите 10-й процентиль из 90-го процентиля.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *