Что такое корреляция? (с определением и примерами)

22 февраля 2021 г.

Понимание и анализ различных корреляций может быть полезным в разных отраслях. Например, если у вас есть пекарня, вы можете решить, что будете делать больше пончиков из кокосового клена по пятницам, исходя из корреляции между спросом на пончики из кокосового клена и днем ​​недели. Хотя в этом обстоятельстве была причинно-следственная связь, важно отметить, что так будет не всегда. В общем, знание корреляции между двумя переменными может помочь вам принимать решения, которые могут положительно повлиять на ваш бизнес. Вычисление корреляции особенно полезно, если вы инвестиционный менеджер или аналитик.

В этой статье мы определяем различные типы корреляции и объясняем, как ее рассчитать.

Что такое корреляция?

Корреляция относится к статистической взаимосвязи между двумя объектами. Другими словами, это то, как две переменные движутся по отношению друг к другу. Корреляция также может использоваться для различных наборов данных. В некоторых случаях вы могли предсказать, как все будет соотноситься, в то время как в других отношения будут для вас неожиданностью. Важно понимать, что корреляция не означает причинно-следственную связь.

Чтобы понять, как работает корреляция, важно понимать следующие термины:

  • Положительная корреляция: положительная корреляция будет равна 1. Это означает, что две переменные вместе перемещаются вверх или вниз в одном направлении.

  • Отрицательная корреляция: Отрицательная корреляция равна -1. Это означает, что две переменные перемещаются в противоположных направлениях.

  • Нулевая корреляция или отсутствие корреляции. Нулевая корреляция означает отсутствие связи между двумя переменными. Другими словами, когда одна переменная движется в одном направлении, другая перемещается в другом, несвязанном направлении.

Типы коэффициентов корреляции

В то время как корреляция изучает, как две сущности связаны друг с другом, коэффициент корреляции измеряет силу связи между двумя переменными. В статистике существует три типа коэффициентов корреляции. Они следующие:

  • Корреляция Пирсона: Корреляция Пирсона является наиболее часто используемым измерением линейной зависимости между двумя переменными. Чем сильнее корреляция между этими двумя наборами данных, тем ближе она будет к +1 или -1.

  • Корреляция Спирмена: этот тип корреляции используется для определения монотонной связи или ассоциации между двумя наборами данных. В отличие от коэффициента корреляции Пирсона, он основан на ранжированных значениях для каждого набора данных и использует искаженные или порядковые переменные, а не нормально распределенные.

  • Корреляция Кендалла: этот тип корреляции измеряет силу зависимости между двумя наборами данных.

Знание ваших переменных помогает определить, какой тип коэффициента корреляции вы будете использовать. Использование правильного уравнения корреляции поможет вам лучше понять взаимосвязь между наборами данных, которые вы анализируете.

Как рассчитать коэффициент корреляции

Вы можете использовать следующее уравнение для расчета корреляции:

∑ (x (i) – x̅) (y (i) – ȳ) / √ ∑ (x (i) – x̅) ^ 2 ∑ (y (i) – ȳ) ^ 2

При расчете корреляции имейте в виду следующие представления:

х(я) = значение х

y(i) = значение y

x̅ = среднее значение x

ȳ = среднее значение y

Выполните следующие действия, чтобы рассчитать коэффициент корреляции:

1. Определите наборы данных

В начале расчета определите, какими будут ваши переменные. Вы можете организовать их на диаграмме, если это поможет вам лучше их визуализировать. Разделите их по переменным x и y. Например:

х: (1, 2, 3, 4) и у: (2, 3, 4, 5)

2. Вычислите среднее значение переменных x и y.

Чтобы вычислить среднее значение, также известное как среднее, сложите значения каждой переменной вместе и разделите на количество значений в этом наборе данных. Используя пример, если бы вам нужно было вычислить среднее значение x, вы бы сложили 1, 2, 3 и 4 вместе и разделили бы на 4, потому что у вас есть четыре значения для x. Сделайте то же самое для переменных y. Используя приведенный выше пример, вы должны сложить 2, 3, 4 и 5 и разделить на 4, потому что у вас есть четыре значения для y.

3. Вычтите среднее

Для переменной x вычтите среднее значение из каждого значения переменной x и назовите его «а». Для переменной y вычтите среднее значение из каждого значения переменной y и назовите его «b».

4. Умножить и найти сумму

Умножьте каждое значение a на соответствующее значение b. После того, как вы это сделаете, найдите сумму, которая окажется числителем формулы.

5. Извлеките квадратный корень

На этом этапе вы можете возвести каждое значение a в квадрат и определить сумму результата. После того, как вы это сделаете, вычислите квадратный корень из значения, которое вы только что определили. Это будет знаменатель формулы.

6. Разделить

Разделите числитель (значение, которое вы определили на шаге 4) на знаменатель (значение, которое вы определили на шаге 5). Это приведет к коэффициенту корреляции.

Если вы предпочитаете рассчитывать в цифровом виде, в Интернете есть калькуляторы корреляции. Этот метод более эффективен при наличии больших наборов данных.

Примеры корреляции

Используйте следующие примеры корреляции, чтобы лучше анализировать результаты корреляции из ваших собственных наборов данных.

Положительные корреляции

Вот несколько примеров положительной корреляции:

1. Чем больше времени вы потратите на проект, тем больше усилий вы приложите.

2. Чем больше денег вы зарабатываете, тем больше налогов вы должны.

3. Чем лучше вы относитесь к сотрудникам, тем больше они будут вас уважать.

4. Чем больше вы получите образования, тем умнее вы станете.

5. Чем больше вы работаете сверхурочно, тем больше денег вы заработаете.

Отрицательные корреляции

Вот несколько примеров отрицательной корреляции:

1. Чем больше платежей вы делаете по кредиту, тем меньше денег вы должны.

2. По мере уменьшения числа ваших сотрудников, тем больше у вас будет открытых вакансий.

3. Чем больше вы работаете в офисе, тем меньше времени вы будете проводить дома.

4. Чем больше сотрудников вы наймете, тем меньше у вас будет средств.

5. Чем больше времени вы потратите на проект, тем меньше времени у вас будет.

Нет корреляции

Вот несколько примеров сущностей с нулевой корреляцией:

1. Чем лучше вы относитесь к своим сотрудникам, тем выше будет их зарплата.

2. Чем ты умнее, тем позже придешь на работу.

3. Чем вы богаче, тем счастливее вы будете.

4. Чем раньше вы приходите на работу, тем больше вам нужно припасов.

5. Чем больше средств вы вложите в свой бизнес, тем больше сотрудников уйдут с работы раньше срока.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *