Формула коэффициента корреляции: подробное руководство
22 апреля 2021 г.
Знание того, как рассчитать и использовать формулу коэффициента корреляции, может помочь вам определить линейную корреляцию между двумя наборами данных. Независимо от контекста, в котором вы используете эту формулу, она может повлиять на точность ваших выводов. Умение использовать формулу коэффициента корреляции — ценный навык, но он требует исследований и практики. В этой статье мы обсудим, что такое формула коэффициента корреляции, когда и как ее следует использовать и как следует интерпретировать коэффициент.
Что такое формула коэффициента корреляции?
Формула коэффициента корреляции — это статистический метод, используемый для измерения того, насколько сильна связь между двумя переменными. Хотя существует много способов расчета коэффициента корреляции, наиболее популярным, вероятно, является корреляция Пирсона, также известная как R Пирсона. произошла ошибка расчета.
Хотя формула коэффициента корреляции является эффективным способом определения того, как коррелируют две переменные, она также не указывает на причинно-следственную связь. Тот факт, что две переменные коррелированы, не означает автоматически, что одна переменная влияет на другую. Вычисление корреляции просто показывает взаимосвязь между двумя переменными, хотя причиной их корреляции могут быть и другие факторы. Хотя возможно, что причина их корреляции в том, что одно влияет на другое, это не единственная потенциальная причина этого явления.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Когда использовать формулу коэффициента корреляции
Формулу коэффициента корреляции можно использовать в любой ситуации, когда вам нужно сравнить два набора переменных. Например, инвесторы могут использовать его, чтобы выяснить, имеют ли различные ценные бумаги отрицательную корреляцию, и если да, то каким образом. Это может помочь им определить наиболее эффективные способы хеджирования своих инвестиций от неожиданных рыночных падений и колебаний цен, показывая им потенциальные инвестиции, которые, вероятно, вырастут в цене, когда другие обесценятся. Инвесторы также используют его, чтобы попытаться предсказать, как внешний фактор может повлиять на цену конкретного актива.
Как правило, формула коэффициента корреляции используется для измерения следующего:
Любые корреляции, происходящие между двумя наборами переменных
Любые корреляции, происходящие между наборами переменных и внутри них
При правильном использовании он показывает, существует ли какая-либо статистически значимая линейная связь между двумя наборами переменных, сила этой связи, а также ее общее направление. Однако его нельзя использовать для нелинейных отношений или отношений между категориальными переменными.
Каковы основные требования для использования формулы коэффициента корреляции
Использование формулы коэффициента корреляции требует наличия наборов данных со следующими характеристиками:
Они содержат две или более непрерывных переменных
Обе переменные должны иметь неотсутствующие значения
Между переменными должна быть линейная зависимость
Между значениями переменных нет прямой связи, а это означает, что значение любой переменной в наборах данных не может напрямую влиять на значение другой переменной.
Все пары переменных имеют двумерное нормальное распределение.
Корреляция наблюдается посредством случайной выборки данных из населения.
Нет статистических выбросов, что означает, что в наборах данных нет точек, которые значительно отличаются по значению от всех остальных.
Как использовать формулу коэффициента корреляции
Учтите следующие шаги при использовании формулы коэффициента корреляции:
Составьте диаграмму, включающую все данные двух переменных, и обозначьте их (x) и (y). Добавьте в диаграмму еще три столбца с именами (xy), (x^2) и (y^2).
Умножьте значения переменных, чтобы завершить диаграмму, где (xy) — две перемноженные переменные, (x^2) — значение переменной X в квадрате, а (y^2) — значение переменной Y в квадрате.
После умножения всех значений и заполнения диаграммы добавьте все значения в столбцах сверху вниз.
Используйте формулу коэффициента корреляции, чтобы определить значение коэффициента корреляции
Если вы добавите все правильные значения в диаграмму и правильно примените формулу, вы получите значение коэффициента корреляции Пирсона.
Интерпретация коэффициента корреляции
Для интерпретации коэффициента корреляции используются два основных термина:
Сила: указывает, как две переменные коррелируют, то есть насколько вероятно, что одна из них изменится в результате изменения другой.
Направление: Направление корреляции указывает, является ли связь между двумя переменными положительной или отрицательной. Если направление вверх, то две переменные имеют положительную связь, а это означает, что увеличение значения одной переменной определяет увеличение значения другой. Однако направление вниз указывает на отрицательную корреляцию, означающую, что увеличение значения одной переменной определяет уменьшение значения другой.
В зависимости от точного значения коэффициента корреляции интерпретации могут быть:
-1: представляет собой идеальную отрицательную корреляцию, означающую, что две переменные имеют тенденцию развиваться в противоположных направлениях.
0: это указывает на отсутствие корреляции, что означает, что две переменные, вероятно, не имеют никакой связи друг с другом.
1: представляет собой идеальную положительную корреляцию, означающую, что две переменные движутся в одном направлении.
Точную силу и характер связи можно определить, проанализировав точное значение коэффициента корреляции. Если, например, значение коэффициента корреляции равно 0,2, это указывает на положительную корреляцию между двумя переменными, но его удаленность от полной положительной корреляции, равной 1, указывает на то, что корреляция слабая и относительно незначительная. В зависимости от конкретной области исследования большинство аналитиков не считают корреляцию значимой, если ее значение не превышает 0,8. В целом, коэффициент корреляции более 0,9 указывает на очень сильную связь между переменными.