Как рассчитать выборочную ковариацию
Выборочная ковариация: Cov(X,Y) = Σ(Xi – μ)(Yj – ν) / (n-1)
Когда совокупность слишком велика для вычисления ковариации, статистики и другие специалисты, которые полагаются на математику, могут взять для анализа меньшую выборку. Выборка из большей совокупности более эффективна для вычисления ковариации, так как этот процесс позволяет быстрее выполнять расчеты. При нахождении ковариации выборочной совокупности необходимо использовать формулу, мало отличающуюся от формулы расчета статистической ковариации. В этой статье мы обсудим, что такое ковариация и выборочная ковариация, чем ковариация отличается от корреляции и как рассчитать выборочную ковариацию на примере для большего понимания.
Что такое ковариация?
Ковариация — это статистическая величина, которая измеряет взаимосвязь между двумя случайными переменными и степень изменения, происходящего в обеих переменных одновременно. Вы также можете измерить ковариацию как дисперсию между двумя случайными переменными, если между переменными нет зависимости.
Измерение ковариации также может дать вам информацию о характере взаимосвязи между данными двух разных совокупностей, такой как корреляция или причинно-следственная связь. Кроме того, ковариация может быть как положительной, так и отрицательной. Положительная ковариация указывает на две переменные, которые движутся или изменяются в одном и том же направлении, а отрицательная ковариация показывает переменные, которые движутся в обратном или противоположном направлении.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Что такое выборочная ковариация?
Выборочная ковариация берет меньшую выборку населения и измеряет взаимосвязь между двумя случайными величинами из выборки. Эта метрика становится полезной при работе с большими группами населения, такими как инструменты инвестирования в акции или долгосрочные медицинские исследования. В этих случаях расчет выборочной ковариации может дать статистикам и аналитикам более глубокое понимание того, как их результаты проявляются в большей совокупности. Выборочная ковариация также может более эффективно предоставлять данные для прогностического анализа, поскольку вы можете работать с выборками меньшего размера. Для расчета ковариации выборки используйте формулу:
Cov(X,Y) = Σ(Xi – μ)(Yj – ν) / (n-1)
Где части уравнения:
Cov(X,Y) представляет собой ковариацию выборки X и ковариацию выборки Y.
Σ(Xi) = μ, что представляет собой ожидаемое среднее (среднее) значение для ваших значений X.
Σ(Yj) = ν, что является ожидаемым средним значением для ваших значений Y.
Σ — операция суммирования точек данных из каждой выборки.
Переменная n — это количество точек данных в выборке.
Ковариация против корреляции
Хотя и ковариация, и корреляция измеряют взаимосвязь между двумя переменными, эти два значения могут дать вам разную информацию. При измерении ковариации вы вычисляете общую вариацию между двумя случайными величинами при их вычислении на основе предсказанных значений. Используя это измерение, вы можете определить, является ли ковариация положительной или отрицательной. Однако ковариация не фокусируется на типе связи между переменными или на том, зависит ли одна переменная от другой.
Однако корреляция вычисляет тип связи и влияет ли независимая переменная на зависимую переменную. В отличие от ковариации, коэффициент корреляции остается чистой величиной, а не единицей измерения. Это становится важным при определении причинных факторов событий или результатов в выборочном наборе данных.
Как рассчитать выборочную ковариацию
Выполните следующие шаги и примените формулу выборочной ковариации, чтобы определить выборочную ковариацию:
1. Соберите данные из обоих образцов
Прежде чем применять формулу, вам нужен набор выборочных данных из двух разных совокупностей. Пусть один образец данных представляет значение X в формуле, а другой набор образцов представляет значение Y. Например, если профессор статистики хочет понять взаимосвязь направлений между различными промежуточными экзаменами для класса колледжа, состоящего из 125 студентов, первый экзамен должен представлять X, а второй экзамен — Y.
Каждый результат теста становится точкой данных в генеральной совокупности, однако, поскольку профессор должен оценить большое количество экзаменов, он может сосредоточиться на выборке из пяти баллов по каждому экзамену.
2. Рассчитайте среднее значение для выборок X и Y.
Как только вы распределите выборку для X и выборку для Y, вы можете вычислить среднее значение для обеих ваших выборок. В примере с тестовыми баллами профессор находит среднее значение для каждого экзамена. Важно отметить, что значения Xi и Yj представляют первую точку данных в каждой выборке, когда профессор упорядочивает точки в порядке возрастания. Значения μ и ν представляют собой средние значения для выборок X и Y.
3. Найдите разницу между каждым средним значением
Когда вы получите средние значения для каждого набора выборок, вычтите среднее значение из ваших значений Xi и Yj для каждой точки в выборке. Используя предыдущий пример двух экзаменов, профессор использует пять баллов из 125, находит среднее значение первой выборки X и получает 89. Среднее значение второй выборки равно 78. Предполагая, что первая оценка выборки X равна 66, а первый балл из выборки Y равен 54, профессор вычитает эти значения в формуле перед умножением различий.
4. Умножьте разницу для X и разницу для Y и выполните суммирование
После вычитания среднего значения ваших выборок X и Y из начальных оценок вы можете умножить разницу. Повторите этот процесс для каждой точки данных в вашей выборке, а затем просуммируйте все продукты. Это значение представляет собой число, на которое делятся ваши точки данных при вычислении окончательного результата. В случае с экзаменационными баллами, если профессор измеряет выборочную ковариацию для пяти баллов по каждому экзамену, он выполняет операцию суммирования между каждым произведением своих выборок X и Y.
5. Вычтите единицу из числа точек данных.
Перед делением замените число точек данных в вашем выборочном наборе на переменную n в формуле. Например, если у вас есть 17 точек данных, вы подставляете 17 вместо n в формуле. После подстановки значения точки данных вычтите единицу из этого числа. В примере с экзаменационными баллами профессора n будет равно пяти, так как профессор вычисляет ковариацию для этого размера выборки из 125 баллов для каждого экзамена. Вычитание единицы из значения n дает четыре.
6. Разделите, чтобы получить выборочную ковариацию
После того, как у вас есть все значения в формуле, разделите произведение, полученное при умножении значений X и Y на предыдущих шагах. Этот результат дает вам выборочную ковариацию и направление изменения между вашими выборками X и Y, что дает вам больше информации о более крупных совокупностях, из которых вы взяли свои выборки. Если результатом является отрицательное число, то у вас есть отрицательная ковариация с обратными отношениями переменных. Если результатом является положительное значение, то ковариация положительна, что указывает на аналогичные изменения между переменными.
Пример расчета выборочной ковариации
В этом примере предположим, что инвестиционный аналитик хочет понять колебания цен между двумя разными фондовыми инструментами. Используя формулу выборочной ковариации, аналитик может рассчитать значение выборочной ковариации как для акций X, так и для акций Y. Аналитик собирает данные о ценах на акции X и Y за последние три месяца и находит:
Акция XАкция YМесяц первый$510$560Месяц второй$480$505Месяц третий$495$540С помощью этой информации аналитик сначала определяет среднее значение для каждой выборки, начиная с акции X:
Среднее (акции X) = (510 долларов + 480 долларов + 495 долларов) / (3) = 495 долларов.
Среднее (акция Y) = (560 долларов + 505 долларов + 540 долларов) / (3) = 535 долларов.
Используя эти данные и выборочные значения для каждого биржевого инструмента, аналитик вычисляет формулу выборочной ковариации при расчете ковариации за три месяца:
Cov(X,Y) = Σ(Xi – µ)(Yj – ν) / (n-1) =
Cov(запас X, запас Y) = (510 – 495)(560 – 535) + (480 – 495)(505 – 535) + (495 – 495)(540 – 535) / (3-1) =
Cov(запас X, запас Y) = (15)(25) + (-15)(-30) + (0)(5) / (2) =
Cov(запас X, запас Y) = (325) + (450) + (0) / (2) =
Cov(запас X, запас Y) = 775/2 = 387,5
Результат выборочной ковариации равен 387,5, что указывает на положительную ковариацию между обоими опционами на акции. Используя это значение, аналитик затем может рассчитать корреляцию обеих акций и определить, ведет ли себя одна акция как зависимая переменная по отношению к другой акции. Это позволяет инвестиционному аналитику рассчитать корреляцию, используя выборочную ковариацию, чтобы определить, создают ли колебания цен акций между каждым инструментом причинно-следственную связь.