Что такое дисперсия? Определение и как его рассчитать

Дисперсия — это мера расстояния каждой переменной от среднего значения или среднего значения в ее наборе данных. Он используется для расчета отклонения в наборе и является ценным инструментом для инвесторов и финансовых специалистов. В этой статье мы определяем дисперсию, как ее рассчитать, а также преимущества и недостатки использования дисперсии.

Что такое дисперсия?

Дисперсия — это расчет, в котором случайные переменные рассматриваются с точки зрения их отношения к среднему значению набора данных. Дисперсию можно использовать для определения того, насколько далеко каждая переменная от среднего и, в свою очередь, насколько далеко каждая переменная отстоит друг от друга. Он также используется в статистических выводах, проверке гипотез, методах Монте-Карло (случайная выборка) и анализе согласия.

Как используется дисперсия?

Дисперсия используется в инвестировании для определения индивидуальной эффективности отдельных частей инвестиционного портфеля. Это помогает управляющим активами и инвесторам повысить эффективность своих инвестиций.

Другими профессионалами, которые могут использовать дисперсию, являются ученые, статистики, математики, аналитики данных и все, кто отвечает за выявление риска или получение информации о популяции эксперимента или выборки.

В некоторых случаях дисперсия и стандартное отклонение могут использоваться взаимозаменяемо. Кто-то может выбрать стандартное отклонение, а не дисперсию, потому что это меньшее число, с которым в некоторых случаях может быть легче работать, и на него с меньшей вероятностью повлияет перекос. Чтобы найти стандартное отклонение, просто возьмите квадратный корень из дисперсии. С этим числом вы можете делать те же выводы, что и при использовании дисперсии, но с меньшими вычислениями.

Как рассчитать дисперсию

Чтобы вычислить дисперсию, вам нужно возвести в квадрат каждое отклонение данной переменной (X) и среднего значения.

В выборочном наборе данных вы должны вычесть каждое значение из среднего значения по отдельности, а затем возвести значение в квадрат, например: (μ – X)². Затем вы должны добавить все квадраты отклонений и разделить их на общее количество значений, чтобы получить среднее значение. Это число и есть дисперсия.

Чтобы найти стандартное отклонение, вы можете просто взять квадратный корень из дисперсии.

Формула дисперсии выглядит следующим образом:

Var(X) = E (x – μ)**² / N**

Формула показывает, что дисперсия X (Var[X]) равно среднему квадрату X минус квадрат его среднего. И вы можете решить это, разделив его на количество чисел в наборе, или N.

Как использовать данные дисперсии

При оценке риска инвесторы используют среднее значение для определения изменчивости, которая может быть приравнена к риску в пределах портфеля. Это часто используется при рассмотрении новой покупки, чтобы решить, стоит ли вложение риска. Дисперсия помогает аналитикам риска определить меру неопределенности, которую без дисперсии и стандартного отклонения трудно определить количественно.

Хотя неопределенность не поддается прямому измерению, дисперсия и стандартное отклонение позволяют аналитикам определить предполагаемое влияние конкретной акции на портфель.

В статистике дисперсия используется для определения того, насколько хорошо среднее значение представляет весь набор данных.

Например, чем выше дисперсия, тем больше диапазон существует в наборе. Исследователи данных могут использовать эту информацию, чтобы сделать вывод о том, что среднее значение может не отражать набор так же хорошо, как если бы набор имел более низкую дисперсию. Исследователи могут искать различия между тестовыми группами, чтобы определить, достаточно ли они похожи для успешной проверки гипотезы.

Каковы преимущества использования дисперсии?

Самым большим преимуществом использования дисперсии является получение информации о наборе данных. Независимо от того, являетесь ли вы инвестором, стремящимся снизить риск, или статистиком, которому необходимо понять разброс выборки, дисперсия — это информация, которую люди могут использовать для быстрых выводов.

Быстрее использовать дисперсию, чем наносить каждое число на спред и определять приблизительное расстояние от среднего значения и каждой переменной. Эта мера позволяет людям, которые используют статистику, делать важные оценки с помощью относительно быстрого расчета, который предоставляет информацию о диапазоне выборки.

Дисперсия обрабатывает все числа в наборе одинаково, независимо от того, положительные они или отрицательные, что является еще одним преимуществом использования этой формулы.

Каковы недостатки использования дисперсии?

Одним из недостатков использования дисперсии является то, что большие выбросы в наборе могут привести к некоторому искажению данных, поэтому это вычисление не обязательно обеспечивает идеальную точность. Это связано с тем, что после возведения в квадрат выбросы по обе стороны совокупности могут иметь значительный вес, связанный с ними, в зависимости от значений в остальной части выборки.

Это усугубляется тем фактом, что некоторые исследователи предпочитают работать с меньшими числами, поэтому они могут предпочесть работать со стандартными отклонениями, которые берут квадратный корень из дисперсии и с меньшей вероятностью сильно смещаются в сторону больших чисел. Дисперсию также бывает трудно интерпретировать, что является еще одной причиной, по которой ее квадратный корень может быть предпочтительнее.

Пример дисперсии

Предположим, в этом инвестиционном примере доходность ваших акций составляет 10 % в первый год инвестиций, 20 % во второй год и 15 % в третий год. Средняя доходность составляет 15%.

Теперь давайте возьмем разницу каждой доходности и средней доходности, которая выглядит так:

Доходность Средняя доходность за первый год 10% – 15% = -5% -5%² = 25% за второй год 20% – 15% = 5% 5%² = 25% за третий год 15% – 15% = 0% 0%² = 0