Как рассчитать коэффициент детерминации

Коэффициент детерминации (CoD) = r ^ 2, где r = коэффициент корреляции.

Логическая статистика измеряет вероятности происходящих событий. Эта область математического анализа применима ко многим областям карьеры, где профессионалы применяют статистический анализ для измерения вероятностей и корреляций. Коэффициент детерминации — это одно из статистических измерений, которое необходимо для понимания возможных корреляций между переменными. В этой статье мы обсудим, что такое коэффициент детерминации, как рассчитать коэффициент детерминации и к чему он применим, с примером для большего понимания.

Что такое коэффициент детерминации?

Коэффициент детерминации — это статистическое измерение, которое оценивает, как изменения одной переменной влияют на изменения другой переменной. Это мера вариации, возникающая в y при изменении x в модели линейной регрессии. Математически коэффициент детерминации представляет собой квадрат коэффициента корреляции, который измеряет взаимосвязь или корреляцию двух переменных.

Коэффициент корреляции заменяет переменную r, а коэффициент детерминации представляет собой квадрат r или r**2. Чтобы найти коэффициент детерминации, просто возведите коэффициент корреляции в квадрат. Результирующее значение колеблется от нуля до единицы, которое вы конвертируете в проценты, чтобы объяснить, какая часть изменения y происходит из-за изменений в x.

Как рассчитать коэффициент детерминации

Используйте следующие шаги, чтобы найти коэффициент детерминации с помощью коэффициента корреляции:

1. Определите коэффициент корреляции

При оценке коэффициента детерминации определите коэффициент корреляции r. В большинстве случаев статистики и аналитики данных используют компьютерные расчеты, чтобы найти коэффициент корреляции при измерении вариаций в наборах данных. Если вы еще не знаете коэффициент корреляции, вы можете использовать следующую формулу для его расчета вручную:

р = [NΣxy – (Σx)(Σy)] / √[NΣx2 – (Σx)2] Икс [NΣy2 – (Σy)2]

2. Примените формулу коэффициента корреляции

Если вы используете формулу коэффициента корреляции, замените значения данных на переменные N, x и y, где N — это количество пар значений данных, которые у вас есть, а переменная Σ определяет функцию суммирования. Это означает, что Σxy представляет собой сумму произведений значений x и y, Σx представляет собой сумму значений x, а Σy представляет собой сумму значений y. Коэффициент Σx2 представляет собой сумму квадратов значений x, а Σy**2 представляет собой сумму квадратов значений y.

Например, предположим, что аналитик данных вычисляет коэффициент корреляции по формуле и получает r = (166) / (346) = 0,39. Это означает, что коэффициент корреляции равен 0,39.

3. Возведите в квадрат коэффициент корреляции

Получив коэффициент корреляции, возведите результат в квадрат. Вы также можете оценить, насколько сильна связь между вашими переменными, взяв абсолютное значение r, где большие значения показывают более сильную корреляцию. Чтобы возвести значение r в квадрат, умножьте значение само на себя. Например, если коэффициент корреляции r = -0,35, возведение этого значения в квадрат дает коэффициент детерминации:

г2 = (-0,35)(-0,35) = 0,1225

4. Оцените результаты

Преобразуйте коэффициент детерминации в проценты и оцените данные. Используя примерный коэффициент 0,1225, преобразуйте его в проценты, чтобы получить 12,25%. Анализ этого процента показывает, что 12,25% значений ваших данных появляются вдоль соответствующей линии регрессии, когда вы наносите свои данные на график. Более высокий коэффициент детерминации означает, что больше ваших данных собирается вдоль линии регрессии, что приводит к более сильной связи между вашими наблюдениями. Коэффициент, равный единице, означает, что линия регрессии содержит 100 % данных, а нулевой коэффициент означает, что в строке отсутствуют данные.

Использование коэффициента детерминации

Коэффициент детерминации является важным значением для построения графика регрессии, поскольку он показывает вероятность повторения значений данных в будущих измерениях. Он также указывает на силу корреляции между переменными, которая может иметь важное значение для ряда процессов обработки данных, включая:

Финансовый анализ

Коэффициент детерминации может иметь важное значение при анализе корреляции между изменением финансовых показателей. Например, многие аналитики рассматривают корреляционные отношения для определения вероятности будущих доходов, расходов и других инвестиционных показателей. Управление финансами в акциях часто зависит от анализа данных, который помогает профессионалам оценить возможные результаты при инвестировании в различные ценные бумаги.

Бизнес-анализ

Рост и развитие бизнеса являются важными показателями, для отслеживания которых используется статистика. Например, при измерении темпов роста бизнес-профессионалы могут анализировать корреляционные отношения между стратегиями и результатами, чтобы определить методы, которые приводят к процентному росту с течением времени. Коммерческие расходы – это еще одно применение статистического анализа, которое может зависеть от корреляционных измерений, где коэффициент детерминации может показать предприятиям области, которые несут самые высокие затраты.

Медицинское исследование

Здравоохранение и медицина часто полагаются на анализ данных в клинических исследованиях. Например, исследователи-фармацевты могут применять коэффициент детерминации для измерения различий в изменениях между дозировкой лекарства и реакцией пациента. Врачи также могут использовать информацию из коэффициента детерминации при применении новых методов лечения и составлении прогнозов. Хотя коэффициент может описывать силу корреляции, для определения причинно-следственной связи необходимы другие факторы.

экономика

Статистика и анализ данных являются неотъемлемой частью экономических приложений, таких как измерение демографии населения, экономических расходов и экономического роста. В этой области коэффициенты корреляции применяются для выявления закономерностей между переменными, где коэффициент детерминации может помочь экономистам измерить силу различных корреляций между экономической деятельностью. Импорт и экспорт являются одной из областей, где может применяться этот фактор вероятности, поскольку экономисты могут определить относительную корреляцию между увеличением и уменьшением доходов от импортируемых и экспортируемых товаров.

Технический анализ

Линейная регрессия и статистический анализ также важны в технических приложениях, таких как наука о данных, компьютерное программирование и машинное обучение. Например, специалисты по данным могут использовать статистику вероятностей для создания алгоритмов, которые с наибольшей вероятностью приведут к желаемым результатам в системах машинного обучения. В этом случае коэффициент детерминации может помочь специалистам по данным измерить эффективность своих моделей линейной регрессии. При более высоком коэффициенте системы машинного обучения, скорее всего, будут иметь небольшие различия между желаемым результатом и начальным вводом.

Пример коэффициента детерминации

Специалист по данным, вычисляющий модель линейной регрессии, хочет определить степень изменчивости между независимым входом и зависимым выходом. Используя коэффициент корреляции для определения r2, специалист по данным использует формулу:

р = [NΣxy – (Σx)(Σy)] / √[NΣx2 – (Σx)2] Икс [NΣy2 – (Σy)2]

Чтобы найти r-значение 0,79. Ученый возводит это значение в квадрат, используя обозначение CoD = r2, чтобы получить (0,79) (0,79) = 0,6241. Оценивая эту метрику, специалист по данным определяет, что на нее приходится 62,41% входных данных, влияющих на результат, а 37,59% — это нереализованные данные. В этом типе приложения специалист по данным может настроить параметры модели линейной регрессии, чтобы увеличить скорость корреляции, чтобы она была ближе к 1,00 или 100%.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *