Как создать и интерпретировать матрицу корреляции в Excel

Опубликовано 5 июля 2020 г. Заком

Один из способов количественно определить взаимосвязь между двумя переменными – использовать коэффициент корреляции Пирсона, который является мерой линейной связи между двумя переменными . Он имеет значение от -1 до 1, где:

  • -1 указывает на абсолютно отрицательную линейную корреляцию между двумя переменными
  • 0 указывает на отсутствие линейной корреляции между двумя переменными.
  • 1 указывает на абсолютно положительную линейную корреляцию между двумя переменными

Чем дальше коэффициент корреляции от нуля, тем более сильная связь между двумя переменными.

Но в некоторых случаях мы хотим понять корреляцию между более чем одной парой переменных. В этих случаях мы можем создать матрицу корреляции, которая представляет собой квадратную таблицу, которая показывает коэффициенты корреляции между несколькими попарными комбинациями переменных.

В этом руководстве объясняется, как создать и интерпретировать матрицу корреляции в Excel.

Как создать матрицу корреляции в Excel

Предположим, у нас есть следующий набор данных, который показывает среднее количество очков, подборов и передач для 10 баскетболистов:

Чтобы создать матрицу корреляции для этого набора данных, перейдите на вкладку Данные на верхней ленте Excel и нажмите Анализ данных .

Если вы не видите этот параметр, вам необходимо сначала загрузить бесплатный пакет инструментов анализа данных в Excel .

В новом всплывающем окне выберите Корреляция и нажмите OK .

Для Диапазон ввода выберите ячейки, в которых расположены данные (включая первую строку с метками). Установите флажок рядом с Ярлыки в первой строке . Для Диапазон вывода выберите ячейку, в которой должна отображаться матрица корреляции. Затем нажмите OK .

Это автоматически создаст следующую матрицу корреляции:

Как интерпретировать матрицу корреляции в Excel

Значения в отдельных ячейках матрицы корреляции сообщают нам коэффициент корреляции Пирсона между каждой попарной комбинацией переменных. Например:

Корреляция между очками и отскоками: -0,04639. Очки и подборы имеют небольшую отрицательную корреляцию, но это значение настолько близко к нулю, что нет убедительных доказательств значимой связи между этими двумя переменными..

Соотношение очков и передач: 0,121871. Очки и передачи имеют слегка положительную корреляцию, но это значение также довольно близко к нулю, поэтому нет убедительных доказательств значимой связи между этими двумя переменными.

Корреляция между отскоками и ассисты: 0,713713. Подборы и передачи сильно взаимосвязаны. То есть игроки, у которых больше подборов, также, как правило, получают больше передач.

Обратите внимание, что все диагональные значения в корреляционной матрице равны 1, потому что корреляция между переменной и самой собой всегда равна 1. На практике это число бесполезно интерпретировать.

Бонус: визуализация коэффициентов корреляции

Один простой способ визуализировать Значение коэффициентов корреляции в таблице заключается в применении к таблице Условное форматирование . В верхней части ленты Excel перейдите на вкладку Главная , затем в группу Стили . Нажмите Диаграмма условного форматирования , затем нажмите Цветовые шкалы , затем нажмите Зеленая-желто-красная цветовая шкала .

Это автоматически применяет следующую цветовую шкалу к матрице корреляции:

Это помогает нам легко визуализировать силу корреляции между переменными. Это особенно полезный трюк, если мы работаем с корреляционной матрицей, содержащей множество переменных, потому что она помогает нам быстро идентифицировать переменные с наиболее сильными корреляциями.

Оцените статью
futurei.ru
Добавить комментарий