Инструмент анализа: Ковариация

Ковариация (корреляционный момент), также как и корреляция, является характеристикой степени линейной зависимости двух переменных. Выражением для вычисления ковариации является числитель в формуле для коэффициента корреляции, а это означает, что ковариация и корреляция представляют, в действительности, одну и ту же информацию. Однако значения ковариации сложнее интерпретировать, т.к. ее единицы измерения являются произведением единиц измерения каждой переменной. Например, для цен и жилой площади ковариация выражена в единицах квадратных метров, умноженных на тысячи долларов. Поэтому при анализе обычно предпочитают использовать коэффициент корреляции, не имеющий размерности. Тем не менее, в некоторых ситуациях ковариация используется как самостоятельная характеристика. Так, например, в теории финансов ковариацию применяют для описания зависимости одних курсов акций по отношению к другим.

Задание 4. Определить ковариацию между размером жилой площади и ценой объекта.

1. Откройте файл Двумерные данные.xls.

2. На Листе2 в ячейку D10 введите Инструмент анализа: Ковариация.

3. Выберите команду: Сервис®Анализ данных®Ковариация.

4. В диалоговом окне Ковариация установите параметры как указано ниже на рисунке.

5. Щелкните на кнопке ОК. Результаты будут расположены в диапазоне D11:F13 (см. рисунок ниже).

6. Результатом является матрица попарных ковариаций. На диагонали расположены дисперсии для каждой переменной (квадрат стандартного отклонения). Значение ковариации Цены и Площади (853,2427) указано в левой нижней части матрицы в ячейке E13. Правая верхняя часть матрицы пустая, т.к. ее значения совпадают с соответствующими значениями в левой нижней части.

7. Вычислите ковариацию, используя Мастер функций. Для этого в ячейку D15 введите Функция КОВАР. Выделите ячейку D16, вызовите Мастер функций и выберите статистическую функцию КОВАР. В диалоговом окне Аргументы функции щелкните в поле Массив1, а затем выделите диапазон A2:A16, не включая метку. Теперь щелкните в поле Массив2 и выделите диапазон B2:B16, не включая метку. Щелкните на кнопке ОК.

Замечание. В отличие от инструмента анализа Ковариация статистическая функция КОВАР не статична, т.е. при изменении данных в исходном диапазоне значение ковариации, рассчитанной с помощью функции КОВАР, тоже изменится.

8. Выделите ячейку B2 и введите в нее число 30. Нажмите [Enter].

Обратите внимание!Величина ковариации в ячейке D16 изменилась, а в матрице попарных ковариаций осталось прежнее значение.

9. Щелкните на кнопке Отменить на панели инструментов Стандартная, чтобы вернуться к исходному значению в ячейке B2.

Контрольные вопросы

1. В чем отличие анализа двумерных данных от анализа одномерных данных?

2. На какие вопросы можно ответить, проанализировав двумерные данные?

3. Что такое диаграмма рассеяния? С какой целью она используется для анализа?

4. Что такое коэффициент корреляции?

5. На что указывает знак (положительный или отрицательный) коэффициента корреляции?

6. Если большие значения X вызывают появление больших значений Y, то какой, по вашему мнению, должна быть корреляция – положительной, отрицательной или нулевой? Почему?

7. Для каждого из приведенных ниже равенств укажите типичный вариант интерпретации?

а) r = 1;

б) r = 0,85;

в) r = 0;

г) r = –0,15;

д) r = –1.

8. Поясните как, по вашему мнению, располагаются точки на диаграмме рассеяния в следующих ситуациях.

а) Взаимосвязь между X и Y отсутствует.

б) Линейная взаимосвязь с сильной положительной корреляцией.

в) Линейная взаимосвязь с сильной отрицательной корреляцией.

г) Линейная взаимосвязь со слабой положительной корреляцией.

д) Линейная взаимосвязь со слабой отрицательной корреляцией.

е) Линейная взаимосвязь с корреляцией +1?

ж) Линейная взаимосвязь с корреляцией –1?

9. Что представляет собой ковариация между X и Y?

10. Какую из характеристик легче интерпретировать – корреляцию или ковариацию? Почему?

Контрольные задания

Добавьте Лист4 и выполните задание с использованием базы данных служащих (файл База данных служащих.xls находится в папке Мои документы).

Замечание. Для выполнения некоторых заданий потребуется фильтрация списка, т.е. отбор из базы данных отдельных записей по условиям фильтра. В этом случае необходимо установить курсор на любой ячейке списка и включить фильтрацию с помощью команды:

Данные®Фильтр®Автофильтр

В строке заголовков таблицы появятся кнопки со стрелкой. При щелчке на стрелке соответствующего заголовка откроется меню, содержащее условия отбора. Например, если необходимо отобрать записи, содержащие данные только для мужчин, то надо щелкнуть на стрелке заголовка Пол и выбрать в меню критерий М. В результате база данных будет отфильтрована, и в списке останутся только записи, соответствующие заданному критерию (записи мужчин). Теперь нужные данные можно скопировать в другой файл и провести анализ.

После окончания анализа необходимо в файле База данных служащих.xls отменить действие фильтра. Для этого сначала выполните команду: Данные®Фильтр®Отобразить все, чтобы вывести все записи базы, а затем выключите автофильтр, повторно выполнив команду:

Данные®Фильтр®Автофильтр.


 

Вариант Задание
Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, постройте диаграмму рассеяния и опишите взаимосвязь.
Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, найдите коэффициент корреляции. О чем свидетельствует его значение?
Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, найдите ковариацию. О чем свидетельствует знак ковариации?
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, постройте диаграмму рассеяния и опишите взаимосвязь.
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, найдите коэффициент корреляции. О чем свидетельствует его значение?
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, постройте диаграмму рассеяния и опишите взаимосвязь.
Рассматривая стаж работы служащих как переменную Y, а возраст – как переменную X, постройте диаграмму рассеяния и опишите взаимосвязь.
Рассматривая стаж работы служащих как переменную Y, а возраст – как переменную X, найдите коэффициент корреляции. О чем свидетельствует его значение?
Рассматривая стаж работы служащих как переменную Y, а возраст – как переменную X, найдите ковариацию. О чем свидетельствует знак ковариации?
Определите попарные корреляции трех переменных: Заработная плата служащих, Стаж работы и Возраст. Какие можно сделать выводы?
Рассматривая годовую зарплату мужчин как переменную Y, а возраст – как переменную X, постройте диаграмму рассеяния и опишите взаимосвязь.
Рассматривая годовую зарплату женщин как переменную Y, а возраст – как переменную X, постройте диаграмму рассеяния и опишите взаимосвязь.
Рассматривая годовую зарплату мужчин как переменную Y, а стаж работы – как переменную X, найдите коэффициент корреляции. О чем свидетельствует его значение?
Рассматривая годовую зарплату женщин как переменную Y, а стаж работы – как переменную X, найдите коэффициент корреляции. О чем свидетельствует его значение?