![]() |
![]() |
||||||||||||||||||||||||||||||||||||||||||||||
Категории: АстрономияБиология География Другие языки Интернет Информатика История Культура Литература Логика Математика Медицина Механика Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Транспорт Физика Философия Финансы Химия Экология Экономика Электроника |
Пример корреляционного анализа трех переменныхТЕМА 4. Основы корреляционного анализа Вопросы: 1. Функциональные и стохастические типы связей. 2. Корреляционный анализ: 2.1. Парная корреляция. 2.2. Множественная корреляция. 2.3. Частная корреляция. 3. Пример корреляционного анализа трех переменных.
Функциональные и стохастические типы связей Большинство явлений и процессов в экономике находятся в постоянной взаимной и всеохватывающей объективной связи. Для исследования этих зависимостей широко применяется аппарат корреляционно-регрессионного анализа. Он используется при решении задач анализа, планирования и прогнозирования хозяйственной деятельности. Различают два вида зависимостей между экономическими переменными: 1) функциональная; 2) стохастическая (вероятностная, статистическая). При функциональной связипо значению одной переменной (экзогенной) можно найти вполне определенное значение другой (эндогенной). Такие связи между реальными экономическими переменными встречаются редко. В большинстве случаев экономические переменные подвержены действию различных случайных факторов. Тогда по значению одной из них можно лишь предсказать с определенной вероятностью или найти среднее значение другой. Такие связи называют стохастическими (вероятностными, статистическими). Иногда их называют корреляционными. В этом случае о связи переменных можно говорить лишь в вероятностном смысле. Корреляционный анализ Корреляционный анализпредназначендля выявления и оценки количественных взаимосвязей экономических переменных на основе коэффициентов корреляции. Виды корреляции: 1) по направлению связей: - положительная, - отрицательная; 2) по форме связи переменных: - линейная, - нелинейная; 3) по числу переменных: - парная, - множественная, - частная. Задачи корреляционного анализа: 1) оценка тесноты связи переменных; 2) определение направления связи переменных; 3) выбор ведущих (информативных) факторов для исследуемой переменной; 4) выявление ранее неизвестных причинных связей.
Для решения этих задач используют три основных вида коэффициентов корреляции: 1) парные, 2) множественные, 3) частные.
Парная корреляция Выборочный коэффициент парной линейной корреляциипозволяет оценить силу и направление связи между двумя линейно зависящими друг от друга переменными.
где Замечания: 1. Ковариация случайных переменных x и y – это величина, определяемая по формуле Рис.1. Ковариация переменных X и Y. Силу и направление связи двух переменных определяют и коэффициенты парной корреляции. Они являются безразмерными величинами. Ковариация же измеряется в определенных единицах. Этим обусловлено неудобство ее практического использования. 2. Дисперсия (вариация) случайной переменной Y – это степень отклонения ее значений
Рис. 2. Дисперсия (вариация) случайной переменной Y Свойства коэффициента парной корреляции: 1) 2) если 3) если 4) если 5) если
Коэффициент парной корреляции называется выборочным, так как рассчитывается по некоторой выборочной совокупности данных (выборке). Возможность перенесения полученных результатов на генеральную совокупность дает статистическая значимость выборочного коэффициента парной корреляции. Проверка статистической значимостикоэффициента осуществляется на основе t-критерия Стьюдента:
Если Замечание: Для определения
Второй параметр (n-2) называется числом степеней свободы[2], то есть числом степеней свободы независимого варьирования признака. Это число связано с числом единиц совокупности n и с числом определяемых по ней констант в уравнении регрессии (для случая двух переменных в уравнении будут определяться два параметра).
Предположим, что имеется не две, а совокупность переменных
Очевидно, что матрица КМ может быть записана в треугольном виде, так как два ее треугольника одинаковы Основным назначением корреляционной матрицы является выбор ведущих (информативных) факторов 1. В первом столбце матрицы R находят коэффициенты, у которых 2. Оценивают статистическую значимость выбранных коэффициентов 3. Отобранные факторы проверяют на наличие между ними тесной связи (коллинеарности или мультиколлинеарности). Два фактора Тесную связь более чем двух факторов называютмультиколлинеарностью. Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами (матрица межфакторных корреляций)
Чем ближе он к нулю, тем сильнее мультиколлинеарность факторов и ненадежнее результаты регрессионного анализа (см. тему 2, 3). И наоборот, чем ближе к единице определитель матрицы межфакторных корреляций, тем меньше мультиколлинеарность факторов. На практике для построения корреляционных матриц можно использовать инструмент «Корреляция» из пакета «Анализ данных» в Excel (показать примеры построения и анализа корреляционных матриц, используя данные из файла «Примеры - корреляция и регрессия»).
Множественная корреляция
Для оценки тесноты связи одной случайной величины с совокупностью других величин используется коэффициент множественной корреляции. Пусть имеется совокупность переменных
где Свойства коэффициента R: 1) 2) если 3) коэффициент R не позволяет анализировать направления связей.
Частная корреляция Если рассматривать несколько коррелирующих друг с другом случайных переменных, то на величине коэффициентов парной корреляции частично сказывается влияние других величин. В частности, соответствующие коэффициенты корреляции могут быть неоправданно завышены. Поэтому возникает необходимость исследования частной корреляции между переменными, которая оценивается при фиксировании или исключении влияния других переменных. Рассмотрим случай трех переменных а) частная корреляция Y c
б) частная корреляция Y c
Свойства частных коэффициентов корреляции аналогичны свойствам коэффициентов парной корреляции. Пример корреляционного анализа трех переменных В таблице представлена информация о прибыли (Y), объеме продаж (X1) и затратах на рекламу (X2) некоторой фирмы за ряд текущих лет:
Требуется: 1) построить матрицу коэффициентов парной корреляции по трем переменным; проанализировать взаимосвязи переменных; проверить статистическую значимость коэффициентов; 2) найти оценку множественного коэффициента корреляции, сделать вывод о совокупном влиянии факторов на прибыль; 3) найти оценки коэффициентов частной корреляции, определить наиболее влиятельный фактор; 4) построить диаграмму рассеяния (корреляционное поле) для переменной «прибыль» и наиболее влиятельного фактора.
Решение. 1) Корреляционная матрица:
Выводы: оба фактора связаны с переменной «прибыль» прямой тесной связью; при этом сами факторы коллинеарны, так как
Выводы: для всех трех коэффициентов парной корреляции выполняется неравенство 2) коэффициент множественной корреляции:
Вывод: совокупное влияние факторов на прибыль сильное.
3) коэффициенты частной корреляции: Вывод: на переменную «прибыль» сильнее влияет фактор
4) диаграмма рассеяния:
Вывод: подтверждается прямая тесная линейная связь прибыли с объемом продаж. [1] Здесь и далее величина n определяет количество данных в выборочных совокупностях. [2] Любая сумма квадратов отклонений связана с числом степеней свободы независимого варьирования признака. Число степеней свободы должно показать, сколько независимых отклонений из n возможных требуется для образования данной суммы квадратов (Елисеева И.И. Эконометрика, 2007). |