Корреляционный метод анализа
Одной из особенностей корреляционной связи является то, что она не бывает функциональной, т.е. не обнаруживается в единичных случаях, а обнаруживается только в массовых наблюдениях и проявляется в среднем для совокупности изучаемых явлений.
Исходной информацией для корреляционного метода исследований являются эмпирические данные, полученные в результате применения элементарных приемов изучения взаимосвязей, т.е. сравнения и сопоставления параллельных рядов и применения метода группировок.
Выборы формы связи осуществляется с помощью графического метода с последующим нанесением на этот же график результатов, полученных на основании построенной корреляционно-регрессионной модели.
Исходные эмпирические (фактические) данные наносятся на график корреляционного поля и на основе графика делается вывод о форме связи.
На оси абсцисс откладываются факторные значения признака, а на оси ординат – результативные значения признака.
Построив график по эмпирическим значениям обоих признаков, можно сделать вывод о форме связи, ее направлении, а по разбросу точек - о тесноте связи между признаками.
Далее необходимо аналитически убедиться, на сколько высокая существует взаимосвязь между признаками.
Мерой существенности тесноты связи являются показатели ее оценки: линейный коэффициент корреляции при прямолинейной форме связи и корреляционное отношение при криволинейной форме связи.
Абсолютная величина коэффициента корреляции определяется по следующей формуле:
Линейный коэффициент корреляции изменяется при прямой связи от
0 до (+1), а при обратной связи - от 0 до (-1). Если коэффициент корреляции равен нулю (r = 0), то связи между признаками нет; если он равен единице с любым знаком (r = 1), то между признаками существует функциональная связь.
Чем теснее связь между признаками, тем ближе к единице будет значение линейного коэффициента корреляции и наоборот.
При наличии криволинейной связи коэффициент корреляции «r» недооценивает тесноту связи и, в некоторых случаях, дает неверное представление о степени тесноты связи, поэтому в случае криволинейной связи между признаками применяется корреляционное отношение (ŋ).
В основе исчисления корреляционного отношения при наличии криволинейной связи между признаками лежит правило сложения дисперсий, согласно которому общая дисперсия результативного признака может быть представлена как сумма двух дисперсий:
· внутригрупповой (остаточной)
· межгрупповой .
Корреляционное отношение (ŋ) представляет собой отношение дисперсий: ŋ = , где:
- межгрупповая дисперсия;
- общая дисперсия.
Общая дисперсия рассчитывается по формуле простой дисперсии и показывает величину вариации признака, обусловленную всеми факторами, влияющими на данный признак.
Межгрупповая дисперсия характеризует ту часть общей вариации признака, которая возникает в результате действия факторов, делящих совокупность на группы, поэтому ее ещё называют факторной дисперсией. Межгрупповая дисперсия равна средневзвешенному квадрату отклонений групповых (частных) средних от общей средней :
= , где:
n – численность единиц в i-той группе.
Внутригрупповая дисперсия или остаточная характеризует остаточную вариацию, не связанную с группированием. То есть она характеризует вариацию признака, обусловленную прочими случайными факторами, не связанными с делением совокупности на группы. Вычисляется она как средняя взвешенная из внутригрупповых дисперсий:
, где:
- дисперсия признака внутри i – той группы.
Чем больше межгрупповая дисперсия , тем лучше проведена группировка. Поэтому, межгрупповая дисперсия является критерием группирования для группировок с одинаковым числом групп.
Лучшей будет та группа, у которой величина больше.
Для нахождения общей дисперсии ( ) необходимо воспользоваться правилом сложения дисперсий:
Отношение называется коэффициентом детерминации (R) и показывает, какую долю общей дисперсии составляет дисперсия под влиянием изучаемого фактора.
Извлекая квадратный корень из величины ранее указанного отношения, получаем корреляционное отношение, характеризующее криволинейную взаимосвязь между признаками:
h=
Коэффициент корреляции (r) является мерой тесноты связи только для линейной формы связи, а корреляционное отношение и для линейной, и для криволинейной формы связи.
При прямолинейной связи коэффициент корреляции по своей абсолютной величине равен корреляционному отношению: .
9.2.2. Регрессионный метод анализа. Результаты корреляционного анализа служат основой для проведения регрессионного анализа, дающего выражение аналитической форме связи в виде построения теоретического уравнения регрессии.
Из построенной ранее, при проведении корреляционного анализа, эмпирической линии связи в корреляционном поле (ломаной линии), можно сделать вывод, что взаимосвязи между факторным и результативным признаками систематически нарушаются влиянием множества случайных факторов.
При проведении регрессионного анализа необходимо определить теоретическую линию связи, заменяющую эмпирическую ломаную линию, которая характеризовала бы форму зависимости признаков с помощью уравнения регрессии. Применяя способ наименьших квадратов (как для прямолинейной, так и для криволинейной связи) можно вычислить параметры уравнения а0 и а1 , и подобрать такие их значения, при которых сумма отклонений значений признака от искомой теоретической линии будет минимальной, что достигается решением системы нормальных уравнений.
Смысл замены ломаной линии эмпирических значений признаков теоретической линией заключается в выравнивании эмпирической ломаной, которое позволяет отыскать в ее движении некоторую регулярность, закономерность. Такое выравнивание устраняет случайные колебания изучаемого признака, создающие изломы кривой, вскрывает общую тенденцию движения ряда и представляет значения показателя как его функцию:
Зависимости между признаками (факторным и результативным) выражаются следующими уравнениями:
прямой линии yx = a0 + a1x,
гиперболы yx = a0 + a1 ,
логарифмической кривой yx = a0 + a1lgx,
параболы 2-го порядка yx = a0 + a1x + a2x2
и другими уравнениями.
Определить тип уравнения можно логическими, графическими или аналитическими методами.
Если результативный и факторный признаки возрастают или уменьшаются одинаково, примерно в арифметической прогрессии, то это свидетельствует о наличии линейной связи между ними, а при обратной связи – криволинейной.
Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная функции.
Степенная функция имеет вид:
у = а0 х а
Параметр а1 степенного уравнения называется показателем эластичности и показывает, на сколько процентов изменится у при возрастании х на 1%. При х =1 а0 =у.
При помощи степенной функции определяют зависимость между фондом оплаты труда и выпуском продукции, связь между выпуском продукции и себестоимостью, уровнем издержек обращения и товарооборотом предприятия, сроками уборки и урожайностью и т.д.
Нахождение параметров теоретической линии связи адекватно выравниванию эмпирических данных для определения параметров модели (искомого уравнения регрессии) a0 и a1.
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
n aо + a1∑x=∑y,
aо∑x + a1 ∑x²=∑xy,
где: п – объем исследуемой совокупности (число единиц наблюдения).
.
В уравнении регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных факторов; параметр а1 – коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.
= a0 + a1x
Полученное уравнение регрессии представляет собой статистическую модель реального экономического процесса, выраженного средствами математических формул.
Таким образом, основной смысл регрессионного анализа состоит в том, чтобы по полученному уравнению регрессии найти теоретические уровни , которые могут служить планируемыми прогнозируемыми показателями на предстоящий период.
Если специальные критерии значимости отвечают необходимым требованиям, то уравнение регрессии будет являться экономико-математической моделью и пригодно к практическому применению.
Интерпретация моделей регрессии осуществляется методами той отрасли знаний, к которой относятся исследуемые явления и начинается с выяснения, как входящие в модель факторные признаки влияют на величину результативного признака.
Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии.
Если факторный признак имеет знак (+), то с увеличением данного фактора результативный признак возрастает. Если факторный признак имеет знак (-), то с его увеличением, результативный признак уменьшается.