Лекция 6. Способы стохастического факторного анализа
После изучения главы студент должен:
знать
• задачи и направления использования стохастического анализа;
• основные этапы стохастического анализа;
• значимость парной корреляции и формы связей между экономическими показателями;
• сущность многофакторной корреляции и регрессии;
• сущность и цели использования ранговой корреляции;
• условия успешного использования многофакторной корреляции;
уметь
• рассчитывать парную корреляцию и отбирать показатели для многофакторных стохастических моделей;
• строить многофакторную стохастическую модель;
• интерпретировать многофакторную стохастическую модель;
владеть
• приемами стохастического анализа;
• навыками включения стохастических моделей в систему обоснования плановых и оценочных управленческих решений.
Ключевые слова: корреляционный и регрессионный анализ, парная и множественная регрессия, коэффициент корреляции, стандартная и относительная ошибка аппроксимации.
Методика проведения стохастического факторного анализа основана на обобщении закономерностей варьирования показателей хозяйственной деятельности. Основными методами стохастического моделирования хозяйственных явлений и процессов являются корреляционный и регрессионный анализ.
Задача корреляционного анализа сводится к установлению направления и формы связи между признаками, измерению ее тесноты и к оценке достоверности выборочных показателей корреляции. Корреляционная связь – это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого. Корреляционная связь между признаками может быть линейной и нелинейной, прямой (положительной) и обратной (отрицательной). Прямая корреляция отражает однотипность в изменении признаков: с увеличением значений первого признака увеличиваются значения и другого, или с уменьшением первого уменьшается второй. Например, чем выше квалификация рабочего (разряд), тем выше уровень производительности труда. Обратная корреляция указывает на увеличение первого признака при уменьшении второго или уменьшение первого признака при увеличении второго. Например, чем выше производительность труда, тем ниже себестоимость единицы продукции. Степень, или теснота корреляционной связи определяется коэффициентом корреляции.
Задача регрессионного анализа сводится к выбору типа модели (формы связи), установлению степени влияния независимых переменных на зависимую и определению расчетных значений зависимой переменной (функции регрессии). По количеству включаемых факторов модели могут быть однофакторными и многофакторными (два и более факторов).
Парная регрессия. Наиболее распространенной в экономическом анализе является парная регрессия, рассматривающая влияние вариации фактора х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ. Алгоритм расчета при анализе парной корреляции состоит из следующих этапов:
этап 1 – отбор наиболее существенных факторов, влияющих на результативный показатель (при отборе факторов учитываются причинно-следственные связи между показателями и возможность их количественного измерения); этап 2 – обоснование формы связи; этап 3 – выбор и решение уравнения регрессии;
этап 4 – оценка точности полученного уравнения.
Для решения аналитических задач чаще всего используются следующие формы связи:
1) линейная ,
где у – теоретические значения результативного признака, полученные по уравнению регрессии; а,Ъ – коэффициенты (параметры) уравнения регрессии. При этом коэффициент при свободном члене а характеризует влияние неучтенных факторов на результирующий показатель;
2) гиперболическая ;
3) параболическая
Уравнения показывают среднее значение изменения результативного признака у при изменении факторного признаках на одну единицу его измерения. Параметры уравнения находят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений).
Для линейной формы связи система нормальных уравнений имеет следующий вид:
где п – количество наблюдений.
Приведем примеры систем нормальных уравнений для нелинейных зависимостей.
Для гиперболы
Для параболы
Точность модели может быть определена средней относительной ошибкой аппроксимации:
где – величина отклонения фактического значения у от расчетного значения
Принято считать, что если , то это свидетельствует о высокой точности модели; если величина находится в пределах от 10 до 20%, то точность прогноза признается хорошей; точность считается удовлетворительной, если
Пример
Методом корреляционно-регрессионного анализа определить зависимость объема продаж от расходов на рекламу, используя следующие данные (млн руб.).
Продажи (у) |
50 |
55 |
68 |
72 |
79 |
86 |
90 |
Расходы на рекламу (х) |
3 |
5 |
1 |
5 |
7 |
0 |
(Необходимо отметить, что в данном случае используется учебный пример. Для надежных результатов анализа целесообразно иметь не менее 20 пар наблюдаемых значений у и х.)
Для расчета параметров уравнения составляется вспомогательная таблица.
п |
x |
y |
ху |
х2 |
yx |
1 |
9 |
150 |
1350 |
81 |
150,7964 |
2 |
13 |
155 |
2015 |
169 |
158,2992 |
3 |
15 |
168 |
2520 |
225 |
162,0506 |
4 |
21 |
172 |
3612 |
441 |
173,3048 |
5 |
25 |
179 |
4475 |
625 |
180,8076 |
6 |
27 |
186 |
5022 |
729 |
184,5590 |
7 |
30 |
190 |
5700 |
900 |
190,1861 |
Итого |
140 |
1200 |
24 694 |
3170 |
1200,004 |
Подставив полученные значения в систему уравнений, получим:
Умножив все члены первого уравнения на 20 (140 : 7), получим следующую систему уравнений:
Вычтем из второго уравнения первое:
В итоге уравнение связи, выражающее связь между объемом продаж и расходами на рекламу, будет иметь следующий вид:
Теоретическая зависимость объема продаж от расходов на рекламу показана во вспомогательной таблице в графе .
Параметр при значении х показывает, что с увеличением расходов на рекламу на 1 тыс. руб., объем продаж будет увеличиваться на 1,8757 тыс. руб.
Для расчета стандартной и относительной ошибки аппроксимации проведем следующие расчеты.
y |
yx |
εx |
ε2x |
|
150 |
150,7964 |
-0,7964 |
0,52813 |
0,634253 |
155 |
158,2992 |
-3,2992 |
2,08415 |
10,88472 |
168 |
162,0506 |
5,9494 |
3,671322 |
35,39536 |
172 |
173,3048 |
-1,3048 |
0,75289 |
1,702503 |
179 |
180,8076 |
-1,8076 |
0,99974 |
3,267418 |
186 |
184,5590 |
1,441 |
0,78078 |
2,076481 |
190 |
190,1861 |
-0,1861 |
0,09785 |
0,034633 |
1200 |
1200,004 |
-0,0037 |
8,914862 |
53,995369 |
Относительная ошибка аппроксимации:
Значение средней относительной ошибки показывает на достаточно высокий уровень точности построенной модели.
Полученное уравнение связи позволяет производить аналитическую оценку объема продаж в зависимости от величины расходов на рекламу. Например, если предприятие планирует вложить в рекламную кампанию 33 млн руб., следовательно, ожидаемый объем продаж составит
Для количественной оценки тесноты связи используется коэффициент корреляции, вычисляемый по формуле:
Существуют и другие формулы расчета коэффициента корреляции, но результат должен быть одинаковым для всех вариантов расчета. Коэффициент корреляции характеризует только линейные связи. При наличии нелинейной зависимости между варьирующими признаками используются другие показатели связи.
Выделим основные аналитические характеристики коэффициента корреляции:
• при отсутствии связи между фактором и результативным показателем ;
• при прямой (положительной) связи коэффициент корреляции приобретает положительный (+) знак и находится в пределах от 0 до + 1;
• при обратной (отрицательной) связи коэффициент корреляции принимает отрицательное (–) значение и находится в пределах от 0 до –1;
• чем сильнее связь между показателями, тем ближе величина коэффициента корреляции к 1.
В практической деятельности при оценке зависимости между показателями используют следующую градацию:
• высокая (тесная) степень взаимосвязи – значения коэффициента корреляции находятся в пределах от 0,7 до 0,99;
• средняя степень взаимосвязи – значения коэффициента корреляции находятся в пределах от 0,5 до 0,69;
• слабая степень взаимосвязи – значения коэффициента корреляции находятся в пределах от 0,2 до 0,49.
В рассмотренном выше примере коэффициент корреляции принимает значение 0,99, что характеризует наличие тесной связи между расходами на рекламу и объемом продаж продукции.
Ранговые коэффициенты корреляции. В аналитической практике могут встречаться такие случаи, когда качества факторного и результативного признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости используются так называемые непараметрические методы. Наибольшее распространение получили ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений ряда показателя. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений.
Рассмотрим ранговые коэффициенты Спирмена и Кендалла.
Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле:
где d – разность рангов каждой пары значений х и у; п – число наблюдений.
Расчет рангового коэффициента Кендалла осуществляется по формуле:
где Q – суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов х (равные ранги не учитываются).
Пример
Для определения ранговых коэффициентов корреляции воспользуемся данными семи наблюдений о фондовооруженности труда (тыс. руб./чел.) и выработке на одного рабочего (тыс. руб./чел.). Расчеты приведены в таблице.
Расчет коэффициента Спирмена
Выработка w |
Фондовооруженность (X) |
Ранг по выработке (р,) |
Ранг по фондовооруженности (рх) |
d = px - py |
d2 |
784,8 |
82,33 |
3 |
4 |
1 |
1 |
760,7 |
78,73 |
1 |
1 |
0 |
0 |
794,8 |
81,76 |
5 |
3 |
-2 |
4 |
830,6 |
92,64 |
7 |
7 |
0 |
0 |
815,9 |
89,03 |
6 |
6 |
0 |
0 |
770,6 |
81,55 |
2 |
2 |
0 |
0 |
790,6 |
82,83 |
4 |
5 |
1 |
1 |
Сумма |
6 |
Расчет коэффициента Кендалла
Для расчета коэффициента Кендалла все значения ранжируются по признаку y (выработка), затем по ряду показателя "фондовооруженность" (х) подсчитывается для каждого ранга число последующих рангов ниже данного (число инверсий, их сумму обозначим Q). Выпишем ранги показателей в две строки:
Ранги по у: 12 3 4 5 6 7;
Ранги по х: 12 4 5 3 6 7;
Q = 0011000 = 2;
Вывод. Связь между показателями в примере может рассматриваться как высокая.