Лекция 11. Статистическое изучение связи социально-экономических явлений
Основные понятия:
корреляция; регрессия; линейный коэффициент корреляции; коэффициент Фехнера; коэффициент ранговой корреляции Спирмена; коэффициент ранговой корреляции Кендэла; коэффициент регрессии.
Изучение современного производства показывает, что каждое явление находится в тесной взаимосвязи и взаимодействии.
При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обусловливающих изменение других признаков. Признаки этой группы называются признаками-факторами (факторными признаками), а признаки, которые являются результатом влияния этих факторов, называются результативными (как на объем выпуска влияет техническая оснащенность производства, тогда объем производства – результативный, а техническая оснащенность – факторный признак). Различают два вида зависимостей между экономическими явлениями – функциональную и стохастическую. При функциональной связи каждой определенной системе значений факторных признаков соответствуют одно или несколько строго определенных значений результативного признака. Примеры функциональной зависимости можно привести из области физических явлений
(S = v· t).
Стохастическая (вероятностная) связь проявляется только в массовых явлениях. В данной связи каждой определенной системе значений факторных признаков соответствует некоторое множество значений результативного признака. Изменение факторных признаков приводит не к строго определенному изменению результативного признака, а к изменению только распределения его значений. Это обусловлено тем, что зависимая переменная, кроме выделенной переменной, подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение переменных неизбежно сопровождается некоторыми случайными ошибками. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью, а только указаны с определенной вероятностью (число бракованных деталей за смену, количество простоев за смену и т.д.).
Стохастическую связь называют корреляционной. Корреляция в широком смысле слова означает связь, соотношение между объективно существующими явлениями и процессами.Регрессия– это частный случай корреляции. В то время, как в корреляционном анализе оценивается сила стохастической связи, в регрессионном анализе исследуется ее форма, т.е. находится уравнение корреляционной связи (уравнение регрессии).
Рассмотрим различные виды корреляции и регрессии.
По числу переменных различают регрессию:
1) парную – регрессия между двумя переменными
(прибыль производительность труда);
2) множественную – регрессия между зависимой переменной y и несколькими переменными (производительность труда уровень механизации производства, квалификации рабочих).
Относительно формы зависимости различают:
· линейную регрессию;
· нелинейную регрессию.
В зависимости от характера регрессии различают:
1) прямую регрессию. Она имеет место, если с увеличением или уменьшением значений факторных переменных значения результативной переменной также увеличиваются или уменьшаются;
2) обратную регрессию. В этом случае с увеличением или уменьшением значений факторного признака результативный признак уменьшается или увеличивается.
Относительно типа соединений явлений различают:
1) непосредственную регрессию. В этом случае явления соединены непосредственно между собой (прибыль затраты);
2) косвенную регрессию. Она имеет место тогда, когда факторная и результативная переменная не состоят непосредственно в причинно-следственных отношениях, и факторная переменная через какую-то другую переменную действует на результативную переменную (число пожаров и урожайность зерновых (метеорологические условия));
3) ложная или абсурдная регрессия. Она возникает при формальном подходе к исследуемым явлениям. В результате можно придти к ложным и даже бессмысленным зависимостям (число импортируемых фруктов и рост дорожно-транспортных происшествий со смертельным исходом).
Аналогична классификация и корреляции.
Изучение взаимозависимостей в экономике имеет большое значение. Статистика не только отвечает на вопрос о реальном существовании связи между явлениями, но и дает количественную характеристику этой зависимости. Зная характер зависимости одного явления от другого, можно объяснить причины и размеры изменений в явлении, а также планировать необходимые мероприятия для дальнейшего его изменения. Чтобы результаты корреляционного анализа нашли практическое применение и дали желаемый результат, должны выполняться определенные требования и признаков-факторов:
1) однородность единиц, подвергающихся корреляционному анализу (предприятия выпускают однотипную продукцию, одинаковый характер технологического процесса и тип оборудования);
2) достаточное число наблюдений;
3) включаемые в исследование факторы должны быть независимы друг от друга.
Для исследования функциональных связей применяются балансовый и индексный методы. Для изучения стохастических связей используют метод параллельных рядов, метод аналитических группировок, дисперсионный анализ и анализ регрессий и корреляций.
Простейшим приемом обнаружения связей является сопоставление двух параллельных рядов. Сущность метода состоит в том, что сначала показатели, характеризующие факторный признак, ранжируются, а затем параллельно им располагаются соответствующие показатели результативного признака. Сравнение построенных таким образом рядов дает возможность не только подтвердить само наличие связи, но и выявить ее направление.
В случае, когда сравниваемые ряды состоят из большого числа единиц, направления связи для разных единиц может оказаться различным. В этом случае целесообразнее воспользоваться корреляционными таблицами. В корреляционной таблице факторный признак (х) располагают в строках, а результативный (у) – в колонках. Числа, расположенные на пересечении строк и столбцов таблицы, показывают частоту повторения данного сочетания х и у. Построение корреляционной таблицы начинают с группировки единиц наблюдения по значениям факторного и результативного признаков. Если частоты в корреляционной таблице расположены по диагонали из левого верхнего угля в правый нижний угол, то можно предположить наличие прямой корреляционной зависимости. Если же частоты расположены по диагонали справа налево, то предполагают наличие обратной связи между признаками.
Другим методом обнаружения связи является построение групповой таблицы (метод аналитических группировок). Совокупность значений фактора х разбивают на группы и по каждой группе вычисляют среднее значение результативного признака. Предполагается, что при достаточно большом числе наблюдений в каждой группе влияние прочих случайных факторов при расчете групповой средней будет взаимопогашаться, и яснее выявится зависимость результативного признака от факторного и, следовательно, различия в величине средних будут связаны только с различиями в величине данного факторного признака. Если бы связи между факторным и результативным признаком не было, то все групповые средние были бы приблизительно одинаковы по величине.
Простейшим показателем тесноты связи является коэффициент корреляции знаков (коэффициент Г.Фехнера):
,
где – число совпадений знаков отклонений индивидуальной величины от средней;
– число несовпадений знаков отклонений индивидуальной величины от средней.
Этот коэффициент позволяет получить представление о направлении связи и приблизительную характеристику ее тесноты. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных признаков Кф [–1;+1]. Если знаки всех отклонений совпадут, то и Кф = 1 – прямая связь, если знаки всех отклонений будут разными, то Кф = –1, что свидетельствует о наличии обратной связи.
Таблица 27