Корреляционной зависимости

Себестоимость единицы продукции

Производительность труда

КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

Виды зависимостей

Признаки, которыми обладают элементы совокупности, существуют неизолированно, они взаимосвязаны между собой. Так, производительность труда на предприятиях зависит от уровня механизации и электрификации производства, стажа и квалификации рабочих и ряда других признаков (факторов). Например, урожайность зерновых зависит от количества внесенных удобрений, срока посева, различных погодно-климатических факторов.

Зависимость между признаками будет функциональной, если каждому значению одного признака соответствует вполне определенное значение другого признака. Подобная зависимость в основном встречается в естественных науках. В экономических же науках между признаками существует статистическая зависимость, при которой каждому значению одного признака соответствует целый ряд распределения другого признака. Так, при одной и той же электровооруженности производительность труда рабочих на различных предприятиях одной отрасли будет разной. Это можно объяснить тем, что производительность труда зависит не только от электровооруженности, но и от ряда других факторов, которые в данный момент не учитываются.

Зависимую переменную принято называть результативным признаком (фактором) и обозначать У. Признаки (факторы), влияющие на результативный признак У, называют факторными признаками и обозначают Х₁, Х₂, ..., Х_n.

Статистическая зависимость между двумя признаками Х и У называется парной. Она задается следующей таблицей:

x_i	х₁	х₂	...	х_n
y_i	y₁	y₂	...	y_n	,

если данные наблюдений не сгруппированы, или корреляционной таблицей:

У \ Х	х₁	х₂	...		...
			...		...
			...		...
...	...	...	...	...	...	...	...
			...		...
...	...	...	...	...	...	...	...
			...		...
			...		...		n	,

если данные сгруппированы,

Частота показывает, сколько раз встречается пара во всех наблюдениях.

В корреляционной таблице наглядно видны ряды распределения одного признака, соответствующие каждому значению другого признака, которые называются условными распределениями. Так, значению х₁ признака Х соответствует следующий ряд распределения признака У:

y₁	y₂	...	y_i	...	y_s
		...		...		,

значению х_j:

y₁	y₂	...	y_i	...	y_s
		...		...		.

Аналогично для признака У значению у_i соответствует следующий ряд распределения признака Х:

х₁	х₂	...	х_j	...	х_k
		...		...		.

По каждому условному ряду распределения можно найти среднюю величину, называемую условной средней и вычисляемую по формуле . В результате получим соответствие между значениями одного признака и условнымисредними другого признака, то есть:

x_j	х₁	х₂	...	х_k
			...		.

Если каждому значению одного признака соответствует вполне определенная условная средняя другого признака, то есть между значениями одного признака и условными средними другого признака наблюдается функциональная связь, то зависимость между этими признаками будем называть корреляционной.

Если с увеличением признака Х условная средняя признака У растет, то корреляционная зависимость называется положительной (прямой). Корреляционная зависимость будет отрицательной (обратной), если с ростом признака Х условная средняя признака У убывает. Если же условная средняя не изменяется, то корреляционная зависимость между признаками отсутствует.

Пример 1.Данные о себестоимости единицы продукции (р.) и производительности труда (тыс. шт.) 50 предприятий представлены в виде следующей корреляционной таблицы:

Определить, существует ли между этими признаками корреляционная зависимость.

Решение. Пусть признак У - себестоимость единицы продукции, р.; Х - месячная производительность труда, тыс. шт. В этой таблице наглядно представлены условные распределения каждой случайной величины. Так, для х₁ = 11 условное распределение признака У имеет следующий вид:

y_i

,

для у₄=13:

х_j

.

Найдем условные средние признака У для каждого значения признака Х.

Результаты вычислений представим в виде таблицы:

х_j

13,8 12,2 9,73 7,67 .

Итак, себестоимость единицы продукции (У) и производительность труда (Х) связаны между собой корреляционной зависимостью.

Определение формы парной

корреляционной зависимости

С помощью корреляционного анализа изучается теснота взаимосвязи между признаками. Регрессионный анализ позволяет приближенно представить корреляционную зависимость между признаками в виде некоторого уравнения, называемого уравнением регрессии.

Пусть Х и У - признаки, связанные между собой корреляционной зависимостью, которая может быть линейной, гиперболической, параболической или какой-то другой. Поэтому необходимо предварительно выяснить форму корреляционной зависимости. Данные задачи можно решить графически. Для этого строятся точки с координатами (х_i, ), если данные сгруппированы в корреляционную таблицу, или (х_i, у_i), если данные не сгруппированы. По расположению построенных точек подбирается линия (прямая, гипербола, парабола), уравнение которой известно (рис. 1, 2, 3).

Рис. 1

Рис. 2

Рис. 3

Так, расположение точек на рис. 1 позволяет сделать вывод, что зависимость между признаками линейная, уравнение прямой у=а₀+а₁х принимается за уравнение регрессии. По рис. 2, 3 делаем вывод, что за уравнение регрессии следует принимать, соответственно, уравнение гиперболы и уравнение параболы у=а₀+а₁х+а₂х².

Далее необходимо найти неизвестные числа а₀, а₁, а₂, называемые параметрами уравнений регрессии. Их определяют, например, методом наименьших квадратов, сущность которого заключается в следующем: находятся такие параметры уравнения регрессии, чтобы была минимальной сумма квадратов отклонений эмпирических значений признака У от теоретических, вычисленных по уравнению регрессии, то есть .

Регрессионный анализ
12
3
4
Далее ⇒