Параметрические методы определения тесноты связи.

Основные понятия корреляционно-регрессионного анализа.

Все явления общественной жизни взаимосвязаны и взаимообусловлены. Задача статистики состоит в том, чтобы выявить и измерить связи и зависимости между изучаемыми явлениями.

Причинно-следственные отношения - это связь явлений и процессов, когда изменение одного из них - причины - ведет к изменению другого - следствия.

Причина - это совокупность условий, обстоятельств, действие которых приводит к появлению следствия.

Этапы статистического изучения связи:

1) В основе первого этапа лежит качественный анализ изучаемого явления, связанный с анализом природы социального или экономического явления методами экономической теории, социологии, конкретной экономики.

2) Построение модели связи. Он базируется на методах статистики: группировках, средних величинах, таблицах и т. д.

3) Интерпретация результатов - связан с качественными особенностями изучаемого явления.

Факторные признаки -признаки, обуславливающие изменения других, связанных с ними признаков.

Результативные признаки -признаки, изменяющиеся под действием факторных признаков.

В статистике различают функциональную связь и стохастическую зависимость.

Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Функциональная связь проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называетсястохастической. Частным случаем стохастической связи являетсякорреляционная связь.

Корреляционная связь - изменение среднего значения результативного признака обусловленного изменением факторных признаков.

Связи между явлениями и их признаками классифицируются по:

· степени тесноты связи;

· направлению;

· аналитическому выражению.

1. По степени тесноты связи различают количественные критерии оценки тесноты связи.

Величина коэффициента корреляции Характер связи
До ç±0,3ç ç±0,3ç- ç±0,5ç ç±0,5ç- ç±0,7ç ç±0,7ç-ç±1,0ç Практически отсутствует Слабая Умеренная Сильная

2. По направлению выделяют связьпрямую и обратную. При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. Так, например, рост производительности труда способствует увеличению уровня рентабельности производства. В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака.

3. По аналитическому выражению выделяют связипрямолинейные (или простолинейные) и нелинейные.

Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называютлинейной связью; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, степенной, показательной, экспоненциальной и т. д.), то такую связь называютнелинейной, иликриволинейной.

 

Для выявления наличия связи, ее характера и направления в статистике используются методы:

1. приведения параллельных данных;

2. аналитических группировок;

3. графический;

4. корреляции.

 

1. Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Сравним изменения двух величин:

С увеличением величины Х величина У также возрастает. Поэтому связь между ними прямая, и описать ее можно или уравнением прямой, или уравнением параболы второго порядка.

Х
У

3.Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи (рис.1).

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака, на него оказывают воздействие многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер и аналитически выражаются функцией вида:

4. Корреляция - это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

Виды корреляции:

1. Парная корреляция - связь между двумя признаками (результативным и факторным или двумя факторными).

2. Частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении дру­гих факторных признаков.

3. Множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.

 

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определять "полезность" факторных признаков при построении уравнений множественной регрессии. Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму. Та и другая служат для установления соотношения между явлениями, для определения наличия или отсутствия связи.

Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты, направления связи и установление аналитического выражения (формы) связи (регрессионный анализ).

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения.

Виды регрессии:

1) однофакторная (парная)

2) многофакторная (множественная).

 

По форме зависимости различают:

а) линейную регрессию, которая выражается уравнениями прямой (линейной функцией) вида:

б) нелинейную регрессию, которая выражается уравнениями вида:

парабола -

гипербола - и т.д.

По направлению связи различают:

а) прямую регрессию (положительную), возникающую при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;

б) обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой ве­личины зависимая соответственно уменьшается или увеличивается.

 

 


2. Основные задачи корреляционно-регрессивного анализа.

Корреляционный анализ изучает взаимосвязи показателей и позволяет решить следующие задачи:

1. Оценка тесноты связи между показателями с помощью парных, частных и множественных коэффициентов корреляции.

2. Оценка уравнения регрессии.

Основной предпосылкой применения корреляционного анализа является необходимость подчинения совокупности значений всех факторных (Х1, Х2, ..., Хk) и результативного (У) признаков k-мерному нормальному закону распределения или близость к нему. Если объем исследуемой совокупности достаточно большой (n > 50), то подтвер­дить нормальность распределения можно на основе расчета и анализа критериев Пирсона, Ястремского, Боярского, Колмогорова и т. д. Если n < 50, то закон распределения исходных данных определяется на базе построения и визуального анализа поля корреляции. При этом если в расположении точек имеет место линейная тенден­ция, то можно предположить, что совокупность исходных данных (У, X1, Х2, ..., Хk) подчиняется нормальному распределению.

Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных (X1, Х2, ..., Хk).

Основной предпосылкой регрессионного анализа является то, что только результативный признак (У) подчиняется нормальному закону распределения, а факторные признаки X1, X2,.... Xk могут иметь произвольный закон распределения. В анализе динамических рядов в качестве факторного признака выступает время t. При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным (У) и факторными X1,X2,…,Xk признаками.

Уравнение регрессии, или статистическая модель связи социально-экономических явлений, выражаемая функцией

,

является достаточно адекватным реальному моделируемому явлению или процессу в случае соблюдения следующихтребований их построения:

1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (цифровое) выражение.

4. Наличие достаточно большого объема исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами следует описывать линейной или приводимой к линейной формой зависимости.

6. Отсутствие количественных ограничений на параметры модели связи.

7. Постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет построить статистическую модель связи, наилучшим образом отражающую моделируемые социально-экономические явления и процессы.


Параметрические методы определения тесноты связи.

Выбор формы уравнения

При статистическом обследовании корреляционных связей одной из основных задач является определение их формы, т. е. построение модели связи. Построение регрессионной модели проходит несколько этапов: предварительный теоретический анализ, определение объекта, отбор факторов, сор и подготовка информации, выбор модели связи, исчисление показателей тесноты корреляционной связи. Оценка адекватности регрессионной модели.