Тема 10. Изучение связи статистических показателей

 

1. Методы корреляционно - регрессионного анализа связей показателей правовой деятельности.

Наиболее разработанной в теории статистики является методология пар­ной корреляции, рассматривающая влияние вариации факторного признака х на результативный у.

В основу выявления и установления аналитической формы связи положе­но применение в анализе исходной информации математических функций. При изучении связей показателей применяются уравнения прямолинейной и криво­линейной связи:

прямолинейная -

полулогарифмическая-

показательная -

степенная-

параболическая -

гиперболическая -

Решение математических уравнений связи предполагает вычисление по исход­ным данным их параметров. Это осуществляется способом выравнивания эмпи­рических данных методом наименьших квадратов. В основу этого метода поло­жено требование минимальности сумм квадратов отклонений импирических данных у, от выровненных :

 

Применительно к совокупности у которых п< 30 для проверки типичности параметров уравнения регрессии используется t - критерий Стьюдента. При этом вычисляется фактические значения t - критерия:

для параметра :

для параметра :

 

где - среднеквадратическое отклонение результативного признака от выровненных значений .

 

- среднеквадратическое отклонение факторного признака от общей средней .

Полученные факторные значения и сравнивают с критерием t , которые получают по таблице Стьюдента с учетом принятого уровня значимости а и числа степеней свободы k . Полученные в анализе корреляционной связи па­раметры уравнения регрессии признаются типичными, если t фактическое больше t критического:

 

Проверка параметрической значимости синтезированных в корреляцион­но-регрессионном анализе математических моделей осуществляется по средст­вам показателей тесноты связей между признаками х и у . Для статистической оценки тесноты связи применяются следующие показатели вариации:

Общая дисперсия результативного признака , отображающая совокупность слияния всех факторов:

 

2. Факторная дисперсия результативного признака отображающая вариацию y только от воздействия изучаемого фактора х:

 

В формуле отклонения характеризуют колеблемость выравненных значений от их общей средней величины .

 

3.Остаточная дисперсия , отображающая вариацию результативного признакам от всех прочих, кроме х, факторов:

 

В формуле отклонения характеризуют колеблимость имперических (фактических) значений результативного признака у от всех выравненных значений

Соотношение между факторной и общий дисперсиями характеризует меру тесноты связи между признаками х и у:

R2 - называется индексом детерминации, который показывает какая часть общей вариации результативного признака y объясняется изучаемым фактором х

 

На основа «Правила сложения дисперсий» получим формулу индекса корре­ляции, которая имеет следующий вид:

При прямолинейной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции r:

 

Линейный коэффициент корреляции r равен индексу корреляции R только при прямолинейной связи.

Для оценки значимости коэффициента корреляции r применяется t - критерий Стьюдента. При этом определяется фактическое значение критерия :

Вычисленные по данной формуле значения сравнивается с критерием , который берется из таблицы значений t Стьюдента с учетом заданного уровня значимости а и числа степеней свободы к. Если > , то величина коэффици­ента корреляции признается существенной.

Для оценки значимости индекс корреляции R применяется F- критерий Фи­шера. Фактическое значение критерия определяется по формуле:

 

где m - число параметров уравнения регрессии.

 

Величина сравнивается с критерием значимости , которые опреде­ляются по таблице F-критерия с учетом принятого уровня значимости а и числа степеней свободы

и

 

Если > , то величина индекса корреляции признается существенной .

В статистический совокупности большого объема вместо таблицы рас­пределения Стьюдента пользуются таблицей интеграла Лапласа. При уровне значимости а = 0,05 табличная величина t=2.

По значению показателя тесноты связи можно по средством t - критерия произвести оценку значимости коэффициента регрессии :

Сравнивая исчисленное по данной формуле значение с табличным , получают заключение о существенности основного параметра уравнения связи - коэффициента регрессии .

Потребности социальной практики требуют разработки методов количест­венного описания социальных процессов, позволяющих точно регистрировать не только количественные, но и качественные факторы.

Тенденция к использованию статистических методов в социальных иссле­дований вызвала к жизни, ряд специфических проблем, в частности проблему измерение тесноты связи.

При исследовании степени тесноты связи между качественными призна­ками, каждый из которых представлен в виде альтернативных признаков, воз­можно использование «тетрахорических показателей». Тогда расчетная таблица состоит из четырех ячеек, обозначаемых буквами а, Ь, с, d Каждая из клеток со­ответствует известной альтернативе того или другого признака.

Таблица 8.

  Да Нет
Да а b
Нет с d

 

Для такого ряда таблиц построен ряд показателей: коэффициент ассоциации Д. Юла и коэффициент контингенции К. Пирсона.

Коэффициент ассоциации определяется по формуле

 

 

где a, b,c,d- коэффициенты четырехклеточной таблицы

В тех случаях, когда один из показателей четырехклеточной таблицы от­сутствует, величина коэффициента ассоциации будет равна единице. Коэффициент контингенции, определяется по формуле :

 

 

где a, b,c,d- коэффициенты четырехклеточной таблицы.

Коэффициент контингенции изменяется от +1 до -1, но всегда меньше ко­эффициента ассоциации.

Для определения тесноты связи как между количественными, так и каче­ственными признаками при условии, что значения этих признаков могут быть упорядочены или проранжированы по степени убывания или возрастания при­знака, может быть использован коэффициент Спирмена, который рассчитывается но следующей формуле:

 

где -квадраты разности рангов, связанных величинами х и у,

N- число наблюдений (число пар рангов). Когда каждый из качественных признаков состоит из более чем двух групп, то для определения тесноты связи можно применить коэффициент взаимной со­пряженности К. Пирсона и А. А. Чупрова. Коэффициент К. Пирсона вычисляет­ся по формуле:

 

где - показатель взаимной сопряженности.

Достаточно высокое значение С указывает на наличие связи между иссле­дуемыми признаками.

Коэффициент взаимной сопряженности А. А. Чупрова вычисляется по формуле:

где - число групп по колонкам;

- число групп по строкам.

 

Он изменяется от 0 до 1.Для качественной оценки тесноты связи можно вос­пользоваться таблицей (по шкале Четдока:

 

Показатель тесноты св язи 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99
Характеристика силы связи слабая умеренная заметная высокая весьма высокая

Контрольные задания.

 

Задание №1 Исследуйте корреляционную зависимость между ростом человека и размером обуви по следующим сведениям:

Рост,см
Размер обуви

 

Задача №2. Определите тесноту связи между среднечасовой выработкой рабочего и количеством рабочих дней в месяце, исходя из следующий данных:

часовая выработка рабочего
количество рабочих дней

 

Задача № З.Исследуйте корреляционную зависимость между ростом человека и длиной его шага по приведенным данным:

 

 

Рост, см
Длина шага,см

 

Задача № 4.0пределите тесноту связи между воспитанием в семье и детской преступностью по результатам обследования 400 семей.

Воспитание в семье Преступность
подвергались приводу не подвергались приводу всего
Занимаются
Не занимаются
Итого

 

 

Задача № 5.Определите коэффициент корреляции, характеризующий тесноту связи между производственной мощностью и себестоимостью продукции, исходя из следующих данных:

Производительность в год, тыс.т
Себестоимость 1т, руб.

 

Задача № 6. Имеется информация по данным статистической отчетности о ра­боте пятнадцати судей (количество рассмотренных под их председательством уголовных дел и процент приговоров, не подвергнутых изменению или отмене). Необходимо оценить характер и тесноту связи между загруженностью суда и качеством судопроизводства (см.ниже).

Для оценки связи между показателями определите коэффициент корреля­ции рангов (Спирмена). Поясните значение исчисленного статистического пока­зателя;

Кол-во рассмотренных дел
% приговоров оставшихся не отмененными и неизмененными

 

Задача № 7. При изучении характеристики лиц, совершивших присвоение вве­ренного имущества в России до 2004 г., получены следующее данные по социальной принадлежности и полу:

 

Социальная принадлежность Мужчины Женщины Итого
Рабочие
Служащие
Итого:

 

Для оценки связи между показателями определите:

1. Коэффициент ассоциации.

2. Коэффициент контингенции. Поясните значение вычисленных статистических показателей.

 

Задача № 8.Имеется информация об осужденных по приговорам, вступившим в законную силу, по отдельным видам преступлений и социальной принадлеж­ности:

 

 

Виды преступлений Социальная принадлежность  
Рабочие Служащие Колхозники Учащиеся Итого
Разбои
Грабежи
Вымогательства
Кражи
Итого:

Для определения тесноты связи между видами преступлений и социальной принадлежностью преступников определите коэффициент взаимной сопряжен­ности К.Пирсона и А.А.Чупрова.

 

Задача № 9 . При контрольной проверке качества поступившей в торговлю партии товара получены следующие данные об удельных весах стандартной продукции по категориям:

 

Категория продукции Удельный вес, % Итого
Стандартная продукция Нестандартная продукция  
Высшая
Первая
Вторая
Итого:

 

Для определения тесноты связи между категорией продукции и ее качест­вом найдите коэффициент взаимосвязи К.Пирсона и А.А.Чупрова. Поясните значение исчисленных показателей.

 

Задача № 10. Получена следующая информация по магазинам торговой ассо-циации за отчетный период:__

Номер магазина Товарооборот Издержки обращения
98,2 6,5
57,6 4,6
26,3 2,6
64,5 5,2
43,1 3,8
11,9 1,9
35,4 3,3
8,6 1,2
76,7 5,6
82,4 5,3

 

Для оценки связи между показателями объема товарооборота и суммой издержек обращения определите коэффициент корреляции рангов (Спирмена).

Поясните значение исчисленного статистического показателя.

 

Задача № 11. Определите коэффициент корреляции, характеризующий тесно­ту связи между производственной мощностью и себестоимостью продукции, исходя из следующих данных:

 

Производительность
Себестоимость 1т.р.уб

 

Задача №12. Имеются следующие данные о стаже работы (лет,х )рабочих одного из заводов и выработке одного рабочего за смену (штук,y)

X
Y

 

Считая, что связь линейная, исчислить уравнение корреляционной связи между стажем работы и выработкой, а также линейный коэффициент корреля­ции. Изобразить зависимость графически.

 

Задача №13. По отчетам десяти мясокомбинатов за один месяц получены сле­дующие данные о живом весе забитого крупного рогатого скота и количестве полученного мяса-говядины:

Номер мясокомбината
Живой вес забитого скота, т
Валовая продукция говядины, т

 

Вычислить:

1) уравнение корреляционной связи между живым весом забитого скота и вало­вой продукцией говядины, а также линейный коэффициент корреляции;

2) изобразить зависимость графически.

 

Задача №14. Для определения скорости износа резца на металлорежущем стан­ке через некоторые интервалы были проведены измерения толщины резца. Результаты этих измерений помещены в следующей таблице:

Номер измерения
Время работы резца, час
Толщина резца, мм 30,0 28,8 28.3 27.9 36.9 26,4 26,2 25,0 24.8 23,7

 

1) Найти корреляционное уравнение связи между временем работы и толщиной резца;

2) построить график этой корреляционной связи;

3) вычислить коэффициент корреляции.

 

Задача №16. По десяти животноводческим фермам имеются следующие данные о валовой продукции молока и об издержках, связанных-с его производством за год:

Номер фермы
Валовая продукция, т
Общие издержки на про изводство, млн.руб.

 

1. Найти уравнение корреляционной связи между валовой продукцией и общими издержками на производство молока.

2. Вычислить линейный коэффициент корреляции.

3. Заданные и выровненные показатели изобразить графически.

 

Задача №17. На крахмально-паточном заводе проведены испытания масляного фильтр пресса с целью определения скорости фильтрации масла в зависимости

Номер испытания И
Температура масла
Скорость фильтрация, мл на 1 м2/мин.

 

1. Найти уравнение прямолинейной корреляционной связи для скорости фильт­рации от температуры масла.

2. Вычислить коэффициент корреляции.

3. Построить график корреляционной связи.