Тема 10. Изучение связи статистических показателей
1. Методы корреляционно - регрессионного анализа связей показателей правовой деятельности.
Наиболее разработанной в теории статистики является методология парной корреляции, рассматривающая влияние вариации факторного признака х на результативный у.
В основу выявления и установления аналитической формы связи положено применение в анализе исходной информации математических функций. При изучении связей показателей применяются уравнения прямолинейной и криволинейной связи:
прямолинейная - 
полулогарифмическая- 
показательная - 
степенная- 
параболическая - 
гиперболическая - 
Решение математических уравнений связи предполагает вычисление по исходным данным их параметров. Это осуществляется способом выравнивания эмпирических данных методом наименьших квадратов. В основу этого метода положено требование минимальности сумм квадратов отклонений импирических данных
у, от выровненных
:

Применительно к совокупности у которых п< 30 для проверки типичности параметров уравнения регрессии используется t - критерий Стьюдента. При этом вычисляется фактические значения t - критерия:
для параметра
:

для параметра
:

где
- среднеквадратическое отклонение результативного признака
от выровненных значений
.
- среднеквадратическое отклонение факторного признака
от общей средней
.
Полученные факторные значения
и
сравнивают с критерием t , которые получают по таблице Стьюдента с учетом принятого уровня значимости а и числа степеней свободы k . Полученные в анализе корреляционной связи параметры уравнения регрессии признаются типичными, если t фактическое больше t критического:

Проверка параметрической значимости синтезированных в корреляционно-регрессионном анализе математических моделей осуществляется по средствам показателей тесноты связей между признаками х и у . Для статистической оценки тесноты связи применяются следующие показатели вариации:
Общая дисперсия результативного признака
, отображающая совокупность слияния всех факторов:

2. Факторная дисперсия результативного признака
отображающая вариацию y только от воздействия изучаемого фактора х:

В формуле отклонения
характеризуют колеблемость выравненных значений
от их общей средней величины
.
3.Остаточная дисперсия
, отображающая вариацию результативного признакам от всех прочих, кроме х, факторов:

В формуле отклонения
характеризуют колеблимость имперических (фактических) значений результативного признака у от всех выравненных значений 
Соотношение между факторной
и общий
дисперсиями характеризует меру тесноты связи между признаками х и у:
R2 - называется индексом детерминации, который показывает какая часть общей вариации результативного признака y объясняется изучаемым фактором х
На основа «Правила сложения дисперсий» получим формулу индекса корреляции, которая имеет следующий вид:

При прямолинейной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции r:

Линейный коэффициент корреляции r равен индексу корреляции R только при прямолинейной связи.
Для оценки значимости коэффициента корреляции r применяется t - критерий Стьюдента. При этом определяется фактическое значение критерия
:

Вычисленные по данной формуле значения
сравнивается с критерием
, который берется из таблицы значений t Стьюдента с учетом заданного уровня значимости а и числа степеней свободы к. Если
>
, то величина коэффициента корреляции признается существенной.
Для оценки значимости индекс корреляции R применяется F- критерий Фишера. Фактическое значение критерия
определяется по формуле:

где m - число параметров уравнения регрессии.
Величина
сравнивается с критерием значимости
, которые определяются по таблице F-критерия с учетом принятого уровня значимости а и числа степеней свободы
и 
Если
>
, то величина индекса корреляции признается существенной .
В статистический совокупности большого объема вместо таблицы распределения Стьюдента пользуются таблицей интеграла Лапласа. При уровне значимости а = 0,05 табличная величина t=2.
По значению показателя тесноты связи можно по средством t - критерия произвести оценку значимости коэффициента регрессии
:

Сравнивая исчисленное по данной формуле значение
с табличным
, получают заключение о существенности основного параметра уравнения связи - коэффициента регрессии
.
Потребности социальной практики требуют разработки методов количественного описания социальных процессов, позволяющих точно регистрировать не только количественные, но и качественные факторы.
Тенденция к использованию статистических методов в социальных исследований вызвала к жизни, ряд специфических проблем, в частности проблему измерение тесноты связи.
При исследовании степени тесноты связи между качественными признаками, каждый из которых представлен в виде альтернативных признаков, возможно использование «тетрахорических показателей». Тогда расчетная таблица состоит из четырех ячеек, обозначаемых буквами а, Ь, с, d Каждая из клеток соответствует известной альтернативе того или другого признака.
Таблица 8.
| Да | Нет | |
| Да | а | b |
| Нет | с | d |
Для такого ряда таблиц построен ряд показателей: коэффициент ассоциации Д. Юла и коэффициент контингенции К. Пирсона.
Коэффициент ассоциации
определяется по формуле

где a, b,c,d- коэффициенты четырехклеточной таблицы
В тех случаях, когда один из показателей четырехклеточной таблицы отсутствует, величина коэффициента ассоциации будет равна единице. Коэффициент контингенции,
определяется по формуле :

где a, b,c,d- коэффициенты четырехклеточной таблицы.
Коэффициент контингенции изменяется от +1 до -1, но всегда меньше коэффициента ассоциации.
Для определения тесноты связи как между количественными, так и качественными признаками при условии, что значения этих признаков могут быть упорядочены или проранжированы по степени убывания или возрастания признака, может быть использован коэффициент Спирмена, который рассчитывается но следующей формуле:

где
-квадраты разности рангов, связанных величинами х и у,
N- число наблюдений (число пар рангов). Когда каждый из качественных признаков состоит из более чем двух групп, то для определения тесноты связи можно применить коэффициент взаимной сопряженности К. Пирсона и А. А. Чупрова. Коэффициент К. Пирсона вычисляется по формуле:

где
- показатель взаимной сопряженности.
Достаточно высокое значение С указывает на наличие связи между исследуемыми признаками.
Коэффициент взаимной сопряженности А. А. Чупрова вычисляется по формуле:

где
- число групп по колонкам;
- число групп по строкам.
Он изменяется от 0 до 1.Для качественной оценки тесноты связи можно воспользоваться таблицей (по шкале Четдока:
| Показатель тесноты св язи | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,99 |
| Характеристика силы связи | слабая | умеренная | заметная | высокая | весьма высокая |
Контрольные задания.
Задание №1 Исследуйте корреляционную зависимость между ростом человека и размером обуви по следующим сведениям:
| Рост,см | ||||||||||
| Размер обуви |
Задача №2. Определите тесноту связи между среднечасовой выработкой рабочего и количеством рабочих дней в месяце, исходя из следующий данных:
| часовая выработка рабочего | ||||||||||||
| количество рабочих дней |
Задача № З.Исследуйте корреляционную зависимость между ростом человека и длиной его шага по приведенным данным:
| Рост, см | ||||||||||
| Длина шага,см |
Задача № 4.0пределите тесноту связи между воспитанием в семье и детской преступностью по результатам обследования 400 семей.
| Воспитание в семье | Преступность | ||
| подвергались приводу | не подвергались приводу | всего | |
| Занимаются | |||
| Не занимаются | |||
| Итого |
Задача № 5.Определите коэффициент корреляции, характеризующий тесноту связи между производственной мощностью и себестоимостью продукции, исходя из следующих данных:
| Производительность в год, тыс.т | ||||||||
| Себестоимость 1т, руб. |
Задача № 6. Имеется информация по данным статистической отчетности о работе пятнадцати судей (количество рассмотренных под их председательством уголовных дел и процент приговоров, не подвергнутых изменению или отмене). Необходимо оценить характер и тесноту связи между загруженностью суда и качеством судопроизводства (см.ниже).
Для оценки связи между показателями определите коэффициент корреляции рангов (Спирмена). Поясните значение исчисленного статистического показателя;
| Кол-во рассмотренных дел | ||||||||||||||
| % приговоров оставшихся не отмененными и неизмененными | ||||||||||||||
Задача № 7. При изучении характеристики лиц, совершивших присвоение вверенного имущества в России до 2004 г., получены следующее данные по социальной принадлежности и полу:
| Социальная принадлежность | Мужчины | Женщины | Итого |
| Рабочие | |||
| Служащие | |||
| Итого: |
Для оценки связи между показателями определите:
1. Коэффициент ассоциации.
2. Коэффициент контингенции. Поясните значение вычисленных статистических показателей.
Задача № 8.Имеется информация об осужденных по приговорам, вступившим в законную силу, по отдельным видам преступлений и социальной принадлежности:
| Виды преступлений | Социальная принадлежность | ||||
| Рабочие | Служащие | Колхозники | Учащиеся | Итого | |
| Разбои | |||||
| Грабежи | |||||
| Вымогательства | |||||
| Кражи | |||||
| Итого: |
Для определения тесноты связи между видами преступлений и социальной принадлежностью преступников определите коэффициент взаимной сопряженности К.Пирсона и А.А.Чупрова.
Задача № 9 . При контрольной проверке качества поступившей в торговлю партии товара получены следующие данные об удельных весах стандартной продукции по категориям:
| Категория продукции | Удельный вес, % | Итого | |
| Стандартная продукция | Нестандартная продукция | ||
| Высшая | |||
| Первая | |||
| Вторая | |||
| Итого: |
Для определения тесноты связи между категорией продукции и ее качеством найдите коэффициент взаимосвязи К.Пирсона и А.А.Чупрова. Поясните значение исчисленных показателей.
Задача № 10. Получена следующая информация по магазинам торговой ассо-циации за отчетный период:__
| Номер магазина | Товарооборот | Издержки обращения |
| 98,2 | 6,5 | |
| 57,6 | 4,6 | |
| 26,3 | 2,6 | |
| 64,5 | 5,2 | |
| 43,1 | 3,8 | |
| 11,9 | 1,9 | |
| 35,4 | 3,3 | |
| 8,6 | 1,2 | |
| 76,7 | 5,6 | |
| 82,4 | 5,3 |
Для оценки связи между показателями объема товарооборота и суммой издержек обращения определите коэффициент корреляции рангов (Спирмена).
Поясните значение исчисленного статистического показателя.
Задача № 11. Определите коэффициент корреляции, характеризующий тесноту связи между производственной мощностью и себестоимостью продукции, исходя из следующих данных:
| Производительность | ||||||||
| Себестоимость 1т.р.уб |
Задача №12. Имеются следующие данные о стаже работы (лет,х )рабочих одного из заводов и выработке одного рабочего за смену (штук,y)
| X | |||||||||||
| Y |
Считая, что связь линейная, исчислить уравнение корреляционной связи между стажем работы и выработкой, а также линейный коэффициент корреляции. Изобразить зависимость графически.
Задача №13. По отчетам десяти мясокомбинатов за один месяц получены следующие данные о живом весе забитого крупного рогатого скота и количестве полученного мяса-говядины:
| Номер мясокомбината | ||||||||||
| Живой вес забитого скота, т | ||||||||||
| Валовая продукция говядины, т |
Вычислить:
1) уравнение корреляционной связи между живым весом забитого скота и валовой продукцией говядины, а также линейный коэффициент корреляции;
2) изобразить зависимость графически.
Задача №14. Для определения скорости износа резца на металлорежущем станке через некоторые интервалы были проведены измерения толщины резца. Результаты этих измерений помещены в следующей таблице:
| Номер измерения | ||||||||||
| Время работы резца, час | ||||||||||
| Толщина резца, мм | 30,0 | 28,8 | 28.3 | 27.9 | 36.9 | 26,4 | 26,2 | 25,0 | 24.8 | 23,7 |
1) Найти корреляционное уравнение связи между временем работы и толщиной резца;
2) построить график этой корреляционной связи;
3) вычислить коэффициент корреляции.
Задача №16. По десяти животноводческим фермам имеются следующие данные о валовой продукции молока и об издержках, связанных-с его производством за год:
| Номер фермы | ||||||||||
| Валовая продукция, т | ||||||||||
| Общие издержки на про изводство, млн.руб. |
1. Найти уравнение корреляционной связи между валовой продукцией и общими издержками на производство молока.
2. Вычислить линейный коэффициент корреляции.
3. Заданные и выровненные показатели изобразить графически.
Задача №17. На крахмально-паточном заводе проведены испытания масляного фильтр пресса с целью определения скорости фильтрации масла в зависимости
| Номер испытания | И | ||||||||||
| Температура масла | |||||||||||
| Скорость фильтрация, мл на 1 м2/мин. |
1. Найти уравнение прямолинейной корреляционной связи для скорости фильтрации от температуры масла.
2. Вычислить коэффициент корреляции.
3. Построить график корреляционной связи.