Далее находим частные производные, приравниваем их
нулю и получаем:
(10.8)
Преобразуем (10.8) и получаем так называемую систему
нормальных уравнений:
; (10.9)
.
Решаем систему (10.9) находим искомые параметры a и b.
Из второго уравнения системы (10.9) выражаем b:
. (10.10)
Теперь из первого уравнения системы (10.9) выражаем а:
. (10.11)
Подставляем (10.10) в (10.11) и получаем:
Первый член последнего выражения переносим в левую
часть и получаем:
.
Из последнего выражения находим искомое значение па-
раметра a.
. (10.12)
Определив по формуле (10.12) параметр a, затем из выра-
жения (10.10) находим параметр b.
Рассмотрим второй способ определения параметров a и b.
Он предусматривает предварительное нахождение оценок ко-
Эффициента корреляции и коэффициента регрессии. При этом
уравнение регрессии записывается следующим образом:
, (10.13)
где — среднее арифметическое ряда наблюдений y;
— среднее арифметическое ряда наблюдений x;
ρy/x — коэффициент регрессии, который находится по сле-
дующей формуле:
, (10.14)
Где и — оценки средних квадратичных отклонений рядов
наблюдений y и x соответственно (о средних квадратических
Отклонениях и их оценках мы уже говорили в главах 2 и 6);
— оценка коэффициента корреляции (о коэффициенте
Корреляции говорилось в главе 2).
Так как в статистике имеют дело с выборками ограничен-
Ного объема, то вычисляют не сами характеристики, а их оцен-
Ки. Об этом мы уже говорили в главе 6. Далее для краткости
слово “оценка” мы будем опускать.
Коэффициент корреляции вычисляется по формуле
, (10.15)
Где — оценка ковариации или корреляционного момента
(о ковариации мы говорили в главе 2).
Корреляционный момент определяется из выражения
, (10.16)
при количестве наблюдений n > 40.
Если n ≤ 40 используется формула
. (10.17)
Напомним, что .
Чем ближе к ±1, тем более тесная линейная связь су-
ществует между рядами наблюдений x и y.
Квадрат коэффициента корреляции называется коэф-
Фициентом детерминации. Часто он более предпочтителен для
Измерения связи, так как его можно применять для измерения
не только линейных, но и нелинейных зависимостей [15]. Коэф-
Фициент детерминации часто выражают в процентах.
Преобразуем формулу (10.13) следующим образом:
. (10.18)
Из сравнения (10.5) и (10.18) получаем:
; (10.19)
, (10.20)
где ρy/x — тангенс угла наклона прямой к положительному на-
Правлению оси абсцисс;
— отрезок, отсекаемый прямой на оси ординат.
Рассмотрим конкретный пример построения однофактор-
Ной линейной регрессионной модели.
Пример 10.1
Предположим, что мы располагаем зарегистрированными
Данными о хищении огнестрельного оружия и вооруженных
Преступлениях в некотором городе N. Между зарегистриро-
Ванным уровнем хищений огнестрельного оружия и учтенными
Преступлениями, совершенными с применением огнестрельно-
Го оружия, существует прямолинейная корреляционная зави-
Симость. Данные деяния корреллируют между собой главным
Образом потому, что у них практически одни и те же причины.
Оговоримся сразу, что пример, который мы приведем, учеб-
Ный. К тому же из результатов предыдущих исследований мы
Знаем, что линейная корреляционная зависимость между ис-
Следуемыми явлениями существует. Если же это не так, то для
Надежного установления корреляционной зависимости коли-
Чество наблюдений должно быть не менее двадцати.
Исходные данные задачи поместим в табл. 10.1, причем не в
Хронологическом порядке, а по возрастанию числа зарегистри-
рованных хищений огнестрельного оружия (признак фактор x).
Посмотрим, как при этом будут меняться зарегистрированные
Значения числа вооруженных преступлений с применением
огнестрельного оружия (результативный признак y). То есть
Покажем, как применяется способ сопоставления двух парал-
Лельных рядов.
Таблица 10.1
Виды преступлений 1991 г. 1996 г. 1992 г. 1995 г. 1994 г. 1993 г.
Хищения огнестрель-
ного оружия, х
773 1130 1138 1336 1352 1396
Вооруженные
преступления, y
4481 9549 8873 12160 18059 19154
Из табл. 10.1 видно, что при возрастании признака факто-
ра х результативный признак тоже в основном возрастает. Вы-