Падает только один год (1992), где при возрастании факторного

признака х признак следствия у убывает. Если между рядами

х и у существует прямолинейная корреляционная зависимость,

То все имеющиеся отклонения обусловлены влиянием случай-

Ных факторов. Конечно наши ряды наблюдений слишком ко-

Роткие для того, чтобы делать какие-то глобальные выводы. По

данным табл. 10.1 построим поле корреляции для нашего при-

мера (рис. 10.2).

Из рисунка видно, что полученную ломанную можно ап-

Роксимировать прямой линией, т. е. в качестве регрессионной

Модели примем уравнение прямой вида (10.5). Для нахождения

параметров a и b используем оба рассмотренных способа. Сна-

чала найдем параметры a и b по МНК (обозначим их a1 и b1). Ис-

пользуя исходные данные табл. 10.1, определяем

(количество наблюдений в нашем примере равно 6, т. е. n = 6);

;

;

;

;

0 200 400 600 800 1000 1200 1400 1600 1800 2000

y

x

Исходный ряд

Выравненный ряд

Рис. 10.2. Поле корреляции

;

;

.

Далее по формуле (10.12) находим искомый параметр a1:

.

Теперь по формуле (10.10) вычисляем искомый параметр b1:

.

Теперь используем второй способ определения параметров

a и b через предварительное нахождение коэффициента кор-

реляции (обозначим искомые параметры a2 и b2). Вычисляем:

;

;

;

;

;

.

Исходя из полученной точечной оценки коэффициента

Корреляции, имеем достаточно близкую линейную прямую за-

висимость между рядами наблюдений x и y.

При количестве наблюдений n ≥ 50 В. И. Романовский ре-

Комендует для среднего квадратического отклонения коэффи-

Циента корреляции использовать формулу

. (10.21)

Связь считается установленной, если выполняется нера-

Венство

. (10.22)

При количестве наблюдений менее тридцати (n < 30) не-

Обходимо проверить полученный коэффициент корреляции на

значимость (существенность). Для этого используют t-крите-

Рий Стьюдента. Выдвигают гипотезу H0 о том, что вычисленное

Нами значение коэффициента корреляции получилось случай-

Но, а на самом деле он равен нулю. Сначала находим расчетное

(фактическое) значение t-критерия по формуле

. (10.23)

Для нашего примера имеем:

.

Затем определяем табличное значение t-критерия Стью-

дента (см. приложение 10) по числу степеней свободы v = n − 2

(для нашего примера v = 4) и по заданному уровню значимости

(ошибки первого рода) α, который обычно задают равным 0,05

(α = 0,05).

Для нашего примера получаем: tтабл = 2,78.

Так как tрасч > tтабл, то гипотеза H0 отвергается, а это озна-

Чает, что полученный нами коэффициент корреляции можно

считать значимым с ошибкой первого рода 5%.

Но, строго говоря, при малой выборке (а выборка разби-

Раемого нами примера является малой) точечной оценкой ко-

Эффициента корреляции пользоваться некорректно и необ-

Ходимо интервальное оценивание. Построим доверительные

Интервальные оценки для истинного значения коэффициента

Корреляции. Это возможно сделать, если основываться на нор-

Мальном распределении точечной оценки коэффициента кор-

Реляции. Верхнюю и нижнюю границы интервала можно найти

Из формулы

, (10.24)

Где — квантиль нормального распределения уровня .

Для нахождения квантиля используется таблица значе-

ний нормированной функции Лапласа Ф0(x) (приложение 5). Но

Применение выражения (10.24) возможно при ряде ограниче-

ний, выполнение которых не всегда реально, а именно: значе-

ние должно быть близко к ±1; число наблюдений (n) должно

Быть достаточно велико.

Отбросить эти ограничения позволяет следующее преоб-

разование:

, (10.25)

которое предложил Р. Фишер. Он доказал, что z в формуле

(10.25) даже при малых n достаточно близко к нормальному за-

Кону распределения. Это позволило Фишеру создать следую-

щий доверительный интервал:

(10.26)

.

Из формулы (10.26) следует, что истинное значение коэф-

фициента корреляции с доверительной вероятностью (1 − α)

заключено в следующем интервале:

thzн < rxy < thzв, (10.27)

где thzн — гиперболический тангенс аргумента z.

Из курса математического анализа известно, что

, (10.28)