Расчет теоретических данных.

На практике одной из частых задач научного исследования является определение соответствия эмпирического и теоретического распределений или нескольких эмпирических распределений.

При решении выдвигается нулевая гипотеза - предположение об отсутствии существенных различий между сравниваемыми данными, в частности между встречаемостью признака при различных методах лечения.

Пользуясь данным предположением, производят расчет теоретических данных:

1. Высчитывают, какой процент от общего числа наблюдаемых (n) составляет общее число встречаемости признака (а+с).

2. Поскольку, согласно нулевой гипотезе, различий во встречаемости признака в методах лечения нет, то найденный процент должен сохраняться для встречаемости признака каждого метода лечения. Т.о. рассчитываются ожидаемые (теоретические) числа.

  встречаемость признака не встречаемость признака итого
1 метод лечения %*( a+b)/100 a+b
2 метод лечения %*( c+d)/100 c+d
всего (a+c)/n*100=% b+d n

 

Для таблицы 2х2 расчет ведется так:

1. (a+c)/n*100=%

2. %*( a+b)/100=Х

  встречаемость признака не встречаемость признака итого
1 метод лечения Х a+b-Х a+b
2 метод лечения a+c-Х c+d- (a+c-Х) c+d
всего a+c b+d n

Обратите внимание: теоретические числа рассчитываются до второго знака после запятой.

 

Определение соответствия эмпирических и теоретических данных. Критерий χ2.

Критерий χ2 для произвольной таблицы.

Для принятия или отклонения нулевой гипотезы используется непараметрический критерий χ2. Общая формула для вычисления критерия , где О – фактически наблюдаемое число, Е – теоретически ожидаемое число.

Следовательно, чтобы определить χ2 необходимо:

1. Найти ожидаемые величины;

2. Определить разности (отклонения) между фактическими и ожидаемыми величинами;

3. Возвести эти разности в квадрат;

4. Разделить полученные квадраты разностей на ожидаемые величины;

5. Суммировав результаты деления, получить χ2.

Полученную величину χ2 необходимо оценить, сравнив ее с табличными значениями, которые зависят от числа степеней свободы df и принятого уровня значимости. df =(число строк - 1)*(число столбцов - 1). Для таблицы 2х2 df =(2 - 1)*(2 - 1)=1.

Нулевая гипотеза отвергается, если вычисленная величина χ2 больше табличного значения χ2 при уровне значимости 0,01, т.е. . И принимается, если .

При полном совпадении эмпирических и теоретических величин χ2 равен нулю. По мере увеличения различий между сравниваемыми частотами значение χ2 возрастает.

Критерий χ2 для таблицы 2х2.

  + - итого
+ a b a+b
- c d c+d
всего a+c b+d a+b+c+d=n

В таблице 2х2 расчет χ2 можно производить также по следующей формуле: .