Оценка достоверности статистических величин

В статистике выделяют два основных метода исследования - сплошной и выборочный.

При сплошном методе объектом исследования является вся сово­купность единиц, представляющих изучаемое явление, которая назы­вается генеральной совокупностью. Однако, поскольку сплошное ис­следование является трудоемким и дорогостоящим, при проведении медико-биологических статистических исследований чаше всего ис­пользуется выборочный метод. При этом исследование проводится на выборочной совокупности, являющейся частью генеральной совокуп­ности, отобранной для обследования и изучения.

При проведении выборочного исследования обязательным является соблюдение следующих требований:

1) репрезентативность выборочной совокупности;

2) достаточное число единиц наблюдений выборочной совокупности.

Для соблюдения первого требования, репрезентативности, очень важен способ отбора части единиц наблюдений из генеральной сово­купности. Статистикой выработан ряд способов осуществления выборки.

1. Случайный отбор, основу которого составляет отбор единиц наблюдений путем жеребьевки. При этом для каждой единицы обеспе­чивается равная возможность попасть в выборку.

2. Механический отбор, при котором единицы генеральной сово­купности последовательно расположенные по какому-либо признаку (по алфавиту, по датам обращения к врачу и т.д.), механически разбиваются на равные части. Из каждой части в заранее обуслов­ленном порядке отбирают каждую пятую, десятую или какую-либо иную единицу наблюдения таким образом, чтобы обеспечить необходимый объем выборки.

3. Типический (типологический) отбор предполагает обязательное предварительное расчленение генеральной совокупности на от­дельные качественно однородные группы (типы). Выборка, произве­денная в случайном порядке в каждой из установленных типических групп, и будет называться типической.

4. Серийный (гнездный) отбор предполагает выборку из гене­ральной совокупности не отдельных единиц, а целых серий групп единиц, которые отбираются по принципам случайного или механичес­кого отбора. Серийный отбор очень удобен в практическом отноше­нии, хотя точность его результатов уступает другим методам отбора.

При выборе единиц наблюдения любым из перечисленных способов, возможны ошибки смещения, т.е. такие события, появление которых не может быть точно предсказуемым. Эти ошибки являются объектив­ными и закономерными. При определении степени точности выборочно­го исследования оценивается величина ошибки, которая может прои­зойти в процессе выборки. Такие ошибки носят название случайных ошибок репрезентативности (m), и являются Фактической разностью между средними или относительными величинами, полученными при проведении выборочного исследования и аналогичными величинами, которые были бы получены при проведении исследования на гене­ральной совокупности.

На практике для определения средней ошибки выборки при проведении статистических исследований, используются следующие Формулы:

1) для расчета ошибки репрезентативности (mм) средней арифмети­ческой величины (М):

, где σ - среднее квадратическое отклонение;

n - численность выборки.

 

2) для расчета ошибки репрезентативности (mР) относительной величины (Р):

, где Ρ - соответствующая относительная величина (рассчитанная, например, в процентах (%));

q - 100 - Ρ;

n - численность выборки.

В клинических и экспериментальных работах довольно часто приходится использовать малую выборку, когда число наблюдений меньше или равно 30. При малой выборке для расчета ошибок репрезентатив­ности, как средних, так и относительных величин, число наблюде­ний уменьшается на единицу, т.е.

, .

Знание величины ошибки недостаточно для того, чтобы быть уве­ренным в результатах выборочного исследования, так как конкрет­ная ошибка выборочного исследования может быть значительно больше (или меньше) величины средней ошибки репрезентативности. Для оп­ределения точности, с которой исследователь желает получить ре­зультат, в статистике используется такое понятие, как вероят­ность безошибочного прогноза, которая является характеристикой надежности результатов выборочных медико-биологических статистических исследований. Обычно, при проведении медико-биологических статистических исследований используют вероятность безошибочного прогноза 95% или 99%. В наиболее ответственных случаях, когда необходимо сделать особенно важные выводы в теоретическом или практическом отношении, используют вероятность безошибочного прогноза 99,7%

Определенной степени вероятности безошибочного прогноза соот­ветствует определенная величина предельной ошибки случайной выборки (Δ) Определяется эта величина по формуле:

Δ=t * m ,

где t - доверительный коэффициент, который при вероятности безо­шибочного прогноза 95% равен 2. при вероятности безоши­бочного прогноза 99% - 3,. и при вероятности безошибочно­го прогноза 99,7% - 3,3.

Используя предельную ошибку выборки (Δ), можно определить до­верительные границы, в которых с определенной вероятностью безо­шибочного прогноза заключено действительное значение статистичес­кой величины, характеризующей всю генеральную совокупность (сред­ней или относительной).

Для определения доверительных границ используются следующие Формулы:

1) для средних величин:

,где - доверительные границы средней величины в генеральной со­вокупности;

- средняя величина, полученная при проведении исследова­ния на выборочной совокупности;

t - доверительный коэффициент, значение которого определяет­ся степенью вероятности безошибочного прогноза, с кото­рой исследователь желает получить результат;

mM - ошибка репрезентативности средней величины.

2) для относительных величин:

, где - доверительные границы относительной величины в гене­ральной совокупности;

- относительная величина, полученная при проведении иссле­дования на выборочной совокупности;

t - доверительный коэффициент;

mP - ошибка репрезентативности относительной величины.

При малом числе наблюдений (n<30), для вычисления довери­тельных границ значение коэффициента t находят по специальной таблице Стьюдента (см. Табл.6). Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, указывающей на имеющееся число степеней свободы (n`), которое равно n-1.

Таблица 6.

Таблица значений критерия t (Стьюдента)

Число степеней свободы n’ Вероятность ошибки
0.05 = 5% 0.01 = 1% 0.001 = 0.1%
  12.70   83.66   637.59  
  4.30   9.92   31.60  
  3.18   5.84   12.94  
  2.78   4.60   8.61  
  2.57   4.03   6.86  
θ   2.42   3.71   5.96  
  2.36   3.50   5.31  
  2.31   3.36   5.04  
  2.26   3.25   4.78  
  2.23   3.17   4.59  
  2.20   3.17   4.44  
  2.18   3.06   4.32  
  2.16   3.01   4.22  
  2.14   2.98   4.14  
  2.13   2.95   4.07  
  2.12   2.92   4.02  
  2.11   2.90   3.96  
  2.10   2.88   3.92  
  2.09   2.86   3.88  
  2.09   2.84   3.85  
  2.08   2.83   3.82  
  2.07   2.82   3.79  
  2.07   2.81   3.77  
  2.06   2.80   3.75  
  2.06   2.79   3.73  
  2.06   2.78   3.71  
  2.05   2.77   3.69  
  2.05   2.76   3.67  
  2.04   2.76   3.66  
  2.04   2.75   3.64  

При проведении выборочного медико-биологического статистичес­кого исследования важное значение имеет определение необходимого числа наблюдений (n). Число наблюдений при проведении выборочно­го исследования зависит от вероятности безошибочного прогноза ре­зультатов исследования (определяется по коэффициенту t), а также от конкретных особенностей организации исследования и объекта наблюдения.

При проведении медико-биологических статистических исследова­ний для определения минимально допустимого числа наблюдений ис­пользуются следующие формулы:

1) для средних величин:

n = t2 * σ2
Δ2

2) для относительных величин:

n =
,где t - доверительный коэффициент; Ρ - относительная величина (рассчитанная, например, в про­цен­тах (%)); Δ - предельная ошибка выборки.
t2 * ρ * (100 * Ρ)

Δ2

 

Величина Δ определяется исследователем на основании необхо­димой вероятности безошибочного прогноза. Среднее квадратическое отклонение (σ) и относительная величина (Р) определяются либо на основании ранее проведенных исследований, либо на основании имею­щихся данных литературы.