Закон больших чисел и предельные теоремы

Под законом больших чисел в широком смысле понимается общий принцип, согласно которому, по формулировке академика Колмогорова, совокупное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая. Или иначе: При большом числе случайных величин их средней результат перестает быть случайным и может быть предсказан с большой степенью определенности.

Под законом больших чисел в узком смысле понимается ряд математических теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным.

 

Неравенство Чебышева: для любой случайной величины, имеющей математическое ожидание M(X) и дисперсию D(X) справедливо:

,(4.1)

или

,(4.2)

Если формула (6.1) устанавливает верхнюю границу рассматриваемого события, то (4.2) – нижнюю границу вероятности события, состоящего в том, что отклонения значения случайной величины от математического ожидания не превысит (не будет менее) величины , где – достаточно малая величина.

В приложении к выборочному методу неравенство Чебышева может быть сформулировано так: при неограниченном увеличении числа наблюдений ( ) в генеральной совокупности с ограниченной дисперсией с вероятностью близкой к единице можно ожидать, что отклонение выборочной средней ( ) от генеральной средней будет сколь угодно мало: при . Эту вероятность в теореме А.М. Ляпунова (1901г.) используют для определения ошибки наблюдений.

, (4.3)

где - нормированная формула Лапласса.

– средняя квадратическая или стандартная ошибка выборки.

. (4.4)

Пусть надо измерить некоторою величину, истинное значение которой равно a. Пусть результат каждого измерения – случайная величина Xi(i=1,2,…,n). Если при измерениях отсутствует систематические погрешности, то M(Xi)=a при любом i. Тогда средняя арифметическая результатов и измерений сходится по вероятности к истинному значению a.

(4.5)

Дисперсия средней случайной величины Xi равна

(4.6)

Среднее квадратическое отклонение ошибок выборки

, (4.7)

. (4.8).

Зная выборочную среднюю и предельную ошибку выборки можно определить границы, в которых размещена генеральная средняя .

 

Величина средней квадратической ошибки простой случайной повторной выборки может быть определена по формуле:

, (4.9)

т.е. чем больше вариация признака в генеральной совокупности, тем больше ошибка выборки.

Величину называют предельной ошибкой для определения значения вероятности. Если требуется оценить среднюю генеральной совокупности с вероятностью 0,9545, то надо получить значение выборочной средней из соотношения (функция Лапласа).

Для выборки объема предельная ошибка может быть определена из соотношения .

t 1,00 1,96 2,00 2,58 3,00
F(t) 0,683 0,9500 0,9545 0,9901 0,9973

 

– это предел возможной ошибки (правило «трех сигм»).

 

Формула предельной ошибки выборки используется не только для оценки пределов, в которых находится изучаемый признак в генеральной совокупности, но и для определения необходимого объема выборки при заданной ее ошибке. Третий тип задач, которые могут быть решены с использованием предельной ошибки выборки, – это определение вероятности, с которой можно гарантировать, что ошибка выборки не выйдет за заданные пределы.

Величина дисперсии генеральной совокупности принципиально не известна и можно говорить лишь о ее оценке по результатам одной выборки.

–для простой случайной выборки.

При , поправка становится 3,5% (30/(30-1)), поэтому ею можно пренебречь.


Выборочное наблюдение

 

Наименование показателя Вид выборки  
  повторная бесповторная
Случайная выборка Средняя (стандартная) ошибка
  Средняя ошибка доли признака
  Объем выборки
Типическая выборка   Средняя ошибка
  Объем выборки
Серийная выборка   Средняя ошибка
  Объем выборки

 

Величина ошибки зависит от колеблемости признака в генеральной совокупности и от объема выборки. Т.е. чем больше вариация тем больше ошибка, чем больше выборка, тем меньше ошибка. Величину называют предельной ошибкой выборки. Следовательно, предельная ошибка выборки , т.е. предельная ошибка равна t-кратному числу средних ошибок выборки.

t – коэффициент доверия

n – объем выборки;

N – объем генеральной совокупности;

s - число отобранных серий;

S – общее число серий;

- средняя из групповых дисперсий;

- межгрупповая дисперсия.