Способы формирования выборочных совокупностей

Существуют ь 2 метода формирования выборочной совокупности.

1.Применение повторного отбора

2.Применение бесповторного отбора

 

В первом случае отобранный в выборку элемент возвращается в генеральную совокупность и может попасть в выборку вновь.

Во втором случае отобранные в выборку элементы в генеральную совокупность не возвращаются, и следовательно, не могут попасть в выборку вновь.

Существует 5 видов формирования выборочной совокупности:

1.Собственно - случайная выборка

2.Механическая выборка

3.Типическая выборка

4.Серийная выборка

5.Комбинированная выборка

 

Собственно – случайная выборка.

Отбор единиц из. генеральной совокупности в выборочную производится случайным образом – наугад, без какой – либо систематизации элементов генеральной совокупности. Для этой цели используется компьютерный датчик случайных чисел.

Механическая выборка.

Совокупность сначала упорядочивается по определённому признаку (например,алфавитному) и затем из этой упорядоченной последовательности выбираются единицы через равные промежутки, т.е. используется некоторая регулярная процедура , а начальный элемент выбирается случайным образом.

Типическая выборка (стратифицированная, районированная)

Генеральная совокупность предварительно разбивается на отдельные группы однотипных элементов, и затем из каждой группы случайным или иным способом отбираются единицы пропорционально удельному весу каждой группы.

Серийная выборка.

В отличии от предыдущих способов , когда выбираются отдельные единичные элементы, в выборку отбираются группы единиц одинаковой численности, и затем в каждой группе проводится сплошное обследование.

Комбинированная выборка.

Применяются различные виды выборки в различных сочетаниях.

3.Расчёт средней и предельной ошибок выборки

 

Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.

Как правило, статистические характеристики выборочной и генеральной совокупностей не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки(ошибкой репрезентативности).

Ошибка выборки – это разность между значением показателя, которое было получено по выборке, и генеральным значением этого показателя. Например, разность

= | -|

определяет ошибку репрезентативности для средней величины признака.

 

Формирование выборок происходит случайным образом, поэтому все получаемые значения выборочных показателей также являются случайными и могут принимать для разных выборок из одной и той же генеральной совокупности разные значения . Например, если из генеральной совокупности сформировать 3 выборки, то средние величины каждой из этих выборок не совпадут:

х1≠ х2 ≠ х3

Поскольку значения выборочных показателей случайны, то и ошибки выборки также случайны. Ввиду этого в статистике рассматриваются 2 вида ошибок выборки - средняя (обозначение )и предельная (обозначение ).

 

1. Для среднего значения признака средняя ошибка выборки (ее называют также стандартной ошибкой) выражает численное значение среднего квадратического отклонения sвыборочной средней от математического ожидания M[ ] генеральной средней :.

 

| | – М [ ]|

 

 

Для определения существуют специальные формулы. В табл.7.2 приведены формулы для собственно-случайной и механической выборок (они одинаковы).

 

Выборка Отбор Средняя Доля, w
Собствен-но случай-ная и механи-ческая Повторный отбор
Бесповтор-ный отбор
Типиче-ская Повторный отбор  
Бесповтор-ный отбор  
Серий-ная выборка Повторный отбор  
Бесповтор-ный отбор  

Как видно из этих формул, величина средней ошибки зависит от объема выборки nи от величины вариации признака s: чем большеnи меньшеs, тем меньшеошибка .

2.Предельная ошибка выборки определяет границы интервала, в пределах которого будет находиться генеральная средняя :

.

( )

- ∆ +∆

_

Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений признака,, которая с вероятностью P (близкой к 1) гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью ( или уровнем надежности, если она выражается в процентах).

Известно, что 0 ≤ Р ≤ 1.Наиболее часто в экономических расчетах используются следующие значения Р:

P=0,683;

P=0,954;

P=0,997.

В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке с коэффициентом кратности t, зависящим от значения доверительной вероятности P:

(1)

Величина коэффициента t (называемого также коэффициентом доверия) является нормированным отклонением, которое вычисляется по формуле

t=

и выражается не в натуральных единицах, а в сигмах: , , и т.д.

 

Рассчитаны специальные таблицы, связывающие доверительные вероятности Ри коэффициенты кратности t (таблицы интегральной функции Лапласа). Для вышеприведенных уровней надежности P коэффициенты доверия задаются следующей таблицей:

 

Р 0,683 0,954 0,997
t

 

Например, если t=2, то с вероятностью P=0,954можно утверждать, что расхождение между выборочной и генеральной средними | -| не превысит двукратной величины средней ошибки выборки:

=| - |

 

Таким образом, предельная ошибка выборки позволяет определить предельные значения показателей генеральной совокупности и их доверительные интервалы. Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:

,

(2)

 

Аналогично для долиримеют место выражения

p = w ± ∆w

w - ∆w ≤p ≤ w + ∆w (3)

 

 

Что касается величины дисперсии генеральной совокупности σ2N, то она может быть оценена непосредственно по выборочной дисперсии σ2n.

В математической статистике доказано, что при малом числе наблюдений (особенно при n 40-50)для вычисления генеральной дисперсии σ2N по выборочной дисперсии σ2n следует использовать формулу

(4)

При достаточно больших nзначение поправочного коэффициента близко к 1 (при n=100его значение равно 1,101, а при n=500- 1,002 и т.д.). Поэтому при достаточно больших nможно приближено считать, что обе дисперсии совпадают:

σ2N σ2n.

 

 

Задача.(3-е задание по курсовой работе)

 

Для определения среднего срока пользования краткосрочным кредитом в банке была произведена 5%-ная механическая выборка в которую попало 100 счетов. В результате исследования этих счетов установлено, что средний срок пользования кредитом составляет 30 дней при среднем квадратическом отклонении 9 дней.

В 5-тисчетах из 100 срок пользования кредитом превысил 60 дней.

Необходимо с вероятностью 0,954 определить:

1) пределы, в которых будет находиться срок пользования долгосрочным кредитом по банку в целом, т.е. в генеральной совокупности,

2) долю счетов со сроком пользования кредитом более 60 дней.

 

Решение.

Прежде всего необходимо текстовую постановку задачи преобразовать в числовой формат, введя параметры , необходимые для использования расчетных формул табл.7.2.

 

 

n = 100 т.к. в выборку попало 100 счетов

N = 2000 счетов т.к. выборка 5%-ая

= 30 дней

s = 9 дней среднее отклонение от среднего срока пользования кредитом

Р = 0,954 t = 2

w = 0,05 поскольку в 5-ти случаев из 100 срок в 30 дней превышен:

-

1) Применим формулу расчета средней для бесповторной выборки из табл.7.2

 

=

 

Следовательно, согласно формуле (1)

 

=2 * =

 

Применив формулу (2), получаем

 

т.е. средняя будет лежать в пределах

 

 

2) Для расчёта среднего срока превышения кредита более чем на 60 дней по банку в целом используем соответствующую формулу из табл.7.2

 

 

Следовательно, согласно формуле (1)

 

∆w =2 * w =

Применив формулу (3), получаем

 

 

5% - 4,2%≤ p ≤ 5% + 4,2%,

 

Следовательно, генеральная доля p будет лежать в пределах

0,8% ≤ р ≤ 9,2%

4. Определение необходимого объёма выборки

При планировании выборочного обследования необходимо находить объём выборки такой, чтобы была обеспечена заданная надёжность расчётов.

Существуют формулы для определения необходимого объёма выборки. Для собственно-случайной и механической выборки эти формулы имеют вид:

 

- для повторной выборки

 

- для бесповторной выборки

Пример.

В районе проживают 2000 семей. Необходимо провести выборочное обследование методом случайного бесповторного отбора для нахождения среднего размера семьи.

Определить необходимый объём выборки при условии, что с вероятностью 0,954 ошибка выборки не должны превышать 1 человека при среднем квадратичном отклонении 3 человека.

 

Условие задачи в числовых параметрах:

 

N = 2000 человек

= 1 человек

s = 3 человека

Р = 0,954 t = 2

 

Решение.

семей

Вывод: Из 2000 семей для обследования с заданной степенью надежности нужно отобрать 35 семей.