Гипергеометрическое распределение.

 

Пусть имеется множество N элементов, из которых М элементов обладают некоторым признаком A. Извлекается случайным образом без возвращения n элементов. Требуется найти вероятность того, что из них m элементов обладают признаком A. Искомая вероятность (зависящая от N, M, n, m) определяется по формуле:

(4.15)

Если по формуле (4.15) вычислить вероятности для всех возможных значений m, то полученный ряд распределения называется гипергеометрическим законом распределения (таблица 4.5):

Таблица 4.5

M ... n
P(X=m) ...

 

Математическое ожидание и дисперсия случайной величины m, распределенной по гипергеометрическому закону, определяются формулами:

(4.16)

(4.17)

 

Пример 4.1Известно, что в определенном городе 20% горожан предпочитают добираться на работу личным автотранспортом. Случайно выбраны 4 человека.

а) Составьте ряд распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте его график.

б) Найдите числовые характеристики этого распределения;

в) Напишите функцию распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом и постройте её график.

г) Чему равна вероятность того, что среди 4-х случайно отобранных человек не будет ни одного, предпочитающего добираться на работу личным автотранспортом?

д) Чему равна вероятность того, что среди 4-х случайно отобранных людей окажется хотя бы один, предпочитающий добираться на работу личным автотранспортом?

е) Чему равна вероятность того, что среди 4-х случайно отобранных человек будет не больше двух, предпочитающих добираться на работу личным автотранспортом?

Решение. В качестве случайной величины в данной задаче выступает число людей в выборке, предпочитающих добираться на работу личным автотранспортом. Обозначим ее через X.

Перечислим все возможные значения случайной величины Х: 0, 1, 2, 3, 4.

Вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспортом, - постоянна и равна 0,2 (p = 0,2). Вероятность противоположного события, т.е. того, что каждый из отобранных людей предпочитает добираться на работу не личным автотранспортом, а как-то иначе - также постоянна и составляет 0,8 (q = 1 - p = 1 0,2 = 0,8).

Все 4 испытания - независимы, т.е. вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспортом, не зависит от того, каким способом предпочитает добираться на работу любой другой человек из числа случайно отобранных.

Очевидно, что случайная величина Х - подчиняется биномиальному закону распределения вероятностей с параметрами n=4 и p=0,2.

Итак, по условию задачи: n = 4; p = 0,2; q = 0,8; X = m.

а) Чтобы построить ряд распределения, необходимо вычислить вероятности того, что случайная величина примет каждое из своих возможных значений и записать полученные результаты в таблицу.

Расчет искомых вероятностей осуществляется по формуле Бернулли.

 

Подставим в эту формулу данные задачи:

Получим ряд распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом:

 

Х
Р 0,4096 0,4096 0,1536 0,0256 0,0016

 

Так как все возможные значения случайной величины образуют полную группу событий, то сумма их вероятностей должна быть равна 1.

Проверка: 0,4096 + 0,4096 + 0,1536 + 0,0256 + 0,0016 = 1.

Вместо ряда распределения дискретная случайная величина может быть задана графически многоугольником (полигоном) распределения (рис. 4.3).

Рис. 4.3.

б)Найдем основные числовые характеристики распределения данной случайной величины: математическое ожидание, дисперсию и среднее квадратическое (стандартное) отклонение.

Математическое ожидание любой дискретной случайной величины может быть рассчитано по формуле (4.4):

= 0 × 0,4096 + 1 × 0,4096 + 2 × 0,1536 + 3 × 0,0256 +4 ×0,0016 = =0,8 (чел.)

Вместе с тем, ввиду того, что в данном случае речь идет о математическом ожидании частоты, для его расчета можно воспользоваться более простой формулой (4.10):

M(X = m) = np = 4 × 0,2 = 0,8 (чел.)

Рассчитаем дисперсию числа человек, предпочитающих добираться на работу личным автотранспортом, среди 4-х отобранных. Дисперсия любой дискретной случайной величины может быть рассчитана по формуле :

= (0 - 0,8)2 × 0,4096 +(1 - 0,8)2 × 0,4096 +(2 - 0,8)2 × 0,1536 + (3 - 0,8)2 × 0,0256 + (4 - 0,8)2 ×0,0016 = 0,64 (кв.ед).

В данном случае речь идет о дисперсии частоты, а её можно найти по формуле (4.11):

D(X = m) = npq = 4 × 0,2 × 0,8 = 0,64 (кв.ед)

Рассчитаем среднее квадратическое отклонение числа людей в выборке, предпочитающих добираться на работу личным автотранспортом. Среднее квадратическое отклонение рассчитывается по формуле:

в) Дискретную случайную величину можно задать функцией распределения:

где для каждого значения х суммируются вероятности тех значений xi , которые лежат левее точки х.

Зададим функцию распределения дискретной случайной величины применительно к условию данной задачи:

.

Для построения графика функции распределения вероятностей дискретной случайной величины необходимо рассчитать кумулятивные (накопленные) вероятности, соответствующие значениям случайной величины. Алгоритм их расчета вытекает из смысла функции распределения:

 

F(Xi) = P(X1) + P(X2) + ... + P(X i -2) + P(X i -1)

 

Эта формула справедлива для всех F(Xi), кроме F(X0). Так как по определению функция распределения определяет вероятность того, что случайная величина примет значение, меньшее заданного, понятно, что вероятность того, что случайная величина примет значение, не более минимального, равна 0:

F(X0) = 0.

Рассчитаем значения F(х):

Эти данные можно представить и в виде таблицы:

 

Х x £ 0 0 < x £ 1 1 < x £ 2 2 < x £ 3 3 < x £ 4 x > 4
F(x) 0.4096 0.8192 0.9728 0.9984

 

 

График функции распределения вероятностей дискретной случайной величины имеет ступенчатый вид. Скачки равны вероятностям, с которыми случайная величина принимает возможные значения (рис.4.4).