Биномиальное распределение и измерение вероятностей

В этой теме рассмотрим основные типы распределения дискретных случайных переменных. Предположим, что вероятность наступления некоторого случайного события А при единичном испытании равно р. Производится серия испытаний в каждом из которых случайное событие А может наступить с этой вероятностью р, причем следует отметить, что испытания независимы друг от друга.

Примеры исчисления вероятностей можно обобщить на основе следующей ниже иллюстрации.

Если подбрасываются одновременно 2 монеты (а, b), то существуют 4 возможных случая выпадения герба Т и цифры Н:

аb аb аb аb

ТТ ТН НТ НН

В первом исходе имеем 2 герба. Принимая это за 2 благоприятных исхода, получим вероятность каждого из них р, а сложного события (ТТ) . В данном случае, при р = 1/2;
p2 = 1/4.

Четвертый из возможных исходов НН представляет 2 неблагоприятных исхода с вероятностью q × q = q2 = 1/4.

Каждый из двух других исходов является комбинацией одного благоприятного и одного неблагоприятного случаев.

Вероятность каждого из этих исходов равна p × q = 1/2 × 1/2 =1/4, а обоих вместе ТН и НТ равна их сумме, т. е. 2 р × q = 1/2.

Обобщенным выражением процесса получения вероятностей различных сочетаний независимых событий, когда вероятности их известны, являются последовательные члены разложения бинома.

Для рассматриваемого примера из двух событий имеем:
(р +q)2 = p2 + 2pq + q2. , При p = 1/2 получим (1/2 + 1/2)2 = 1/4+1/2+1/4.

Если 3 монеты а, b, с подбрасываются одновременно, получим 8 возможных комбинаций:

abс abc abc abc abc abc abc abc

ТТТ ТТН ТНН ТНТ НТТ НТН ННТ ННН

Вероятность выпадения 3 гербов составит 1/8, 2 гербов (в сочетании с одним случаем цифры) равна 3/8, одного герба и 2 цифр – 3/8, ни одного герба – 1/8. При 3 независимых событиях степень бинома равна 3.

Вероятности отдельных возможных исходов даются последовательными членами разложения:

(р + q)3 = p3 + 3p2q + 3pq2 + q3.

При p = q = 1/2 имеем (1/2 + 1/2)3 = 1/8 + 3/8 + 3/8 + 1/8, т. e. то же, что и непосредственным подсчетом.

Если число независимых случайных событий n, то вероятность n, n–1, n–2 и т. д. благоприятных исходов равна последовательным членам разложения:

(р + q)n

Если желаем получить вероятные численности разных исходов при данном числе испытаний n, применяем выражение:

N × (p+q)n

Например, при числе испытаний N = 200 и двух независимых событиях n в каждом испытании вероятные численности будут равны 200×(p+q)2 = 200×(р2+2р×q+q2). Если p = q = 1/2, имеем последовательные вероятные численности: 50 + 100 + 50.

При подбрасывании монеты 200 раз (N = 200) выпадения герба следует ожидать в 50 случаях, герба или цифры – в 100 случаях и цифры – 50 случаях.

При тех же р и N, но n = 3 получим последовательные вероятные численности: 25 + 75 + 75 + 25, которые означают 3, 2, 1 наступление события и ненаступление его, причем сумма всех численностей равна N.

При 200 бросаниях трех монет ожидаем в 25 случаях выпадения 3 гербов (ТТТ), в 75 случаях выпадения 2 гербов и одной цифры (ТТН), в 75 случаях выпадения 2 цифр и одного герба (ННТ) и в 25 случаях – 3 цифр.

Итак, когда вероятности независимых событий известны априори, то можно определить вероятные численности любого данного числа n, n–1, n–2.... наступления события и ненаступления его. При этом неважно, равны или не равны р и q, лишь бы они оставались при испытаниях постоянными. Этот факт имеет большое значение в теории статистики.

При изучении природных явлений выделение элементарных событий и вообще расчленения причинного процесса, в результате которого происходят случайные события, обычно невозможно. Классический подход к определению вероятности здесь бессилен. Проблему определения вероятностей таких событий решают на основе статистического подхода.

Однако классический подход к определению вероятностей событий лежит в основе теории анализа случайных событий и теоретических (модельных) распределений исходов испытаний. В свою очередь теория математического анализа случайных событий и модели распределений исходов испытаний являются базой статистических методов, в частности, базой статистических заключений.

Альтернативные, дискретно варьирующие признаки, как было показано выше, распределяются так, что вероятные численности их появления могут быть найдены по формуле бинома Ньютона:

(3.1)

где n – число независимых исходов в одном испытании; р – вероятность благоприятного исхода одного случая; q – вероятность неблагоприятного исхода; N – общее число испытаний (исходов).

При n = 6 возможны 26 = 64 исходов. При равной вероятности альтернатив, т. е. при условии р = q = 0,5, получим следующий ряд вероятных численностей:

64(0,5 + 0,5)6 = 64 [1/64 + 6/64 + 15/64 + 20/64 + 15/64 + 6/64 + 1/64] = 1+6+15 + 20 + 15 + 6+1

Откладывая значения числа наступления благоприятных исходов m по оси абсцисс, а значения вероятных численностей – по оси ординат, получим многоугольник численностей распределения (рисунок 3.1). Ломаная линия, соединяющая точки на графике, называется кривой распределения.

Найденные по формуле бинома численности или биномиальные коэффициенты (при p = q = 0,5) можно получить также при помощи треугольника Паскаля (таблица 3.1). Числовые значения коэффициентов построены так, что любой из них получается суммированием двух стоящих над ним строкой выше значений, справа и слева.

Значения коэффициентов, начиная с единицы, закономерно возрастают до определенного уровня, а затем в той же последовательности уменьшаются. Кривые, изображающие биномиальные распределения с р = q = 0,5, симметричны. При любой степени бинома п число коэффициентов равно n+1, например при
n = 1 оно равно 2 и т. д. Сумма биномиальных коэффициентов равна 2n, как в нашем примере, n = 6; N = 26 = 64.

Если р и q не равны, распределение будет асимметрично, причем тем в большей степени, чем меньше n. При большом n, например 30 и более, оно симметрично и малоступенчато. Характер распределения остается тем же, независимо от того, выражено оно в значениях вероятности или в значениях частоты m ожидаемого события.

Рисунок 3. 1 – Кривая распределения

Таблица 3.1 – Треугольник Паскаля

n Биномиальные коэффициенты N=2n
                   
                 
               
             
           
         
       
     
   
 

 

Для вычисления вероятностей у события (появиться m раз в n независимых испытаний) наряду с формулой бинома применяют также формулу Якоба Бернулли:

(3.2)

Здесь – число сочетаний из n элементов по m, или биномиальный коэффициент;

р – вероятность ожидаемого события (благоприятного исхода);

q = 1 – р – вероятность противоположного события; m – частота появления ожидаемого события; n –число испытаний; n! и m! –факториалы, т. е.: 1×2×3×...×n и 1×2×3×...×m.

Совокупность вероятностей при m = 1, 2, 3, ...n называется биномиальным распределением вероятностей.

Так, для предыдущего примера, при p = q = 0,5, n = 6 и
m = 0, 1, 2, ..., 6 вероятности будут:

m = 0

m = 1

m = 2

при m = 3, 4, 5, 6 вероятности соответственно будут равны:

20/64; 15/64; 6/64; 6/64 т. е. такие, какие получены по формуле бинома.

Биномиальное распределение определяется двумя параметрами: средней величиной μ = np и дисперсией или квадратическим отклонением .

Для рассматриваемого примера имеем среднюю частоту ожидаемого случайного события m = nр = 6 – 0,5 = 3 и дисперсию
s2 = npq = 6 × 0,5 × 0,5 = 1,5.



php"; ?>