Правила построения дерева вероятностей

Как решать вероятностные задачи

 

Существуют два способа решения задач на нахождение вероятности: простой и сложный. Сложный способ состоит в творческом применении правильной комбинации изложенных ранее правил, простой способ — в том, чтобы построить дерево вероятностейи найти ответыпрямо на таком большом рисунке. Другой полезный метод, помогающий разобраться в ситуации, связан с построением таблиц совместных вероятностей. И еще один метод, который мы уже рас­смотрели, заключается в использовании диаграмм Венна. Независимо от выбора способа — простого или сложного — ответ должен быть один и тот же.

 

Дерево вероятностей

 

Дерево вероятностей — это рисунок, на котором показаны безусловные и условные вероятности для комбинаций двух и более событий. Рассмотрим сначала пример, для которого дерево вероятностей уже построено, и проследим детали его построения. Дерево вероятностей тесно связано с деревом решений, которое широко используют в финансах и других областях коммерческой деятельности.

 

Пример. Управление поддержкой программного обеспечения.

 

Поддержка программного обеспечения — достаточно сложный вид деятельности. Некоторые пользователи звонят, чтобы попросить совета, как работать с программой. Другим необходимо помочь разрешить проблемы, с которыми они столкнулись во время работы. Представьте себе, что в качестве руководителя отдела поддержки вы количественно описали вероятности некоторых характерных звонков пользователей и изобразили свои результаты в виде дерева вероятностей, показанного на рис 6.5.1.

 

 

 

Рис. 6.5.1 содержит много информации. Будем рассматривать его слева направо. Прежде всего, отметим, что вероятность события "пользователь раздражен" составляет 0,20 (это значит, что 20% всех обратившихся за помощью были раздражены, а 80% — нет).

Условные вероятности записаны на рисунке над четырьмя ветвями дерева, расположенными прямо под надписью "Получил ли пользователь помощь?". Обратите внимание, что 15% раздраженных пользователей помощь получили (это вероятность события “пользователь получил помощь" при условии события "пользователь раздражен"), а 85% раздраженных пользователей помощи не получили. Ниже нарисованы две другие ветви. Они свидетельствуют о том, что помощь получили 70% "нераздраженных" пользователей и не получили помощь 30% таких пользователей. Явно видно, что отдел поддержки лучше справляется с оказанием помощи пользователям, которые при обращении не высказывают своего раздражения (соотношение получивших помощь пользователей для этих групп составляет 70% к 15%).

Числа в кружках в правой части рис 6.5.1 показывают вероятности различных событий, сформированных путем комбинирования и и не. Вероятность того, что пользователь был раздражен и получил помощь, составляет 0,03. Это означает, что 3% всех пользователей были раздражены и получили при этом помощь. Далее, 17% всех пользователей были раздражены и помощи не получили; в 56% случаев пользователи не были раздражены и помощь получили, а 24% пользователей не были раздражены и помощи не получили.

Из представленного на рисунке дерева можно найти любую из представляющих интерес вероятностей.

Вероятность события "пользователь раздражен" приведена в первом столбце обведенных в кружок чисел (0,20), а вероятность противоположного события, "не раздражен", показана в кружке, расположенном непосредственно ниже. Вероятность события "пользователь получил помощь" находим сложением двух помещенных в кружочках справа вероятностей, характеризующих получение помощи: 0,03 + 0,56 =0,59. Условная вероятность события "пользователь получил помощь” при условии наступления события "пользователь раздражен" приведена над соответствующей ветвью дерева, она равна 0,15. Несколько сложнее найти вероятность события "пользователь раздражен” при условии события "пользователь получил помощь”. Для этого можно воспользоваться определением условной вероятности.

Условная вероятность "пользователь раздражен" при условии "пользователь получил помощь" равна

 

Вероятность «пользователь раздражен и получил помощь»/

Вероятность «пользователь получил помощь» =

= 0,03/(0,03+0,56) = 0,051

Таким образом, из всех пользователей, которым сотрудники отдела оказали помощь, раздраженными при обращении были 5,1%. Другой способ найти эту условную вероятность состоит в том, чтобы построить новое дерево вероятностей, начинающееся не с события "пользователь раздражен", а с события "пользователь получил помощь". Для того, чтобы представить некоторую условную вероятность, информацию, задающуюусловие, необходимо разместить в дереве перед этой условной вероятностью.

 

Правила построения дерева вероятностей

 

Для построения дерева вероятностей прежде всего необходимо нарисовать само дерево, затем записать на рисунке всю известную для данной задачи информацию и, наконец, воспользоваться основными правилами, чтобы вычислить недостающие числа и закончить дерево.

1. Вероятности указываются в каждой из конечных точек и обводятся кружочками. На каждом уровне дерева сумма этих вероятностей должна равняться 1 (или 100%). Так, например, на рис. 6.5.1 сумма вероятностей на первом уровне составляет 0,20 + 0,80 = 1,00 и на втором уровне — 0,03 + 0,17 + 0,56 + 0,24 = 1,00. Эго правило помогает заполнить один пустой кружок в столбце, если значения всех остальных вероятностей этого уровня известны.

2. Условные вероятности указываются рядом с каждой из ветвей (кроме, возможно, ветвей первого уровня). Для каждой из групп ветвей, выходящих из одной точки, сумма этих вероятностей также равна 1 (или 100%). Например, на рис. 6.5.1 для первой группы ветвей получаем 0,15 + 0,85 = 1,00 и для второй группы — 0,70 + 0,30 = 1,00. Это правило позволяет вычислить одно неизвестное значение условной вероятности в группе ветвей, исходящих из одной точки.

3. Обведенная кругом в начале ветви вероятность, умноженная на условную вероятность рядом с этой ветвью, дает вероятность, записанную в круге в конце ветви. Например, на рис. 6.5.1 для верхней ведущей вправо ветви имеем 0,20 * 0,15 = 0,03, для следующей ветви — 0,20 * 0,85 = 0,17; аналогичные соотношения выполняются и для других двух ветвей. Это правило можно использовать для вычисления одного неизвестного значения вероятности из трех, соответствующих некоторой ветви.

4. Записанное в круге значение вероятности равно сумме обведенных кружками вероятностей на концах всех ветвей, выходящих из этого круга вправо. Так, например, для рис. 6.5.1 из круга со значением 0,20 выходят две ветви, на концах которых находятся обведенные кружками вероятности, сумма которых равна этому значению: 0,03 + 0,17 = 0,20. Это правило позволяет найти одно неизвестное значение вероятности в группе, включающей эту вероятность и все вероятности на концах ветвей дерева, выходящих из соответствующего круга.

 

Используя эти правила можно, зная все, кроме одного значения вероятности для некоторой ветви или на некотором уровне, находить это неизвестное значение. Общий вид такого типа дерева вероятностей с обозначением смысла всех помечающих дерево чисел приведен на рис. 6.5.2,а. Общий вид соответствующей диаграммы Венна показан для сравнения на рис. 6.5.2,б.

 

(Опечатка – «Эти двевеличины при сложении дают Р(В)»)

Пример. Проверка сотрудников на употребление наркотиков

 

Представьте себе, что ваша фирма собирается провести обязательную проверку всех сотрудников на предмет употребления ими наркотиков. Чтобы оценить требуемые затраты (необходимые для тестирования средства и возможные психологические проблемы) и ожидаемый выигрыш (повышение производительности труда), принято решение исследовать различные результаты на основе рассмотрения ситуаций для одного работника. Вы собираетесь воспользоваться деревом вероятностей для вычисления недос­тающей, но полезной информации.

Процедура тестирования неидеальна. Сотрудники лаборатории сообщили, что если человек употребляет наркотики, тест будет "положительным" с вероятностью 90%. Вместе с тем, если человек наркотики не употребляет, тест покажет "отрицательный" (т.е. "не положительный") результат в 95% случаев. На основе неофициального опроса некоторых рабочих можно ожидать, что примерно 8% всего персонала употребляют наркотики.

Базовое дерево вероятностей для данной ситуации показано на рис. 6.5.3. Событие ''употребляет наркотики" помещено на нем первым, поскольку часть исходной информации представлена как условная вероятность, для которой это событие выступает условием.

 

 

 

После нанесения на диаграмму исходной информации получаем дерево вероятностей, приведенное на рис. 6.5.4. Обратите внимание на то, что величины 90% и 95% отражают условные вероятности вдоль соответствующих ветвей; значение 8% для тех, кто употребляет наркотики, представляет собой безусловную вероятность.

 

 

Для заполнения дерева в качестве исходной информации можно использовать и значения других вероятностей, которые не всегдаудается разместить непосредственно надереве. Так, например, если бы нам сообщили вероятность (безусловную) для результата "тест положителен", ее нельзя было бы непосредственно нанести на рисунок; нужно было бы сделать примечание, что сумма значений в первом и третьем кружках на правом краю равна значению этой вероятности.

Воспользуемся теперь нашими основными правилами для нанесения недостающих значений на дерево вероятностей. Этот процесс похож но разгадывание головоломки, и идти здесь к правильному результату можно разными путями. Так, например, можно воспользоваться первым правилом, чтобы найти, что величину 0,08 дополняет величина 0,92. Второе правило дает значения условных вероятностей 0,10 и 0,05. И, наконец, воспользовавшись третьим правилом, получаем все величины вероятностей для заполнения кружков в правой части. Окончательно заполненное дерево вероятностей показано на рис. 6.5.5.

 

 

Теперь легко можно построить и диаграмму Венна, воспользовавшись для этого результатами из правой части показанного на рис. 6.5.5 дерева вероятностей. Несмотря на то, что диаграмма Венна (рис.6.5.6) для получения результатов не нужна, ее использование также часто может быть полезным.

 

 

Из дерева вероятностей (рис. 6.5.5) или диаграммы Венна (рис. 6.5.6) легко найти любую вероятность или условную вероятность. Вот несколько примеров.

 

1. Вероятность "употребляет наркотики и тест положителен" = 0,072.

2. Вероятность "наркотики не употребляет, но тест положителен" = 0,046.

3. Вероятность "тест положителен" = 0,072 + 0,046 = 0,118.

4. Вероятность "тест положителен” при условии, что "наркотики не употребляет" = 0,05.

 

Другие условные вероятности можно найти, воспользовавшись соответствующими формулами, например:

Условная вероятность «употребляет наркотики» при условии «тест положителен» =

Вероятность «употребляет наркотики и тест положителен» /

Вероятность «тест положителен» =

= 0,072/(0,072+0,046) = 0,610

 

Эта условная вероятность представляет особый интерес. Несмотря на кажущуюся надежность методики тестирования (90% положительных результатов для людей, употребляющих наркотики, и 95% отрицательных для тех, кто их не употребляет), условная вероятность того, что в случае положительного результата теста человек действительно употребляет наркотики, оказывается равной только 61%. Это означает, что среди всех работников, для которых тест окажется положительным, только 61% окажутся действительно употребляющими наркотики, в то время как остальные 39% — нет.

Вот над этим уже необходимо подумать трезво. Есть ли смысл проводить проверку, в результате которой 39% людей, для которых тестирование укажет на употребление наркотиков, окажутся обвиненными в этом напрасно? Анализ вероятностей имеет в данном случае большое значение, поскольку позволяет трансформировать имеющуюся информацию в значительно более полезные для принятия решений вероятности.

 

Пример. Использование пилотного проекта для анализа возможного успеха выпуска товара на рынок

 

Допустим, что ваша фирма собирается выпустить на рынок новый товар и на вас лежит ответственность за адекватную подачу описания соответствующих возможностей высшему руководству. В данном случае существуют два основных вопроса: во-первых, следует, ли вообще работать над данным проектом и, во-вторых, есть ли смысл сначала сделать вложение в пилотный проект для проработки его на тестируемом рынке. Такой проект потребует меньших затрат и даст возможность получить некоторую информацию относительно того, велика ли вероятность успеха нового товара.

Для того чтобы собраться с мыслями, следует продумать сценарий вида «что, если,….», включив в него как пилотный проект, так и собственно выпуск продукции на рынок. Предположим, что при этом представляются разумными следующие значения вероятностей.

1. Вероятность того, что выпуск товара на рынок окажется успешным, составляет 0,60.

2. Вероятность успешного выполнения, пилотного проекта равна 0,70. (Это значение несколько выше, поскольку в случае пилотного проекта рынок оказывается более восприимчивым.)

3. Вероятность, того, что успешным окажется либо пилотный проект, либо выпуск товара на рынок (либо оба) составляет 0,75.

 

Для того чтобы принять решение о том, есть ли смысл делать пилотный проект, следует найти:

· условную вероятность (1) того, что выпуск товара на рынок будет успешным при условии достижения успеха в выполнении пилотного проекта.

· условную вероятность (2) того, что выпуск товара на рынок будет успешным даже при отсутствии успеха в выполнении пилотного проекта.

· вероятность (3) того, что успешными будут и выпуск товара на рынок, и выполнение пилотного проекта,

· вероятность (4) провала обоих.

 

Все перечисленные вероятности можно найти, творчески применив для этих целей основные формулы, приведенные в разделе 6.4. Однако поиск правильной для данного конкретного случая комбинации формул может потребовать значительных затрат времени. Более простой путь вычисления необходимых значений вероятностей состоит в построении дерева вероятностей, которое и поможет найти ответы на поставленные вопросы.

 

 

На рис. 6.5.7. показано базовое дерево вероятностей с представленной на нем исходной информацией. Обратите внимание на то, что для двух из трех известных чисел непосредственно на дереве вероятностей места нет; их можно указать рядом, как это показано на рисунке.

Что делать дальше? Первое правило построения дерево вероятностей (или правило дополнительности событий) дает возможность найти вероятность дополнительного, или противоположного, события, величину которой следует поместить в левый нижний круг на диаграмме: 1,00 - 0,70 = 0,30. Кружочки, расположенные в правом столбце, заполнить несколько сложнее. Если три верхних значения при сложении дают 0,75, а сумма двух из них составляет 0,60, третья величина должна быть равна разности этих чисел, т.е. 0,75 - 0,60 = 0,15. Эго значение записываем во второй сверху кружок (вероятность "успешный пилотный проект и неуспешный выпуск товара”). Теперь можно воспользоваться правилом 4 для нахождения вероятности, которую следует поместить в верхний круг 0,70 - 0,15 = 0,55. Итак, у нас заполнены два из трех верхних кружочков в правом столбце; поскольку все они в сумме дают величину 0,75, неизвестная до сих пор величина равна 0,75 - 0,55 -0,15 = 0,05. С этого момента для заполнения дерева вероятностей можно использовать основные правила. Результат в виде заполненного дерева вероятностей показан на рис. 6.5.8.

 

 

В полностью заполненном дереве вероятностей можно найти значения всех необходимых вероятностей (а также значения любых других вероятностей, которые также могут представлять интерес). Ниже эти вероятности перечислены вместе с краткими комментариями к интерпретации условных вероятностей.

1. Вероятность успешного выпуска товара на рынок при условии успешного выполнения пилотного проекта составляет 0,786. Если бы пилотный проект был идеальным средством прогноза успеха новой продукции, эта величина была бы равна 1,00. Однако в реальной жизни ситуация неидеальна и после успешного выполнения пилотного проекта шансы нового товара на успех оцениваются только в 78,6%.

2. Вероятность того, что выпуск товара на рынок будет успешным в случае провала пилотного проекта равна 0,167. Если бы пилотный проект мог полностью предсказать наличие или отсутствие успеха в дальнейшем, эта величина была бы равна 0. Однако в этом случае мы видим, что с вероятностью 16,7% выпуск товара может быть успешным даже после провала пилотного проекта.

3. Вероятность того, что успешными будут и выполнение пилотного проекта, и выпуск товара на рынок, составляет 0,55.

4. Вероятность провала обоих составляет 0,25.

Решение задачи «За какой дверью спрятан приз?»

 

Теперь мы можем построить дерево вероятности и для примера, рассмотренного ранее. Разумно предположить, что приз может находиться за любой из этих дверей (т.е. у нас нет никаких подсказок относительно того, за какой дверью он спрятан), и выбор двери производится случайно. Дерево вероятностей для данной ситуации показано на рис.6.5.9.

 

 

Это дерево несколько отличается от тех, которые мы строили ранее, поскольку из каждой вершины выходит три ветви. Однако основные правила для дерева вероятностей справедливы по-прежнему.

При построении дерева исходными являются вероятность того, что приз находится за определенной дверью (1/3), и условные вероятности выдвигаемых предположений (также 1/3 — условная вероятность всегда одна и та же, поскольку неизвестно, за какой из дверей находится приз). Далее, следуя правилам заполнения дерева вероятностей, приходим к четкому ответу: изменение выбора удваивает шансы на выигрыш с 1/3 до 2/3.

 

Заполните дерево вероятностей с применением основных правил и определите вероятность события P(A или B)

 

 

0,4
0,6
0,2
0,72
0,06
0,08
Событие А ?
Событие В ?
да
нет
да
нет
да
нет
0,57
0,5
0,41
0,69

 


Заполните дерево вероятностей с применением основных правил и определите вероятность события P(B)

 

0,2
0,8
0,14
0,72
0,06
0,08
Событие А ?
Событие В ?
да
нет
да
нет
да
нет
0,7
0,3
0,1
0,9