Пример практического применения Байесова подхода к статистическим задачам

Обратимся вновь к булавочной компании. Компания имеет две фабрики, причем старая выпускает 40% продукции. Это озна­чает, что взятая наугад булавка, бракованная или нет, с веро­ятностью 40% выпущена на старой фабрике; это исходная ве­роятность. Известно, что на старой фабрике процент брака вдвое больше, чем на новой. Если клиент звонит и сообщает о купленной им бракованной булавке, на какую из двух фаб­рик должен звонить менеджер по сбыту?

Исходная вероятность побуждает утверждать, что, скорее всего, бракованная булавка сделана на новой фабрике, выпу­скающей 60% продукции компании. С другой стороны, час­тота появления брака на этой фабрике вдвое меньше, чем на старой. Пересмотрев исходную вероятность с учетом этой до­полнительной информации, получаем, что вероятность выпус­ка бракованной булавки новой фабрикой равна только 42,8%; это значит, что с вероятностью 57,2% виновата старая фабри­ка. Эта новая оценка становится апостериорной вероятностью.

 

 

Глава 8

Предельный закон хаоса

В 1855 году в Гёттингене в возрасте 78 лет скончался Карл Фридрих Гаусс. За последние 27 лет жизни он только од­нажды не ночевал дома и, надо думать, из неприязни к пу­тешествиям категорически отказывался от предложений самых из­вестных университетов Европы занять место профессора1.

Подобно многим математикам до и после него, Гаусс уже в ран­нем детстве проявил гениальные способности, чем в равной степе­ни огорчил отца и обрадовал мать. Его отец был простым рабочим, презирал заумные увлечения своего гениального сына и всячески портил ему жизнь. Мать, напротив, как могла, старалась защитить своего мальчика и всемерно поощряла его увлечение математикой, за что Гаусс до конца дней вспоминал о ней с глубокой благодар­ностью.

Биографы, как обычно в таких случаях, сообщают всевозможные истории о математических головоломках, которые будущий великий математик решал в том возрасте, когда большинство детей с трудом делят 24 на 12. Он обладал феноменальной памятью и помнил всю логарифмическую таблицу назубок. В восемнадцать лет он сделал удивительное открытие, касающееся свойств семнадцатиугольника; такого в математике не случалось уже 2000 лет со времен древних греков. Его докторская диссертация на тему «Новое доказательство того, что каждая целая рациональная функция одной переменной может быть представлена произведением действительных чисел пер­вой и второй степени» посвящена решению основной теоремы ал­гебры. Сама теорема была известна и раньше, но он предложил со­вершенно новое доказательство.

Слава Гаусса была столь велика, что, когда в 1807 году фран­цузские войска подошли к Гёттингену, Наполеон приказал побе­речь город, в котором живет «величайший математик всех вре­мен»2. Со стороны Наполеона это было очень любезно, но слава имеет и оборотную сторону. Когда победители наложили на Герма­нию контрибуцию, они потребовали с Гаусса 2000 франков. Это соответствовало примерно 5000 нынешних долларов — довольно крупная сумма для университетского профессора1}. Друзья пред­лагали помощь, Гаусс отказывался; пока шли препирательства, выяснилось, что деньги уже уплачены знаменитым французским математиком Морисом Пьером де Лапласом (1749-1827). Лаплас объяснил свой поступок тем, что считает Гаусса, который был на 29 лет моложе его, «величайшим математиком в мире»3, т. е. оце­нил его чуть ниже, чем Наполеон. Позднее анонимный почитатель прислал Гауссу 1000 франков, чтобы помочь ему рассчитаться с Лапласом.

Соотношение франка и доллара в течение многих лет с удивительным постоянством держалось на уровне 5 : 1. Таким образом, 2000 франков можно приравнять к 400 дол­ларам. В 1807 году покупательная способность доллара была в двенадцать раз выше, чем сегодня.

 

Сам Лаплас был весьма колоритной фигурой, о которой стоит сказать здесь несколько слов; подробнее мы поговорим о нем в гла­ве 12.

В детстве он, как и Гаусс, был математическим вундеркиндом, а впоследствии прославился своей космогонической теорией в аст­рономии. В течение многих лет его внимание привлекали некото­рые разделы теории вероятностей, которые исследовал Гаусс. Но на этом сходство кончается. Жизнь Лапласа протекала на фоне Фран­цузской революции, Наполеоновских войн и реставрации Бурбо­нов. Честолюбивому человеку нужно было обладать большой лов­костью, чтобы в этой кутерьме удержаться на поверхности. Лаплас оказался как раз таким человеком4.

В 1784 году король сделал его инспектором королевской артил­лерии, положив очень приличное жалованье. Однако с установле­нием республики в Лапласе проснулась «неугасимая ненависть к монархии»5, а очень скоро после захвата власти Наполеоном он за­явил о своей решительной поддержке нового вождя, который дал ему пост министра внутренних дел и титул графа, по-видимому рассчитывая, что сотрудничество всемирно известного ученого укре­пит авторитет нового режима. Но уже через шесть недель, уволив Лапласа и посадив на его место своего брата, Наполеон скажет: «Он был хуже самого посредственного чиновника, который во всем видит только хитросплетения. Министерство под его руководством погрязло в трясине бесконечно малой чепухи»8. Неплохой урок для ученых, которым неймется стать власть имущими!

Правда, позже Лаплас взял реванш. Вышедшее в 1812 году первое издание своей «Theorie analytique des probabilites» («Аналитической теории вероятностей») он еще посвятил «Великому Наполеону», но из второго издания 1814 года это посвящение вычеркнул и связал пере­мену политических ветров с темой своего трактата. «Падение импе­рий, стремившихся к господству над миром, — написал он, — с очень высокой степенью вероятности мог предсказать каждый сведущий в вычислениях шансов»7. Людовик XVIII после коронации припомнил это замечание, и Лаплас стал маркизом.

В отличие от Лапласа Гаусс был очень замкнутым человеком и вел затворнический образ жизни. Он не опубликовал массу своих открытий, и многие из них были заново сделаны другими матема­тиками. В публикациях он уделял больше внимания результатам, не придавая особого значения методам их получения и часто зас­тавляя других математиков тратить массу сил на доказательство его выводов. Эрик Темпл Белл, один из биографов Гаусса, считает, что его необщительность задержала развитие математики по мень­шей мере на пятьдесят лет; полдюжины математиков могли бы прославиться, если бы получили результаты, годами, а то и деся­тилетиями хранившиеся у него архиве8.

Слава и замкнутость сделали Гаусса неисправимым интеллекту­альным снобом. Хотя его основные достижения связаны с теорией чисел, в которой прославился Ферма, он почти не использовал ре­зультаты знаменитого тулузского адвоката, а от его великой теоре­мы, остающейся более трех столетий завораживающей загадкой для математиков всего мира, отмахнулся, назвав ее «частным ут­верждением, для меня малоинтересным, потому что я легко могу выложить множество подобных утверждений, которые никто не сможет ни доказать, ни опровергнуть»9.

Это не было пустой похвальбой. В 1801 году, когда ему было 24 года, Гаусс опубликовал «Disquisitiones Arithmeticae» («Арифме­тическое исследование»), написанное на элегантной латыни яркое и значительное историко-научное исследование по теории чисел. Большая часть книги недоступна нематематикам, но для него са­мого написанное звучало как музыка10. Он находил в теории чисел «магическое очарование» и радовался открытию и доказательству всеобщности таких, например, соотношений:

1 = 12

1 + 3 = 22 1 + 3 + 5 = З2

1 + 3 + 5 + 7 = 42

Или, в общем виде, сумма п первых нечетных чисел равна п2. Отсюда сумма первых 100 нечетных чисел от 1 до 199 равна 1002, или 10 000, а сумма нечетных чисел от 1 до 999 равна 250 000.

В 1801 году Гаусс снизошел до демонстрации важных практи­ческих приложений своих теоретических выкладок. В 1800 году один итальянский астроном открыл маленькую новую планету, на астрономическом языке астероид, и назвал ее Церера. Год спустя Гаусс вычислил ее орбиту; раньше он уже занимался вычислением лунных таблиц, позволяющих в любой год определить дату празд­ника Пасхи. В те времена он еще руководствовался желанием за­воевать признание, и ему очень хотелось попасть в компанию сво­их выдающихся предшественников — от Птолемея до Галилея и Ньютона — в изучении небесной механики, хотя он был далек от мысли превзойти астрономические достижения своего современни­ка и благодетеля Лапласа. Впрочем, эта частная задача была при­влекательна и сама по себе, в особенности учитывая неполноту данных и незнание скорости вращения Цереры вокруг Солнца.

В результате лихорадочных вычислений Гаусс нашел очень точ­ное решение, дающее возможность предсказывать местонахождение Цереры в любой момент. За время этой работы он настолько подна­торел в небесной механике, что научился вычислять орбиты комет в течение одного-двух часов, в то время как у других ученых эта рабо­та отнимала три-четыре дня.

Гаусс особенно гордился своими астрономическими достижения­ми, ощущая себя последователем Ньютона, который был его идеалом. Восхищенный открытиями великого англичанина, он впадал в бе­шенство при упоминании об истории с яблоком, падение которого якобы послужило поводом к открытию закона всемирного тяготе­ния, и так отзывался об этой басне:

Глупость! Какой-то надоедливый дурак пристал к Ньютону с вопросом, как он открыл закон тяготения. Увидев, что имеет дело с несмышле­нышем, и стараясь избавиться от надоеды, Ньютон сказал, что ему на нос упало яблоко. Удовлетворенный ответом приставала отошел в пол­ной уверенности, что все понял11.

Гаусс был невысокого мнения о человечестве, порицал рост наци­оналистических настроений, сопровождаемый прославлением воин­ских доблестей, и считал завоевательную политику «непостижимой глупостью». Из-за своей мизантропии он и просидел дома большую часть жизни12.

Не питая особого интереса к управлению риском как таковому, он, однако, интересовался теоретическими проблемами, поднятыми в работах по вероятности, теории больших чисел и теории выборки, начатых Якобом Бернулли и продолженных де Муавром и Байесом, и его собственные достижения в этой области легли в основу совре­менных методов контроля риска.

Впервые он обратился к вероятностным проблемам лри описа­нии метода определения орбиты на основе множества дискретных наблюдений в книге о движении небесных тел, опубликованной в 1809 году под названием «Theoria Motus» («Теория движения»). Когда в 1810 году «Theoria Motus» попала в руки Лапласу, тот сразу ухватился за нее и занялся выяснением некоторых неясно­стей, которых Гауссу не удалось избежать.

Но наиболее ценный вклад в теорию вероятностей Гаусс внес в результате работы, к вероятности никакого отношения не имеющей, а именно занимаясь геодезическими измерениями кривизны Земли для определения точности географических наблюдений. Из-за шаро­образности Земли расстояние между двумя точками на ее поверхно­сти отличается от расстояния между ними, пролетаемого вороной. Эта разница пренебрежимо мала для расстояния в несколько миль, но при расстоянии более десяти миль она становится ощутимой.

В 1816 году Гаусс получил приглашение руководить геодезиче­скими съемками в Баварии и состыковать их результаты с такими же измерениями, уже выполненными в Дании и Северной Германии. На­до полагать, эта работа была малоинтересна для такого до корней во­лос теоретика, каким был Гаусс. Ему пришлось покинуть кабинет, работать на пересеченной местности, общаться с чиновниками и про­чим людом, включая коллег, интеллектуальный уровень которых был ему неинтересен. Но работа затянулась до 1848 года, и опубликован­ные в конце концов результаты составили шестнадцать томов.

Поскольку невозможно обмерить каждый квадратный дюйм зем­ной поверхности, геодезическая съемка представляет собой замеры, выполняемые на заданном расстоянии друг от друга. Анализируя распределение результатов этих замеров, Гаусс заметил, что они име­ют разброс, но, когда число замеров растет, результаты группируются вокруг некоторой центральной точки. Этой центральной точкой явля­ется среднее значение всех результатов измерений, а сами результаты распределяются симметрично по обе стороны от среднего значения. Чем больше измерений выполнялось, тем больше прояснялась кар­тина распределения результатов и тем больше она напоминала коло-колообразную кривую, полученную де Муавром 83 годами раньше.

Связь между риском и измерением кривизны земной поверхно­сти оказалась теснее, чем можно было предположить. Пытаясь ус­тановить кривизну Земли, Гаусс день за днем осуществлял на ба­варских холмах одно геодезическое измерение за другим, пока не набралось огромное количество наблюдений. Точно так же, как мы рассматриваем опыт прошлого для вынесения суждений о вероят­ности того или иного направления развития событий в будущем, Гаусс оценивал накопившиеся результаты и выносил суждение о том, как кривизна земной поверхности влияет на результаты заме­ров расстояний между разными точками в Баварии. Он мог судить о точности своих наблюдений по распределению массы результатов наблюдений вокруг среднего значения.

Принимая связанные с риском решения, мы на каждом шагу встречаемся с разновидностями вопроса, на который он пытался ответить. Сколько в среднем ливней следует ожидать в Нью-Йорке в апреле и каковы наши шансы остаться сухими, если, уезжая на неделю в Нью-Йорк, мы не захватим плащ? Какова вероятность попасть в автомобильную аварию, если мы собираемся проехать 3000 миль, чтобы пересечь страну? Какова вероятность падения курса акций на 10% в будущем году?

 

Разработанные Гауссом методы получения ответов на подобные вопросы настолько общеизвестны, что мы редко задаемся вопросом об их происхождении. Но без этих методов невозможно оценить степень риска, с которым мы сталкиваемся в жизни, и принимать обоснованные решения о том, стоит или не стоит идти на риск. Без этих методов мы не смогли бы оценивать точность имеющейся ин­формации, как не смогли бы оценивать вероятность того, что некое событие произойдет — дождь, смерть 85-летнего человека или па­дение курса акций на 20%, победа русских на Кубке Дэвиса или демократического большинства на выборах в конгресс, что срабо­тают ремни безопасности при аварии или при бурении наугад будет открыто месторождение нефти.

Процесс оценки данных начинается с анализа колоколообразной кривой, главным назначением которой является не определение точ­ного значения, а оценка ошибок. Если бы результат каждого измере­ния точно соответствовал тому, что мы измеряем, не о чем было бы говорить. Если бы люди, слоны, орхидеи или гагарки не отличались друг от друга в пределах своего вида, жизнь на Земле была бы совсем другой. Но в мире господствует не тождество, а сходство; ни одно из­мерение не является абсолютно точным. При наличии нормального распределения колоколообразная кривая упорядочивает эту путаницу. Фрэнсис Гальтон, с которым мы встретимся в следующей главе, с не­малой долей пафоса писал о нормальном распределении:

«Закон частоты ошибок»... с непоколебимым самообладанием безмятеж­но царит в немыслимом хаосе. Чем больше толпа... тем больше в ней единства. Это предельный закон хаоса. Чем больше беспорядочных эле­ментов попадает в его руки... тем более неожиданной и прекрасной ока­зывается скрывающаяся за видимым хаосом форма упорядоченности13.

Большинство из нас сталкивается с колоколообразной кривой еще в школьные годы. Учитель выставляет оценки «по кривой», в слу­чайном порядке, он не начинает с низшей, чтобы закончить высшей. Успеваемость средних студентов вознаграждается средней троечкой. Слабые и сильные получают оценки, распределяющиеся симметрич­но относительно средней. Даже если все работы выполнены прекрас­но или, наоборот, безобразно, в совокупности имеющихся работ лучшая оценивается по высшему баллу, а худшая по низшему.

Многие натуральные показатели, например рост людей в группе или длина среднего пальца, описываются нормальным распределени­ем. По утверждению Гальтона, для того чтобы результаты наблюде­ний располагались нормально или симметрично относительно средне­го значения, необходимы два условия. Во-первых, число наблюдений должно быть достаточно велико, во-вторых, наблюдения должны быть независимыми, как бросание кости. Упорядочить можно только хаос.

Взаимозависимость входящих в выборку данных может стать причиной серьезных ошибок. В 1936 году ныне забытый журнал «Literary Digest» предпринял опрос для предсказания исхода борьбы между кандидатами в президенты Франклином Рузвельтом и Альфредом Лэндоном. Редакция разослала лицам, отобранным с ис­пользованием телефонной книги и данных о регистрации автомоби­лей, около десяти миллионов опросных листов в виде открыток с оп­лаченным возвратом. Подсчет возвращенных открыток показал, что за Лэндона собираются голосовать 59% избирателей, а за Рузвельта только 41%. Однако в ходе выборов Лэндон получил 19% голосов, .в то время как за Рузвельта проголосовали 61% избирателей. Дело в том, что в середине 30-х годов владельцы автомобилей и телефо­нов не составляли типичной выборки американских избирателей: их избирательные предпочтения были обусловлены их уровнем жизни, который был тогда не по карману большинству населения.

По-настоящему независимые наблюдения дают богатую инфор­мацию о вероятностях. Возьмем для примера кости.

Все шесть сторон костяного кубика могут выпасть с равной ве­роятностью. Если графически представить вероятность получить каждое из шести возможных значений, мы получим горизонталь­ную прямую на уровне Ve- График не будет иметь ничего общего с нормальной кривой, как выборка, состоящая из одного броска, ни­чего не скажет о шансах ожидания того или иного значения кости. Мы окажемся в состоянии слепых, ощупывающих слона.

Бросим теперь кость шесть раз и посмотрим, что получится. (Я моделировал этот опыт на моем компьютере, чтобы быть уве­ренным в том, что в результате получаются случайные числа.) Первая серия из шести бросков дала четыре пятерки, одну шестер­ку и одну четверку, в среднем ровно 5,0. Во второй серии получи­лась смесь из трех шестерок, двух четверок и одной двойки, в сред­нем 4,7. Информации не намного больше.

После десяти испытаний по шесть бросков каждый средние ре­зультаты по шести броскам стали группироваться около значения 3,5, являющегося средним числом очков на поверхности кости: (1 + 2 + + 3 + 4 + 5 + 6):6 = 3,5 — и ровно половиной величины математиче­ского ожидания при бросании двух костей. Шесть моих средних бы­ли ниже 3,5 и четыре превышали это число. Вторая серия из десяти бросков дала следующие результаты: четыре раза среднее значение было ниже 3,0, четыре раза оно превышало 4,0, было также по од­ному значению выше 4,5 и ниже 2,5.

Следующим шагом было определение среднего значения первых десяти испытаний по шесть бросков каждый. В то время как распределение в каждом из этих испытаний, рассматриваемых по от­дельности, само по себе мало о чем говорило, среднее от средних оказалось равным 3,48! Теперь среднее уточнилось, но среднее квадратичное отклонение оказалось равным 0,82 — значительно большим, чем хотелось бы2). (Среднее квадратичное отклонение — это величина, которую де Муавр предложил исполь­зовать для измерения разброса наблюдаемых значений вокруг среднего значения. В рас­пределении де Муавра приблизительно две трети (68,26%) результатов наблюдений в большую или меньшую сторону отличаются от среднего значения на величину среднего квадратичного отклонения; 95,46% отличаются от среднего на удвоенное среднее квадра­тичное отклонение).

Иными словами, в семи из десяти ис­пытаний среднее значение оказалось в пределах 3,48 + 0,82 и 3,48 - 0,82, или между 4,30 и 2,66; в остальных трех испытаниях разброс результатов был еще большим.

Тогда я заставил компьютер выполнить 256 испытаний по шесть бросков каждое. Первые 256 испытаний дали близкую к ожидаемому значению величину 3,49 со средним квадратичным отклонением 0,69, то есть две трети результатов оказались в ин­тервале между 4,18 и 2,80. Только в 10% испытаний средние зна­чения были меньше 2,5 или больше 4,5, в то время как больше по­ловины значений попало в интервал от 3,0 до 4,0.

Продолжая насиловать компьютер, я повторил серию из 256 испытаний десять раз. Усреднив результаты, полученные в каждой из десяти выборок, я затем усреднил эти средние и получил 3,499 (я привожу результат с точностью до трех знаков после запятой, чтобы показать степень приближения к 3,5). Впечатляющим ока­залось уменьшение величины среднего квадратичного отклонения до 0,044. При этом пять средних оказались ниже 3,5 и пять выше, а семь из десяти выборок по 256 испытаний дали значение в пре­делах от 3,455 до 3,543. Это неплохая точность.

Как выяснил Якоб Бернулли, количества важны. Это он обратил внимание на то, что среднее от средних значений отдельных выбо­рок удивительным образом снижает дисперсию вокруг основного среднего значения, — утверждение, известное как центральная пре­дельная теорема. Эта теорема была впервые сформулирована Лапла­сом в 1809 году в работе, которую он закончил и опубликовал перед тем, как в 1810 году ознакомился с «Theoria Motus» Гаусса.

Среднее от средних интересно еще и с другой стороны. Мы на­чали эксперименты с бросанием шестигранной кости, каждая грань которой имеет равные шансы выпасть. Распределение получалось плоским, не имеющим ничего общего с нормальным. По мере того как компьютер моделировал все большее и большее число бросков, накапливая число выборок, мы получали всё больше и больше ин­формации о свойствах кости.

Очень редко среднее значение в испытании из шести бросков оказывалось близким к шести или к единице; большая часть их оказывалась между двумя и тремя или четырьмя и пятью. Струк­тура результатов в точности повторила расчеты Кар дано, выпол­ненные им для игры 250 лет назад, когда он начал нащупывать подходы к вероятностным законам. Множество бросков одной кос­ти дают среднее значение 3,5. Отсюда ясно, что многократное бро­сание двух костей даст в среднем удвоенную величину, то есть 7,0. Как показал Кардано, значения, отличающиеся от 7 в ту или дру­гую сторону, будут встречаться с одинаково убывающей частотой по мере продвижения от 7 к 2 или к 12.

 

Нормальное распределение является основным элементом боль­шинства систем управления риском. На нем целиком основан стра­ховой бизнес, потому что от пожара в Атланте не загораются дома в Чикаго, а смерть определенного человека в одном месте, как прави­ло, не имеет отношения к смерти другого человека в другом месте и в другое время. Когда страховые компании собирают сведения о миллионах людей обоего пола всех возрастов, значения ожидаемой продолжительности жизни оказываются распределенными по нор­мальной кривой. В силу этого страховые компании способны с боль­шой степенью надежности оценивать продолжительность жизни раз­ных групп населения. Они могут не только определять ожидаемую среднюю продолжительность жизни, но и диапазоны, в которых она может колебаться из года в год. Уточняя эти оценки на основе до­полнительных данных, таких, как истории болезней, число куриль­щиков, постоянные места проживания, профессиональная деятель­ность, эти компании повышают точность оценки ожидаемой про­должительности жизни 3).

Порой нормальное распределение дает гораздо больше важной информации, чем простые оценки представительности выборки. Нормальное распределение менее вероятно, хотя и не исключено, когда наблюдения зависимы друг от друга, то есть когда вероят­ность события определяется предыдущим событием. Например, если у лучника проблемы со зрением, стрелы будут ложиться слева от яблочка, т. е. центр распределения окажется сдвинутым. В по­добных ситуациях распределение относительно среднего значения обычно оказывается асимметричным.

В таких случаях мы можем воспользоваться рассуждением на­оборот. Если независимость событий является необходимым усло­вием нормального распределения, можно предположить, что дан­ные, распределение которых представлено колоколообразной кри­вой, получены на основе независимых наблюдений. Теперь мы мо­жем поставить несколько интересных вопросов.

Насколько точно изменения курса акций на бирже подчинены законам нормального распределения? Некоторые знатоки рынка ут­верждают, что курс подвержен случайным колебаниям, напомина­ющим пошатывающегося пьяного, пытающегося ухватиться за фо­нарный столб. Они полагают, что у курса не больше памяти, чем у рулетки или пары костей, и что каждое наблюдение здесь независи­мо от предыдущего наблюдения. Сегодняшнее движение цен не за­висит от того, что произошло минуту назад, вчера или позавчера.

Лучший способ решения вопроса о том, являются ли изменения курса акций независимыми событиями, заключается в сравнении ко­лебаний курса с нормальным распределением. У нас есть веские осно­вания утверждать, что эти колебания подчиняются нормальному за­кону, и в этом нет ничего удивительного. В условиях постоянной из­менчивости и конкурентной борьбы на нашем рынке капитала, когда каждый инвестор стремится переиграть других, новая информация мгновенно отражается на котировках. Когда выясняется падение при­были у General Motors или Merck объявляет о выпуске нового чудо­действенного лекарства, котировки не стоят на месте в ожидании, по­ка инвесторы переварят информацию. Ни один инвестор не станет ждать, пока начнут действовать другие. На рынке действуют сворой, и новая информация немедленно изменит котировки акций General Mo­tors или Merck. При этом сама новая информация поступает в слу­чайном порядке. В силу этого изменения котировок непредсказуемы.

Интересные данные в поддержку этой точки зрения были при­ведены в 1950-х годах профессором Чикагского университета Гар­ри Робертсом (Roberts)14. Роберте с помощью компьютера брал слу­чайные числа из наборов с тем же средним и тем же средним квад­ратичным отклонением, какие наблюдались у цен на фондовой бирже. Затем он начертил диаграмму последовательной смены этих случайных чисел. Результаты оказались идентичными с результа­тами аналитиков рынков ценных бумаг, пытающихся предугадать движение котировок. Реальная динамика цен и динамика случайных чисел, выданных компьютером, оказались практически нераз­личимыми. Возможно, что и на самом деле биржевые котировки не имеют памяти.

На приведенных диаграммах представлены в процентах месяч­ные, квартальные и годовые изменения котировок столь любимого профессиональными инвесторами индекса Standard & Poor's 500. Данные охватывают период с января 1926-го по декабрь 1995 года и содержат результаты 840 месячных наблюдений, 280 кварталь­ных и 70 годовых 4).

Хотя диаграммы отличаются друг от друга, у них есть две об­щие черты. Во-первых, как, по слухам, говаривал Д. П. Морган, «рынок переменчив». Действительно, фондовый рынок непредска­зуем, на нем может случиться все что угодно. Во-вторых, большая часть наблюдений попадает вправо от нуля: в среднем рынок чаще рос, чем падал.

Нормальность распределения — это жесткая проверка гипотезы случайных колебаний рынка. Но нужна одна важная оговорка. Да­же если гипотеза случайных колебаний адекватно описывает ситу­ацию на фондовом рынке, даже если изменения котировок описы­ваются нормальным распределением, среднее значение изменений всегда отлично от нуля. Тенденция к повышению котировок не должна нас удивлять. Состояние владельцев акций со временем ра­стет, как и сбережения, доходы и прибыли корпораций. Поскольку по большей части котировки не падают, а растут, среднее значение их изменений оказывается положительным.

Сопоставление годовых данных показывает, что все среднегодо­вые изменения котировок нетипичны. Котировки беспорядочно ра­стут со средней скоростью 7,7% в год5'. Среднее квадратичное от­клонение равно 19,3%, что означает, что в любой год 2/з времени котировки изменяются в интервале от +27,0% до -12,1%. Хотя максимальный подъем котировок до 46,4% наблюдался на протя­жении только 2,5% лет, то есть раз в сорок лет, утешает то, что и максимальное падение котировок до -31,6% оказалось возможным не чаще чем раз в сорок лет.

Искушенным в статистике читателям может не понравиться, что я использую в после­дующем обсуждении логарифмически нормальное распределение. Для не столь сведу­щих в статистике читателей такая форма изложения будет более понятной, и при этом потеря точности оказалась слишком незначительной, чтобы оправдать последующие сложности.

Эти данные относятся только к росту котировок и не включают данные о диви­дендах. Если же включить данные о доходе от дивидендов, значение средней будет равно 12,3%, а среднее квадратичное отклонение — 20,5%.

 

Диаграммы месячных, квартальных и годовых процентных изменений

значения индекса Standard & Poor's 500 за период с января 1926-го по декабрь 1995 г.

На обследуемом отрезке времени котировки росли в течение 47 из 70 лет, или каждые два года из трех. При этом они падали в те­чение 23 лет, почти половину этого срока, т. е. в течение десяти лет они выходили за пределы среднего квадратичного отклонения, то есть больше, чем на 12,1%. Среднее же падение за эти 22 несча­стливых года составило 15,2%.

Достаточно ли 70 наблюдений, чтобы подтвердить вывод о слу­чайном изменении котировок акций? Возможно, нет. Известно, что при бросании кости получаемые результаты случайны, но если бросить кость только шесть раз, то ничего похожего на нормальное распределение мы не увидим. Нужно существенно увеличить число бросков, чтобы результаты стали согласовываться с теорией.

Распределение 280 квартальных наблюдений гораздо ближе к нормальной кривой, чем 70 годовых. Но величина дисперсии очень велика и никоим образом не симметрична, поскольку наличествует небольшое число очень значительных изменений. Величина средне­го изменения за квартал равна +2,0%, но значение среднего квад­ратичного отклонения 12,0% говорит, что это значение (+2,0%) вряд ли типично для квартальных изменений. 45% кварталов по­казали изменения, меньшие чем 2,0%, а 55% — большие.

Инвестор, который бы купил портфель акций и держал его 70 лет, заработал бы очень неплохие деньги. Но инвестор, который бы рассчитывал на то, что каждый квартал будет зарабатывать на ак­циях по 2%, был бы дураком. (Заметьте, что я здесь использую только прошлое время — у нас нет гарантий, что в будущем фон­довый рынок будет вести себя так же, как в прошлом.)

Распределение 840 помесячных изменений котировок отличается большей упорядоченностью, чем в случае квартальных и годовых из­менений. Среднемесячное изменение составило +0,6%. Если мы выч­тем 0,6% из каждого наблюдаемого значения, чтобы сделать поправку на постоянный рост котировок за весь рассматриваемый период, то среднее изменение составит +0,00000000000000002%, причем в тече­ние 50,6% месяца оно было положительным, а в течение 49,4% месяца отрицательным. Средняя для первого квартиля составила -2,78%, а для третьего квартиля +2,91%. Почти безупречная сим­метричность.

Случайный характер месячных колебаний проявляется также в кратковременности периодов с постоянным направлением измене­ния котировок. Сохранение тенденции в течение двух месяцев на­блюдалось не более половины исследуемого отрезка времени, и только 9% времени направление изменения котировок не менялось в течение пяти месяцев.

Итак, изменение котировок акций носит чисто случайный харак­тер, по крайней мере если судить по 840 месячным наблюдениям, — ведь мы не имели бы такой формы распределения данных вокруг сред­ней, если бы изменения цен не были взаимно независимыми — как ре­зультат бросания костей. После внесения поправок на долговременную тенденцию роста частота повышения и понижения котировок практи­чески сравнялись; серии однонаправленных изменений встречались редко; значение коэффициентов изменчивости близко к теоретическому.

Считая, что можно руководствоваться предположением Бернулли о сходстве будущего с прошлым, мы вправе использовать эту инфор­мацию для вычисления вероятности того, что в некоем месяце коти­ровки изменятся на некую определенную величину. Среднемесячное изменение значения индекса S&P было в этот период 0,6%, а среднее квадратичное отклонение — 5,8%. Если изменения котировок рас­пределены случайно, то мы имеем 68% шансов за то, что в любой ме­сяц изменение котировок окажется в интервале от -5,2% до +6,4%. Предположим, мы хотим узнать вероятность того, что цены в тече­ние какого-то месяца упадут. Ответ — 45%, то есть чуть меньше по­ловины времени. Но вероятность падения курса более чем на 10% равна только 3,5%, иными словами, такое падение возможно в од­ном месяце из тридцати; изменение курса за месяц на 10% вверх или вниз случалось примерно один раз в пятнадцать месяцев.

В 33 из 840 месячных наблюдений, то есть в 4% наблюдений, наблюдаемые значения оказались за пределами двух стандартных отклонений от среднего значения, равного +0,6%, то есть измене­ния находились в интервале от -11% до +12,2%. Хотя 33 сильных отклонения — это меньше, чем можно было бы ожидать от совер­шенно случайной серии наблюдений, 21 из них было в сторону па­дения; в совершенно случайной серии это число должно было бы быть равно 16 или 17. У рынка с длительной тенденцией к росту курса могло бы быть и меньше неприятностей, чем 16 или 17 ме­сяцев значительного падения из 816.

В пределе рынок — это не случайные колебания. В пределе на рынке с большей вероятностью можно потерять, чем выиграть. Рынок — это опасное место.

До сих пор речь шла главным образом о числах. Математика была в центре нашего внимания, когда мы обсуждали многие до­стижения от древних индусов, арабов и греков до Гаусса и Лапласа в XIX столетии. Нашей главной темой была скорее вероятность, чем неопределенность.

Теперь речь пойдет о другом. Реальная жизнь, в отличие от игры в balla Пацциоли, — это не последовательность взаимно независи­мых событий. Происходящее на фондовом рынке похоже на чисто случайные изменения цен, но сходство еще не тождество. В неко­торых случаях средние полезны, но в других вводят в заблужде­ние. А бывает и так, что числа вовсе бесполезны, и нам приходит­ся принимать решения исключительно по догадке.

Это не значит, что в реальной жизни числа не нужны. Важно научиться понимать, когда ими можно пользоваться, а когда не­льзя. И тут перед нами встает целый ряд вопросов.

Например, чем определяется риск погибнуть от бомбы? Какое из трех средних мы выберем для определения нормального распределе­ния, описывающего ситуацию на фондовом рынке: среднемесячное изменение котировок +0,6% за период с 1926-го по 1995 год, мизерное значение этого же показателя 0,1% за период с 1930-го по 1940 год или привлекательный 1,0% в месяц за период с 1954-го по 1964 год?

Другими словами, что мы называем «нормальным»? Насколько хорошо любое среднее значение соотносится с «нормальным»? На­сколько стабильно, насколько исчерпывающе оно характеризует поведение? Если результаты наблюдений сильно отклонялись от среднего в прошлом, какова вероятность их схождения к среднему в будущем? И если схождение будет иметь место, сохранится ли прежнее значение средней?

Как быть с теми редкими случаями, когда фондовый рынок прет вверх пять месяцев подряд? Верно ли, что подъем обязательно сменяется падением? Какова вероятность того, что убыточная ком­пания поправит свои дела? Быстро ли маниакальная фаза психоза сменится депрессией и наоборот? Когда кончится засуха? Не нач­нется ли процветание прямо завтра?

Для ответа на все эти вопросы нужна способность различать между нормальным и анормальным. Многие рискованные предпри­ятия основываются на благоприятных обстоятельствах, возникших за счет отклонения от нормы. Когда аналитики говорят, что их лю­бимые акции «недооценены», это значит, что инвестор может выиг­рать, если купит эти акции теперь и дождется возврата их цены к норме. С другой стороны, душевные депрессии и маниакальные состояния иногда длятся всю жизнь. И экономика США в 1932 году отказывалась сама выходить из кризиса, хотя мистер Гувер и его советники были убеждены, что деятельное участие правительства только помешает ей найти выход из этого положения.

 

На самом деле никто не исследовал понятие «нормальное», рав­но как и понятие «среднее». Но Фрэнсис Гальтон, ученый-дилетант из викторианской Англии, воспользовался разработанным Гауссом и его предшественниками обоснованием понятия среднего — нор­мальным распределением — и разработал новые средства, помога­ющие отличать ситуации с измеримым риском от ситуаций на­столько неопределенных, что нам остается только гадать о возмож­ном будущем.

Гальтон не был ученым, погруженным в поиски вечных истин. Он был человеком практичным, хотя и увлеченным наукой, но все же дилетантом. Тем не менее его новшества и достижения оказали весомое влияние и на математику, и на практику принятия реше­ний в повседневной жизни.

 

Глава 9

Человек с вывихнутыми мозгами

Фрэнсис Гальтон (1822-1911) был светским снобом и ни­когда не зарабатывал на жизнь, если не считать кратко­временной службы в больнице, когда ему было около двад­цати1. Тем не менее трудно представить себе более приятного и при­влекательного человека. Он был двоюродным братом Чарлза Дарви­на, изобретателем и неутомимым исследователем той части Африки, куда до него не ступала нога белого человека. Он внес плодотворный вклад в развитие стратегии риска, но сделал это за счет упорной приверженности порочным идеям.

Измерения были хобби Гальтона, его навязчивой идеей. Его де­визом могло бы быть «Считайте всё, что можно»2. Он измерял и об­считывал головы, носы, руки, ноги, фиксировал у разных людей рост и вес, цвет глаз, изменения цвета лица у посетителей лошадиных бе­гов, бесплодие наследниц и число случаев невнимания на лекциях. Он классифицировал проходящих по улице девушек по степени при­влекательности, прокалывая карту в левом кармане, если встречал хорошенькую, и другую карту в правом кармане, встречая дурнуш­ку. В его «Карте красоты» Британии первое место занимают Лондон-ки, а последнее абердинки. Он проанализировал 10 000 судебных приговоров и заметил, что большинство из них повторяются с ин­тервалами в 3, 6, 9, 12, 15, 18 и 24 года, в то время как нет пригово­ров, повторяющихся через 17 лет, и очень мало повторяющихся че­рез 11 и 13 лет. На выставке крупного рогатого скота он представил в табличной форме 800 предположений посетителей относительно веса одного быка и нашел, что «в среднем общественное мнение ока­залось верным с точностью до одного процента»3.

Основанная им в 1884 году антропометрическая лаборатория за­нималась выполнением обмеров и фиксацией всех возможных раз­меров человеческого тела, включая отпечатки пальцев. Последние особенно заинтересовали Гальтона, потому что, в отличие от дру­гих характеристик человеческого тела, они не меняются в процессе старения человека. Опубликованная им в 1893 году книга объемом в 200 страниц, посвященная этому вопросу, вскоре легла в основу использования отпечатков пальцев полицейскими службами.

Страсть Гальтона к измерениям не оставила его и во время предпринятого им в 1849 году путешествия в ту часть Африки, где сейчас находится Намибия. Попав в селение готтентотов, он обна­ружил «фигуры, которые довели бы английскую женщину до от­чаяния, — фигуры, которые были бы посмешищем в кринолине»4. Одна из женщин особенно привлекла его внимание5. Как человек науки, он, по его словам, был «чрезвычайно заинтересован в точ­ном обмере ее форм». Не имея возможности объясниться с готтен­тотами и не зная, что предпринять для проведения этого крайне необходимого обследования, он все же нашел выход из положения:

Случайно мне на глаза попался мой секстант, и тотчас пришла в го­лову блестящая мысль воспользоваться им для выполнения обмеров. Я провел серию измерений ее фигуры с разных точек... затем нагло вы­тащил рулетку, измерил расстояние между мной и объектом и, полу­чив таким образом расстояния и углы, вычислил нужные мне величи­ны с помощью тригонометрии и логарифмов.

Гальтон был типичным британцем Викторианской эпохи, ша­гавшим по земле как по собственным угодьям. Как-то во время охоты в Африке у него возникли опасения, что местный вождь на­падет на его бивак. Натянув на себя красную охотничью куртку, шапку и высокие сапоги, он взгромоздился на быка, атаковал са­мую большую хижину в деревне и принудил быка сунуться голо­вой в хижину. Его бивак стали обходить стороной.

В другой деревне он позволил себе бестактность, отказавшись уча­ствовать в церемонии, в ходе которой хозяин полощет горло и вы­плевывает остатки в лицо гостю. Как-то король Нангоро подарил ему принцессу Чапангу на вечерок. Когда она пришла к нему, «вы­мазанная красной охрой и маслом», Гальтон ужаснулся. «Я был в моем единственном приличном белом льняном костюме и выпрово­дил ее с минимумом церемоний».

Королю Нангоро трудно было поверить, что в мире есть места, населенные людьми с белой кожей. Гальтон и его друзья казались ему редкими кочующими животными или какой-то аномалией. Од­ному из спутников Гальтона неоднократно приходилось раздеваться перед королем, чтобы убедить его, что у него вся кожа белого цвета. Любопытство Гальтона было ненасытным. Как-то, когда через Кембридж, где он тогда учился, проходил бродячий цирк, он вошел в клетку со львом; за всю историю этого цирка такое позволили себе только четыре человека. В студенческие годы он любил заниматься ночью и, чтобы не спать, надевал себе на голову «соображалку» — сложную конструкцию, время от времени подающую к голове хо­лодную воду. Позднее он изобрел приспособление для чтения под водой и чуть не утонул в собственной ванне, увлекшись книгой.

 

Скоро вы узнаете, какие ужасные последствия имело увлечение Гальтона измерениями и выдумками. Тем не менее ему мы обяза­ны крупным вкладом в развитие статистики и управления риском. Проверяя, подобно Кардано, свои идеи на опыте, он способствовал созданию новой статистической теории, хотя вовсе не ставил перед собой этой задачи.

Гальтон вводит нас в мир повседневности, где люди дышат, по­теют, совокупляются и размышляют о будущем. В отличие от ма­тематиков прежних времен мы не анализируем игры и не смотрим на звезды для проверки своих теорий. Гальтон брал уже готовые теории и пускал их в работу.

Хотя он никогда не ссылался на Бернулли, в его работах нашла отражение мысль сварливого швейцарца о том, что вероятность яв­ляется важнейшим средством анализа болезней, умственных спо­собностей и физической ловкости. Он шел по стопам Гранта и Прай­са, которых больше интересовало устройство человеческого общест­ва, нежели исследование природы. То, что сделали эти люди, в конце концов привело к созданию набора средств для контроля за риском и оценки его в бизнесе и финансовой деятельности.

 

Гальтон вырос в обстановке материального благополучия и ожив­ленной интеллектуальной деятельности. Его дед, Эразм Дарвин, был одним из самых известных врачей своего времени, интересы которого отнюдь не ограничивались медициной. Он, в частности, изобрел паром, использующий механическую тягу вместо животной, туалет со сливом, экспериментировал с ветряными мельницами и паровыми двигателями, написал поэму в 2000 строк с детальным описанием про­цесса воспроизводства множества растений под названием «Любовь растений» («The Loves of Plants»). В 1796 году, когда ему было 65 лет, Эразм опубликовал двухтомный труд под названием «Зоономия, или Теория наследственности» («Zoonomia, or the Theory of Generations»). Хотя эта книга, имевшая сугубо теоретический характер, за семь лет выдержала три издания, она не получила должного отклика в научных кругах из-за скудости содержавшегося в ней фактического материала. Тем не менее «Зоономия» имеет поразительное сходство с «Про­исхождением видов» («The Origin of the Species»), опубликованным 63 года спустя его более знаменитым внуком Чарлзом Дарвином.

Гальтон рассказывал, что в четыре года он мог читать любую книгу, написанную на английском. Он декламировал наизусть «латинские су­ществительные, прилагательные и все активные глаголы, а кроме того, 52 строки латинских стихов» и умел умножать на 2, 3, 4, 5, 6, 7, 106.

В 16 лет он начал изучать медицину в Бирмингеме, но описал посещение палат и морга как «ужас-ужас-ужас!»7. После того как Чарлз Дарвин порекомендовал ему «подзаняться математикой», он направился в Кембридж изучать математику и филологию8.

Ему было 22 года, когда умер его отец, оставив своим семерым де­тям приличное состояние. Решив, что теперь можно делать все, что вздумается, он вскоре бросил учебу и, воодушевленный путешествием Дарвина на Галапагосские острова, предпринял свое первое путешест­вие в Африку. Он поднялся вверх по Нилу, а затем на верблюдах до­брался до Хартума, пройдя в общей сложности более тысячи миль. Вернувшись домой, он четыре года бездельничал, а потом совершил второе путешествие в Африку. В 1853 году он написал книгу об Афри­ке, получившую признание в научных кругах, после чего был принят в члены Королевского Географического общества, наградившего его золотой медалью, а в 1856 году стал членом Королевского общества.

Это предпринятое в 27 лет второе путешествие привело Гальто-на к «расстройству здоровья» и приступам депрессии, повторяв­шимся довольно часто на протяжении всей его жизни. Он говорил, что во время этих приступов у него «вывихнутые мозги»9.

 

Гальтон был ученым-дилетантом, проявлявшим глубокий инте­рес к проблемам наследственности, но совершенно равнодушным к экономике и бизнесу. Тем не менее его работы, касающиеся «иде­ального среднего дочернего типа», «родительского типа» и «усред­ненного наследственного типа», привели к открытиям в области статистики, имеющим существенное значение для прогнозирования и управления риском.

Наука о наследственности занимается изучением передачи из по­коления в поколение таких ключевых характеристик, как умствен­ные способности, цвет глаз, рост, манера поведения и пр. Всегда ин­тересны исключения — индивидуумы, чьи характеристики не соот­ветствуют норме, — но еще интереснее то, что все члены вида в зна­чительной степени похожи друг на друга. Тенденция к усреднению, таящаяся за этой тенденцией к однородности, является важнейшей статистической закономерностью, имеющей отношение ко многим аспектам управления риском.

Гальтон пытался выяснить, как талант упорно сохраняется из поколения в поколение в некоторых семьях, в частности в его се­мье и в семье Бернулли. Он надеялся на сохранение таланта в соб­ственном потомстве, но они с супругой оказались бездетными, так же как двое из его братьев и одна из сестер. Он очень старался вы­явить «черты природного благородства» у членов семей, которые он считал наиболее одаренными.

В 1883 году он назвал предмет своих ученых занятий евгени­кой; греческий корень этого слова означает 'хорошее' или 'благое'. Использование этого термина полстолетия спустя нацистами ассо­циируется с уничтожением миллионов людей, которых они сочли бездарными и малоценными.

Вопрос о том, насколько Гальтон ответствен за эти преступле­ния, был предметом острых дискуссий. Ничто не указывает на то, что он мог бы одобрить столь варварское поведение. Для него хоро­шее общество — это общество, признающее свою обязанность помо­гать «высокоодаренным» индивидуумам получать образование вне зависимости от их материального благосостояния, социальной и ра­совой принадлежности. Он предлагал приглашать и обустраивать в Британии «эмигрантов и спасающихся бегством» и способствовать тому, чтобы их потомки становились гражданами страны. В то же время он размышлял о путях ограничения рождаемости менее спо­собных или больных людей, утверждая, что хорошее общество должно быть обществом, «в котором слабые могут найти приют и убежище в монастырях или сестринских общинах»10.

Невзирая на спорные трактовки труда Гальтона по евгенике, сле­дует признать, что его значение выходит далеко за пределы прямо по­ставленных в нем вопросов. В сущности, это очередное подтверждение трюизма, что разнообразие придает вкус. Отдавая должное Клео­патре, римский военачальник Энобарбус заметил: «Возраст не лиша­ет ее свежести, а бесконечное разнообразие делает ее неизменно при­влекательной». Оставаясь самой собой, она была попеременно влюб­ленной, дружелюбной, холодной, горячей, соблазнительной, враж­дебной, покорной, требовательной. Человек может быть разным.

Каждый из живущих ныне 6 миллиардов людей является индиви­дуальностью. В вермонтских лесах растет несчетное количество кле­нов, каждый из которых отличается от других, но ни один из них нельзя спутать с березой или сосной. Акции General Electric, как и акции Biogen, одинаково просто купить на Нью-Йоркской фондовой бирже, но факторы риска для этих акций не имеют между собой ни­чего общего.

Какой из многочисленных ликов Клеопатры, кто из миллиар­дов ныне живущих людей, какой клен, какая береза или сосна в вермонтских лесах, какая акция на Нью-Йоркской бирже является типичным представителем своего вида? Насколько представители каждого вида отличаются друг от друга? Насколько младенец из Уганды отличается от старушки из Стокгольма? Есть ли в разли­чиях закономерность, или они являются просто результатом слу­чайных воздействий? Иначе говоря, что мы называем нормой?

В поисках ответов на такие вопросы Гальтон не использовал до­стижения математики и игнорировал специалистов по социальной статистике, подобных Гранту. Однако он ссылался на серию эмпи­рических исследований, выполненных в 1820-х и 1830-х годах бель­гийским ученым Ламбертом Адольфом Жаком Кветеле (Quetelet), который был на двадцать лет старше Гальтона, приобрел извест­ность как настойчивый исследователь устройства общества и был одержим измерениями не менее самого Гальтона11.

 

Кветеле было всего 23 года, когда он получил степень доктора в новом университете в Генте. К этому времени он уже отдал дань изучению искусства, писал стихи и был соавтором оперы.

Он был, пользуясь выражением историка статистики Стивена Стиглера, «в равной степени ученым и организатором науки»12. Он принял участие в создании нескольких статистических ассоциа­ций, включая Лондонское Королевское статистическое общество и Международный статистический конгресс, и многие годы был ре­гиональным корреспондентом Бельгийского правительственного статистического бюро. Около 1820 года он возглавил кампанию за осно­вание новой обсерватории в Бельгии, хотя его познания в астроно­мии в то время оставляли желать лучшего. После создания обсер­ватории он убедил правительство командировать его на три месяца в Париж для изучения астрономии и метеорологии и стажировки в Парижской обсерватории.

Во время пребывания в Париже он встречался со многими ве­дущими французскими астрономами и математиками, в результате чего приобрел хорошие познания в теории вероятностей. Он мог да­же встретиться с завершавшим работу над последним томом своей «Mecanique celeste» («Небесной механики») Лапласом, которому бы­ло в ту пору 74 года. Кветеле был очарован теорией вероятностей и написал о ней три книги подряд, последнюю в 1853 году. Кроме то­го, он нашел хорошее практическое применение своим новым по­знаниям.

После возвращения из Парижа в 1820 году он, не оставляя ра­боту в Королевской обсерватории в Брюсселе, проводил исследова­ния, касающиеся народонаселения Франции, и готовился к пред­стоящей переписи 1829 года. В 1827 году была опубликована его монография, озаглавленная «Исследование населения, рождений, смертей, тюрем, приютов для бедных и т. п. в Королевстве Нидер­ланды» («Researches on population, births, deaths, prisons, and poor houses, etc. in the Kingdom of the Low Countries»), в которой Кве­теле провел критический разбор процедур, используемых при сборе и анализе статистических данных. Ему не терпелось применить метод определения численности населения, разработанный Лапла­сом еще для переписи 1780-х годов во Франции. Этот метод сво­дился к обследованию случайных выборок из различных групп на­селения тридцати департаментов и использованию этих выборок в качестве основы для подсчета общей численности населения.

Коллеги скоро отговорили Кветеле от использования этого под­хода. Дело в том, что чиновники, проводившие перепись, не знали, насколько репрезентативны эти выборки. В каждой местности бы­ли свои условия и обычаи, оказывавшие влияние на рождаемость. Более того, как отмечали еще Галлей и Прайс, на качество перепи­си даже в небольшом регионе может оказать сильное влияние пе­ремещение населения. В отличие от Энобарбуса Кветеле счел, что структура народонаселения Франции слишком неоднородна, чтобы делать обобщения на основе выборочного обследования. Было ре­шено провести сплошную перепись населения Франции.

Это заставило Кветеле заняться поисками объяснения различий между местностями и группами населения — откуда это разнообразие, придающее вкус жизни? Если различия случайны, данные должны выглядеть одинаково для каждой выборки, если же они закономерны, то выборки должны отличаться одна от другой.

Эта идея побудила Кветеле окунуться в оргию измерений, кото­рую Стиглер описывал следующим образом:

Он обследовал рождения и смерти по месяцам и городам, в зависимо­сти от температуры воздуха и времени дня... Он исследовал смертность по возрастам, по профессиям, по местностям, по сезонам, в тюрьмах и больницах. Он учитывал рост, вес, скорость роста и физическую си­лу... [и вел] статистический учет пьянства, сумасшествия, самоубийств и преступности13.

В результате в 1835 году появился «Трактат о человеке и раз­витии его способностей» («A Treatise on Man and the Development of his Faculties»), вскоре переведенный на английский язык. Сло­вом «faculties» ('способности') переведено использованное Кветеле французское выражение physique social. Эта работа составила Кве­теле имя. Автор трехчастной статьи в ведущем научном журнале заметил: «Мы рассматриваем появление этого тома как вступление в новую эпоху писаной истории цивилизации»14.

Книга представляет собой нечто большее, нежели просто набор сухих статистических данных и тяжеловесного текста. Кветеле со­здал героя, который жив до сих пор: I'homme moyen, или средний человек. Новое понятие покорило воображение публики и принесло огромную известность его создателю.

Кветеле старался определить характеристики среднего мужчины (в некоторых случаях женщины), становившегося затем образом определенной группы, которую он представлял, будь то группа преступников, пьяниц, солдат или мертвецов. Кветеле даже теоре­тизирует, что, «если бы индивидуум на каком-нибудь этапе разви­тия общества представлял все качества среднего человека, в нем отразилось бы все великое, доброе и прекрасное»15.

Не все были с этим согласны. Одним из самых суровых крити­ков книги Кветеле стал Антуан Августин Карно, знаменитый мате­матик и экономист, большой авторитет в области теории вероятно­стей, утверждавший, что, не принимая во внимание законы веро­ятности, «мы не можем получить ясной оценки точности измере­ний, предлагаемых наукой о наблюдениях... или условий, ведущих к успеху коммерческих предприятий»16. Карно высмеял концепцию среднестатистического человека. Усреднением набора прямоуголь­ных треугольников мы не получим прямоугольного треугольника, заметил он, а средний человек должен бы представлять собой не­кое чудовище.

Кветеле был непреклонен. Он был убежден, что сможет найти об­раз среднего человека для любой возрастной группы, рода занятий, места проживания или этнической принадлежности. Более того, он утверждал, что может не только определить, но и объяснить, почему данный индивидуум принадлежит скорее к одной группе, нежели к другой. Это был принципиально новый шаг: до сих пор еще никому не приходило в голову использовать математику и статистику для отделения причины от следствия. «Следствие пропорционально при­чине, — написал он и продолжил курсивом: — Чем большее число индивидуумов подвергается наблюдению, тем больше проявляются превалирующие характерные качества, физические или моральные, позволяющие выявить общие доминирующие факты, благодаря ко­торым общество существует и сохраняется»". К 1836 году Кве­теле развил эти идеи в книге о применении теории вероятностей в «моральных и политических науках».

Работа Кветеле о причинах и следствиях представляет собой увлекательное чтиво. Например, в ней можно найти подробный анализ факторов, влияющих на долю осужденных среди тех, кому предъявлено обвинение. В среднем 61,4% всех обвиняемых были осуждены, но вероятность обвинительного приговора в случае пре­ступлений против личности составляла менее 50%, в то время как вероятность осуждения по обвинению в имущественных преступ­лениях составила свыше 60%. Вероятность осуждения была ниже 61,4%, если обвиняемыми оказывались женщины старше тридцати лет, грамотные и хорошо образованные, которые добровольно яв­лялись в суд, вместо того чтобы уклоняться от него. Кветеле ста­рался определить, являются ли отклонения от среднего значения 61,4% значимыми или случайными: он искал моральной достовер­ности в процессах над аморальностью.

Что бы ни брался исследовать Кветеле, всюду он видел колоко-лообразную кривую. Почти всегда «ошибки» или отклонения от среднего послушно распределялись согласно описанному Лапласом и Гауссом нормальному закону, симметрично уменьшаясь по обе стороны от среднего значения. Эта замечательно сбалансированная упорядоченность с пиком, соответствующим среднему значению, убеждала Кветеле в правомерности его излюбленного понятия сред­него человека. Оно положено в основу всех его выводов, полученных на основе статистических обследований.

Например, в одном из обследований проводились измерения объема грудной клетки 5738 солдат шотландской армии. Кветеле построил кривую распределения результатов обследования и сравнил его с тео­ретической нормальной кривой. Они почти идеально совпали18.

К этому времени уже было установлено, что нормальное рас­пределение, описываемое формулой Гаусса, имеет широкое распро­странение в природе; теперь подтвердилось, что оно может быть по­ложено в основу описания социальных явлений и физических ха­рактеристик людей. Исходя из этого, Кветеле пришел к заключе­нию, что совпадение нормального распределения с результатами об­следования шотландских солдат указывает на то, что отклонения от среднего значения, скорее всего, не отражали систематических раз­личий в исследуемой совокупности, а носили случайный характер. Другими словами, совокупность представлялась в основном одно­родной, и средний солдат шотландской армии является идеальным представителем всех шотландских солдат. Клеопатра была прежде всего женщиной.

Однако в одной из работ Кветеле совпадение с нормальным рас­пределением оказалось несколько менее выраженным. Анализируя распределение 100 000 французских призывников по росту, он об­наружил большое число малорослых, не позволяющее признать распределение нормальным. Поскольку в то время малый рост служил основанием для освобождения от воинской службы, Квете­ле сделал вывод, что в ходе обследования результаты измерений мошеннически искажались с целью получения освобождения.

Замечание Карно о том, что среднестатистический человек должен оказаться монстром, отражало его мнение, что теория ве­роятностей применима к анализу естественнонаучных данных, но не применима в анализе общества. Он утверждал, что совокупность людей допускает сколь угодно произвольную классификацию. В отличие от него Кветеле верил, что нормальное распределение из­мерений, относящихся к группе людей, свидетельствует только о случайном характере различий в группе испытуемых. Но Карно подозревал, что различия могут быть не случайными. Рассмотрим, например, как можно классифицировать число рождений мальчи­ков в течение года: по возрасту родителей, по географическому по­ложению обследуемых регионов, по дням недели, по этнической принадлежности, по весу, по времени беременности, по цвету глаз или длине среднего пальца, и это далеко не исчерпывающий спи­сок. Как здесь с уверенностью сказать, какое дитя является сред-нестатистическим! Карно полагал, что невозможно установить, какие из этих данных следует считать значимыми, а какие слу­чайными: «Одна и та же величина отклонения [от среднего значе­ния] может служить основанием для различных суждений»19. Карно не учитывал того, что хорошо известно современной науке, а именно что результаты большинства подобных измерений физиче­ских данных человека напрямую зависят от питания, то есть что они также являются отражением и социального статуса обследуемых.

Сегодня статистики обозначают то, что вызвало неприятие Кар-но, «добычей данных». Они говорят, что, если мучить данные до­статочно долго, можно доказать что угодно. Карно чувствовал, что Кветеле ступил на опасную почву широких обобщений на основе ограниченного числа наблюдений. Весьма вероятно, что другая се­рия наблюдений над группой того же размера может дать резуль­таты, существенно отличные от полученных в первой серии.

Несомненно, увлеченность нормальным распределением завела Кветеле слишком далеко. Тем не менее в свое время его работы сыграли огромную роль. Позже знаменитый математик и эконо­мист Фрэнсис Исидор Эджворт употребил термин «кветелизм» для обозначения повального увлечения нахождением нормальных рас­пределений там, где их не было, или идеи считать нормальным любое распределение, далеко не отвечающее требованиям, предъяв­ляемым нормальному распределению20.

 

Первая работа Кветеле, с которой Гальтон впервые познакомил­ся в 1863 году, произвела на него неизгладимое впечатление. «Среднее — это всего лишь единичный факт, — писал он, — тогда как при добавлении другого единичного факта начинает прояв­ляться действующая нормальная схема, хорошо согласующаяся с данными наблюдений. Некоторые люди не переносят само упоми­нание о статистике, я же нахожу в ней бездну красоты и занима­тельности»21.

Гальтон был очарован Кветеле, считая, что «самый любопыт­ный теоретический закон об отклонениях от среднего» — нормаль­ное распределение — оказался вездесущим и особенно удобным для описания результатов таких измерений, как измерения роста или грудной клетки22. Самому Гальтону понравилась колоколообразная кривая распределения 7634 оценок по математике, которые были проставлены студентам Кембриджского университета на выпуск­ном экзамене, ранжированных от самой высокой до «трудно ска­зать, насколько плохой»23. Он обнаружил схожее статистическое распределение экзаменационных оценок на вступительных экзаме­нах в Королевский военный колледж в Сандхерсте.

Больше всего колоколообразная кривая привлекала Гальтона тем, что выявляла определенные наборы данных, которые могли рассматриваться как относительно однородные. И наоборот, отсут­ствие нормального распределения свидетельствовало о «неоднород­ности системы». Гальтон любил сильные высказывания: «Это пред­положение не может быть опровергнуто»24.

Но Гальтон искал как раз различия, а не однородность, — ему нужна была Клеопатра, а не среднестатистическая женщина. В рам­ках создаваемой им евгеники он искал различия даже в пределах групп, где измеряемые качества, казалось, укладывались в нор­мальное распределение. Гальтон ставил своей целью классификацию людей по «природным способностям», которые он понимал следую­щим образом:

...такие качества интеллекта и предрасположенности, которые побужда­ют человека и делают его способным совершать действия, ведущие к сла­ве... Я имею в виду натуры, которые, будучи предоставлены самим себе, побуждаемые врожденными стимулами, карабкаются по тропе, ведущей на вершину, и имеют достаточно сил добраться до нее... Люди, достигшие вершины, и другие, по природе своей способные на это, в значительной