Эксперименты П.В. Баранова и А.Ф. Трудолюбова

Изложенный выше эксперимент был существенно развит в двух экспериментах, проведенных П.В. Барановым и А.Ф. Трудолюбовым (1, 2). В первом эксперименте испытуемым предъявлялось табло, на котором был изображен симметричный лабиринт с двумя выходами. В тайне от всех испытуемый должен .был задумать один из выходов и записать его номер. Перед испытуемым ставилась задача: не позволить путнику выйти в те «ворота», которое им задуманы и держатся в секрете. Идея алгоритма, который также работал без обратной связи с действиями испытуемого, была аналогична вышеизложенной: сначала путник формировал у испытуемого «убеждение» в своем послушании, а потом использовал это «убеждение», формировал навое, использовал его и т.д. Эксперимент показал, что около 72% процентов выходов происходит именно в те ворота, которые задуманы, т.е. в среднем испытуемые значительно чаще проигрывали, чем выигрывали.

Эксперимент проводился на той же установке, что и предыдущий (см. рис. 39). Предъявляемое испытуемым изображение на табло представлено на рис. 47. Перемещение желтой лампочки изображало, как и прежде, перемещение путника, а указания испытуемого фиксировались вспышкой зеленой лампочки.

Алгоритм, управляющий движением путника, был следующим:

+2 —3 +1 —3 +1 —2 +3 —1 +3 —1

Напомним, что знак «+» фиксирует выполнение указания испытуемого, а знак «—» — выбор хода, противоположного указанному испытуемым.

Контингент испытуемых состоял из 10 девушек и 51 юноши— студентов МЭИ. Соотношение побед и поражений для юношей 38:13, для девушек 7:3 (в обоих случаях в пользу автомата). Средняя длина партии составила 18 ходов; средняя длина партий, выигранных автоматом, — 15 ходов; средняя длина партий проигранных автоматом — 26,5; среднее же число ходов при случайном блуждании — 25^*.

В другом эксперименте, задача, стоящая перед испытуемым, была принципиально изменена. Испытуемый, мог в тайне от экспериментатора выбрать одну из следующих четырех целей.

1. Вывести путника в ворота 9 и не пустить в ворота 26.

2. Вывести путника в ворота 26 и не пустить в ворота. 9.

3. Вывести путника в любые ворота как можно быстрее, меньше, чем за 25 ходов.

4. Продержать путника в лабиринте как можно дольше, более 25 кодов.

Автомат-дриблинг должен был реализовывать одну и ту же программу, независимую от выбора испытуемым цели. Первый алгоритм, с которым проводился контрольный эксперимент, был следующим:

+2 —3 +1 —4 +1 —3 +3 —1 +4 —1 +1 —1.

Испытуемыми были студенты МГПИ им. Ленина. Результаты контрольной серии эксперимента с этим алгоритмом приведены в табл. 1.

Та блица 1

Номера задач

Суммарный результат

Количество партий Соотношение побед и поражений дриблинга 19:7 12:0 6:21 17:3 54:31

Легко видеть, что автомат выигрывает у всех «задач», кроме третьей. Экспериментаторы решили провести «коррекцию» алгоритма. Они изменили его окончание и провели дополнительную серию экспериментов. После коррекции алгоритм стал таким:

+2–3+1—4+1—3 +3 —2 +3–1 +1 —1.

Особенность дополнительной серии состояла в том, что испытуемый, получив обычную инструкцию, не произвольно выбирал номер задачи, а тянул бумажку с номером задачи из коробки. На самом деле на всех бумажках в коробке был один и тот же номер — 3.

Дополнительная серия проводилась так, чтобы можно было использовать результаты партий первой серии по остальным трем задачам. Это оказалось возможным, ибо значительное большинство партий первой серии заканчивались на начальном, не измененном участке алгоритма, а те партии, которые превышали «длину» неизмененной части, засчитывались дриблингу как проигранные. Пересчитанные результаты приведены в табл. 2. Автор считает результаты этого эксперимента крайне важными, ибо эксперимент продемонстрировал возможность создания эффективно работающей схемы рефлексивного управления, в определенной степени независимой от

Таблица 2

Номера задач

. 3 Суммарный результат

Количество партий Соотношение побед и поражений дриблинга 18:8 10:2 22:17 18:2 68:29

сюжета экспериментально-игровой ситуации. Более того, сюжеты ситуаций характеризуются различными критериями победы (для двух задач — это число ходов, а для двух других задач — одна из двух альтернатив). Этот эксперимент показал, что можно найти схему рефлексивного управления, которая достаточно нечувствительна к критерию. Системе важно, чтобы ей противодействовали. А по какому критерию противник ведет противодействие — важно в значительно меньшей степени.

Эксперимент В.Е. Лепского

Эксперимент несколько иного рода был проведен В.Е. Лепским [8]. Испытуемый играл с программой в матричную игру с нулевой суммой. При этом испытуемый должен был в тайне от всех выбрать «сторону» платежной матрицы. Программа реализовывала жесткую последовательность номеров стратегий, причем программа «не знала», что выражает эта последовательность — номера строк или номера столбцов. Оказалось, что программа, подобная использованным в вышеизложенных экспериментах, в большинстве случаев может добиться победы.

В.Е. Лепским была выбрана следующая платежная матрица:

+1. –1 -1. +1

-1. +1 4-1. -1

Основным преимуществом этой матрицы является возможность отбросить версию о том, что человек проигрывает из-за неумения формировать оптимальную смешанную стратегию, а программа пользуется оптимальной стратегией и поэтому выигрывает. В игре с этой платежной матрицей при использовании одним из игроков оптимальной смешанной стратегии оба игрока будут выигрывать с равной вероятностью.

Испытуемому не предъявлялась эта матрица в явном виде. Он располагался перед табло, на котором находились две пары лампочек (рис. 48). Каждая 'пара состояла из лампочек двух цветов—зеленого и желтого (на рис. 48 зеленая лампочка заштрихована). Одна пара лампочек контролировалась экспериментатором, а другая — испытуемым.

Испытуемый до начала игры выбирал и записывал в тайне от экспериментатора выигрышную для себя комбинацию лампочек: либо он будет получать выигрыш каждый раз, когда загораются лампочки одного цвета, либо, когда разного. Лампочки загораются на табло только после того, как оба участника игры примут решение, независимо от порядка принятия ими решений и времени обдумывания

По окончании игры (в одних сериях 15, .в других 20 выборов) подсчитывались числа выигрышей алгоритма и испытуемого, и выявлялся победитель. Легко видна связь этой игры с вышеприведенной матрицей:

зеленый желтый зеленый желтый

+1, -1 -1, +1

-1, +1 +1. -1

Выбору номеров строк в качестве своих стратегии соответствует выбор «одинакового цвета»; выбору столбцов—выбор «разного цвета» (первое число в клетке — платеж, получаемый игроком, стратегии которого—номера строк). Выборы, которые делал экспериментатор, не зависели от выборов испытуемого. Экспериментатор работал «в режиме автомата», реализуя экспериментально найденную последовательность, которая была получена в результате доработки алгоритма, использованного П. В. Барановым и А. Ф. Трудолюбовым в первом эксперименте.

Доработанный алгоритм имел вид

+2-3+1-3+1-2 +2 -2 +4

или в другой записи

++ – – – + — — — + — --++ — — ++++.

Перед началом каждой игры экспериментатор бросал жребий и определял, какого цвета лампочка будет соответствовать знаку «+», а какого — знаку «—'«. Контингент испытуемых в контрольной серии

состоял из 30 испытуемых, каждый из которых делал по 20 выборов. Оказалось, что вероятность выигрыша программы близка к 0,8.

Чрезвычайно существенно, что программа могла добиться успеха лишь при условии, что с помощью специальной инструкции у испытуемых «гасилась» инициатива проведения рефлексивного управления. Это крайне важный момент, поскольку, если испытуемый сам проводит рефлексивное управление, он может оказаться нечувствительным к рефлексивному управлению, которое совершается над ним. Гашение инициативы в проведении рефлексивного управления достигалось подчеркиванием того, что экспериментатор будет стараться выиграть у испытуемого. Безусловно, очень важную роль в .гашении инициативы испытуемого играло личностное взаимодействие экспериментатора и испытуемого в процессе инструкции. В голосе, да и во всем облике экспериментатора должны были чувствоваться уверенность и «агрессивность». В результате у испытуемого должна была возникнуть «установка» на защиту, которая, по-видимому, и гасила инициативу в проведении рефлексивного управления. Эффект «гашения инициативы», безусловно, требует дальнейшего специального исследования.

При использовании инструкции, в которой подчеркивалось, что испытуемый должен стараться выиграть у экспериментатора, игры lie давали заметного преимущества ни одной из сторон.

Этот эксперимент в определенной степени показал, что информация о «нормальной форме» игры является совершенно необязательной, чтобы человек мог вести эффективную борьбу. Нормальная форма позволяет зафиксировать лишь чисто внешние стороны конфликтного взаимодействия, совершенно не затрагивая скрытые рефлексивные механизмы, которые в значительной степени предопределяют исход реальных поединков.

Сопоставление всех описанных экспериментов показывает, что в человеческом конфликте проявляются некоторые рефлексивные инварианты, слабо зависимые от типа и сюжета игры. Это экспериментальный аргумент в пользу того, что рефлексивная феноменология может быть объектом специального изучения.

Дриблинги, оптимизирующие свою работу в результате противодействия человека, можно интерпретировать как «устройства, превращающие опасения в явь». Эти устройства, предоставленные самим себе, либо крайне редко переходят в некоторое состояние, либо характеризуются постоянным распределением различных исходов; но если человек начинает совершать действия, чтобы воспрепятствовать переходу системы в определенное состояние, то система достаточно быстро или достаточно часто переходит именно в это состояние.^ß

6—13 9—23 1—11 7—17

7—16 13—15 15—13 16—7 11—26 23—9 26—11 11—1 3—9 9—3 12—14 14—16 16—7 17—12

5—21 3—12 7—17 15—25

14—24 12—3 8—17 25—15

21—5 7—10 . 13—18 20—22

24—10 10—7 17-8 22—20

18—13

14—6 6—13 8—13 12—8 13—6 10—16 16—10 12—21 21—12 16—23 23—16 17—21 21—27 3-14 14—3 11—7 7—11

17 25

12—17 13—22 15—17 17—15 22—13 18—25 25—18 19—22 22—19 2—15 6—20 20—6 15-2 13—22 21—26 14—16 26—21 16—18 24—23 18—16 23—24

22—13

Глава VI.РЕФЛЕКСИВНЫЕ СВЯЗИ В КОЛЛЕКТИВАХ

Простейшая рефлексивная модель социального организма.Произведем следующую схематизацию. Пусть Т— поле материальных вещей, на фоне которых развертывается рефлексивное представление. Пусть в материальный фон включены персонажи e₁,е₂,...,еп. Каждый персонаж отражает поле материальных вещей и имеет собственную картину Te1, Те2, ..., Те_п. Кроме того, картины, которые есть у одних персонажей, могут отражаться другими. Мы получим элементы Te_je_i и т.д. Произведя несложные рассуждения, мы придем к следующему символическому изображению элементов и связей этой системы:

Для некоторых персонажей е_i какие-то элементы могут отсутствовать. Подобное разложение в ряд позволяет дать глобальную рефлексивную характеристику социального организма или некоторых его частей.

Система разумных особей будет характеризоваться наличием по крайней мере третьего члена этого ряда:

E(i)E(j)Te_je_i