Ожидание и целенаправленность
Независимо от Левина Толмен еще в конце 20-х гг., экспериментируя с крысами, пришел к совершенно аналогичным теоретическим положениям. Будучи убежденным бихевиористом, он тем не менее не сомневался в том, что не поддающиеся наблюдению когнитивные процессы являются решающими в поведении живого существа. Однако, не приемля чисто меиталистского объяснения поведения через когнитивные процессы, Толмен стремился сделать их доступными контролю, так сказать, вывести наружу непосредственно не наблюдаемые внутренние процессы. Особое внимание он уделял соотношению предшествующих условий и последующих эффектов, т. е. наблюдаемым событиям, между которыми происходят интересующие нас процессы. Так, Толмен первым выявил природу промежуточных переменных как гипотетических конструктов и указал на необходимость их опера-ционализации с помощью экспериментальных процедур и наблюдения (см. главу 1). Если вслед за Толменом соотнести друг с другом в приведенном ниже отрывке наблюдения и операции, то станет очевидно, что невозможно обойтись без ответа на вопрос, обладает ли, например, крыса знанием кратчайшего пути в лабиринте к местонахождению пищи, т. е. ожиданиями соотношения действий и их последствий (R-S*):
«...посмотрим на крысу, вполне научившуюся проходить лабиринт: как только она оказывается у входа, то устремляется по лабиринту наиболее коротким путем, поворачивая там, где надо, и добираясь до камеры с пищей за 4-5 с. Предположим теперь, что между двумя проходами лабиринта одну из секций значительно укоротили. Что же происходит? При очередном проходе животное упрямо бежит в соседнюю секцию. Одним словом, оно действует так, как если бы укороченная секция сохранила свою длину. Его поведение постулирует, выдвигает, предполагает тезис о сохранении представления о прежней длине» (Tolman, 1926b, p. 356).
Толмен был приверженцем «психологического бихевиоризма». Его идеи отличались от идей представителей психологии научения того времени и были близки взглядам Левина; прежде всего, это выражалось в выдвижении трех взаимосвязанных принципов объяснения поведения. Первый.Предпочтение молярных единиц молекулярным: не движения мышц или секреция желез, а процессы, влияющие на поведение в целом, позволяют выявить его целенаправленность или намерения индивида. Второй.Пока поведение не объяснено психологически, не оправдано обращение к его физиологическим и неврологическим основам. Третий.Поведение, поскольку оно направлено на целевые объекты и состояния, должно рассматриваться и анализироваться с точки зрения его целенаправленности.
Толмен подчеркивал, что постулируемое понятие целенаправленности не должно носить чисто умозрительный, описательный характер (т. е. не подвергаться
измерительным процедурам). Согласно бихевиористской точке зрения, целенаправленность должна быть конкретизирована в терминах различных наблюдаемых аспектов поведения. В первую очередь Толмена интересовали три аспекта целенаправленности: настойчивость, понятливость и избирательность. Настойчивость — это почти что черта характера, она означает способность упорно прилагать усилия вплоть до достижения определенного объекта или состояния. Понятливость определяет наступающий со временем успех научения в одинаковых или сходных ситуациях. Избирательность указывает на спонтанное, не вынуждаемое внешним давлением поведение, при котором отдается предпочтение одному из нескольких возможных действий.
Сформулированные Толменом принципы напомнили о торндайковской методике научения посредством проб иошибок, которая уже 25 лет как не использовалась в зоопсихологии. Эксперименты состояли в следующем: голодные или испытывающие жажду животные на пути к пище или воде в проблемных ящиках и лабиринтах постоянно сталкивались с препятствиями. После нескольких проб и ошибок животное научалось все быстрее их преодолевать. Кривые научения типа торидай-ковскихотражали усовершенствование достижений от попытки к попытке вплоть до максимальных результатов. На их основании был выведен закон эффекта, согласно которому подкрепляется то поведение, которое предшествует удовлетворению. Эффект удовлетворения все больше скрепляет связь между соответствующими особенностями раздражителя и ведущими к удовлетворению реакциями. Закон эффекта, таким образом, является чистым законом научения.
Поскольку оперантное научение явно зависит от эффекта удовлетворения потребности и поскольку процесс научения трудно представить себе иначе, чем в виде образования связи «раздражитель—реакция» (хотя подобное представление является чисто гипотетической или квазифизиологической спекуляцией), мотивацион-ные условия наблюдаемых достижений в научении долго оставались невыясненными. Классические парадигмы эксперимента по научению сложились так, что всякий успех в научении мог быть зафиксирован, лишь получив свое выражение в поведении. В этом случае различение поведения и научения — того, что выучено, и того, что делается, — оказывается бесполезным. Положение мало изменилось и после того, как Халл (Hull, 1943) создал на основе закона эффекта свою теорию подкрепления, в которой выявил могивационные условия научения: минимальная сила влечения для неспецифической энергетизации поведения и последующая, ведущая к образованию привычкиредукция влечения (собственно процесс научения). Однако понятия мотивации и научения так и не были четко противопоставлены друг другу.
Эффекты привлекательности
Рамки теории «стимул—реакция* оказались тесными для толменовского представления о бихевиоризме, который на первый план в объяснении поведения выдвигает мслярность ицеленаправленность. Действительно ли можно представить себе научение как выработку прочных связей «стимула—реакциир? Не состоит ли оно в ооразовании когнитивных карт, которые по мере надобности актуализируют ожидания ближайших будущих событий? Можно ли представить себе поведение осу-
ществляющимся шаг за шагом по жестко выработанной программе? Может быть^ оно приводится в движение целями и на пути к ним непосредственно (т. е. без проб и ошибок) управляется ожиданиями по типу «средства—цель»? Начиная с 1920-х гг. в первую очередь сторонники Толмена стали проводить исследования, в которых варьировалась степень привлекательности цели. При этом наблюдались внезапные изменения поведения, которые вряд ли можно было объяснить только постепенным совершенствованием в процессе научения. Таким образом, поведение и научение были разведены. Экспериментальный анализ поведения мог освободиться и отделиться от анализа научения. Результаты этих работ Толмен обобщил в вышедшей в 1932 г. книге «Целенаправленное поведение у животных и человека» в виде теории мотивации с позиции привлекательности и ожидания. Прежде чем переходить к обсуждению исследований, рассмотрим использовавшееся в них экспериментальное устройство — Т-образный лабиринт. Как видно из рис. 5.7, такой лабиринт состоит из соединенных друг с другом Т-образных секций, причем одно из ответвлений образует тупик, а в другом имеется дверь, ведущая в соседнюю секцию лабиринта.
Рис. 5.7. Т-образный 14-секционный лабиринт
Одна из исходных серий исследований касалась влияния на поведение побуждений различной силы. Первый эксперимент был проведен в 1924 г. В то время при изучении влияния силы потребности на активность широко использовался колумбийский проблемный ящик. Недостатком этих исследований был слабый контроль привлекательности используемого целевого объекта. Симмонс (Simmons, 1924) первой сделала фактор привлекательности центральным пунктом своего исследования. Она обнаружила, что крысы быстрее обучаются проходить лабиринт, если в целевой камере находят предпочитаемую ими пищу. Животные к началу эксперимента были одинаково голодны, поскольку свой дневной рацион получали толь-
ко через 2-3 ч после эксперимента в своих обычных клетках. Перед каждой попыткой им давалась возможность попробовать находящийся в целевой камере корм. После этого крысы помещались в стартовую камеру. Если кормом был вымоченный в молоке хлеб, скорость бега резко возрастала и количество ошибочных пробежек уменьшалось быстрее, чем при подкреплении семечками. Этот различный эффект побуждения можно интерпретировать двояко: либо большая привлекательность ускоряет научение, либо оно происходит независимо от привлекательности, но ограниченная привлекательность цели меньше мотивирует животное к ее более быстрому достижению. Первое объяснение соответствовало бы более позднему варианту теории подкрепления Халла, второе — постулату Толмена о «нужности целевого объекта», которая наряду с соответствующим уровнем обучепно-сти непосредственно детерминирует поведение в лабиринте.
Данные исследований Эллиота (Elliott, 1928) подтвердили правильность последней интерпретации. Во время обучения группы экспериментальных животных прохождению лабиринта он изменял силу привлекательности объекта. Крысы этой группы после десятой попытки прохождения лабиринта находили в целевой камере вместо смеси из отрубей менее привлекательные семечки. Уже в следующих попытках прохождения лабиринта число ошибок возрастало и даже превосходило уровень контрольной группы, подкреплявшейся только семечками. На рис. 5.8 изображены «1ф1 шые научения» обеих групп животных. Внезапное увеличение числа ошибок при переходе к i и пце с ограниченной привлекательностью нельзя объяснить молниеносным забыванием, оно может быть лишь следствием независимого от научения эффекта мотивации. Поскольку достигнутый к тому моменту уровень обученное™ в этом случае больше не наблюдался, следует различать научение и поведение, учитывая независимое влияние привлекательности целевого объекта.
Рис. 5.8. Влияние уровня привлекательности на достижения (переход от более к менее предпочитаемому корму) (Elliott, 1928, S. 26)
В другом своем исследовании Эллиот (Elliott, 1929) по прошествии девяти дней изменял вид подкрепления (корм на воду). У менее голодных, но ощущавших сильную жажду животных сразу после введения адекватного потребности целевого объек-
та (воды) наблюдался рост достижений, проявлявшихся в увеличении скорости бега и уменьшении числа ошибок. Иными словами, определяющая уровень достижения привлекательность целевого объекта зависит от сиюминутного состояния потребности. То же соотношение Левин установил для квазипотребности и валентности. Однако эффект привлекательности целевого объекта определяется помимо адекватности потребности еще одной, независимой от потребности переменной, которая соответствует фактору G в формуле валентности Левина. Согласно Сим-монс и более позднему систематическому исследованию Янга (Young, 1947), эта переменная содержит качественные характеристики целевого объекта. Креспи (Crespi, 1942,1944) также доказал значимость его количественных показателей. Увеличение количества пищи мгновенно улучшает уровень достижения при экспериментальном научении голодного животного. Этот так называемый эффект Креспи опровергает постулат теории подкрепления Халла о большом количестве подкреплений как решающем факторе образования привычки; но к этому мы еще вернемся.
Латентное научение: разделение научения и мотивации
Крайним случаем варьирования привлекательности является полное ее отсутствие; при этом не происходит подкрепления и, следовательно, не приходится ожидать целенаправленного поведения. А что же в подобной ситуации происходит с научением? То, что научение имеет место, первым доказал Блоджетт (Blodgett, 1929) в экспериментах по так называемому латентному научению. Три группы в равной степени голодных крыс в течение девяти дней по одному разу в день помещались в лабиринт. Первая группа находила корм в целевой камере начиная с первого же дня, вторая — с третьего, а третья — с седьмого. После того как животное попадало в целевую камеру, оно при наличии там еды могло есть только в течение 3 мин, а при отсутствии еды извлекалось оттуда через 2 мин. Как видно из рис. 5.9, после введения целевого объекта во второй и третьей группах число ошибок быстро сокращается. Каждая группа почти сразу же достигает уровня научения первой группы, которая подкреплялась с первого дня. Более поздние исследования Толмена и Хонзика (Tolman, Honzik, 1930) подтвердили эти данные.
Рис. 5.9. Зависимость достижений от латентного научения и последующего подкрепления.
Первая группа получала корм после каждой попытки, две другие -соответственно после третьей и седьмой (отмечено х} (Blodgett, 1929, S. 120)
Полученные результаты многое проясняют. Прежде всего это касается того факта, что научение происходит и без подкрепления, а значит, последнее не является необходимым условием научения. Научение может оставаться латентным, т. е., состоявшись, не проявляться в поведении. В таком случае научение должно заключаться в образовании знаний о структуре путей в лабиринте, а не в образовании жесткой последовательности объединений «раздражитель—реакция», поскольку целенаправленный, с уменьшающимся количеством ошибок поиск целевой камеры не происходил, когда там не было корма. Успехи научения можно наблюдать в поведении при достижении цели, только когда имеет место мотивация. Поэтому закон эффекта Торндайка есть не принцип научения, а принцип поведения. Научение и мотивация представляют собой две самостоятельные группы факторов, совместное проявление которых определяет поведение. Реализация вызванной привлекательностью пищи мотивации к достижению целевой камеры зависит от достигнутых на данный момент результатов научения, что сказывается на различиях в усовершенствовании достижений второй и третьей групп. После семикратно предоставленной возможности ознакомиться с лабиринтом количество ошибок сокращается быстрее, чем после трехкратной.
Итак, поведение объясняется взаимодействием двух промежуточных переменных: научения имотивации. Фактор научения, по Толмену, состоит из знаний о том, какая из секций лабиринта куда ведет. Этот результат научения становится ожиданием цели в форме отношений между действием и его последствиями. Мо-тивационным фактором в данном случае является нужность цели. Она зависит от физиологического состояния потребности, или влечения, и от привлекательности целевого объекта (у Левина — соответственно от tu G; Толмен рассматривает оба фактора, влечение и привлекательность, как явления более или менее одного порядка; различия в степени их влияния и их взаимоотношений им не рассматриваются). Постулированные Толменом нужность цели и ее ожидание стали теми промежуточными переменными, которые не только имеют когнитивную природу, но и выступают посредниками между поддающимися наблюдению особенностями исходных условий и последующим поведением, благодаря чему оказывается возможным объяснение наблюдаемой целенаправленности поведения. На рис. 5.10 схематично представлены эти теории мотивации. Исходные условия, которые помимо стимулов окружения и влечения (состояние потребности) включают также прошлое научение, предрасположенность и степень развития, при некоторых, еще подлежащих уточнению, обстоятельствах могут детерминировать как нужность цели, так иее ожидание. Последующие молярные действия определяются тремя доступными наблюдению аспектами целенаправленности.
Приводимая ниже цитата из книги «Целенаправленное поведение у животных и человека» содержит ответ на вопрос, чему же научаются животные в экспериментах по научению, а также раскрывает новый взгляд на взаимовлияние научения и мотивации поведения.
«Окончательная критика доктрины научения методом проб и ошибок направлена на ее основополагающее понятие стимульно-реактивных связей. Стимулы, как таковые, реакции не вызывают. Правильные стимулы ю-реактивные связи не "запечатлеваются", а неправильные не "стираются". Скорее, научение состоит в "открытии", или "вы-
членении", организмом того, к чему ведут любые из всех соответствующих альтернативных реакций.Позднее, если при возбуждающе-аверсивных условиях момента одна из этих альтернативоказывается нужнее других (или одна "требуется", а другие "не требуются"), то организм будет стремиться (в результате такого научения) выбирать или осуществлять реакцию, ведущую к более "нужным" последствиям. Но если различия в нужности отсутствуют, то никакоговыбора и осуществления данной реакции не произойдет, хотя научение будет иметь место» (Tolman, 1932, р. 364).
Рис. 5.10. Толменовская теоретико-мотивационная схема с двумя промежуточными переменными -
нужностью и ожиданием цели, объясняющими отношение между наблюдаемыми особенностями ситуации
(исходные условия) и последующим молярным поведением
Матрица «ожидаемой ценности»
Позднее Толмен (Tolman, 1951, 1959) несколько переработал свою теорию мотивации (по сравнению с теорией Халла она была менеесистематичной). Наряду с состояниями потребности (его классификацию мотивов см. в главе 3) актуальное поведение мотивируют еще две промежуточные переменные — ожидание и ценность. Ценность — это то же, что привлекательность целевого объекта: наряду с потребностью (или влечением) она определяет нужность цели. Обе переменные обычно не поддаются свободному комбинированию, их зависимость друг от другаустанавливается так называемой матрицей «ожидаемой ценности». Как правило, для достижения соответствующего целевого состояния удовлетворения существуют многочисленные возможности в форме ожиданий действий и их последствий (R—S*): с одной стороны, предвосхищения возможных действий, а с другой — связанных с ними целевых состояний (£*), обладающих различной ценностью.
Это особенно ярко проявляется в ситуациях выбора, например когда человек испытывает голод, а поблизости находятся несколько хороших и дорогих ресторанов с разным ассортиментом блюд и с соответствующими требованиями к кошельку. Выбор ресторана определяется не только предлагаемой там едой, т. е. предвосхищением возможных действий, но и соображениями возможной стоимости обеда. На рис. 5.11 приведена матрица «ожидаемой ценности» для человека, находящегося в подобной ситуации (задачей психологии личности помимо прочего является установление расхождения между матрицей «ожидаемой ценности» конкретного индивида и соответствующими социокультурными нормами). Составленная Толменом матрица дает годологическую картину последовательности действий в проме-
жутке междусостоянием голода (слева) и его удовлетворением (справа). Заканчивающиеся стрелками лассообразные линии представляют учтенные этапы действия, размер знаков «+» соответствует оценке конкретного ресторана (средства) и пищи(целевого объекта). Во всех четырех ресторанах можно получить предпочитаемые данным человеком блюда а и Ь; блюда с, due также могли бы его насытить; по не блюдо/.
Рис. 5.11. Пример матрицы «ожидаемой ценности»: когнитивного предвосхищения при выборе в состоянии голода между хорошими (и дорогими) ресторанами и различными блюдами (Tolman, 1952, р. 392)
Еще заметнее влияние Левина проявилось в попытке Толмеиа (Tolman, 1952) психологически полно представить описанную ситуацию выбора. Как видно из рис. 5.12, Толмен нашел свой способ объединения левиновских моделей личности (система потребно<*гей) и окружения (поведенческое пространство), причем уже отмечавшаяся несовместимость этих моделей была преодолена благодаря включению (см. заканчивающиеся стрелками пунктирные линии) когнитивных процессов системы «ожидаемой ценности». Независимыми переменными при этом выступают физиологическое состояние потребности (Т, влечение) и стимулы окружения (51), промежуточными —система потребностей, система «ожидаемой ценности» ипространство поведения, зависимой переменной — результирующее поведение (V). Пространство поведения представляет собой когнитивно-феноменальную репрезентацию данной ситуации. Ее структура решающим образом зависит от системы «ожидаемой ценности». Привлекательности аг,, х2, а также av a2 являются производными от соответствующих оценок в системе «ожидаемой ценности» (в данном случае два ресторана и наличие в каждом из них предпочитаемых блюд). В этой же системе учитываются ожидаемое насыщение и переживаемый импульс голода {needpush), в конечном счете также непосредственно зависящий от потребности и стимулов окружения.
Не вдаваясь в подробности (и не принимая во внимание трудности), из рис. 5.12 можно видеть, что Толмен в своей попытке установить генетическую связь данного пространства поведения с состоянием когнитивных переменных пошел далыие Левина. В работе, посвященной этому вопросу, он, кроме того, рассмотрел возможности операциональной диагностики индивидуальной выраженности когнитивных переменных системы «ожидаемой ценности». В отличие от Левина Толмен подчеркивал значимость индивидуальных различий ив результате своих исследо-
ваний сформулировал проблему, которая заняла центральное место в новых работах по мотивации, в первую очередь выполненных в рамках теории «ожидаемой ценности» (см.: Feather, 1982; Heckhausen, 1982b; Kuhl, 1982).
Рис. 5.12. Влияние на ситуацию выбора актуальной потребности представлено тремя различными блоками
модели: системой потребностей, системой «ожидаемой ценности* и пространством поведения. Система
«ожидаемой ценности» служит посредником между системой потребностей и пространством поведения,
последние два блока соответствуют левиновским моделям личности и окружения. Независимыми
переменными являются состояние потребности, голод (Г) и стимулы окружающего мира (S),
промежуточными - системы потребностей, «ожидаемой ценности" и пространство поведения,
зависимой переменной - результирующее поведение {V) (Tolman, 1952, р. 395)