Классическое обусловливание

Классическое обусловливание — это процесс научения, при котором ранее нейтральный стимул начинает ассоциироваться с другим стимулом вследствие того, что второй стимул сопровождает первый.

Эксперименты Павлова. В основном эксперименте Павлова сначала в слюнную железу собаки вживляют фистулу, чтобы измерять количество выделенной слюны. Затем перед собакой ставят миску, в которую автоматически может подаваться мясной порошок. Экспериментатор включает свет в окошке перед собакой. Через несколько секунд в миску подается немного мясного порошка, и свет выключается. Собака голодна, и записывающее устройство регистрирует обильное слюноотделение. Выделение слюны — это безусловный рефлекс (БУР), поскольку здесь никакого научения нет; по той же причине мясной порошок — это безусловный стимул (БУС). Эту процедуру повторяют несколько раз: свет, затем пища, свет, затем пища и так далее. После этого, чтобы проверить, научилась ли собака ассоциировать свет с пищей, экспериментатор включает свет, но не подает никакого мясного порошка. Если у собаки выделяется слюна, значит, она научилась этой ассоциации. Такое слюноотделение является условной реакцией (УР), а свет в данном случае — условным стимулом (УС).Эту собаку научили, или обусловили, ассоциировать свет с пищей и реагировать на него выделением слюны. Каждое парное предъявление условного стимула (УС) и безусловного стимула (БУС) называется пробой. Пробы, во время которых испытуемый научается ассоциировать эти два стимула, называют стадией приобретения, во время этой стадии повторные предъявления пары УС (свет) и БУС (пища) подкрепляют ассоциацию между двумя стимулами. Если эта реакция не подкрепляется, реакция будет постепенно уменьшаться; это называется угасанием.

Понятия приобретения и угасания создают интуитивное ощущение, что мы рассматриваем классическое обусловливание как научение предсказанию того, что произойдет дальше. (Это — ядро когнитивного подхода к обусловливанию, который мы рассмотрим позднее.) Когда предсказание успешно (т. е. подкреплено), животное научается и далее делать такое предсказание (т. е. имеет место приобретение); когда внешняя ситуация меняется так, что предсказание устаревает (не подкрепляется), животное научается его тормозить (угасание).

Обусловливание второго порядка. До сих пор в нашем рассмотрении обусловливания БУС всегда был биологически значимым — это были пища, холод или электрораздражитель. Однако силу БУС могут обретать и другие стимулы, если их последовательно сочетать с биологически значимыми БУСами. Вспомним пример с собакой, на которую воздействует свет (УС), после чего следует пища (БУС), и свет начинает вызывать условную реакцию. После того как у собаки выработан условный рефлекс, свет приобретает силу БУСа. Если теперь собаку поместить в обстановку, где на нее будет воздействовать звук, за которым в каждой пробе будет следовать свет (но не пища), то этот звук сам по себе со временем будет вызывать условную реакцию, хотя он никогда не сочетался с пищей.

Генерализация и дифференцировка. Генерализация.После того как условная реакция стала ассоциироваться с определенным стимулом, эту же реакцию может вызывать другой стимул. Предположим, что у человека выработан условный рефлекс — средней силы эмоциональная реакция на звук камертона, соответствующий ноте "до" малой октавы. Уровень эмоциональности можно измерить по кожно-гальванической реакции (КГР). У этого человека КГР будет меняться также в ответ на более низкий или более высокий тон без специального обусловливания. Чем больше новые стимулы похожи на первоначальный УС, тем вероятнее они будут вызывать условную реакцию. Если генерализация — реакция на сходство, то дифференцировка — реакция на различие. Условная дифференцировка вырабатывается посредством избирательного подкрепления. Например, вместо одного тона теперь есть два: тон меньшей высоты, УС-1, за которым всегда следует электрический удар, и тон большей высоты, УС-2, за которым ничего не следует. Первоначально у испытуемых КГР появляется на оба тона. В ходе обусловливания, однако, амплитуда условной реакции на УС-1 постепенно возрастает, а амплитуда реакции на УС-2 уменьшается. В ходе такого дифференциального подкрепления у испытуемых вырабатывается условная реакция различения этих двух тонов. Более высокий тон, УС-2, стал сигналом для торможения заученной реакции.

Условный страх. Классическое обусловливание играет роль и в эмоциональных реакциях, таких как страх. Представим, что крысу помещают в закрытый ящик, в котором она периодически подвергается электрическому. Как раз перед электрическим ударом раздается тональный сигнал. После неоднократного сочетания тона (УС) и удара током (БУС) тон сам по себе будет вызывать у крысы реакцию, являющуюся признаком страха.

Роль когнитивных факторов в классическом обусловливании. Со времен Павлова исследователи пытались определить, какой фактор для классического обусловливания является главным. Павлов полагал, что решающим фактором является совпадение УС и БУС во времени. Однако для совпадения по времени как основного фактора классического обусловливания есть альтернатива: чтобы произошло обусловливание, БУС должен появляться с большей вероятностью при предъявлении УС, чем при его отсутствии. Последующие эксперименты подтвердили вывод, что отношение предсказания между УС и БУС важнее, чем совпадение их по времени или частота парного предъявления УС и БУС.

Предсказуемость важна также для эмоциональных реакций. Если определенный УС надежно предвещает наступление боли, то отсутствие этого УС предупреждает, что боли не будет и организму можно расслабиться. Следовательно, УС — это сигнал «опасности», а его отсутствие — сигнал «безопасности».

Биологические ограничения Разные биологические виды научаются одному и тому же при помощи различных механизмов. Относящиеся сюда феномены были открыты этологами — биологами и психологами, изучающими поведение животных в естественном окружении. Этологи полагают, что научение жестко ограничено генетическими задатками животного и что разные виды научаются одним и тем же вещам разными способами. Когда животное учится, оно подчиняется генетически заданному «поведенческому проекту»; который генетически ограничивает виды ассоциаций, которым организм может научиться. То есть животные предпрограммированы заучивать определенные вещи определенными способами.

Оперантное обусловливаниеРебенок будет чаще лопотать, если за каждым таким действием следует родительское внимание, и собака будет чаще поднимать мячик, если за этим следует ласка или вознаграждение пищей. Если считать, что у ребенка есть цель вызвать родительское внимание, а у собаки цель — пища, то оперантное обусловливание сводится к научению тому, что определенное поведение ведет к достижению определенной цели. Закон эффектаТорндайк стремился показать, что научение у животных неотрывно от научения у человека. Типичный эксперимент проходил так. Голодного кота сажали в клетку, дверца которой была закрыта на простую задвижку, а совсем рядом с клеткой клали кусочек рыбы. Кот не догадывается, а просто ведет себя по типу проб и ошибок, и когда после совершения какого-то действия немедленно следует вознаграждение, научение этому действию закрепляется. Это закрепление Торндайк называл законом эффекта. Он утверждал, что при оперантном научении в силу закона эффекта из набора случайных реакций выбирается та, за которой идут положительные последствия. Закон эффекта, таким образом, провозглашает выживание самых приспособленных реакций.

Эксперименты Скиннера В эксперименте Скиннера голодное животное помещают в ящик, который внутри пуст, если не считать выступающего рычага, под которым стоит тарелка для еды. Каждый раз, когда крыса нажимает на рычаг, небольшой шарик пищи выпадает в тарелку. Крыса съедает его и вскоре снова нажимает на рычаг; пища подкрепляет нажатие на рычаг, и частота нажатий стремительно растет. Если при нажатии на рычаг пища больше не подается, частота нажатий будет уменьшаться. Следовательно, оперантно обусловленная реакция (или просто операнта) при неподкреплении угасает точно так же, как и классически обусловленная реакция. Экспериментатор может установить критерий дифференцировки, подавая пищу только тогда, когда крыса нажимает на рычаг при горящей лампочке, и тем самым вырабатывая условную реакцию у крысы путем избирательного подкрепления. В этом примере свет служит дифференцировочным стимулом, который контролирует реакцию. Итак, оперантное обусловливание повышает вероятность некоторой реакции, когда определенное поведение сопровождается подкреплением.

Существует ряд явлений, значительно расширяющих сферу действия оперантного обусловливания и указывающих на возможное его применение к поведению человека.

Условное подкрепление. Большинство из рассмотренных нами подкреплений называются первичными, поскольку, как и пища, они удовлетворяют основные потребности. Если бы оперантное обусловливание происходило только с первичными подкреплениями, оно не было бы таким распространенным в нашей жизни, поскольку первичные подкрепления не столь часты. Однако практически любой стимул может стать вторичным, или условным, подкреплением, если его последовательно сочетать с первичным подкреплением; условные подкрепления значительно расширяют диапазон оперантного обусловливания (так же как обусловливание второго порядка значительно расширяет диапазон классического обусловливания).

Генерализация и дифференцировка. То, что было верно для классического обусловливания, верно и для оперантного: организмы генерализуют то, что они выучили, и генерализацию можно ограничить тренировкой на дифференцировку.

Режимы подкрепления. 1.эффект частичного подкрепления. Данный эффект понятен на чисто интуитивном уровне, поскольку если подкрепление для поддержания реакции является лишь частичным, случаи угасания и поддержания реакции труднее отличить друг от друга. 2.При режиме с фиксированной пропорцией (его называют режимом ФП) число реакций, которые должны совершиться, равно определенной величине. 3.При режиме с переменной пропорцией (ПП) подкрепление также дается после совершения определенного количества реакций, но их число варьируется непредсказуемо. 4.интервальные режимы, в которых подкрепление выдается только по прошествии определенного времени. Такие режимы тоже бывают фиксированными и переменными. При фиксированном интервале (ФИ) организм получает подкрепление за первую реакцию по прошествии определенного времени с момента ее последнего подкрепления. 5.При режиме с переменным интервалом (ПИ) вознаграждение все еще зависит от прошествия определенного интервала, но его длительность колеблется непредсказуемо.

Обусловливание неприятными стимулами Наказание может подавить нежелательную реакцию, но у него есть несколько недостатков. Во-первых, его эффект не столь предсказуем, как эффект вознаграждения. Вознаграждение, по сути, говорит: «Повтори то, что ты уже сделал»; наказание говорит «Перестань!» и не может предложить альтернативу. В результате организм может заменить наказываемую реакцию еще менее желательной. Во-вторых, побочные результаты наказания могут оказаться вредными. Наказание часто ведет к антипатии или страху перед наказывающим человеком и перед самой ситуацией, где происходило наказание. Наконец, крайне суровое или болезненное наказание может вызвать агрессивное поведение, более серьезное, чем первоначальное нежелательное.

Организм может реагировать и так, чтобы предотвратить неприятное событие до его начала, Это называется научением предотвращению событий. Научение избеганию часто предшествует научению предотвращать события.

Контроль и когнитивные факторы В когнитивной теории предотвращения предполагается, что в оперантном обусловливании, так же как и в классическом, важную роль играют когнитивные факторы.. Некоторые важные эксперименты больше говорят в пользу фактора контроля, чем в пользу фактора совпадения по времени. Многие другие эксперименты свидетельствуют в пользу того, что оперантное обусловливание происходит, только когда организм воспринимает подкрепление как нечто, что он может контролировать.

и в классическом, и в оперантном обусловливании организм усваивает именно зависимость между двумя событиями. В классическом обусловливании поведение определяется конкретными стимулами; в оперантном обусловливании поведение определяется конкретными ожидаемыми реакциями.

Биологические ограничения Эти ограничения касаются соотношений между реакцией и подкреплением. Случай с вознаграждением, когда пища сочетается с клеванием (но не хлопанием крыльев), является частью естественной активности птиц, связанной с едой. Значит, разумно предположить, что существует генетически заданная связь между клеванием и едой. Сходным образом, в варианте с прекращением раздражения током имеется опасная ситуация, а естественной реакцией голубя на опасность является хлопанье крыльями (но не клевание).

Комплексное научение

Согласно когнитивному подходу, основной вопрос научения лежит в способности организма к мысленному представлению различных аспектов мира и оперированию этими мысленными репрезентациями, а не самим миром. Во многих случаях мысленные репрезентации состоят из ассоциаций между стимулами или событиями; эти случаи соответствуют классическому и оперантному обусловливанию. В других случаях содержание репрезентаций сложнее. Это может быть карта окружающей местности или абстрактное понятие причины. Есть также случаи, когда операции, выполняемые с мысленными репрезентациями, сложнее ассоциативных процессов. Эти операции могут принимать форму мысленных проб и ошибок, путем которых организм испытывает в уме различные возможности. Они могут составлять многоэтапную стратегию, в которой некоторые мысленные этапы предпринимаются только потому, что они открывают путь к последующим этапам. Идея стратегии, в частности, расходится с предположением, что сложное научение строится из простых ассоциаций. Далее мы рассмотрим явления научения, прямо указывающие на необходимость принимать в расчет не-ассоциативные репрезентации и операции. Некоторые из этих явлений относятся к животным, а некоторые — к выполнению человеком задач, сходных с обусловливанием.

Когнитивные карты и абстрактные понятия

Толмэн изучал как крысы заучивают путь через сложный лабиринт. По его мнению, крыса, пробегающая по сложному лабиринту, не заучивает последовательность из реакций типа «повернуть налево» или «повернуть направо», а формирует когнитивную карту — мысленное представление о схеме лабиринта. В более новых исследованиях найдены убедительные подтверждения наличия у крыс когнитивной карты. Крыса проходит рукава в случайном порядке, и это говорит о том, что она заучила не жесткую последовательность реакций. Что же тогда она заучила? Видимо, крыса выработала картоподобную репрезентацию этого лабиринта, в которой определены пространственные отношения рукавов, и в каждой пробе она мысленно отмечает каждый посещенный ею рукав. В более новых исследованиях, где участвовали приматы, а не крысы, получены еще более сильные свидетельства в пользу сложных мысленных репрезентаций. Особенно примечательны исследования, показавшие, что шимпанзе могут приобретать абстрактные понятия, хотя когда-то считалось, что эта сфера принадлежит только человеку.

Инсайт в научении Кёлер ставил перед шимпанзе задачи, оставлявшие некоторое пространство для догадок (инсайта), поскольку ни один из элементов задачи не был скрыт от глаз шимпанзе. Как правило, Кёлер помещал шимпанзе в огороженное пространство, а банан, находился вне досягаемости. Чтобы заполучить фрукт, животному надо было использовать находящийся рядом предмет в качестве инструмента. Обычно шимпанзе решал эту задачу и делал это способом, предполагавшим наличие у него некоторой способности к инсайту. Некоторые аспекты поведения этих шимпанзе отличаются от поведения кошек у Торндайка или крыс и голубей у Скиннера. Во-первых, решение было внезапным, а не явилось результатом постепенного процесса проб и ошибок. Во-вторых, после того как шимпанзе решила задачу, с этих пор она будет решать ее с малым числом ненужных движений. Далее, шимпанзе у Кёлера могли легко переносить выученное на новую ситуацию. Таким образом, у решения шимпанзе есть три важнейших особенности: внезапность; повторяемость после того, как оно один раз найдено; возможность его переноса. Эти особенности не свойственны поведению типа «проб и ошибок», которое наблюдали Торндайк, Скиннер и их коллеги. Скорее, решения шимпанзе отражают мысленные пробы и ошибки. То есть животное формирует мысленную репрезентацию задачи, манипулирует компонентами этой репрезентации, пока не нападает на решение, и затем реализует его в реальном мире. Решение потому и кажется внезапным, что умственные процессы обезьяны недоступны исследователям. Само решение сохраняется в дальнейшем, поскольку мысленная репрезентация со временем не исчезает. И это решение можно переносить на другие ситуации, поскольку репрезентация либо достаточно абстрактна, чтобы охватить не только первоначальную ситуацию, либо достаточно податлива, чтобы распространить ее на новую ситуацию. Из работы Кёлера следует, что комплексное научение часто состоит из двух фаз. В начальной фазе задача решается, чтобы получить само решение; на второй фазе это решение сохраняется в памяти и воспроизводится каждый раз, когда возникает сходная проблемная ситуация. Следовательно, комплексное научение изначально связано с памятью и мышлением.

Предубеждения могут влиять на то, чему научаются, откуда следует, что в научении участвуют не только процессы формирования ассоциаций между входными сигналами. В исследованиях в каждой пробе предъявлялась пара стимулов, скажем, изображение и описание человека; задачей испытуемого было установить связь между членами этих пар — например, что изображения высокого человека имеют тенденцию ассоциироваться с краткими описаниями. Некоторые данные о роли предубеждений были получены в тех случаях, когда никакой объективной связи между этими стимулами не существовало, и все же испытуемые такую связь «находили». В одном эксперименте испытуемых просили указать возможную связь между рисунками психически больных и проявлявшимися у них симптомами. В каждой пробе испытуемым показывали рисунок человека, сделанный пациентом, и один из шести симптомов. Задачей испытуемых было определить, есть ли в рисунке какой-либо признак, относящийся к какому-либо из этих симптомов. На самом деле эти шесть симптомов сочетались с рисунками в случайном порядке. И тем не менее испытуемые неизменно сообщали о наличии такой связи. Эти несуществующие, но правдоподобные отношения называют мнимыми ассоциациями. Поскольку предубеждения являются частью знаний человека, эти результаты свидетельствуют о когнитивной природе такого научения.

Результаты показали, что испытуемые неизменно переоценивали силу этой связи. Их предубеждение, что честный человек честен во всех ситуациях, заставляло их видеть больше, чем есть на самом деле. В этом исследовании предубеждения испытуемых иногда расходились с объективной ассоциацией, которую надо было усвоить. Однако по мере того как данные (объективная ассоциация) делаются все более заметными, предубеждения постепенно сдают свои позиции, и тогда человек усваивает то, что есть на самом деле.

это направление исследований демонстрирует важную роль предубеждений в научении человека, укрепляя тем самым когнитивный подход к научению. Это направление связано также с этологическим подходом к научению. Подобно крысам и голубям, ограниченным в научении только теми ассоциациями, которые для них заготовила эволюция, люди ограничены в научении теми ассоциациями, к которым подготовлены своими предубеждениями.