Подкрепление в научении через наблюдение

 

Бандура полагает, что хотя подкрепление часто способствует научению, оно совсем не является обязательным для него. Существует множество других факторов, замечает он, отличных от подкрепляющих последствий, которые могут влиять на то, будет ли человек внимательно наблюдать. Нам не нужно ждать подкрепления, например, чтобы обратить внимание на пожарную сирену, вспышки молнии, неприятный запах, непривычные стимулы. Действительно, когда наше внимание к моделируемой деятельности достигается посредством абсолютного влияния физических стимулов, даже дополнительные позитивные мотивы не усиливают научение через наблюдение. Этот факт доказывается исследованием, показывающим, что дети, наблюдающие модельный процесс по телевидению в затемненной комнате, позже ведут себя сходным образом, независимо от того, было ли им известно заранее, что такая имитация будет поощрена. Говоря короче, прямое подкрепление может помочь моделированию, но не является необходимым для него (Bandura, 1986).

Бандура полагает, что понимание поведения человека только как контролируемого исключительно внешними последствиями будет слишком ограниченным: «Если бы действия определялись только внешними поощрениями и наказаниями, люди вели бы себя подобно флюгеру, постоянно вертясь в разные стороны, чтобы соответствовать прихотям других» (Bandura, 1971, р. 27). Таким образом, хотя теория социально-когнитивного научения действительно признает важную роль внешних подкреплений, она постулирует существование более широкого круга подкрепляющих воздействий. Люди не только подвержены влиянию опыта, приобретенного в результате своих действий, но и регулируют поведение на основе ожидаемых последствий, а также создают их для себя сами. Эти две формы подкреплений — косвенное и самоподкрепление — мы вкратце обсудим далее.

Бандура, анализируя роль подкрепления в научении через наблюдение, показывает его когнитивную ориентацию. В отличие от Скиннера, он утверждает, что внешнее подкрепление редко выступает в роли автоматического определителя поведения. Чаще оно выполняет две другие функции — информативную и побудительную. Подкрепление, следующее за реакцией, указывает или, по крайней мере, может указать человеку на необходимость сформировать гипотезу о том, что такое правильная реакция. Эта информативная функция, или обратная связь, может работать, когда подкрепление переживается прямо или косвенно. Возьмем такой пример: если вы являетесь свидетелем того, как кого-то наказывают за определенное деяние, это дает вам столько же информации, как если бы наказывали вас. Подкрепление сообщает нам, какие последствия можно ожидать в результате правильной или неправильной реакции. Если, например, ученица средней школы, которая хочет стать врачом, узнает, что она может получить отличную подготовку (подкрепление) на вводном курсе по медицине в колледже — это как раз такой случай. Этот вид информации — обычно называемой побудительной — имеет значение, если нам нужно правильно предвидеть возможные последствия наших действий и соответственно регулировать поведение. Действительно, без способности предвидеть вероятный исход будущих поступков люди действовали бы крайне непроизводительно, если не сказать рискованно.

 

Косвенное подкрепление

 

Из предыдущего обсуждения очевидно, что люди могут получить пользу от наблюдения успехов и поражений других так же, как из своего непосредственного опыта. Действительно, мы, как общественные индивиды, постоянно следим за действиями других людей и за ситуациями, в которых тех поощряют, игнорируют или наказывают. Возьмем, например, школьника, который наблюдает, как делают выговор однокласснику за то, что он мешает учителю. Данный пример, вероятно, послужит ему предостережением, если, конечно, этот ребенок не посчитает, что в его случае последствия могут быть другими. Или, например, официант, который видит, как его коллеги получают щедрые чаевые за дружелюбную улыбку и веселую болтовню с клиентами. Это, несомненно, может подвигнуть его на то, чтобы улыбнуться и поболтать с посетителем. Как показывают эти два примера, наблюдаемые или косвенные последствия (наказания и поощрения), подкрепляющие действия других, часто играют значительную роль в регуляции нашего поведения. Это означает, что пробы и ошибки оперантного обусловливания могут быть получены «из вторых рук». Преимущество этого принципа в том, что он не только позволяет нам экономить энергию, но также дает возможность учиться на ошибках и успехах других.

Косвенное подкрепление осуществляется всякий раз, когда наблюдатель видит действие модели с результатом, который наблюдатель осознает как результат предшествующих действий модели. Можно говорить о косвенном позитивном подкреплении,когда наблюдатели ведут себя таким же образом, как наблюдаемые ранее модели, получившие подкрепление, в то время как при косвенном наказании наблюдаемые аверсивные последствия снижают тенденцию вести себя подобным образом. В каждом примере информация, полученная от наблюдаемых последствий, позволяет наблюдателю определить, будет отдельный внешний подкрепляющий стимул являться поощрением или наказанием. Таким образом, если вы увидите, что кого-то поощряют за какие-то действия, вы, вероятно, придете к заключению, что получите такой же подкрепляющий стимул, если поступите так же. И наоборот, если вы увидите, что кого-то наказывают за что-то, вы, вероятно, придете к заключению, что то же самое случится с вами, если вы поступите сходным образом.

 

Самоподкрепление

 

До сих пор мы рассматривали, как люди регулируют свое поведение на основе внешних последствий, которые они либо наблюдают, либо испытывают непосредственно. С точки зрения социально-когнитивной теории, однако, многие наши поступки регулируются самоналагаемым подкреплением. Бандура утверждает даже, что в основном поведение человека регулируется посредством подкрепления самого себя (Bandura, 1988).

Самоподкрепление очевидно имеет место всякий раз, когда люди устанавливают для себя планку достижений и поощряют или наказывают себя за ее достижение, превышение или неудачу. При работе над книгой или статьей для публикации в журнале, например, авторам не требуется, чтобы кто-то стоял сзади и заглядывал через плечо, одобряя каждое предложение, пока не получится удовлетворительная рукопись. Они заранее знают, что должно получиться в конце работы, и постоянно редактируют себя, часто бывая излишне строгими. Во многих других областях деятельности люди аналогичным образом сами оценивают свое поведение и поощряют или наказывают себя. Они поздравляют себя со своими мыслями и поступками; они хвалят себя или разочаровываются в своих достоинствах; и они сами выбирают моральные и материальные поощрения и наказания из множества доступных им. Акцент Бандуры на самоподкреплении значительно повышает возможности объяснения поведения человека на основе принципов подкрепления.