Классические концепции научения

Научение с позиций учения об условных рефлексах

В рамках учения И.П. Павлова в основе научения лежит образование условных рефлексов, или временных связей между нервными структурами, зависящих от ре-

ализации различных составляющих поведения. В результате одного или нескольких предъявлений последовательности индифферентного раздражителя (условного стимула) и следующего за ним безусловного стимула, вызывающего безусловную реакцию, т. е. врожденную, не требующую специального формирования, индифферентный раздражитель начинает сам вызывать условную реакцию, которую до введения новых условий он не вызывал. Если это сочетание перестает повторяться, реакция угасает. Если условный стимул предъявляют после безусловного, условная связь не вырабатывается. Таким образом, в процессе установления временной связи, т. е. при обусловливании, безусловный стимул выступает в роли подкрепления, индифферентный раздражитель приобретает сигнальное значение, а выработанный рефлекс отражает условия достижения приспособительного результата, способствует адаптации организма к меняющимся условиям среды. Вариации условной связи (угасание, генерализация, дифференци-ровка, включение дополнительных условий ее реализации и т. д.) обеспечиваются процессами возбуждения, торможения и их соотношением.

В отличие от ортодоксальной и радикальной бихевиористских концепций, предметом изучения которых являются исключительно внешне наблюдаемые феномены, учение об условных рефлексах изначально считалось физиологическим и рассматривало поведение как внешние проявления организованной активности нервных центров (высшей нервной деятельности). Важно заметить, однако, что оно было последовательно физиологическим и не требовало обязательного введения представлений о внутренних психологических структурах.

Бихевиоризм

Законы и принципы научения

Впервые закономерности научения, установленные экспериментальными методами, сформулированы в рамках бихевиористской парадигмы. Они были зафикси-

3.5. Научение

рованы в истории психологии под названием «законы обучения», но фактически являются эмпирическими обобщениями, а иногда и постулатами. Сформулированные преимущественно Э. Торндайком (E.L. Thorn-dyke), а затем модифицированные или дополненные К. Халлом (C.L. Hull), Э. Тол-маном (E.G. Tolman) и Э. Газри (E.R. Guth-rie; в отечественной литературе встречаются и другие написания: Гатри, Гасри, Гетри) на основе большого эмпирического материала, полученного в опытах с участием человека и животных, они в неявной форме учитывали также и результаты исследований, проведенных в школе И.П. Павлова. Именно поэтому выделенные закономерности описывают факторы, важные для разных форм обучения, и, несмотря на непрекращающуюся критику, принимаются во внимание по сей день.

Закон готовности(law of readiness). Удовлетворение при научении есть производное от функционирования единиц, обеспечивающих поведение (The satisfaction is derived from the functioning of behavioral «conduction units»), т. е. в случае если нервная сеть готова к проведению возбуждения, то оно вызывает удовлетворение.

Иная трактовка закона готовности, предлагаемая в различных отечественных и зарубежных руководствах, связывает успешность научения с «напряжением потребности»: чем выше уровень соответствующей потребности, тем быстрее и эффективнее протекает научение.

Закон эффекта(law of effect). В наиболее общей форме — события во внешнем мире (стимулы) являются основой селекции какого-либо конкретного поведения из множества возможных. Поведение, которое приводит к полезному событию (стимулу/подкреплению), будет повторяться, в то время как приводящее к «вредным» последствиям (стимулу/событию/наказанию) повторяться не будет.

Первоначально Торндайк выделял также «негативный закон эффекта» (negative law of effect), который описывал снижение вероятности реакций, приводящих к нежелательным последствиям.

Строгая форма закона эффекта (strong law of effect) гласит: подкрепление не только увеличивает частоту или вероятность ре-

акции, но служит необходимым условием ее возникновения.

Торндайк использовал понятия «удовлетворительное положение дел» (satisfying state of affairs) и «неприятное положение дел» (annoying state of affairs), а не «подкрепление» и «наказание»; события он обозначал соответственно «satisfiers» и «annoyers» (см. [Kling, Riggs, 1971]).

Бихевиористы отметили параллели между этим законом и принципами естественного отбора. Подобно тому как из множества организмов выживают наиболее приспособленные, так и из множества возможных в данный момент вариантов поведения отбирается тот, который приведет к полезному событию. Наиболее полное развитие эта аналогия получила в работах Б.Ф. Скиннера [Skinner, 1984] (см. также подразд. «Процедуры», метод проб и ошибок).

Закон упражнения(law of exercise): при прочих равных условиях повторение определенного действия облегчает совершение поведения, приводит к более быстрому выполнению и снижению вероятности ошибок. Позже Торндайк экспериментально показал ограниченность действия закона упражнения: не при всяких условиях повторение способствует упрочению навыка, знания, опыта. Тем не менее при моторном научении и формировании навыков повторение — весьма важный фактор модификации поведения. Показано постоянное возрастание скорости выполнения серии стереотипных действий при их повторении даже в течение 10 лет (см. [Норман, 1985, с. 91]). Выполнение простейшей двигательной задачи может совершенствоваться на протяжении миллионов повторений: «Не существует такого акта у человека, чтобы он был слишком простым для усовершенствования» [Gottlieb et al., 1988].

Закон недавности(law of recency), принцип или эффект недавности: тенденция к лучшему заучиванию (лучшему воспроизведению) материала, который предъявлялся в конце серии. Особенно ярко эффект недавности проявляется при использовании материала, не представляющего интереса для испытуемого. Эта формулировка находится в противоречии с эффектом первичности (primacy effect, principle of primacy,

3. ПОЗНАНИЕ И ОБЩЕНИЕ

law of primacy) — тенденцией к лучшему заучиванию материала, предъявляемого в начале сессии научения. «Эффект края (последовательности)» (serialposition effect) снимает это противоречие, поскольку проявляется в лучшем заучивании начальных и конечных элементов предъявляемого ряда. U-образная зависимость степени заученности материала, отображающая этот эффект, называется «позиционная кривая» (см. [Солсо, 1996, с. 152]).

Закон соответствия(matching law): существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Принцип реагирования по аналогии(res-ponse-by-analogy principle): испытуемый в незнакомой ситуации будет вести себя так же, как в знакомой ситуации, сходной с настоящей.

Процедуры

Метод «проб и ошибок» (trial-and-error learning)

Этот метод впервые описан Э. Торндай-ком в 1898 г. Феноменологически состоит в том, что в проблемной ситуации субъект для решения задачи применяет большой набор пробных действий, при этом происходит постепенное устранение неэффективных и закрепление действий, приводящих к достижению результата. Для изучения этой формы научения Торндайк разработал специальное устройство -«проблемный ящик» (problem box). Он полагал, что «слепые» пробы, ошибки и случайный успех, закрепляющий удачные пробы, составляют суть процесса научения у животных и человека. В настоящее время состав и порядок перебора пробных актов в ситуации научения методом проб и ошибок не считаются случайными. Субъект использует действия, сформированные в прошлом опыте, для решения новой для него задачи. Если эти действия оказываются неадекватными поставленной задаче, поведение выглядит хаотическим. Согласно представлениям, развитым Б.Ф. Скинне-ром [Skinner, 1984], научение путем проб и ошибок аналогично естественному от-

бору (см. разд. 3.5.4 «Законы и принципы научения», закон эффекта). Однако эта аналогия неполна, так как, если в процессах эволюции происхождение разнообразия генов объясняется, в частности, мутациями, остается неясным, что именно порождает разнообразие поведенческих актов, из которых происходит выбор.

Для того чтобы распространить представление о роли проб и ошибок в модификации внешне наблюдаемого поведения на скрытые, внутренние процессы, такие, как мышление, было введено представление о замещающих, «викарных», пробах и ошибках (vicarious trial and error — VTE). Предполагается, что этот феномен проявляется, например, в переборе возможных ходов при игре в шахматы.

Ограниченность представлений о научении, основанных на методе проб и ошибок, очевидна при рассмотрении таких феноменов, как инсайт, подражание, научение с одной попытки, научение, основанное на наблюдении.