Классические концепции научения

Научение с позиций учения об условных рефлексах

В рамках учения И.П. Павлова в осно­ве научения лежит образование условных рефлексов, или временных связей между нервными структурами, зависящих от ре-


ализации различных составляющих пове­дения. В результате одного или несколь­ких предъявлений последовательности индифферентного раздражителя (услов­ного стимула) и следующего за ним безус­ловного стимула, вызывающего безуслов­ную реакцию, т. е. врожденную, не требу­ющую специального формирования, ин­дифферентный раздражитель начинает сам вызывать условную реакцию, которую до введения новых условий он не вызывал. Если это сочетание перестает повторяться, реакция угасает. Если условный стимул предъявляют после безусловного, условная связь не вырабатывается. Таким образом, в процессе установления временной связи, т. е. при обусловливании, безусловный стимул выступает в роли подкрепления, индифферентный раздражитель приобре­тает сигнальное значение, а выработанный рефлекс отражает условия достижения приспособительного результата, способст­вует адаптации организма к меняющимся условиям среды. Вариации условной связи (угасание, генерализация, дифференци-ровка, включение дополнительных усло­вий ее реализации и т. д.) обеспечиваются процессами возбуждения, торможения и их соотношением.

В отличие от ортодоксальной и ради­кальной бихевиористских концепций, предметом изучения которых являются исключительно внешне наблюдаемые фе­номены, учение об условных рефлексах изначально считалось физиологическим и рассматривало поведение как внешние проявления организованной активности нервных центров (высшей нервной дея­тельности). Важно заметить, однако, что оно было последовательно физиологичес­ким и не требовало обязательного введе­ния представлений о внутренних психоло­гических структурах.

Бихевиоризм

Законы и принципы научения

Впервые закономерности научения, ус­тановленные экспериментальными мето­дами, сформулированы в рамках бихевио­ристской парадигмы. Они были зафикси-


3.5. Научение



 


 


рованы в истории психологии под назва­нием «законы обучения», но фактически являются эмпирическими обобщениями, а иногда и постулатами. Сформулированные преимущественно Э. Торндайком (E.L. Thorn-dyke), а затем модифицированные или до­полненные К. Халлом (C.L. Hull), Э. Тол-маном (E.G. Tolman) и Э. Газри (E.R. Guth-rie; в отечественной литературе встреча­ются и другие написания: Гатри, Гасри, Гетри) на основе большого эмпиричес­кого материала, полученного в опытах с участием человека и животных, они в не­явной форме учитывали также и резуль­таты исследований, проведенных в школе И.П. Павлова. Именно поэтому выделен­ные закономерности описывают факторы, важные для разных форм обучения, и, несмотря на непрекращающуюся критику, принимаются во внимание по сей день.

Закон готовности(law of readiness). Удов­летворение при научении есть производ­ное от функционирования единиц, обес­печивающих поведение (The satisfaction is derived from the functioning of behavioral «conduction units»), т. е. в случае если нерв­ная сеть готова к проведению возбужде­ния, то оно вызывает удовлетворение.

Иная трактовка закона готовности, предлагаемая в различных отечественных и зарубежных руководствах, связывает успешность научения с «напряжением потребности»: чем выше уровень соответст­вующей потребности, тем быстрее и эф­фективнее протекает научение.

Закон эффекта(law of effect). В наибо­лее общей форме — события во внешнем мире (стимулы) являются основой селек­ции какого-либо конкретного поведения из множества возможных. Поведение, ко­торое приводит к полезному событию (сти­мулу/подкреплению), будет повторяться, в то время как приводящее к «вредным» последствиям (стимулу/событию/наказа­нию) повторяться не будет.

Первоначально Торндайк выделял так­же «негативный закон эффекта» (negative law of effect), который описывал снижение вероятности реакций, приводящих к не­желательным последствиям.

Строгая форма закона эффекта (strong law of effect) гласит: подкрепление не только увеличивает частоту или вероятность ре-


акции, но служит необходимым условием ее возникновения.

Торндайк использовал понятия «удов­летворительное положение дел» (satisfying state of affairs) и «неприятное положение дел» (annoying state of affairs), а не «под­крепление» и «наказание»; события он обозначал соответственно «satisfiers» и «annoyers» (см. [Kling, Riggs, 1971]).

Бихевиористы отметили параллели между этим законом и принципами естест­венного отбора. Подобно тому как из мно­жества организмов выживают наиболее приспособленные, так и из множества возможных в данный момент вариантов поведения отбирается тот, который при­ведет к полезному событию. Наиболее полное развитие эта аналогия получила в работах Б.Ф. Скиннера [Skinner, 1984] (см. также подразд. «Процедуры», метод проб и ошибок).

Закон упражнения(law of exercise): при прочих равных условиях повторение оп­ределенного действия облегчает соверше­ние поведения, приводит к более быстрому выполнению и снижению вероятности ошибок. Позже Торндайк экспериментально показал ограниченность действия закона упражнения: не при всяких условиях по­вторение способствует упрочению навыка, знания, опыта. Тем не менее при мотор­ном научении и формировании навыков повторение — весьма важный фактор моди­фикации поведения. Показано постоянное возрастание скорости выполнения серии стереотипных действий при их повторении даже в течение 10 лет (см. [Норман, 1985, с. 91]). Выполнение простейшей двига­тельной задачи может совершенствоваться на протяжении миллионов повторений: «Не существует такого акта у человека, чтобы он был слишком простым для усо­вершенствования» [Gottlieb et al., 1988].

Закон недавности(law of recency), прин­цип или эффект недавности: тенденция к лучшему заучиванию (лучшему воспроиз­ведению) материала, который предъявлялся в конце серии. Особенно ярко эффект не­давности проявляется при использовании материала, не представляющего интереса для испытуемого. Эта формулировка на­ходится в противоречии с эффектом пер­вичности (primacy effect, principle of primacy,



3. ПОЗНАНИЕ И ОБЩЕНИЕ


 


 


law of primacy) — тенденцией к лучшему заучиванию материала, предъявляемого в начале сессии научения. «Эффект края (последовательности)» (serialposition effect) снимает это противоречие, поскольку про­является в лучшем заучивании начальных и конечных элементов предъявляемого ряда. U-образная зависимость степени заученности материала, отображающая этот эффект, называется «позиционная кривая» (см. [Солсо, 1996, с. 152]).

Закон соответствия(matching law): су­ществует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Принцип реагирования по аналогии(res-ponse-by-analogy principle): испытуемый в незнакомой ситуации будет вести себя так же, как в знакомой ситуации, сходной с настоящей.

Процедуры

Метод «проб и ошибок» (trial-and-error learning)

Этот метод впервые описан Э. Торндай-ком в 1898 г. Феноменологически состоит в том, что в проблемной ситуации субъект для решения задачи применяет большой набор пробных действий, при этом про­исходит постепенное устранение неэффек­тивных и закрепление действий, приво­дящих к достижению результата. Для изу­чения этой формы научения Торндайк разработал специальное устройство -«проблемный ящик» (problem box). Он полагал, что «слепые» пробы, ошибки и случайный успех, закрепляющий удачные пробы, составляют суть процесса научения у животных и человека. В настоящее время состав и порядок перебора пробных актов в ситуации научения методом проб и ошибок не считаются случайными. Субъ­ект использует действия, сформированные в прошлом опыте, для решения новой для него задачи. Если эти действия оказыва­ются неадекватными поставленной задаче, поведение выглядит хаотическим. Согласно представлениям, развитым Б.Ф. Скинне-ром [Skinner, 1984], научение путем проб и ошибок аналогично естественному от-


бору (см. разд. 3.5.4 «Законы и принципы научения», закон эффекта). Однако эта аналогия неполна, так как, если в процессах эволюции происхождение разнообразия генов объясняется, в частности, мутациями, остается неясным, что именно порождает разнообразие поведенческих актов, из ко­торых происходит выбор.

Для того чтобы распространить пред­ставление о роли проб и ошибок в моди­фикации внешне наблюдаемого поведения на скрытые, внутренние процессы, такие, как мышление, было введено представле­ние о замещающих, «викарных», пробах и ошибках (vicarious trial and error — VTE). Предполагается, что этот феномен прояв­ляется, например, в переборе возможных ходов при игре в шахматы.

Ограниченность представлений о на­учении, основанных на методе проб и ошибок, очевидна при рассмотрении та­ких феноменов, как инсайт, подражание, научение с одной попытки, научение, осно­ванное на наблюдении.