Изменчивость поведения при обучении. Теория S-R

Но параллельно шли и другие исследования, ориентированные на реальные возможности живых существ в решении поведенческих задач. В конце XIX в. начались исследования американского психолога Э. Торндайка (1874–1949) по выявлению возможностей животных к обучению. Основываясь на результатах своих исследований, этот ученый показал, что поведение животных не сводится к набору готовых от рождения неизменных реакций, что живое существо, попавшее в новую для него ситуацию, научается изменять свое поведение, отбирая те способы, которые в данных условиях приводят к успеху.

Не отрицая наличия готовых способов поведения, Э. Торндайк выделяет поведение, которое животное находит через пробы и ошибки, закрепляет его в упражнениях (то, что получило потом название "навык"). К имеющимся понятиям, описывающим поведение, прибавилось еще одно понятие – "навык", которое отличалось от других понятий своей природой.

Это было не объяснительное понятие, а название реальной способности животных к изменениям в поведении. Наряду со способностью всех животных осуществлять врожденное неизменяемое поведение, у ряда более развитых видов, но мнению Э. Торндайка, появляется возможность изменять свое поведение через научение и обучение.

Казалось бы, от этого утверждения всего один шаг до понимания поведения как решения разными способами приспособительных задач. Но прямые последователи Э. Торндайка, представители школы бихевиоризма, взяли от учителя только одну идею – поведение животных можно изучать объективно. Осознание этой возможности действительно позволило психологам и другим исследователям поведения развернуть широкий фронт экспериментальных работ. Но в теории ученики Э. Торндайка вернулись от него и И. М. Сеченова назад, к простой идее Р. Декарта об однозначной зависимости ответной реакции животных от внешнего раздражителя. Причем в отличие от Декарта и Лёба бихевиористы не интересовались механизмами поведения и его причинами. Для них были важны только связи стимулов с реакциями (теория S-R). Им казалось, что выявление заложенных связей стимулов и реакций поможет понять поведение и управлять им (в том числе и поведением человека).

Теория теорией, а игнорировать реальность изменчивости поведения животных в естественных условиях и в условиях экспериментов нс получалось. Требовался новый подход к объяснению изменчивости поведения через прямое влияние внешних условий.

Помощь "теории S-R" пришла из России, где в начале XX столетия начались исследования поведения, получившего название "условный рефлекс". Факт существования таких рефлексов был упомянут еще в работах И. М. Сеченова. В начале XX в. подобного рода реакции изучал В. М. Бехтерев, считавший, что все поведение живых существ состоит из рефлексов, в том числе тех, которые создаются при жизни животных. Он назвал их сочетательными рефлексами, формируемыми при сочетании различных раздражителей и реакций животных. Но в науке о поведении бо́льшую известность получили труды другого российского ученого – лауреата Нобелевской премии И. П. Павлова^[1]. Он получил премию как физиолог за создание метода изучения работы желудка (изолированный желудочек). В своих исследованиях этот ученый заметил, что животные реагируют не только на биологически закрепленные раздражители, но и на раздражители, которые появляются перед вызывающими врожденную реакцию (отделение слюны). Первые раздражители И. II. Павлов назвал безусловными сигналами, и им соответствовали безусловные врожденные рефлексы; вторые сигналы и соответствующие им ответы получили название условных сигналов и условных рефлексов.

Перенос этих исследований на двигательную сферу животных позволил И. II. Павлову сделать заключение, что адаптация к меняющимся условиям среды достигается выработкой новых условных рефлексов. Авторитет И. П. Павлова на долгие годы затормозил сомнения в истинности таких утверждений.

Давайте посмотрим, чему же в действительности обучается животное при выработке условных рефлексов и насколько такой рефлекс является новым поведением. Воспроизведем известную схему выработки условного рефлекса.

Например, вы предъявляете собаке мясо, и она реагирует на него выделением слюны, точно соответствующей по своему химическому составу мясу (если вы покажете собаке сухари, то состав слюны будет другим, соответствующим сухарям).

Теперь за несколько секунд до мяса вы включаете короткий звук и в ответ получаете на него ориентировочный рефлекс собаки. Через 10–11 сочетаний звук – мясо у собаки исчезнет ориентировочный рефлекс на звук, но появится слюноотделение. Чему научилась собака в этой ситуации? Она научилась опережать события внешней среды. Она научилась прогнозировать появление после звука мяса и реагирует на звук, как на мясо. То есть никакой новой реакции не появилось, просто старая, адекватная мясу реакция теперь осуществляется раньше, чем появится безусловный сигнал. Условный раздражитель сигнализировал собаке о будущем событии в среде.

Обратите внимание на названия раздражителя у И. П. Павлова – "сигнал", который действует не своей энергетической стороной, как "физический раздражитель" (толчок) у Декарта или как "стимул" у бихевиористов, а своим значением для животного. И. П. Павлов осознанно стоял на позициях Р. Декарта, полностью принимая все три идеи рефлекса, но реально, не отдавая себе отчета, вводил новые понятия, противоречащие идеям Декарта, и открывал новые явления, не вписывающиеся ни в логику Декарта, ни в свою собственную. Выработка условного рефлекса на время (когда безусловный сигнал подается ритмично через равные промежутки времени) показывает, что животное способно давать реакции без внешних физических воздействий, что в логике Декарта невозможно. Ориентировочная реакция, которую первым как целостную реакцию выделил И. П. Павлов, по его мнению, возникала на новизну сигнала, а не на физическое воздействие. Этот ученый также четко показал, что без ориентировочной реакции на условный сигнал условный рефлекс не вырабатывается, хотя сам пытался понять последний через процессы возбуждения и торможения, т.е. физически. Его заслугой является также указание на роль подкрепления, т.е. потребностей, при выработке условного рефлекса. Это означало объективно, что поведение есть решение приспособительной задачи, представленной животному в актуализированной потребности.

Судьба идей и достижений И. П. Павлова очень поучительна. Его работы прямо противоречили его осознанным принципам, которые он разделял и защищал. Он долгое время пытался доказать, что поведение животных выводится из работы мозга, из баланса возбуждений и торможений, т.е. из биофизических процессов, но объективно показывал, что поведение подчиняется другим законам и животное нельзя понимать как машину, пусть и очень сложную.