Обстановочная афферентация

Конкретное поведение определяется не только наличием соответствующей потребности. Возможность осуществления поведенческого акта зависит также от обстановки, т. е. условий, в которых приходится действовать животному. Факторы внешней среды (обстановочная афферентация) влияют на появление и характер поведенческого акта, а иногда и сами могут вызывать привычное для данной ситуации поведение.

Значение обстановочной афферентации заключается в том, что, создавая скрытое возбуждение, она приурочивает поведение к определенному месту, наиболее целесообразному для удовлетворения соответствующей потребности. Как правило, поведение животного в несвойственной для него обстановке, не связанной с удовлетворением данной потребности, выражено неполно. Собаки в непривычной для них обстановке подчиняются командам неохотно, выполняют знакомые им навыки с трудом и часто неправильно.

Память

Память хранит множество сценариев о том, что можно и нужно делать, если чего-нибудь очень хочется, с учетом конкретной обстановки. Многие из них закодированы генами (в этом случае говорят о врожденном или инстинктивном поведении), но и не меньшее количество осваивается и запоминается (записывается в памяти) собакой в процессе жизни. Прежде чем начать что-нибудь делать, она обязательно просмотрит свою «библиотеку сценариев возможного поведения» и выберет наиболее подходящий, с ее точки зрения.

В результате взаимодействия информации о потребности, обстановки и данных памяти формируется готовность организма к определенному действию, которое запускается соответствующими сигналами, стимулами или командами. Пусковая афферентация (иногда ее называют санкционирующим стимулом) привязывает поведение к конкретному времени, определенной обстановке или ситуации.

Стадия афферентного синтеза завершается переходом в стадию принятия решения, которая определяет тип и направление поведения. При этом формируются так называемый акцептор результата действия, т. е. образ будущих событий и программы действий, а также представление о средствах достижения необходимого результата.

На стадии эфферентного синтеза у собаки формируется конкретная программа поведенческого акта, т. е. она уже знает, с какой стороны забежать, какой лапой толкнуться и с какой силой. Полученный результат действия сравнивается по своим параметрам с акцептором результата действия. Если происходит их совпадение, удовлетворяющее животное, его действия в данном направлении заканчиваются, а если нет – животное возобновляет действия, но уже с изменениями, необходимыми для достижения цели.

Большую роль в целенаправленном поведении играют эмоции, как связанные с появлением и усилением потребностей, так и возникающие в процессе деятельности (отражающие вероятность достижения цели или результаты сравнения реальных результатов с ожидаемыми).

Таким образом, наиболее важным компонентом, определяющим поведение, следует считать достижение биологически полезного результата, т. е. удовлетворение насущных потребностей – голода, жажды, страха и т. п. Только при наличии биологически важной цели поведение становится целесообразным для животного. Поэтому и успех дрессировки определяется тем, насколько целесообразны для животного навыки, предлагаемые ему человеком.

Поведение животных строится по рефлекторному принципу, но, согласно теории функциональных систем, его нельзя определить как цепь условных рефлексов. Поведение определяется не только внешними раздражителями, но и внутренними потребностями и создается на основе опережающего отражения действительности – программирования, а ведущий фактор его организации (его цель) – получение биологически полезного результата.

На основе многолетнего изучения отдельного рефлекса и поведенческого акта П. К. Анохиным была предложена теория функциональных систем, которая в настоящее время плодотворно разрабатывается школой К. В. Судакова.

Теория функциональных систем предусматривает следующие основные положения:

1. Определяющий момент деятельности функциональных систем, обеспечивающих поведение, – не само действие, а полезный для организма результат.

2. Инициативная роль в формировании целенаправленного поведения принадлежит потребностям, организующим мотивации, врожденные и приобретенные программы действия.

3. Каждая функциональная система строится по принципу саморегуляции.

4. Функциональная система избирательно объединяет различные органы, ткани и структуры мозга для обеспечения результативной поведенческой деятельности.

5. В функциональных системах осуществляется постоянная оценка результата поведенческой деятельности с помощью обратной афферентации (связи).

6. Поведенческий акт, обеспеченный функциональной системой, имеет несколько стадий; рефлекс – это только составная часть функциональной системы.

7. В системную организацию целенаправленного поведенческого акта включаются мотивации, память и эмоции.

8. При образовании функциональной системы складываются сложные структуры программирования и предвидения.

Данная теория, в отличие от рефлекторной, выдвигает следующие принципы:

1. Поведение живых существ детерминировано не только внешними стимулами, но и внутренними потребностями, генетическим, индивидуальным опытом и действием обстановочных раздражителей, которые создают так называемую предпусковую интеграцию возбуждений, вскрываемую пусковыми стимулами.

2. Поведенческий акт разворачивается с опережением реальных результатов поведения, что позволяет сравнивать достигнутое с запланированным на основе прошлого опыта и корректировать свое поведение.

3. Целенаправленный поведенческий акт заканчивается не действием, а полезным приспособительным результатом, удовлетворяющим доминирующую потребность.

Навык

Навыком может быть любое действие, в том числе и невидимое (недоступное для непосредственного наблюдения), сформированное путем повторения, характеризующееся высокой степенью освоения и отсутствием поэтапной сознательной регуляции и контроля. Иначе говоря, навык – это такое действие, которое воспроизводится безотказно, быстро и однообразно, независимо от внешнего влияния.

Принято различать навыки перцептивные, обеспечивающие узнавание объекта, интеллектуальные, автоматизирующие применение способа или приема решения задач, и двигательные. В процессе дрессировки формируются практически все эти виды, причем даже тогда, когда вы отрабатываете у собаки, казалось бы, только двигательный навык. Перцептивные навыки осваиваются как бы сами собой, а необходимы они, например, для узнавания и различения команд.

Навык нельзя свести к условному рефлексу или сравнить с совокупностью условных рефлексов. Любое завершенное поведение животного (поведенческий акт) гораздо сложнее. Оно представляет собой совокупность наследуемых и приобретенных элементов поведения, взаимодействие которых происходит под управлением и контролем интеллектуального аппарата животного.

На скорость формирования навыка влияют: мотивация или лежащая в ее основе потребность; способность к научению; особенности подкрепления; режим тренировки; методика формирования и опыт животного по освоению других реакций и навыков.

Под методикой формирования навыка понимают способ отработки его в целом или по частям, переход от одного уровня освоения к другому по показателям автоматизированности, скорости, устойчивости к различного вида торможению и т. п.

Основную роль в становлении навыка играет упражнение или тренировка, т. е. повторное выполнение действия с целью его усвоения (овладения). При этом лучше уясняются задачи, закрепляются и автоматизируются действия.

Важное условие успешности упражнений – медленный темп действий на начальном этапе. Преждевременное ускорение уменьшает возможность освоения и правильность выполнения действия. Однако длительные паузы при медленном темпе задерживают объединение отдельных действий в системы.

Столь же важное значение имеет правильное распределение упражнений во времени. Если одни и те же упражнения выполнять непрерывно и долго, результаты не улучшаются, а ухудшаются вследствие утомления. Отдельные упражнения и вовсе не должны быть слишком длительными, а кроме того, виды упражнений должны чередоваться.

Эффективность упражнений зависит от длительности перерывов между ними. При одном и том же количестве времени, затраченном на то или иное упражнение, слишком длительные промежутки между ними дают худшие результаты. Наиболее эффективно такое распределение упражнений: более частое повторение их в начале обучения и постепенное удлинение промежутков между ними по мере овладения навыком.

В общем виде формирование навыка проходит в несколько этапов:

– конструирование навыка;

– первичная автоматизация, когда действие выполняется с ошибками, медленно и не всегда вызывается командой (умение);

– дезавтоматизация (отмечается не всегда), т. е. ухудшение выполнения действия;

– вторичная автоматизация, когда навык по своим признакам соответствует тому, что мы хотели сформировать.

Главные показатели формирования навыка – скорость и качество выполнения действия.

От навыка следует отличать умение, под которым понимают выполнение действий, не достигающих устойчивого и высокого уровня воспроизведения. Например, собака, уже знакомая с действием подхода по команде, не всегда правильно его делает или отвлекается в это время на посторонние раздражители, или вообще отказывается подчиниться, помчавшись за кошкой. Иначе говоря, умение отличается от навыка необязательностью выполнения требуемого действия, отказом от него или выполнением действия от случая к случаю. Кроме того, для умения требуется гораздо меньше повторений (количества упражнений).

Освоение любого действия начинается с усвоения знаний и формирования представления об этом действии, а знания и представления формируются с помощью форм научения. Таким образом, становление навыка можно описать так: от знания к умению, от умения к навыку.

Положительное влияние усвоенных навыков на овладение другим действием называют переносом навыков. Он имеет место, когда новые действия очень похожи на уже усвоенные. Больший опыт и большее количество усвоенных действий способствуют более быстрому овладению новыми навыками. Однако старые навыки порой отрицательно влияют на усвоение новых. Такое взаимодействие навыков называют интерференцией. Это случается, например, когда при выполнении какого-либо действия требуется заменить ранее усвоенный способ его выполнения на новый. Такую интерференцию называют ассоциативным торможением.

Старый навык может оказывать отрицательное влияние и после овладения новым навыком. В этих случаях уже после усвоения нового способа возникают или задержки в применении нового способа действия, или повторение старых приемов. Такое бывает, когда собаку, подготовленную по общему курсу дрессировки (ОКД), пытаются переучить по курсу послушания IPO-1.

Важнейшее средство устранения и предупреждения интерференции навыков – четкое противопоставление старого и нового способов действий (перемежающееся противопоставление).

Навык, не обеспечивающий получения подкрепления, затормаживается или может забываться (дезавтоматизироваться) в результате длительного невостребования. Если животное в течение продолжительного времени при воспроизведении навыка не получает того, ради чего оно его освоило, навык затухает, это же происходит, если он долгое время не воспроизводится животным по нашей команде (не тренируется).

Способы дрессировки

Теория дрессировки реализуется через свои методы. Метод дрессировки можно определить как совокупность специфических теоретических и практических положений, определяющих действия дрессировщика в процессе формирования поведения животного. В отличие от методики, способа и приема дрессировки метод определяет общий подход к процессу модификации поведения и имеет в своей основе закономерности соответствующей формы научения. Например, оперантный метод основывается на оперантном научении и образовании инструментальных условных рефлексов, условно-рефлекторный имеет в основе классическую условно-рефлекторную форму научения. Кроме описанных, в формировании поведения животных могут быть использованы и другие методы – импринтинга, привыкания, доминанты, подражания, а также когнитивного научения. Конкретный метод предполагает воспроизведение закономерностей и условий соответствующей формы научения.

Под способом понимают такое воздействие на животное, которое приводит к воспроизведению им нужных дрессировщику действий или сохранению необходимых поз. Ниже описаны наиболее употребимые способы дрессировки.

Способ наведения. Заключается в том, что дрессировщик вызывает нужное ему движение, предлагая животному следовать за кусочком пищи или рукой. В. Л. Дуров называл этот способ жестикуляцией и понимал под этим «комплекс движений, которые наводят животное на нужное движение». К этому способу относится и способ мишени, описанный К. Прайор, – инициирование двигательной реакции животного с помощью движения рукой или каким-либо предметом (мишенью). Мы часто инстинктивно используем этот способ – похлопываем собаку рукой, приглашая ее подойти, или по дивану, когда хотим, чтобы она вспрыгнула на него, берем в руку кусочек лакомства и предлагаем собаке следовать за ним.

Способ наталкивания. Дрессировщик с помощью направляющих (подталкивающих) воздействий рук и поводка, не приводящих к неприятным ощущениям для животного, добивается воспроизведения нужного действия. Таким образом он дает понять собаке, что от нее требуется. Здесь главное – вовремя прекратить вспомогательные действия, иначе собака включит их в состав вашей команды.

Способ пассивной флексии. Суть его в том, чтобы придать животному необходимую позу или помочь сделать нужное движение. Такое возможно при условии, если животное не сопротивляется воздействиям дрессировщика, например при научении собаки подавать лапу. В оперантной дрессировке этот способ получил название «лепка», так как дрессировщик как был лепит ту или иную позу. Именно таким способом иногда обучают детей писать буквы: взрослый человек берет руку ребенка в свою и помогает ему совершить правильные движения.

Способ отбора поведения. В этом случае при естественном поведении животного положительно подкрепляются нужные и отрицательно – ненужные действия. А. В. Дурова-Садовская назвала этот способ «подлавливание». По Скиннеру, при этом способе весь путь от исходного поведения (еще до начала обучения) до конечной реакции, которую исследователь стремится выработать у животного, должен быть разбит на несколько этапов. Допустим, что нам нужно обучить голубя ударять клювом по маленькому светящемуся кружку, используя пищевое подкрепление в виде зернышка. Вначале мы будем давать ему зернышко каждый раз, когда он зайдет в ту половину клетки, где находится кружок. Далее мы будем подкреплять лишь те его действия, если он, зайдя в клетку, повернулся головой к стенке, на которой находится кружок, а на третьем этапе – если еще и клюв направил в сторону кружка. Постепенно можно заставить голубя касаться клювом кружка и, наконец, ударять по нему с целью получить подкрепление. Как мы видим, при таком методе обучения к очередному этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на предыдущем этапе.

Способ отбора поведения служит базой для других способов дрессировки, позволяющих не только отрабатывать свойственные (видоспецифические) реакции животных, но и осваивать навыки, необычные для их нормального поведения.

Способ усиления поведенческого признака. Заключается в том, что подкрепляется все более выраженный вариант поведенческого акта. К. Прайор называет такой способ способом последовательного приближения, именно его она использовала как основной для дрессировки дельфинов с целью увеличения высоты их прыжков.

Способ сокращения (редукции) поведенческого акта до его отдельного элемента. В этом случае положительно подкрепляют только один элемент. Редуцируя поведенческий акт, В. Л. Дуров отработал у собаки навыки дутья в музыкальную трубу и произнесение слова «мама».

Способ альтернативы (альтернативного поведения).Дрессировщик создает такие условия (иногда даже с помощью реквизита), которые допускают совершение лишь единственно возможного движения. Именно так называется один из старинных способов обучения собаки двигаться рядом с дрессировщиком, но ближе к забору.

Способ игрового поведения. Он особенно эффективен для молодых или любящих играть животных. При этом используется потребность в игре, а сама возможность поиграть и служит подкреплением. Для применения такого способа создается игровая ситуация и собаке предлагается форма игры, которая должна представлять нужное дрессировщику действие.

Имитационный способ (способ подражания).Особенность его в том, что он одновременно выступает и как метод (имитационный метод научения).

Способ оборонительного поведения или избегания. Добиваются нужного поведения с помощью болевых или неприятных воздействий, избегая которые, животные и совершают желаемое действие. Например, неприятные или болевые рывки, удары, болезненные надавливания, ожидание боли (страх), способные вызвать изменение поведения животного, нужные дрессировщику, – оборонительное поведение. Как правило, с помощью этого способа отрабатывается движение собаки рядом с дрессировщиком, посадки и укладки.

Способ агрессивно-оборонительного поведения. На животное оказывают такое воздействие, избавиться от которого оно может только посредством агрессивно-оборонительного поведения. От опасного раздражителя можно избавиться двояко – уйти (убежать) от него или уничтожить, атакуя. Задача дрессировщика – вызвать у собаки желание следовать по второму пути. Со временем команда, предшествующая агрессивному состоянию и соответствующему инструментальному действию, или ситуация, связанная с этим, становятся сигнальными, т. е. образуются не только инструментальные рефлексы, но и условные рефлексы на состояние.

Указанные способы можно использовать при любой форме научения (методе дрессировке), но эффективность их при этом будет различной. Очень часто при отработке конкретного навыка последовательно или параллельно используют несколько способов. Выбор того или иного определяется возрастом и породой собаки, стоящей перед дрессировщиком задачей, его опытом, интуицией, а порой и вкусом. Очень часто «быстрые» способы оказываются не самыми лучшими.

Подкрепление

В школе классических условных рефлексов подкреплением считается безусловное воздействие на животное, связанное во времени с условным сигналом. Причем подкреплением может быть любая вызванная деятельность организма.

В случае наличия подкрепления условный рефлекс называют положительным (подкрепляемым), а в случае отсутствия безусловного воздействия – отрицательным или тормозным (неподкрепляемым). При таком подходе болевое воздействие служит положительным подкреплением оборонительному поведению.

Любое поведение определяется своими последствиями. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, животное проявит себя по-разному: повторит данный поведенческий акт, не придаст ему никакого значения, постарается избегать его повторения в дальнейшем. В любом случае животное стремится к получению положительного подкрепления, поскольку момент его получения всегда положительно эмоционален. Отрицательного подкрепления животное старается избежать, поскольку оно вызывает негативные эмоции. Как уже упоминалось, само эмоциональное состояние может иметь выраженный подкрепляющий характер.

В настоящее время считается, что термин «отрицательное подкрепление» несколько некорректен, так как всякое подкрепление, по определению, оказывает положительное действие. Видимо, правильнее было бы в обоих случаях говорить не об отрицательном, а об аверсивном (болевом) подкреплении.

С точки зрения мотивированного поведения подкреплением считается любое событие, увеличивающее, уменьшающее или исключающее вероятность удовлетворения имеющейся на данный момент потребности. Событие, связанное с ее удовлетворением, и сам факт удовлетворения – это положительное подкрепление, факт неудовлетворения – отрицательное. Такой подход объясняет существование форм научения без выраженного подкрепления, например импринтинга или латентного научения.

Событие, регулярно предшествующее факту подкрепления, несет информацию о его наступлении и, по законам развития условных рефлексов, само становится подкреплением. Его называют условным. Различают положительное и отрицательное условное подкрепление (известные всем «Хорошо!» и «Фу!»).

По мере тренированности свойства условного подкрепления может приобретать команда, а при инструментальных рефлексах – действия животного или даже данные обстановочной афферентации, потому что, чаще или реже, их результатом бывает подкрепление. Чтобы условное подкрепление не потеряло своего сигнального значения, время от времени необходимо его подтверждать непосредственным воздействием на животное – так называемым натуральным подкреплением.

Особое значение имеет время подкрепления: закрепляется только поведение, непосредственно предшествующее подкреплению. В оперантном научении считается, что разрыв между нужной формой поведения и фактом подкрепления не должен составлять более 10 с. Если этот разрыв больше, научение может не состояться.

Школой И. П. Павлова были описаны так называемые отставленные рефлексы, когда разрыв между действием условного раздражителя и подкрепления составлял минуты и десятки минут. Выработка этих рефлексов была возможна только в специфических условиях павловской «башни молчания», но и при этом была отмечена закономерность: чем дольше действия животного не подкрепляются, тем медленнее вырабатывается условно-рефлекторная реакция. В реальных условиях избежать этого помогает использование условного подкрепления.

Частичное подкрепление условных сигналов (до 50%, а по некоторым данным – до 33—25% случаев), не затрудняет выработку условного рефлекса, но значительно замедляет его угашение при последующей отмене подкрепления. Но при свободном выборе режима положительного подкрепления животные выбирают ускоренный. Возможно, общее число случаев подкрепления важно только для упрочения реакции до навыка, однако вариационный (вариабельный) режим подкрепления значительно закрепляет отработанный навык.

Значимость подкрепления, т. е. его влияние на модификацию поведения, определяется его величиной, и при условии свободы выбора животные выбирают большую. Однако величина подкрепления не всегда окупает энергетические затраты, связанные с его получением. В любом случае она должна быть такой, чтобы вызвать безусловную реакцию животного.

Следует всегда помнить об относительности биологической значимости подкрепления. Для сытого животного вряд ли значимым будет пищевое подкрепление. Некоторые собаки безразличны к ласковым словам или поглаживаниям, следовательно, такие действия хозяина не воспринимаются ими как подкрепление. Для одних животных сильный подкрепляющий фактор – игра, а для других – возможность свободы и физической активности. Одни собаки воспринимают рывок поводком средней силы как значимое отрицательное подкрепление, а другие не обращают на это внимание и продолжают тянуть.

Относительность подкрепления связана и с потребностью, испытываемой организмом. Если ваша собака очень хочет погнаться за кошкой, то ваш кусочек сыра вряд ли будет подкреплением команде подхода.

Значимость подкрепления определяется и значимостью связанной с ним потребности. Например, витальные потребности более значимы, чем потребности саморазвития. А в опытах по изучению влияния различных видов подкрепления на реакции экстраполяции оказалось, что при подкреплении самостимуляцией положительных зон мозга крысы оказались способны не только многократно решить простую задачу, но и успешно справиться с усложненным ее вариантом, тогда как при пищевом подкреплении они этого сделать не могли.

Говоря о значимости подкрепления, следует еще иметь в виду индивидуальные особенности животного и его ранний опыт. Как уже упоминалось, для животных, пребывавших в условиях ранней сенсорной депривации, отрицательное подкрепление более значимо, чем для животных, выращенных в нормальной или обогащенной среде. Кроме того, значимость подкрепления определяется величиной базовой для него потребности. Кстати, при отработке какого-либо действия использование подкреплений, ориентированных к различным потребностям, способствует более быстрому научению.

Как при реактивном (классическом), так и при оперантном научении приобретенная реакция сохраняется лишь до тех пор, пока ее поддерживают безусловным раздражителем (в первом случае) или специальным подкреплением (во втором случае). Если же эти подкрепляющие факторы перестают действовать, то выработанное на их основе поведение быстро угасает и после нескольких попыток прекращается вовсе. Важно отметить, что речь здесь идет именно об угасании, а не об исчезновении или «стирании следов». Дело в том, что если снова начать использовать безусловный раздражитель или подкрепляющий фактор, то прежнее поведение почти сразу же восстанавливается.

Наказание

Наказание – чисто человеческое понятие, и оно пригодно для человечества, но привнесение этого понятия в дрессировку вызывает ряд отрицательных последствий.

1. Наказание неизбежно (в отличие от отрицательного подкрепления), поэтому оно не влияет на модификацию поведения. Наказание учит только как не попадаться или как принимать такую позу подчинения, которая снижает его интенсивность или исключает его.

Цель дрессировки – не в применении наказания, как, впрочем, и отрицательного подкрепления, а в создании таких возможностей для животного, в которых оно могло бы избежать их, изменив поведение.

2. Как правило, наказание используется после того, как поведенческий акт уже завершен. По физиологическому действию его можно отнести к отсроченному отрицательному (аверсивному) подкреплению, а, как известно, чем больше отсрочено подкрепление, тем с большим трудом модифицируется поведение.

3. «По мне, если наказание помогло прекратить нежелательное поведение, то такое воздействие служит мощным подкреплением для наказывающего, и в дальнейшем наказывающий будет стремиться к наказанию» – это мнение К. Прайор.

4. Наказывающий может быть бессознательно заинтересован не в исправлении поведения, а в получении доказательств своего лидерства, так как наказание способствует сохранению и упрочнению доминирующего положения наказывающего.

Можно сформировать поведение, используя только отрицательное подкрепление, как это характерно для классической дрессировки, при этом образуются типичные оборонительные рефлексы. В такой ситуации животные будут стремиться избегать тех мест, где они получили отрицательное подкрепление, а команды исполнять с неохотой, так как они с большой долей вероятности могут стать предвестниками болевых или неприятных ощущений.

Избыток отрицательного подкрепления снижает скорость научения, у животных со слабой нервной системой может вызвать невроз, а у щенков – робость, трусость и неуверенность в себе.

Формы научения