Рассуждения о наказаниях

6 ноября 2017 г.

Автор - Эндрю Маклин

Рассуждения о наказаниях

Последователи индуистской религии верят в то, что бог Ганеша дал на службу людям слонов, и, чтобы слоны делали все, что требуется, сделал их покорными. Слоны гораздо опаснее лошадей, а смертность среди управляющих ими махаутов намного выше, чем среди людей, связанных с лошадьми. Поэтому, "обучая" молодых слонов, люди привязывают их и мучают палками и копьями, пока он не перестанет сопротивляться. Чтобы животное ослабло, ему не дают пищу, а иногда и воду. Через несколько дней молодого слона выводят и закрепляют между двумя взрослыми слонами, на которых сидят наездники (на молодом слоне также сидит наездник). Все наездники одновременно подают четкие сигналы своим слонам, в том числе и молодому. Это те сигналы, на которые слон должен реагировать. В течение нескольких недель молодой слон начинает понимать, что обозначают сигналы. Когда, к примеру, наездники дают сигнал остановки, большие слоны останавливаются и останавливают молодого слона - так он начинает соотносить сигнал и то действие, которое он "выполняет". Слон сразу учится правильным ответам на четкие сигналы, но каким жестоким способом...

Мой рассказ звучит дико, не так ли? Но иногда, когда мы смотрим на работу утонченных, цивилизованных всадников и тренеров и на их взаимодействие со своими лошадьми, то видим, что они не далеко ушли от индийских махаутов...

Я часто думаю, что самая большая проблема многих владельцев лошадей заключается в том, что они верят, что лошадь знает, что она должна делать, убеждены, что она понимает, что делает, осознает свое поведение, отличает правильное от неправильного. И здесь следовало бы ввести своеобразную презумпцию невиновности: если лошадь чего-то не делает, очевидно, она не знает или не понимает, чего вы от нее хотите. Будьте последовательны и настойчивы как тренер, и лошадь всему научится.

Что бы лошадь ни делала, это либо "выгодно" ей, либо нет. Если донести до лошади, что требуемое от нее поведение будет для нее "выгодным", то она будет с желанием демонстрировать его, а со временем такое поведение превратится в привычку.

Лошади не одинаковы - одни из них сложнее, чем другие, и я думаю, именно поэтому, на ранних этапах обучения мы должны аккуратно, но настойчиво использовать давление и смягчение со всеми лошадьми. Я убежден, что основное различие между так называемыми "хорошими" и "сложными" лошадьми является результатом того, что именно мы вознаграждаем на ранней стадии обучения. «Хорошая» лошадь дает правильный ответ и вознаграждается за него, "сложная" же вознаграждается за неправильный ответ - так тренер сам усугубляет проблему. Я поясню. Если лошадь делает что-то, чего мы не хотим, скажем, свечит, и мы смягчаем давление, тогда мы вознаграждаем свечку. Или, если она пятится назад, мы смягчаем давление и снова учим ее делать то, чего нам бы не хотелось. Мы должны быть уверены, что вознаграждаем только то поведение, которое хотим получить.

Посмотрите, как "зарождается" так называемая "сложная" лошадь: кто-то касается крупа жеребенка, жеребенок отбивает и убегает. При этом он извлекает важный урок: когда люди прикасаются к тебе, ты убегаешь, и это работает, - человек больше не досаждает тебе. Затем ту же лошадь учат ходить в поводу или возить всадника: лошадь реагирует неправильно на что-то (отбивает или пятится), а всадник отпускает давление - и вот он снова непреднамеренно учит лошадь неправильной реакции. С точки зрения лошади, она все делает правильно - она учится точно так же, как «хорошая» лошадь, которая, как оказалось, пошла вперед когда всадник впервые выдвинул ее шенкелем. Лошадь, которая находится на «хорошем» пути, все будут любить, в то время как "сложную" лошадь начнут "воспитывать". Но на самом-то деле обе они реагируют одинаково, просто одну награждали за "хорошее", а вторую - за "плохое".

Самая распространенная реакция - наказать лошадь за то, что она сделала. В ее основе - наша уверенность в том, что лошадь знала, что делает, оценивала свое поведение как неправильное, но все равно демонстрировала его.

Хороший же тренер задумался бы: «Какова цель обучения и как я могу ее наилучшим образом достичь? Как мне использовать свои инструменты оперантного обусловливания - отрицательное подкрепление, положительное подкрепление или наказание?»

Даже если вы используете отрицательное подкрепление, оно все равно сводится к давлению и освобождению от него. В какой момент и в ответ на какое поведение вы смягчите давление? Как вы сформируете давление, обучая лошадь одной "переменной" за раз? Такой подход должен стать самой важной составляющей ранней подготовки лошади.

Мы должны убедиться, что все наши действия понятны. Как формируется первое сопротивление?

В большинстве книг о лошадях и верховой езде, начиная с античности, редко упоминается о том, как тренировать правильные ответы лошади. Внимание в большей степени уделяется вопросам посадки всадника, а не реальным инструментам обучения. Посадка, конечно же, важна для того, чтобы передать лошади четкий и ясный сигнал, но она не тренирует. Возьмем для примера немецкую шкалу обучения. Ее первая "ступень" - ритм/расслабление. Но ведь даже к этой ступени лошадь подходит уже обученной ответу. Ритм просто совершенствует его, а релаксация является его существенной характеристикой. Представим пиаффе. Вам нужно знать, как подготовиться к нему, как получить базовый ответ, как сделать шаг от него, как затем получить плавное продвижение и т.д.

Мы должны признать, что лошадь не отличается выдающимися интеллектуальными способностями. Они умны, как лошади, но им никогда не нужно было стараться перехитрить свой обед или столкнуться с трудностями животных, которые поедают фрукты и орехи, которые должны что-то придумывать, чтобы добраться до мякоти. Да, можно сразу заговорить об умных лошадях, которые открывают ворота или даже выпускают других лошадей. Да, их действия умны, но это Оперантное обусловливание, а не рассуждение. Какие бы мы ни проводили эксперименты, лошади не дотягивают до уровня собак, или шимпанзе, или дельфинов. И они не являются животными, изначально стремящимися к сотрудничеству с нами. Во всяком случае, нам нужно ясно осознавать, что, приступая к обучению представителей другого вида, мы должны быть осторожными, не надеяться на чудо и не думать, даже подспудно, что мы должны действовать так, как будто обучаем другого человека.

Каковы принципы работы с лошадью, имеющий негативный опыт раннего обучения?

1. Лошадь необходимо обучить работе на земле так, чтобы возможные путаница и неясности, присутствующие в работе на земле, не перенеслись на работу под седом.

2. Мы должны знать те сигналы, которым хотим научить лошадь.

3. Мы должны быть уверенны, что все используемые сигналы отличаются друг от друга так, чтобы лошадь их различала.

4. Следует сделать все возможное, чтобы сигналы не накладывались друг на друга, потому что некоторые средства управления очень схожи друг с другом. Например, воздействие рукой, "округляющее" лошадь, или остановка одним поводом могут быть похожими на раннюю команду к остановке и повороту соответственно. Поэтому нужно позаботится, чтобы лошадь их отличала.

5. В ваших правилах не должно быть исключений! Мы не можем ожидать от лошадей наличия умственных способностей, достаточных для обработки исключений.

Лошади взаимодействуют друг с другом на понятном им языке. Поэтому, если человек сможет общаться с лошадью так же "понятно", подавая четкие сигналы, то и лошадь "услышит" его, как слышит своих сородичей.

Приведу пример. Я учу людей тому, чтобы они давали команду лошади о движении вперед чомбуром или поводом до того, как сделать шаг вперед своей ногой. Затем, если им хочется, они могут добавить еще одну команду, например, звуковую ("вперед") или, как делает Джорджия Брюс, поднять руку. Любая из этих команд будет полезна. Но мы должны убедиться, что не делаем первый шаг или не останавливаемся первыми, иначе мы закладываем небольшой, но увесистый кирпич в стену путаницы (лошадь может расценить как команду к движению движение наших ног).

Когда лошадь получает четкие сигналы, которые никогда не обманывают, в том числе, обучающие ее стоять на месте, она становится намного спокойнее. Она не беспокоится о том, что делают ваши ноги. Я исправил множество нервных лошадей, просто становясь для них понятным.

Я использовал эту технику и в своей работе со слонами. Она действительно помогает сделать запутавшееся животное вновь разумным. Эти принципы важны для старта в рамках любой системы обучения, которой вы следуете. Убедитесь, что вы ясны и последовательны, а ваши сигналы не накладываются друг на друга. Они должны быть разными для разных команд, из этого правила нет исключений.

И еще одно правило, в котором никогда не будет исключений, - это недопустимость наказания лошади в гневе.

Мы знаем, что насилие делает людей "сильнее", увереннее. Оно заставляет нас чувствовать, что именно так можно решить проблему. Когда у вас в руке молоток, все проблемы начинают выглядеть, как гвозди. Есть еще одна вещь, которую мы знаем о наказании, - то, что наказание может создавать довольно небезопасные отношения между карающим и наказанными. У лошадей просто фантастическая память, особенно на то, что их когда-то напугало. Поэтому раз возникшая проблема может еще долго преследовать вас в будущем.

Вам действительно следует избегать наказания и ни в коем случае не допускать того, чтобы лошадь вас боялась. Наказание снижает способность животного к генерации новых ответов, поэтому в сложных ситуациях (когда вы просите от лошади сложные ответы), лошадь с меньшей вероятностью будет пытаться вникнуть в суть задания и с большей вероятностью начнет нервничать, как ребенок, которого наказали или унизили в школе учителя, будет бояться поднять руку даже тогда, когда уверен в правильности своего ответа.

Разница между Наказанием и Отрицательным Подкреплением, на первый взгляд, может показаться размытой. А заключается она в том, что отрицательное подкрепление способствует закреплению нужного поведения - вы смягчаете давление, когда лошадь отвечает правильно, вы пытаетесь спроектировать правильный ответ. Наказание же предназначено для удаления (!) поведения: если лошадь ударит вас, вы ударите ее.... но как же легко переусердствовать. Я бы предпочел выяснить, почему лошадь бьет или кусает.

Я хочу предложить вашему вниманию схему, описывающую оперантное обусловливание:

Andrew conditioning 2

Оперантное обусловливание: Способствование ответу <--> Удаление ответа; Отрицательное подкрепление <--> Негативное наказание; Что-то, что животное не любит <--> Что-то, что животное любит; Положительное подкрепление <--> Позитивное наказание.

Эта схема показывает нам четыре формы оперантного обусловливания - отрицательное подкрепление, положительное подкрепление, положительное наказание и отрицательное наказание. Если вы посмотрите на горизонтальную ось, то увидите два блока - то, что что лошади нравится, и то, что ей не нравится - привлекательные и непривлекательные стимулы. Непривлекательными стимулами могут быть повод и шенкель , а привлекательными - лакомство и ласка.

На вертикальной оси мы видим два блока с ответами, которые мы хотим увидеть с большей (сверху) или меньшей (снизу) вероятностью.

Положительное означает добавление, отрицательное - вычитание. Итак, теперь у нас есть четыре блока. Положительное подкрепление использует привлекательные стимулы, чтобы сделать ответ более вероятным (например, при работе над пиаффе используется метод кликера). Отрицательное подкрепление использует непривлекательные стимулы, чтобы также сделать ответ более вероятным (например, смягчение шенкеля, когда лошадь двинулась вперед). Позитивное наказание работает на удаление поведения (например, лошадь получает удар хлыстом, когда отбивает), а негативное наказание удаляет что-то привлекательное (чтобы удалить ответ - мы уходим от лошади, когда она начинает копать).

Мы использовали эту схему в наших последних исследованиях. В Сиднейском университете Мелисса Старлинг, PhD, студентка профессора Пола МакГриви, изучает, как возбуждение (бдительность) и эмоциональное состояние мешают обучению. Так, было бы бесполезно пытаться обучать лошадь, если она всю ночь была заперта в конюшне, а потому оказалась слишком возбужденной. Точно так же может оказаться очень сложно проехать езду из-за высокого уровня возбуждения и отрицательного эмоционального состояния лошади, если она имела негативный, напугавший ее, опыт в определенном месте.

Конечно, тренеры всегда знали, что уровни возбуждения и эмоциональный эффект влияют на обучение. Самое интересное в этом исследовании - это то, что мы делаем точные прогнозы относительно полезности или недостаточности конкретного типа обучения (отрицательное или позитивное подкрепление или наказание) при определенных условиях (возбуждение, излишняя эмоциональность).

Эндрю Маклин, доктор философии, руководитель Австралийского центра исследований поведения лошадей (источник); перевод Валерии Смирновой.

Комментарии

Пожалуйста, авторизуйтесь или зарегистрируйтесь для комментирования