Previous Entry Share Next Entry
Революция кликера (10) Karen Pryor «Don't shoot the dog!»
1
metatheo wrote in metapractice
http://community.livejournal.com/metapractice/276069.html

Цитируем, анализируем, обсуждаем книгу Карен Прайор, вышедшую на русском языке в 1995 году под названием «Не рычите на собаку!». Используемый мной текст можно взят из библиотеки Мошкова. Оригинал, с которого делался перевод — найти мне не удалось. На Амазоне, например, только переиздание 1999 года и 3-ие издание от 2006 года.


  • 1
Электронный вариант книги на английском: http://rapidshare.com/files/184588209/karen_pryor_-_don_t_shoot_the_dog.pdf

Простите, вы хотели обсудить в данной теме некие цитаты из книга/автора. А свелось все к указанию на некие "свободные источники", которым мы как первоочередным делом в метапрактике не занимаемся. Т.е. на фоне интенсивного рабочего обсуждения это еще как-то допустимо. Типа в пылу полемики.

Да-да, понимаю. Простите. Я скоро начну выписывать. Могу удалить все ссылки, привел их только для точности. Мол все же только перевод используется и в нем могут быть искажения смысла, внесенные переводчиком.

Предисловие автора

Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других - и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить память? Все это можно достичь, используя принципы обучения с подкреплением.
...
Законы подкрепления просты: их можно за десять минут записать на школьной доске и за час выучить. Применение их в основном зависит от ситуации, обучение с подкреплением подобно игре, в которой надо быстро соображать. Каждый может быть тренером, но некоторые от природы способны к этому больше, чем другие. Вам вовсе не обязательно отличаться каким-то особым терпением, быть сильной личностью, не требуется и особого подхода к детям и животным, можно не обладать и тем, что цирковой дрессировщик Франк Бук называет силой человеческого взгляда.

Хорошие пресуппозиции и Франк Бук

Хочется отметить, что Прайор с первых слов задает такие вот ~хорошие пресуппозиции.

Фраза про «человеческий взгляд» Франка Бука заинтересовала мое внимание. И я заглянул в оригинал:
«You do not need special qualities of patience, or a forceful personality, or a way with animals or children, or what circus trainer Frank Buck used to call the power of the human eye. »

Может быть Бук говорил что-то более конкретное, что может оказаться подходящим материалом для моделирования.
А Франк Бук, видимо, это вот это человек: http://en.wikipedia.org/wiki/Frank_Buck_(animal_collector)




Основа этой теории по разным источникам известна как модификация поведения, теория подкрепления, оперантное обусловливание, бихевиоризм, психология поведения и т.д.; это тот раздел психологии, который принес мировую известность Б.Ф.Скиннеру, профессору Гарвардского университета.


Re: Основа ОФ

А какое там современное введение в бихевиоризм почитать можно?

ОФ и мотивация

Существуют два вида подкрепления: положительное и отрицательное.
Положительное подкрепление - это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление - это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, - это отрицательное подкрепление).


Тут очевидно можно провести параллель между ОФ и мотивацией. Отрицательное ОФ — отрицательная мотивая; положительное ОФ - положительная мотивация. И еще одним моментом, который похожи — это подкрепление при осуществление какой-то длительной программы поведения. В «Используй свой мозг» Бэндлер выявляется стратегию мотивации одной женщины, и она говорит, что испытываю небольшую часть приятного переживания, которое ожидает ее в конце, при завершении каждого небольшого шага.
Отсюда вопрос — не является ли предпочитаемая стратегия мотивации в какой-то степени отражение того, как именно происходило воспитание/выработка поведения.
Например, кого-то в школу заставляют идти, заставляют учится, грозясь наказанием. А кому-то больше везет, их хвалят, ими гордятся. И эти уроки для кого-то становятся решающими в их дальнейшей жизни.

Re: ОФ и мотивация

т.е стиль мотивации определяется стилем стилей стратегий покрепления к тем или иным действиям в детстве. но вопрос: что же приводит к использованию взрослым того или иного стиля подкрепления из детства для реализации мотивации взрослой жизни?

это
1. незнание другого паттерна?
2. организация некоторых факторов (теже транзактные игры) так чтобы поддерживать предпочтительный для дества паттерн?
3. или иное?

Время подкрепления и длительность программы

Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление - это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию.


Я вот думаю, а человека ведь можно дать подкреплении в большинстве случае и чуть позже. Конечно, когда речь идет как в примерах о танце или спорте, то, вероятно, единственный момент поощрить какое-либо отработаваемое действие — это в тот же после его совершения. Но если речь идет о том, чтобы подкрепить не какое-то конкретное действие, а более сложную программу поведения, например, возьмем тот же спорт, тренировку, то подкрепление можно дать, похвалив не тут сразу прямо после окончания тренировки, а позже. Конечно, и тут, наверное, ценность подкрепления может угаснуть если пройдет достаточное количество времени. Но я думаю, что закономерность такая — чем сложнее и длиннее программа поведения, тем на более поздний срок можно отложить подкрепление. Ну, например, человек готовился-готовился к экзамену и сдал его. Необязательно же сразу ему сообщаться какой он молодец. Это можно сделать и через неделю. И более того потом еще несколько раз похвалить его. Не уверен еще в качестве своего примера, ведь, конечно, тут сам сдача экзамена может быть и чаще всего будет подкреплением.

Мы всегда слишком запаздываем, подкрепляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", - звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вредное воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления.

И тут как раз я думаю, что если быть достаточно искуссным коммуникатором, то можно поведение, указанное в данном примере, подкрепить и на следующий день. Только не в лоб так говорить, а грубо говоря, сначала получить доступ к тому вчерашнему переживанию и затем уже похвалить.
Так что может Прайор и права в общем, что сила слов не может исправить ошибки во времени подкрепления, но в данном примере эта сила все-таки недооценена.

Щелчок и рыбка

Я вот думаю, а человека ведь можно дать подкреплении в большинстве случае и чуть позже. Конечно, когда речь идет как в примерах о танце или спорте, то, вероятно, единственный момент поощрить какое-либо отработаваемое действие — это в тот же после его совершения. Но если речь идет о том, чтобы подкрепить не какое-то конкретное действие, а более сложную программу поведения, например, возьмем тот же спорт, тренировку, то подкрепление можно дать, похвалив не тут сразу прямо после окончания тренировки, а позже.

Так и дельфина ведь поощряют "дважды":
— прямо во время правильного действия щелчком
— потом — рыбкой, в общем количестве пропорциональном сумме щелчков

Слишкое раннее подкрепление неэффективно

Слишком раннее подкрепление тоже неэффективно.
...
Мне кажется, что иногда и детей мы подкрепляем слишком рано, находясь под ложным впечатлением, будто мы их подбадриваем ("Молодец, хорошо, ты уже почти все сделала правильно"). Возможно, при этом мы подкрепляем попытки. Но существует разница между попыткой сделать что-то и выполнением этого. Причитания типа "я не могу" иногда отражают фактическое положение вещей, но они могут являться и признаками того, что часто подкреплялись просто попытки. Вообще, подкрепление поведения, которое еще не совершилось, - подарками, обещаниями, комплиментами или чем-нибудь в этом роде - ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное время: верояшве всего - выпрашивание подкрепления.

Вот это заставило меня задуматься. Как бы провести грань между создание мотивации у человека, приободрении и слишком ранним подкреплением. Может быть мои теплые слова подкрепляют в человеке, как раз то, чего бы я не хотел, и он даже он не хотел. Меня и раньше терзали такие сомнения, но тут они облечены в форму, с которой можно поработать.

Вложенные системы подкреплений

Конечно можно искуссно владеть ОФ на одном сигнале подкрепления и тем самым решать поставленную задачу/проблему. Типа не выдавать подкрепления слишком часто. Сложность должна со временем расти. Подкреплять реальное продвижение.

Но может поставленная тобой задача уже решена типа в компьютерных играх за рамками описываемой Карен модели ОФ. Там используются вложенные циклы активности-и-подкреплений. Шаги подкрепляются одним стимулом, а завершение всего действия другим.

[(1* 2* 3*)* (4* 5* 6*)* (7* 8* 9*)*]*

Цифрами обозначены отдельные шаги, разным цветом звёздочек — разные стимулы подкрепления.

Вариабельное подкрепление

Для того чтобы поддерживать уже выученное поведение нa определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и непредсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления. Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый.

Настолько важная идея, что хочется ее просто выписать. Совершенно не понятно, почему это должно работать, но не доверять и смысла не вижу. Подумать, как это можно использовать в самоподкреплении.

Действенность вариативного подкрепления лежит в основе всех азартных игр. Если каждый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к этому интерес.

В сервисы социальных сетей тот же механизм присутствует. Народ даже сообразил: «Vkontakte, как холодильник - знаешь что ничего нового нету, но 5 раз зайдёшь и проверишь.»

Re: Вариабельное подкрепление

Совершенно не понятно, почему это должно работать, но не доверять и смысла не вижу.

см, например, первую книгу Прайон "Несущие ветер", там есть хорошая метафора.

Условное подрепления = Якорь особого типа

Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал - звук, свет, движение - который умышленно связывают с подачей подкрепления.
...
Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции - утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи - картины, посуду, трофеи - не потому, что они красивы или полезны, а потому, что они напоминают нам о временах, когда мы были счастливы, или о людях, которых мы любили. Они представляют собой условные подкрепления.

Ну из этого описания хорошо видно, что условное подкрепление — это определенного вида якорь. Как назвать переживание, которое якорится, и если в этом смысл, я сходу не соображу.

Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием или другим истинным подкреплением.


Угу. Дрессировка животного начинается с установки определенного вида якоря.

Как только вы выработали условное подкрепление, вы должны пользоваться им осторожно, не разбрасывать без толку, иначе его сила уменьшится.


Как и в случае с якорением? Или подождите, ведь якорь может быть типа самоподкрепляющимся? Хотя, кстати, вроде никаких закомерностей на этот счет нигде не указано.

Даже обычный якорь фиксирует ДЕЙСТВИЯ

Как назвать переживание, которое якорится, и если в этом смысл, я сходу не соображу.

М.б. в этом месте и нет смысла заглядывать в чёрный ящик. Даже обычный первокодовый гипноякорь должен якорить ДЕЙСТВИЯ. Для субъекта по приколу, что у него изменились внутренние ощущения/переживания приятным ему путём. Но оператор должен убедиться, что вместе с тем и изменились внешние действия, в которые субъект будет автоматически вовлечён в прежде проблемном контексте.

Вроде где-то метанимус писал близкое/подобное (сорри если переврал :) ). Там было написано что-то вроде: после стандартной интеграции якорей, когда субъект попадает в прежде проблемный контекст, происходит что-то вроде повторной реинтеграции якорей, которая сопровождает/вызывает выбор оптимального поведения.

К чему в итоге вы пришли? :)

Кажется, к тому, что даже классическое оперантное формирование по К.П. включает вложенные иерархии стимулов подкрепления.

  • 1
?

Log in

No account? Create an account