Негативне підкріплення: як замінити об’єкт?


18

Моєму вівчарку Босе зараз 9 місяців, ми провели кілька уроків з поведінки з особистим тренером, і все пройшло дуже добре. До того, як собака зробить так, як хотів, і зараз, він просто слухає справжнє добро!

На думку тренера, деякі поведінки підкріплювались позитивно, а деякі негативно. Проблема, яку ми маємо зараз, полягає у поведінці, яку ми підкріпили негативно. Ми використовуємо металевий ящик, щоб видати звук, собака ненавидить його і підкоряється. Він завжди використовується після "ні" як друга санкція. Все працює прекрасно, і тепер нам більше не потрібно використовувати коробку, оскільки він веде себе правильно.

Проблема полягає в тому, що ми думаємо, що нам потрібно буде замінити коробку чимось іншим, оскільки він тепер дізнався, що якщо у нас немає коробки, звуку не буде, і тому він бере участь у небажаній поведінці. Це починає бути проблемою, оскільки нам зараз потрібно носити коробку скрізь, тому що якщо у нас її немає, він скористається умовами.

Чи є спосіб, як ми можемо це виправити, замінивши коробку своїм тілом чи чимось?

Примітка: Він був дезаксенсований місяць тому, і він нам менше зажадає, але все одно це робить, коли нам це не зручно.

Дякую


1
Напевно, ви повинні задати своєму тренерові це запитання, але як тільки негативне підкріплення (металевий ящик) спрацювало на стримуванні його небажаної поведінки, чи не варто вам зараз починати посилювати гарну поведінку? Як приклад, якби моя собака продовжувала підніматися на дивані, я могла (1) потиснути металевий ящик, щоб відбити його, а потім, коли він дізнався, що їхати на дивані буде небажаним, я (2) похваляв би і щедро ставився, коли б він укладений на підлозі біля дивана або подібного.
Стів D

1
:) Мені подобається, як собаки можуть навчитися цим речам самостійно, після деякого спостереження ... "немає коробки, ей, я можу робити все, що хочу!" :) :) :)
woliveirajr

Відповіді:


10

Кожен раз, коли обговорюється умова роботи, це допомагає розмовляти тією ж мовою:

  • Підсилення: Дія, спрямована на збільшення частоти поведінки
  • Покарання: дія, спрямована на зменшення частоти поведінки
  • Позитивні: Наявність подразника
  • Негативний: відсутність подразника

Ці терміни можуть утворювати чотири різні комбінації ( Примітка. Приклади в дужках - це приклади, а не поради!):

  • Позитивне підкріплення: надайте стимул для збільшення частоти поведінки (наприклад, пригощайте, коли собака сидить за командою)
  • Негативне підкріплення: усуньте стимул, щоб збільшити частоту поведінки (наприклад, поштальєр йде геть після того, як собака гавкає на нього)
  • Позитивне покарання: надайте стимул зменшити частоту поведінки (наприклад, вдарити собаку, коли вона мочиться на килим)
  • Негативне покарання: видаліть стимул, щоб зменшити частоту поведінки (наприклад, залиште приміщення, коли собака стрибне на вас)

На практиці вони можуть заплутатися. Наприклад, ви робите шум разом із коробкою - це стимул, призначений для зменшення частоти поведінки, тому технічно це приклад позитивного покарання, але якщо ви припиняєте шум, коли собака виконує правильну поведінку, ви також знімаєте стимул до збільшити частоту правильної поведінки, ей престо !, негативне підкріплення.

Але це передбачає, що ваша собака має правильну поведінку. Ви не вказуєте, що таке небажана поведінка, чи є бажана альтернативна поведінка, яку ви намагаєтесь посилити. Якщо все, що ви робите зі шумом, намагаєтесь змусити його щось робити, то ви забезпечуєте покарання, а не негативне підкріплення.

У будь-якому випадку частина вашої проблеми, ймовірно, полягає в тому, що ви використовуєте лише первинних підсилювачів та карателів, тобто тих, яких собаці не потрібно навчати. Їжа, наприклад, є основним підсилювачем. Собака знає, що їжа - це гарна річ, не пізнаючи її. За розширенням шум є основним карателем, оскільки собаці це незручно чути. Вторинні підкріплювачі та карателі, навпаки, - це ті, яких собака навчила.

Класичний приклад - дзвінок Павлова, який би дзвонив щоразу, коли він забезпечував собаку їжею. Послідовно поєднуючи первинний підсилювач із подразником, стимул може почати виконувати роль вторинного підсилювача. Тобто собака дізнається, що дзвін сигналізує про прихід їжі і відповідно реагуватиме.

Ви згадуєте, що вживаєте слово "ні" (сподіваємось суворим голосом, собаки досить вміло розпізнають інтонації), коли відволікаєте собаку разом із шумом. "Ні" має діяти як вторинний каратель, так само, як похвала може працювати і як вторинний підсилювач. Але ви, мабуть, не змогли поступово припинити фактичний шум, почавши іноді лише говорити «ні», але не робити шуму.

Проблема полягає в тому, що до цього часу ваша собака підхопила до того, що "ні", не маючи поля, не означає, що первинний каратель, тобто два не пов'язані між собою, і він, таким чином, рятує, коли його немає навколо.

Я пропоную вам відкрити нове питання, що описує фактичну поведінку, яку ви хочете відбити, і ми могли б краще допомогти вам знайти спосіб, використовуючи весь спектр оперативних умов, щоб ваш собака дізнався, чого ви хочете? зробити.


5

@ThomasH - це відмінна відповідь і дуже чітко торкається питання про використання вторинних покарань.

Тут я лише додаю кілька коментарів щодо двох аспектів проблеми.

Покарайте неправильну поведінку проти посилення правильної поведінки

Навіть якщо "теорія" працює однаково як на "стороні підкріплювача", так і на "стороні карателя", і ефекти можуть бути настільки ж ефективними, ми не повинні забувати, що придушення поведінки не вчить собаку, що робити замість цього і зосереджуватись головним чином на частина "ні" навчання призводить до мікроуправління : вам постійно потрібно вчити собаку того, чого він не повинен робити. Навіть якщо собака дізнається, що він не повинен робити X в тій чи іншій ситуації, він все одно вільний виконувати Y, Z і т. Д. Якщо ви позитивно навчите його (підкріпите його) робити W натомість, це, ймовірно, зупинить якесь порочне коло і зробити всіх щасливими.

Підсилення / покарання змінної ставки

@ThomasH пояснив поняття вторинного посилення або покарання.

Один з аспектів, який слід пам’ятати, полягає в тому, що, на відміну від первинних підкріплювачів / покарань, вторинні повинні бути винагороджені (так чи інакше) за допомогою змінного розкладу .

Їжа є основним підсилювачем. Кожен раз, коли собака отримує шматочок їжі, він підкріплюється.

Але ключове слово типу "так" або клацання може стати вторинним підсилювачем. Він пов'язаний з подальшим первинним підсилювачем. Ключовим моментом є те, що він працює, тому що собака дізналася, що вторинний підсилювач нагороджений первинним підсилювачем. Як тільки це дізнається, посилання має підтримуватися з фактичними винагородами. На початку (під час тренінгу) нагорода прийде кожного разу, тоді її можна буде нагородити змінним графіком. Змінний графік фактично зміцнює зв'язок, оскільки собака не може передбачити, коли прийде головна нагорода.

Зауважте, що це зазвичай застосовується до третинних підсилювачів: кий "сидіти" насправді є підсилювачем, оскільки це може призвести до іншого підсилювача (натискання, наприклад), який потім призведе до фактичної винагороди.

Зазвичай ми ніколи не відмежовуємо вторинний підсилювач (клацання) від основного підсилювача (наприклад, нагорода за їжу). Це підтримує зв'язок між двома надзвичайно сильними, і змінна швидкість застосовується між києм (третинним підсилювачем) та клацанням.

Однак у випадку покарань у вас немає справжнього "третинного покарання", тому змінна швидкість "підкріплення" (в даному випадку розуміється як покарання) знаходиться між вашим вторинним покаранням ("ні") і фактичним покаранням ( коробка).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.