Co když se mu nechce?

29. 11. 2013 František Šusta Autor fotek: archiv Františka Šusty, Martin Lipinský

Začínáme-li jakýkoliv živočišný druh motivovat pomocí odměn, narazíme nevyhnutelně na situace, kdy zvíře o odměnu nestojí. Kůň stojící na trávě přestává věnovat pozornost pamlskům v naší ruce, prasátko při cestě přes oranici ryje v zemi a rozhodně nezdvihne hlavu nahoru, odkud by mu snad mohla přijít mrkvička. Automatická reakce člověka pak bývá následující – popadnout koně za ohlávku či prasátko za vodítko, z prostoru je odvést (v případě prasátka s dost velkým úsilím odtáhnout) a do příštího tréninku s odměnami je nechat lehce vyhládnout, aby tomu, co jim nabízíme, věnovali pozornost. Ale hlavně, nepustit je už na trávu, resp. oranici, kde by se odměnili sami. Já osobně tuhle cestu za nejlepší nepovažuji.

„Dobrý den, pane. Nakoupil jste v našem obchodním domě za víc než 200 Kč? Ano, tak v tom případě jste si zasloužil akční slevu na náš speciální lahůdkový salám. A vaše sleva může být ještě větší, pokud se vám podaří vylosovat právě teď červenou kartičku z osudí ... to není možné, vy jste vyhrál!" Po několika minutách stojím před obchodním domem lehčí o pár korun a v ruce se  salámem, který mi vlastně ani nechutná a který bych si jinak nevzal, ani kdyby ležel u východu zdarma. Proč jsem si ho tedy koupil? Protože byl „za odměnu", za můj předchozí nákup nad 200 Kč a můj zázračný výkon v losování. Zkrátka, sám jsem podlehnul jedné z mnoha motivačních technik a pokud bych já byl zvíře a prodejce trenér, byl by tohle klasický contrafreeloading.

rsPředstavme si znovu sebe sama v obchodním domě blízko prodejce s uzeninou. Já mířím do obuvi, protože potřebuju boty, ale prodejce mi zastoupí cestu a pokusí se mi vrazit do ruky předražený salám. Já ho obejdu a dál jdu do obuvi. Prodejce s výkřikem „Tak ty takhle?!" na mě hodí laso a odvleče mě do malé místnosti v zázemí, kde mě nechá vyhladovět. Potom mě pustí ven, dost daleko od všech ostatních lákavých obchodů a strčí mi před nos salám s očekáváním, že si ho teď zaplatím a s díky odnesu. Je ale jeho předpoklad správný? Asi ne. V první řadě, hned po propuštění z cely se pokusím tomu šílenci utéct a příště jeho stánek obejdu tak velkým obloukem, kam až dosáhne jeho laso. Pokud utéct nejde, nebo pokud mám opravdu velký hlad, tak si půjdu pro salám. Jenže, hlad je hlad a já měřím dva metry, takže tomu pánovi určitě nebudu platit! Jak on na mě, tak já na něj - srazím ho k zemi a vyjím mu na stánku bez placení všechno, na co dosáhnu! A pokud mi tohle vyjde, třeba se mi u něj i zalíbí. Třeba k tomu pánovi opravdu začnu chodit na salám zdarma, když už vím, že se nechá odstrčit stranou a vyjíst si krámek bez zaplacení. Hladem ve mně vyvolal agresi a ta se mi pak vyplatila - co tedy může čekat?

Popsaná situace v podání lidí připomíná spíš válečné drama. Ale dosaďme si za sebe zvíře a za prodejce trenéra dotyčného zvířete. Je tak těžké si představit, že se silné zvíře motivované hladem agresivně zmocní odměn, nebo že naopak při nedostatečném hladu uteče a bude se držet mimo dosah člověka? I proto vyhladovění zvířete není vhodným způsobem, jak ho motivovat - koneckonců mnoho zvířat je silnějších než my a jejich inteligence je větší, než si myslíme.

Jak je tedy možné, že mi v prvním uvedeném příkladu dokázal prodejce salám prodat, tedy vytvořit chování „zákazník platí" za odměnu „nechutný salám", i když odměna pro mě nebyla nijak zvlášť atraktivní? V první řadě nechal na mě první krok. Já sám jsem udělal nějakou velmi snadnou akci (nákup nad 200 Kč) a tu prodejce odměnil (slevou). „Ejhle, to bylo snadné," říkám si, a protože sleva není nic závazného, prostě jen nabídka, kterou si vezmu či ne, nic mi nebrání zkusit o vlastní vůli další chování - tedy losování. Protože v osudí jsou nejspíš jen červené lístečky, snadno vyhraju a prodejce to opět odmění další příjemnou, byť nezávaznou odměnou v podobě ještě vyšší slevy. Mezi námi se rozjíždí hra „já udělám chování - prodejce odmění", nároky se zvyšují úměrně mé aktivitě a schopnostem, až nakonec jsme v cíli: Já platím (chování) a dostanu salám (odměna). Všimněte si dalšího aspektu - pokud by prodejce během našeho jednání řekl „slevu povinně využiješ a basta!", pravděpodobně od něj odejdu. Vše funguje jen proto, že sleva byla nabídka, možnost ber nebo neber a až do poslední fáze jsem se opravdu rozhodoval svobodně. V okamžiku, kdy za nechutný salám platím, prostupuje mým tělem hřejivý pocit „Já to dokázal!"

Kdo dá první krok?

paseniPrávě dialog, při kterém se střídá vlastní akce zvířete následovaná odměnou, je typický pro správně vedený trénink pozitivní cestou. Akce zvířete přitom nemusí být nijak akční. Stačí cokoliv, co ale udělalo samo a co může mířit k cíli. Pokud koně odtáhnu za ohlávku z pastvy, neudělal on sám nic, co bych mohl odměnit. Pouze se nechal mnou odvést, společně jsme odešli díky mojí síle a mojí vůli. Chci-li koně pasoucího se na trávě motivovat k našemu společnému odchodu jen pamlskem, musím najít ten první nejjednodušší krok, jakého je schopen. Zdvihnul hlavu směrem ke mně, v tu chvíli dostane odměnu. Zdvihnul jí výše - druhá odměna. Zdvihnul ji ještě výš - třetí odměna a já se postavím o krok před něj. Udělal ke mně první krok - odměna. A tak spolu pokračujeme dál v dialogu jeho chování a mých odměn, až nakonec odměňuji pohyb koně po louce za mnou. Ano, není vyloučeno, že ho hra za chvíli omrzí a vrátí se k trávě. Ale já také zatím nevyčerpal celý svůj arzenál motivačních prvků. Zatím to byl jen správně zvolený rytmus práce, nastolení dialogu a postupné zvyšování obtížnosti.

dgUvedený příklad má v sobě i jiný, velmi podstatný motivační prvek. Jde o už výše zmíněný contrafreeloading. Živočich je motivován využít více tu odměnu, ke které ho vedla složitější cesta. Snad všem chovatelům psů je známa skutečnost, že pokud psovi schováme prášek na odčervení do běžné potravy v misce, často si nechutné části potravy všimne a prášku se vyhne. Pokud ale stejný prášek dáme do odměn za cvičení, pes zhltne prášek i s odměnou bez ohledu na pozměněnou chuť. Odměny za cvičení nemusejí být při tom nutně extra chutné. Řada psů vyžaduje chutnější pamlsky jen „na rozjezd" a po chvíli cvičení přijímá jako odměny i granule, které má jinak volně dostupné v misce. Jak je to možné? Živočich zkrátka vynaložil určité množství energie na to, aby odměnu získal, a o to víc si jí váží - je motivován ji sníst. Samozřejmě, že překonaná obtížnost nesmí být moc velká, aby živočicha neodradila od dalších pokusů, ale rozumně odhadnutá. Pokud tedy například pes nejeví velký zájem o odměnu, lze ji přikrýt rukou a při prvním šťouchnutí čenichem do dlaně ji odkrýt. Princip contrafreeloadingu využíváme i v našem lidském životě. Když naše dvouletá holčička odmítala snídat, dostal její bratr do ruky její snídani a kliker. Spolu si pak zahráli hru „na cvičení pejska" - holčička dostávala od staršího brášky úkoly a za splnění se ozval kliker a přišla odměna - stejný chleba, který předtím odmítala sníst. Kupodivu, před chvílí odmítaná snídaně v ní zmizela jedna dvě. Teď byla totiž za odměnu. Pokud bychom hledali další paralelu v našem lidském životě, tak se stačí vrátit do mládí. Vždyť typická contrafreeloadingová věta pro zdůraznění „hodnoty odměny" a zvýšení snahy „trénovaného" zní: „Na prvním rande ještě ne!"

rfV předchozích případech jsme se soustředili na správný sousled akcí, kdy subjekt nejprve udělá chování, za něj okamžitě dostane odměnu, zase udělá chování atd. Je jasné, že první chování subjektu nesmí být příliš těžké. Pes šťouchne do ruky, kůň zdvihne hlavu, člověk vyhrál v loterii, kde všechny losy vyhrávají. Obtížnost úkolu ale není dána jen tím, kolik energie živočich při jeho řešení vynaloží, ale také tím, jak moc je chování nacvičeno. Zatímco pro batole je jeden krok obrovským výkonem, pro jeho staršího sourozence je i přeskok přes překážku daleko snazší. Z toho nám zároveň plyne, že postupným procvičováním se úkon stává snazším a snazším, až bude nejsnazším na celém světě, jak praví klasik ... a tady pak máme odpověď na to, co zvolit jako ten správný nejsnazší první krok. Vyrazím-li na procházku s miniprasátkem na vodítku a ono zaryje rypáček do trávníku, je asi bláhové čekat, že ke mně spontánně zdvihne hlavu a já to odměním. Mohu ale použít target, dotyk na nějž už má dobře naučený. Dám target vedle prasátka, dotkne se, odměním, dám ho na druhou stranu, dotkne se, odměním. Náhle přestává rýt v trávníku, ale chodí za targetem. V konkurenci jiné potravy dostalo za úkol cvik, který má z dřívějška nesmírně dobře nacvičený. Konkrétně pro tohle prasátko je to tedy ten nejjednodušší úkol na světě a je tudíž ideální na nastartování dialogu chování - odměna.

vcVyužili jsme tzv. naladění chováním (behavioral momentum), které má mnohem širší uplatnění, než jen převést pozornost z volně dostupných odměn na odměny za cvičení. Může fungovat jako jakýsi restart pro zvířecí mozeček, který je právě teď zmatený, unavený či vystrašený. Pokud mi dotyčné prasátko na cestě něco vyděsí a ono se dá na úprk, ustoupím s ním stranou od nebezpečí a novou komunikaci navážeme opět dotykem targetu. Dotkne se několikrát po sobě, nasbírá úspěchy něčím, co velmi dobře zná a s uklidněným prasátkem můžeme zvesela pokračovat. Podobné to je, pokud se zvíře „zasekne", ať už ze strachu či proto, že neví, co po něm chceme. Zvíře, které nechápe náš požadavek, může po několika marných pokusech zcela ztratit motivaci spolupracovat a odejít. Proto behavioral momentum, jednoduchý cvik jako dobrý „restart", mívá v zásobě každý dobrý cvičitel lachtanů. Před několika sty diváky uprostřed programu lachtan náhle přestane pracovat, zmateně se dívá na trenéra. Ten řekne „Ty dneska nepracuješ nebo co?" a dá ruce v bok, což je nacvičený povel. Lachtan zakroutí hlavu, jako že nebude (což je nacvičené chování na povel „Ruce v bok", tedy připravené behavioral momentum pro kritické chvíle). Trenér mu nenápadně hodí rybu, ale pro diváky dál hraje rozzlobeného. „Styď se," zahrozí člověk rukou (povel) a lachtan dá ploutev na čenich (chování). Znovu mu přiletí ryba za odměnu a od tohoto okamžiku už dál pracuje bez problému dál. Z pohledu diváka veselá epizodka, z pohledu trenéra a lachtana behavioral momentum připravené pro chvíli, kdy mezi nimi mizelo porozumění a motivace.

Kouzlo konkurence

Až doposud jsme se soustředili na to, co zvíře udělá jako první. Stále nám však chybí dost důvodů k tomu, proč by to mělo udělat. Odměny mohou omrzet, jednoduché úkoly mohou být nuda ... zkrátka chce to ještě nějaký důvod. Tím může být například konkurence ostatních. Představme si dva papoušky v jedné místnosti, každý ve své klícce. „Dobré ráno," řekne majitel směrem k žakovi v první kleci a očekává nacvičenou odpověď. Žako ale nepovažuje za nutné odpovídat a probírá si peří. Majitel se otočí k amazoňanovi ve vedlejší voliérce a zamává na něj rukou. Amazoňan odpovídá zamáváním a dostává velký kus oříšku. „Cože, dneska se dávají velké oříšky za prachobyčejné zamávání?" je vidět ve výrazu, který náhle nasadil žako v první kleci. „Tak to moment, v tom případě já přehodnocuji svůj přístup a chci cvičit!" Svou postavou, pohledem, vším dává žako najevo, že je připraven pokračovat. „Otoč se!" dá mu majitel jednoduchý úkol a jeho splnění odmění větším kusem oříšku. Snadnou věc papoušek bez problému udělá, rychle sní odměnu a čeká, co bude dál. „Dobré ráno," vydá povel majitel a žako nacvičeně odpovídá „Trrrhni si!" (protože majitel je evidentně šprýmař) a dostává běžnou odměnu. Běžná odměna už mu ale nevadí, rozjel se a dál pokračuje s majitelem v dialogu chování - odměna. Z letargie ho vytáhnul trénink v konkurenci. Konkurence během tréninku může být silným motivačním prvkem, pokud ji umíme správně použít.

Síla konkurence v našem lidském životě je například tím, co nutí účastníky dražby přihazovat vyšší a vyšší sumy. „Obraz Padlé Madony je k mání za vyvolávací cenu jedno sto tisíc. Má někdo zájem? Ano, pán v modrém klobouku. Kdo dá víc? Ano, pán vzadu nabízí sto deset. Kdo dá víc?" Ovšem i taková dražba se může pěkně zvrtnout, stejně jako trénink v konkurenci: „Vyvolávací cena sto tisíc, kdo má zájem? A pan Corleone, šéf místní mafie. Kdo nabídne víc než pan Corleone, šéf místní mafie?" Obávám se, že nikdo. Proti donu Corleone se totiž nepřihazuje, a pokud náhodou ano, tak naposledy. Stejně tak trénink zvířat v konkurenci se může stát velkým fiaskem, pokud při něm nerespektujeme hierarchii ve skupině. Výše uvedený příklad s papoušky dobře funguje proto, že každý z papoušků je ve svém soukromém prostoru. Ve vlastní voliérce, kam mu druhý opeřený kolega nemůže vlézt. Pokud mezi nimi existuje nějaká hierarchie, pak v tomhle případě hraje minimální roli. Jiná situace ale nastává, pokud bychom trénink v konkurenci použili tam, kde zvířata mají přístup jeden k druhému. Čím vyhraněnější je dominance jednotlivých zvířat nad zdroji potravy, tím větší pozor si při tréninku v konkurenci musí trenér dávat a tím větší privilegia musí přiznávat dominantnímu zvířeti. Dominance mezi zvířaty je věc jejich dohody (byť někdy i bolestivé) a člověk ji nemůže měnit. Může ji ale respektovat a využít natolik, že celá skupina bude při dobrém rozdělování odměn harmonicky pracovat bez potyček. Každopádně tou největší chybou by bylo motivovat dominantního jedince k práci tím, že dám úkol a po něm velkou odměnu slabšímu sousedovi. Představme si, že v příkladu s papoušky sedí žako a amazoňan na jediném bidélku a žako tu funguje jako místní don Corleone. Je dominantnější, při běžném krmení je první u společné misky s potravou a nechává amazoňana nakrmit až poté, co on sám je hotov. Pokud tedy v takové situaci majitel promluví na žaka, ten neodpoví a majitel dá jednoduchý signál amazoňanovi, aby tak žaka motivoval k práci, visí ve vzduchu, že žako na amazoňana zaútočí. Zvířata však v tomhle směru bývají chytřejší než člověk, a tak amazoňan při chybě majitele zřejmě buďto vůbec nezareaguje a jednoduchý úkol nesplní, aby sám sebe neohrozil, nebo si na větvi nejprve ustoupí mimo dosah žaka. Bezpečí je mu totiž mnohem dražší než pomíjivá odměna. Trénink zvířat v konkurenci může být tedy mocným motivačním nástrojem, ale musí se umět. A vždy je bezpečnější motivovat slabšího jedince tím, že před ním cvičím dominantnějšího, než naopak.

Když nechce odměnu, zkus lepší odměnu

Prozatím jsme se bavili o tom, jak uměle zatraktivnit odměnu, která zvířeti „nestála za to". Hodnotu odměny ale nemusíme zvyšovat jen uměle, můžeme zkrátka použít jako odměnu něco, co zvíře moc a moc chce. Mezi kynology se často říká „Když ti nejí odměny, zkus lepší odměny". Problém může být v praxi v tom, že zvíře stejně jako dítě nepovažuje vždy za tu nejlepší odměnu zdravou mrkvičku, ale třeba mastnou či přeslazenou potravu. Potom za několik takových přeslazených tučných odměn získá zvíře nejen dost energie na celý den a brzy se zasytí, ale může se to i zle podepsat na jeho zdraví. Osobně si myslím, že dobrý trenér zvířat by měl vždy mít připravené nadprůměrné odměny, ale neměl by jimi plýtvat. Výjimečně oblíbená odměna by crměla být něčím, co se neomrzí, co je stále očekáváno s nadšením. Stejně jako narozeniny a Vánoce mají pro dítě své kouzlo jen proto, že jsou jedinkrát v roce a příliš mnoha dárků během celého roku si postupně přestává vážit. V případě, že se pokouším motivovat zvíře k práci lepší odměnou, musím si také dát velký pozor, aby se stále jednalo o odměnu a ne úplatek. Kde je ten rozdíl? Opět v načasování. Řekněme, že se pokusím dostat koně do přepravníku nalákáním za mrkvičkou. Já s plnou rukou mrkví stojím uvnitř a kůň venku před vstupem. Natáhnu ruku s jednou mrkví. Kůň si ji prohlíží, ale ani se nehne. „Ještě jich máš pět, přihoď, kamaráde!" A já, chtivý toho, aby kůň vlezl dovnitř, natáhnu dopředu ruku s dvěma mrkvemi, třemi mrkvemi, všemi mrkvemi... „Ještě máš v kapse jablíčko!" jako bych četl v očích koně, který se zatím nepohnul z místa. Tak tedy vytáhnu jablíčko a popojdu kousek dopředu, aby se už konečně pohnul. A hurá, kůň se skutečně pohnul - natáhnul se jako harmonika tak, aby se přepravník nedal zavřít a nataženým krkem mi vybral z ruky všechny odměny, co tam byly. Tak tohle, přátelé, byl úplatek a hlavně fiasko. Kůň využil toho, že já moc a moc chci dosáhnout úspěchu, a donutil mě přihazovat. Úplně otočil rytmus práce, který si od počátku kapitoly zdůrazňujeme - zvíře dá chování, člověk dá odměnu. V tomhle případě ale zvíře nedalo nic a tak jsem já navýšil nabídku (chování) a on se pohnul (odměna, po které od začátku toužím). Začít nabízet úplatky zvířatům je cesta do pekel stejně jako v životě. Zkorumpovaný úředník vidí, že moc chcete získat povolení a nechá si dát úplatek. Ovšem nestane se nic, jen úředník si po pár dnech řekne ještě o úplatek pro kamarády, kteří „mi s tím pomůžou"... jenže nepomůže nikdo a tak nakonec zmizí v kapse úředníka nemalá suma bez toho, že by se cokoliv stalo. Zkorumpovaný úředník stejně jako kůň před přepravníkem vás totiž donutil přehodit rytmus, on si trénoval vás.

Aby se při navyšování atraktivity nestaly z odměn úplatky, je třeba myslet dopředu a dobře se ovládat. Stále si opakovat „to ty to chceš, ne já". V první řadě už jen samotné lákání zvířete za žrádlem je špatně a dává mu moc velký prostor donutit nás ke hře na úplatky. On má nejprve něco udělat - tedy např. dotknout se targetu. Dotyk, odměna ... ejhle, on ji nežere. V tu chvíli dám několik vteřin pauzu a během ní si rozmyslím, jaké jsou moje další možnosti. Každopádně vím, že dotyk na target podruhé neudělá tak ochotně, když teď dostal něco, co mu nechutná. Počkám si, až se zvíře alespoň podívá mým směrem, dám target blíž, aby to teď vyšlo, dotkne se a já odměním lepší odměnou. Tu spolkne a já konečně vím, čím se dá motivovat, aniž bych ztratil rytmus a stal se úplatkářem.

Se zvýšením kvality odměny souvisí i tzv. jackpot. Stejně jako u hracích automatů znamená jackpot obvykle to, že se za celkem jednoduchý úkon vysype nečekaně velké množství odměn. Gambler se raduje a cpe drobné do kapsy. Zvíře s chutí pojídá nečekanou nadílku. A stejně jako gambler s výkřikem „Teď mi dává!" hodí do automatu další minci a pokračuje neúnavně ve hře, tak i zvíře po jackpotu obvykle pokračuje ve hře s námi. Jackpot ale nesmí přijít moc často, jinak se stává běžnou odměnou. A hlavně, podle mého názoru, by se jím měly odměňovat jen ty úkoly, které zvíře dobře ovládá. Tedy například právě situace, kdy povedu koně za targetem přes louku plnou trávy - dotyk - odměna, dotyk - odměna, pomalejší dotyk s dlouhým pohledem dolů na lákavou trávu - jackpot, okamžitý dotyk s novou energií do práce a velkým očekáváním - jen trochu větší odměna, dotyk - odměna ... a jedeme dál. Jackpot udržel koně ve hře, protože zvíře nepracuje za odměnu, kterou dostane, ale za tu, kterou očekává. A od okamžiku podání jackpotu ho očekává znovu. Citlivě volené jackpoty tedy zvyšují očekávání, ale po nich je zase třeba být opatrný, abych vzniklé očekávání příliš nezklamal.

Představme si ale situaci, kdy se kůň dotyk na target teprve učí, neumí ho. Nastavím target blízko - dotyk - odměna, target stále blízko - dotyk - odměna, target daleko - kůň neví, co s tím, kouká na nás, zkouší hrabat nohou ... po delší době se dotkne - jackpot (z radosti, že se to povedlo), dám target daleko - a kůň odchází. Jak to, že tady jackpot nesplnil svůj účel? Protože v tomhle případě se kůň nezpozdil proto, že už neměl motivaci, ale protože nerozuměl úkolu. A když se mu konečně podařilo úkol naplnit, dostal tolik odměn, že než je snědl, zapomněl souvislost. Proto další opakování nezvládne. Nic si nezapamatoval. Pokud vidím, že složitý úkol během učení dělal zvířeti problém, je vhodné po jeho splnění dát rychlou odměnu a ihned opakovat, ideálně na trochu menší obtížnosti, kde se nesplete.

Velmi dobrým motivačním nástrojem pro úkoly, které už zvíře ovládá, je i nepravidelný (proměnlivý) rozvrh odměn (variable - intermittent schedule of reinforcement). Nehodí se pro chvíle, kdy se zvíře učí, ale jen pro úkoly, které má již dobře nacvičené. Vychází z přirozené logiky, že ani v přírodě nezíská zvíře potravu pokaždé, i když vše provede správně. Smečka psů hyenovitých může provést štvanici na kořist s naprostou dokonalostí, ale nakonec jim kořist stejně často upláchne. Lední medvěd čekající u díry v ledu na tuleně, několikrát mine, a nebo se tuleň vynoří v jiném otvoru, než kde čeká medvěd. Ani psi ani medvěd však kvůli dílčím neúspěchům své úsilí nevzdají. Každý neúspěch je jen učí vytrvalosti. Je samozřejmé, že vše musí být s mírou. Pokud psům unikne už desátá antilopa, půjdou se zřejmě spokojit s lovem malých ale jistých myší. Stejně tak medvěd po příliš velkém množství neúspěchů u díry v ledu zkusí najít mršinu na břehu moře. V obou případech totiž množství neúspěchů překročilo tzv. „no return point", bod zlomu, po kterém neodměňované chování vyprchává. Do jeho překročení však zvíře zvyšovalo úsilí. Pokud tenhle princip pochopíme, můžeme ho využít v motivaci trénovaných zvířat. Znovu zdůrazňuji, že proměnlivým rozvrhem odměn můžeme motivovat jen ta chování, která má živočich dobře naučená. Pokud se teprve učí, měl by za každý dílčí úspěch odměnu dostat. Vždyť jak jinak by poznal, že jde správnou cestou a jak by při nezískání odměny pochopil, zda se mu opravdu chování nepovedlo, nebo zda to byl jen proměnlivý rozvrh? Velkou roli hrají i přirozené dispozice toho kterého živočišného druhu. Zatímco lední medvědy, živící se v přírodě čistě živočišnou (tedy prchající) kořistí, nemusí v tréninku odradit ani dlouhá fáze bez odměn, jejich blízký příbuzný grizzly se bez odměn odradí mnohem dříve. On totiž velkou část roku tráví v přírodě na lesních bobulích, kde je „úspěšnost lovu" takřka stoprocentní. U kopytníků či jiných jasných býložravců, jejichž obživou není „nejistý lov", ale „jisté pasení", je tedy třeba být s proměnlivostí odměn opatrnější. Ale ani kůň nenarazí při pastvě vždy na oblíbenou trávu a tak místo získání či nezískání odměny v proměnlivém rozvrhu můžu měnit druh odměn, byť za každý úspěch „vždy nějaká přijde".

Použití proměnlivých rozvrhů odměn správným způsobem představuje rozhodně velké umění, asi nejobtížnější kapitolu motivování trénovaného subjektu a bylo mu věnováno obrovské množství behaviorálních pokusů. I proto se tomuto umění většina profesionálních trenérů zvířat učí celý život a snad nikdy se nedostanete do situace, kdy byste mohli říci „Teď jsem v tom dokonalý!".

Věčná šance není šance

Vraťme se na začátek kapitoly, k prodejci uzenin, který mi prodává ne moc dobrý salám. V popsaném příkladu chybí ještě jeden motivační prvek, který každý, kdo se s podobným prodejcem setkal, dobře zná: „Jsme tu jen dnes, zítra přejíždíme se stánkem jinam." „Objednáte-li si do deseti minut po skončení pořadu..." Krátká příležitost, která se nebude opakovat, dělá ze šance skutečnou šanci. Něco, co je tu věčně, můžu využít za chvíli, ale to, co se k mému neuvěřitelnému štěstí náhodou na chvilku objevilo, to se musí okamžitě využít. Cirkus je ve městě jen na tři týdny, sleva platí do konce měsíce, krásná spolužačka má večer čas jen tohle úterý... Princip krátké šance (short windows of oportunity, limited hold of reinforcement) se nám objevuje i estam, kde bychom ho nehledali. Představme si znovu koně, který se pase na trávě a člověk ho po několika neúspěšných pokusech o odlákání za pamlskem popadne za ohlávku a odvede do stáje, aby ho tam nechal trochu vyhládnout a později ho bude snadnější motivovat pamlsky. Jenže, co je v tomhle případě pro koně vzácnější, tráva, nebo pamlsek? Pokud už z dřívějška zná přístup svého pána, tak ví, že na pasení má omezený čas jen do chvíle, než ho pán chytí za ohlávku. Tráva je tedy krátká šance a musí se využít, dokud to jde. Ale pamlsky? Když si je nevezme teď, tak později je do něj ambiciózní pán stejně dostane, až půjdou ze stáje na druhý pokus. „Naše doga nám spí v posteli, když nejsme doma! Pokud tam jsme, tak si netroufne k posteli přiblížit, ale když zůstane v bytě sama, je pak na posteli vždycky důlek ve tvaru dogy. V bytě má spoustu hraček, to si je nemůže kousat, když jsme pryč a nelézt nám do postele?" Ale co je v tomhle případě vzácnější příležitost, nehlídaná postel, nebo vždy přítomná hračka? Pokud má doga v době nepřítomnosti majitelů dát přednost kousání hraček před spaním v posteli, musejí být pro ni jednak hračky dost atraktivní a hlavně musejí být dostupné jen na dobu, kdy je majitel pryč. Tedy být alespoň tak vzácné, jako postel ... a v ideálním případě radši takové, aby si je nemohla kousat v posteli.

Princip krátké příležitosti ke splnění pozitivně motivovaného úkolu je jakousi dohodou mezi člověkem a trénovaným zvířetem. Něčím, co se ve vzájemné komunikaci oba učí a co je neustále přítomno „pod povrchem" jejich vzájemné komunikace během tréninku. Kdysi se mě někdo ptal, jaké jsou podle mě první věci, které by se mělo naučit štěně trénované pozitivní cestou. Mezi řadou základních věcí jsem mu vyjmenoval i princip krátké příležitosti: „Od vyřknutí povelu máš šanci ho splnit a zasloužit si odměnu jen do pěti vteřin (doba záleží na chovateli a schopnostech psa). Pokud to nesplníš, přišel jsi o odměnu. Ale nebudu tě nutit cvik splnit, zkrátka jsi jen přišel o odměnu. Pokud bych tě nutil, dal bych ti totiž mnohem vzácnější příležitost k tomu, co právě děláš, a vše by se obrátilo." Taková je logika pozitivního posilování a krátká šance na odměnu je jedním z jejích hlavních principů, prvních dohod, které spolu člověk a zvíře uzavřou.

První krok pro zvíře

„To mě nezajímá, jestli to nejde, vy tu zakázku vyrobíte, jinak vás vyrazím!" huláká nervózní šéf. „No to by tě ale mělo zajímat, když nám chceš dělat šéfa!" myslí si pro sebe parta soustružníků a vymýšlí, jak to zařídit, aby nepřišli o práci. Ono to totiž možná doopravdy vyrobit nejde. Ale jak má šéf, který v životě nedělal u soustruhu, poznat, zda se parta soustružníků vymlouvá, nebo je úkol opravdu mimo jejich možnosti? Skutečnou pravdu totiž znají oni, ne on. Aby šéf zjistil pravdu, může na úkolu trvat, soustružníky za jeho nesplnění vyrazit a nabrat nové, těm zadat stejný úkol a za pár týdnů je opět vyrazit... propuštěním dostatečného množství soustružníků tak experimentálně ověří, že se první parta skutečně nevymlouvala. Nebo se může naučit pracovat se soustruhem a pak bude z vlastní zkušenosti vědět, zda ho zaměstnanci netahají za nos. Třetí možnost je vyčlenit na výrobu výjimečné zakázky prémii a tuto možnost na pár dnů partě nabídnout. První soustružník, který se pod vidinou prémie přihlásí o úkol, potvrzuje, že úkol se splnit dá, protože on ví víc než šéf, co se na soustruhu dá a nedá udělat. Takový zaměstnanec ale po splnění musí slíbenou prémii dostat, protože jinak už to podruhé nezabere. Do budoucna ale šéf ví, kde jsou skutečné soustružníkovy možnosti a hlavně, naučil soustružníka říkat si o práci. Vytvořil tedy ten správný rytmus chování - odměna.

Všimněte si, jak snadno se se zvířaty můžeme dostat do podobné role šéfa, kterého „to nezajímá", a to dokonce i při nejlepší vůli a snahu o vycítění potřeb zvířete. Člověk totiž zkrátka není zvíře a zvířecí vidění světa není lidské vidění. „Mě to nezajímá, že máš mnohem lepší sluch než já, tisíckrát lepší čich, vnímáš vibrace zemského povrchu... a že ode dneška začaly pár kilometrů od nás přistávat letadla na novém letišti. Ty máš jít za targetem nebo..." My totiž stejně jako šéf nesoustružník nikdy nedokážeme vnímat svět zvířecími smysly a filtrovat ho přes zkušenosti toho, koho právě trénujeme. A následovat target v klidném prostředí je úplně jiný úkol, než to dělat při neznámém pachu, děsivých vibracích nebo nepřetržitém ultrazvuku. Šéf se může naučit na soustruhu, ale my i přes tu nejlepší snahu nikdy nedosáhneme schopností a vnímání zvířete. Co nám tedy ze tří výše uvedených možností zbývá? Můžeme na dostatečném množství stejných zvířat ověřit, zda to skutečně jde - a stejně jako u soustružníků i tady bude nemalý odpad těch zvířat, co to nezvládla. Nebo můžeme bedlivě sledovat okamžik, kdy si „soustružník při vidině odměny řekl o práci", tedy okamžik, kdy zvíře hlásí „já jsem připraven". Chvíle, kdy si zvíře říká o činnost, nám dává najevo, že teď to může zvládnout. Například pes dostane povel k pozitivně vytvořenému cviku jen ve chvíli, kdy si předsedne před psovoda, papoušek je vynesen na ruce z bezpečné místnosti jen, když se na bidélku posunul k majiteli, pozitivně trénovaný kůň se postavil po levé straně jezdce na jeden metr od něj, miniprasátko se postavilo vedle levé nohy člověka... To vše je součástí techniky, kterou nazývám „první krok pro zvíře". Všimněme si, že ve všech uvedených příkladech si zvíře řeklo o práci chováním, které ho člověk předem naučil a ve kterém nelze nebezpečně zesílit. Mnoho zvířat si při vidině odměn říká o práci naopak až moc - pes vyskakuje do výšky a štěká, papoušek píská, kůň se tlačí na člověka, prasátko rýpne rypáčkem do lýtka. Kdo na podobnou výzvu reaguje odměnou či zadáním práce, učí zvíře jeho vlastní verzi „prvního kroku". Ale co když člověk příště nestihne včas zareagovat a pozitivně posílený povel vydat? Pak zvíře svůj „první krok" zesílí, aby to konečně fungovalo - pes ve výskoku prokousne majiteli ruku s hračkou, papoušek křičí, až řinčí okna, kůň majitele převálcuje a prasátko rypáčkem podrazí člověku nohy. Vždyť přeci doteď to fungovalo, tak proč ten člověk nereaguje? Asi musím přidat. A co víc, zvíře očekávající odměnu uplatní úspěšný scénář na kohokoliv, od koho odměnu, resp. úkol ke splnění očekává, a to už končí legrace. První krok pro zvíře tak není při pozitivní cestě tréninku zvířat jen zajímavou možností. Je tu přítomen vždy, ať chceme či nechceme, a je jen na nás, zda ho dokážeme využít pro dobrou a hlavně bezpečnou motivaci zvířete předučeným bezpečným úkonem, nebo budeme ve vzájemném nepochopení riskovat zdraví lidí a plýtvat nervy zvířete. První krok pro zvíře je výchozím bodem, od kterého se celý dialog v pozitivní cestě tréninku odvíjí.

Co dodat?

Z uvedených příkladů vidíme, že možností, jak v pozitivně zaměřeném tréninku motivovat zvíře, je nepřeberně. Všechny však mají jedno společné - udržují role mezi subjektem a jeho trenérem v rovině, která jako motor tlačí celý proces kupředu. Rytmus „chování - odměna" a udržení vyšší aktivity na straně zvířete se táhne celým pozitivním tréninkem jako červená nit. Takový vztah ale nevzniká automaticky. Je to vzájemná dohoda, kterou zvíře a jeho trenér den za dnem stvrzují svojí každodenní komunikací. „Proč vás musím pořád do všeho honit!?" zoufá si matka na své ratolesti. „Protože jsme si zvykli, že nás do všeho honíš. Protože chvíle, kdy nás nehoníš, jsou vzácnou příležitostí hodnou k využití a protože ty jsi ten, kdo dělá vždy první krok na cestě k uklizenému pokojíčku." Stejně tak kůň, kterého chci z louky plné trávy odvést za targetem, není tupá hromada hlíny připravená k opracování a není to ani „prostě kůň". Je to živočich se svou historií a roky vytvořeným přístupem k práci. A pokud po celý život žil s pravidlem „blízko člověka nedělej nic, o co ti neřekli", bude pro něj ten první vlastní krůček něčím jako vstup člověka na Měsíc. Ale pokud chceme, dokážeme mu ten první krůček zjednodušit, vytvořit novou dohodu a dál den za dnem ji spolu utvrzovat. Vždyť chvíle, kdy zvíře pracuje, protože chce, ty stojí určitě za to.


(Článek je kapitolou v připravované knize „Pojďme nad tím přemýšlet".)

Podobné články

Moderní kůň byl domestikován kolem roku 2200 př. n. l. v oblasti na sever od Kavkazu a v následujících staletích se rozšířil v Asii a Evropě. Může se…

Co myslíte? Mohla by mít na chování koní a jejich vztah k lidem vliv skutečnost, že jejich jezdci a ošetřovatelé jsou příslušníky jednoho určitého…