OPERANTNÍ PODMIŇOVÁNÍ

Dějinný nástin vzniku

Americký psycholog a neobehaviorista Burrhus Frederic Skinner (1904 - 1990) při svých proslulých pokusech poukázal na to, jak výrazně odměna mění a formuje chování. Se svými boxy, demonstroval pozitivní a negativní posílení a v samém důsledku zpochybnil existenci svobodné vůle. Striktně se držel behaviorálního S – R přístupu a svými utopickými myšlenkami uspořádání společnosti (Walden two 1948), vyvolával zájem a pozdvižení. Ve své práci vycházel z poznatků Ivana Petroviče Pavlova o klasickém podmiňování. Dále ho výrazně ovlivnila práce zakladatelů behaviorismu J. B. Watsona a Edwarda L. Thorndika, na jehož instrumentálním podmiňování vytvořil podmiňování operantní. To je podle Skinnera druh učení, který je daleko bližší běžnému životu, než klasické podmiňování. Výsledky své práce shrnul B. F. Skinner ve dvou základních pracích: Behavior of Organism 1938 a Science and Human Behavior 1953.

Princip a základní pojmy

Operantní podmiňování (někdy též učení úspěchem) je druh učení, při kterém se mění pravděpodobnost výskytu spontánních aktů chování (operantů), na základě jejich důsledků.

B. F. Skinner rozlišil dva druhy důsledků chování, z nichž posilování dále dělí na pozitivní a negativní:

· Posílení (zpevnění) - kladný důsledek chování zvyšující pravděpodobnost budoucího výskytu chování (operantu).

· Pozitivní posílení (zpevnění) - proces, při kterém je určité chování odměněno něčím pozitivním, příjemným.

· Negativní posílení (zpevnění) - jde o chování, které je posilováno a tím i více opakováno, jako důsledek potřeby vyhnout se nepříjemným podnětům (př. otevření okna v přetopené místnosti).

· Trest - proces, při kterém je jako důsledek chování přidáno něco nepříjemného. Zvláště averzivní(násilná) forma trestu vede ke snaze vyhnout se působení trestu jakýmikoli prostředky a způsoby chování, které mohou být více nežádoucí než původní trestané chování.

Procesy provázející operantní podmiňování

Osvojení operantní reakce - z počátku, kdy jedinec ještě nedokáže dokonale provést daný operant, by měla být odměněna, každá žádoucí reakce (viz tvarování). Po osvojení to už není nezbytně nutné. Zpevnění (odměnou) by mělo následovat bezprostředně po operantním chování a mělo by být takového druhu, aby bylo pro danou osobu opravdu cenné. Jinak budeme odměňovat laboratorního potkana a jinak dospělého člověka (dar, pochvala, potrava, pohlazení).

Generalizace a diskriminace podnětů - při pokusech se zvířaty, byla podmínka sešlápnutí pedálu rozšířena o akustický signál (diskriminační podnět). Potrava tak byla dodána pouze tehdy, když potkan sešlápl pedál při zvukovém signálu. Nenechal se však zmást změnou výšky tónu signálu, a nadále správně prováděl operant při zaznění i zkresleného tónu. Došlo k takzvané generalizaci podnětu.

Diskriminační učení se u lidí projevuje například zvýšeným pracovním nasazením (operantu) v přítomnosti nadřízeného. Generalizace se v tomto případě může projevit například tak, že pokud se objeví osoba, která se nadřízenému podobná, dojde alespoň po určitou dobu ke zvýšení výkonnosti také. U známého Watsonova experimentu malý Albert, došlo ke generalizaci přítomnosti živého potkana. Úzkost tak vyvolávala třeba i plyšová hračka apod.

Vyhasínání a spontánní obnovení - v dalších pokusech bylo zjištěno, že operantní chování po určitém počtu neodměněných pokusů přestane laboratorní potkan provádět, tedy vyhasne. Pokud ho ovšem další den do Skinnerova boxu vrátíme, opět několik pokusů operantního chování provede. Naučené operantní chování se obnoví.

U lidí se s vyhasnutím můžeme setkat například u vztekajících se dětí, kterým rodiče v tomto případě nevěnují pozornost. Po nějaké době, dítě zjistí, že svým křikem změnu situace nevyvolá a přestane. Podobně, ignoruje-li učitel u žáků některé drobné přestupky nekázně, pak postupně slábnou nebo úplně vymizí.

Pozitivní posílení (zpevnění)

Rozvržení kladného posilování (zpevnění)

Po zkoumání průběhu učení v roce 1957 navrhli C. Ferser a B.F. Skinner 4 druhy přerušovaného posilování. Při posilování nepřetržitém, dochází k rychlému osvojení si operantu.

Posilování podle stálého časového intervalu (fixed intervat FI) - přísun odměny zde nezávisí pouze na operantu, ale také na době, která uplynula od minulého odměnění. To zákonitě vede ke zvyšování frekvence operantů s blížícím se koncem časového intervalu.

S tímto druhem posilování se můžeme setkat třeba v politice, kde jsou na začátku funkčního období prováděna nepopulární opatření a s jeho blížícím se koncem jsou prováděna opatření populární až populistická.

Posilování podle proměnlivého časového intervalu (variable interval VI) - při tomto posilování jsou odměňovány úkony, které se objevují po náhodně dlouhém intervalu. Tento způsob není příliš efektivní při učení. Na druhou stranu, pokud má osoba již operant vštípený, posilování podle proměnlivého časového intervalu vede k relativně stabilnímu výskytu požadovaného chování.

S tímto způsobem posilování se můžeme setkat například při chválení dobrého chování dětí, rodiči. Bylo prokázáno, že náhodné zpevnění dokáže udržet "dobré mravy" v repertoáru chování dospělého natrvalo. Ale pokud tento druh posílení použijeme k zlepšení výkonů zaměstnance, který podává stabilní relativně neměnné výkony, neuspějeme.

Posilování ve stálém poměru k počtu operantů (fixed rate FR) - posilování (odměna) zde následuje pravidelně po daném počtu operantů (1:2, 1:5, 1:20 apod.). Vede k velkému počtu stabilně prováděných operantů.

U lidí se s tímto způsobem posilování můžeme setkat například při výkupu ovoce na brigádě. Pokud pracovník dostane za 10kg jablek 100Kč bude pracovní výkonnost relativně vysoká.

Posilování v nepravidelném (náhodném) poměru k počtu reakcí (variable ratio VR) - odměny při tomto druhu posilování následují po různém počtu operantů. Poměr odměn k výskytu operantů se s každou reakcí mění (1:4, 1:9, 1:1 etc.). Jedinec si tak nikdy není jistý, kdy dojde k dalšímu posílení a jen obtížně zaznamená, že bylo posilování zcela ukončeno. V tom spočívá vysoká efektivita tohoto způsobu a může vést až k závislosti. Jedinec je totiž dlouho ponechán v nejistotě a naději, že přijde další odměna, pro kterou je ochoten provést veliký počet požadovaných operantů.

U lidí se s posilováním v náhodném poměru k počtu operantů můžeme setkat například u hracích automatů a dalších hazardních her, jako je internetový poker. Dá se jím vysvětlit jejich návykovost.

Pověrčivé chování

Skinner používal pro své pokusy, mimo jiné, i holuby.

B. F. Skinner provedl sérii pokusů, při kterých byli holubi v boxu odměňováni nezávisle na jejich chování, každých 15 sekund. Ti s každou odměnou stále více opakovali operanty, které prováděli bezprostředně před tím, než do krmítka spadla potrava. Někteří tak stále opakovali chování jako kývání hlavou nahoru a dolů, otáčení hlavou dopředu, dozadu a nebo se celí otáčeli dokolečka. Skinner toto chování označil za pověrčivé. Osoby se jím snaží přivolat úspěch, ačkoliv spolu jejich chování a následná odměna nijak nesouvisí.

Při pověrčivém chování si lidé sami vytvoří diskriminační podnět, nebo opakují operanty o kterých se domnívají, že přinesou úspěch. Prvky náhodného posilování zřejmě zapříčiňují, že se člověk pověrčivého chování drží a jen těžko zbavuje. Příkladem jsou talismany, pověry(zaťukávání) apod.

Efekt kontrastu

Začnou-li laboratorní zvířata dostávat za operant větší odměnu, než doposavad zvýší přirozeně svůj výkon a frekvenci vykonávání. Podobně při snížení dávky odměny, se jejich výkon sníží.

U lidí se s tímto efektem můžeme setkat v zaměstnání, kde postupné zvyšování odměn, vede ke zvýšení výkonu. Důležitý a rozhodující je rozdíl s původní odměnou, která určuje naše očekávání. Dobrým příkladem je citace z filmu Když Harry potkal Sally: Nenavykněte partnera na začátku vztahu na to, že jej pokaždé doprovodíte na letiště. Jakmile s tím přestanete, bude vám to vyčítat.

Tvarování (shaping, postupná aproximace)

Tvarování (shaping), je specifický druh pozitivního posílení. Při klasickém kladném posílení je vždy odměněn zcela splněný operant, u tvarování následuje odměna i po dílčích úspěších. Výhoda tvarování tkví v tom, že lze subjekt naučit zcela novým prvkům chování. To se postupně posunuje a formuje směrem k cíli, který může představovat relativně složité úkony.

U lidí se tvarování využívá například při vyučování nejrůznějších pohybových dovedností. Lyžařský instruktor odměňuje dílčí úspěchy svého žáka, stejně jako rodiče, kteří ze začátku ocení i nedokonale uklizený pokoj svého potomka. V programech pro mentálně retardované se principy tvarování využívají při nácviku běžných denních dovedností. U lidí je tvarování složitější, kvůli individuální hodnotě odměny (sociální, fyzické, psychické).

B. F. Skinner demonstroval účinek posilování na experimentu s holuby, které naučil hrát hru s míčkem připomínající ping pong. Je jasné, že v přirozeném repertoáru chování holubů tyto operanty nejsou a tak nebylo možné čekat až na výsledné chování - to by nikdy nepřišlo. Místo toho bylo nejprve posilováno přiblížení se k míčku jedním holubem. Pokud to zvládl, byl odměňován pouze, když klovl do míčku a poté pouze když posunul míček směrem k druhému konci stolu. Podobně byl vycvičen i druhý holub. Pak už stačilo odměňovat společnou souhru obou holubů.[1] Skinnerovi následovníci, později naučili králíka, aby vzal do tlamy minci a vhodil jí do kasičky ve tvaru prasátka. I dnes se tvarování používá, například při specifickém výcviku psů apod.

Negativní posílení (zpevnění)

Jde o důsledek odstranění nebo zmírnění nepříjemných pocitů. Zpevňují se tak operanty, díky kterým nepříjemné podněty vůbec nemusejí začít působit. Negativní posílení vede ke zvýšení frekvence tohoto ulehčujícího chování.

V běžném životě se s negativním posílením můžeme setkat, například pokud půjdeme za příliš hlučným sousedem a asertivně ho požádáme, aby nedělal hluk. Pokud naše jednání povede k úspěchu, bude posíleno. Tento druh zpevnění se podílí na vzniku některých závislostí, pokud například alkoholem úspěšně odstraníme svou nervozitu, třeba před veřejným vystoupením, bude použití pití, jako léku na úzkost posíleno. Podobně může vzniknout závislost na prášcích proti bolestí hlavy na spaní apod. S negativním posílením se můžeme často setkat v reklamě, kde nějaký produkt, zázračně odstraní nepříjemné pocity.

Záporné zpevňování často vede k vyhýbavému chování i v situacích, kdy je žádoucí problému čelit. Je velmi účinné takže učení probíhá snadno a velice obtížně zažité operanty vyhasínají. Jedinec se tak často uchyluje k zajetému chování, ačkoliv se situace, po které obvykle následovaly nepříjemné pocity, změnila. Negativní posílení se podílí na vzniku poruch chování, jako je obsedantně kompulzivní porucha.

Podmiňování úniku a vyhýbavého chování

Podmiňování úniku - jde o posilování operantu, díky němuž se podařilo uniknout nepříjemnému pocitu. Například pokud je na koupališti příliš velké horko, přesuneme svou deku do stínu. Podobně chlapec, který se rozbrečí poté co ho rodiče za trest poslali do svého pokoje a který si tímto chováním vymůže obměkčení rodičů, posílí v sobě tuto možnost úniku před trestem.

Podmiňování vyhýbavého chování - jde o posilování chování, díky kterému se do nepříjemné situace jedinec vůbec nedostane. Jde o jakési předcházení možným nepříjemnostem. Například, je-li víno zakalené nebudeme ho pít, nemáme-li někoho rádi, budeme se mu vyhýbat, máme-li špatné zkušenosti s partnerskými vztahy budeme se jim spíše vyhýbat.

Toto posilování se podílí na vzniku tzv. sekundárního zisku z nemoci. Tím je myšlen zisk z výjimečného postavení, které nemocný díky nemoci získá. Jeho okolí se k němu chová pozorněji a s větší ochotou pomáhá řešit problémy běžného života, které si jinak nemocný řeší sám.

Trest

Jde o nepříjemný důsledek určitého chování, který by měl snižovat pravděpodobnost jeho dalšího výskytu. Výzkum však prokázal, že je méně efektivní než pozitivní či negativní zpevňování. Změna operantu se tak vůbec nemusí dostavit a především averzivní tresty doprovází několik nežádoucích účinků. Pokud jsou ovšem tresty využívány zřídka, mohou být dobrým způsobem, pro odstranění nežádoucího chování.

Existují dva druhy trestů:

· Působení nepříjemného (averzivního) podnětu (pozitivní trest) - jde o bolestivé tresty, nadávky, nepřiměřenou kritiku, ponižování apod.

· Zastavení působení příjemných podnětů (negativní trest) - jde o trest v podobě omezení nebo celkového odstranění působení příjemných podnětů. V praxi se může jednat o zákaz hraní si na počítači, zákaz účasti na společenské akci, odepření slibovaného dárku, odepření lásky a náklonnosti apod.

Zejména averzivní chování může být doprovázeno těmito nežádoucími účinky:

· Bolestivé tělesné tresty vyvolávají nenávist k trestajícímu, která se později může projevit jinde

nepřiměřeně tvrdý trest může vést nepřiměřenému strachu až k úzkosti.

· Trest může mít generalizovaný inhibiční efekt, pokud tak dítěti budeme ustavičně vtloukat do hlavy aby neodmlouvalo, může s námi zcela přestat mluvit. Diskriminační procesy zas zapříčiní účinnost trestu jen v přítomnosti trestající osoby.

· Trestání se pro trestajícího může stát odměnou v podobě rychlé změny neposlušnosti druhých, směrem k požadovanému chování.

· Některé tresty jako například veřejná kritika v sobě zahrnují i prvky pozitivního posilování (rebelie, pozornost všech zúčastněných), což může paradoxně vést k zvýšení nežádoucího chování. Kritika, tak může pro samotného kritika představovat past.

· Trestající rodiče nedávají příliš dobrý vzor toho, jak by se měli řešit problémy. Podporují ve svých potomcích stejný způsob chování.

Reakce na trest jsou poměrně komplikované a krom podmiňování strachu a vyhýbavého chování se při něm také uplatňuje kognitivní faktor očekávání.

Naučená bezmocnost

Vzniká tehdy, pokud žádné operantní chování nevede k ukončení působení nepříjemných pocitů. Pokud tedy jedinec zažije situace ve kterých nemá možnost uniknout nepříjemným podnětům, bude se později spíše chovat rezignovaně a nebude jevit snahu, změnit současnou situaci i v případě, že má možnost úniku.
----------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------REFLEXY A PODNĚTY

Teorie bývá ve výcviku psů často opomíjena, ačkoliv její znalost pro výcvik je rozhodující. Bez pochopení principů učení u psů, nikdy nemůžeme se psem správě pracovat a dobrat se úspěchu. Bohužel současná kynologická literatura teoriií učení právě nehýří. Naopak je plná velkých barevných obrazků a jednoduchých rad typu uděljete to, to a to, pes udělá tamto a všichni jsou spokojení. Tyto rady zní velmi snadně a je pravda, že člověku, který je poskytl, jistě fungují. Bohužel, každý z nás je jiný a jiným způsobem působí na psa. A pokud nepochopíme v čem je takzvaně "zakopaný pes", nedokážeme ani pochopit jak na psa působit, aby při tom a tom udělal tamto. Případně, aby jsme odhalili, kde děláme ve výcviku chybu a co je potřeba napravit.
Tak tedy, s chutí do toho!

Reflexy

Jednou ze základních věcí, jenž potřebujeme při výcviku znát, jsou reflexy. Ty lze charakterizovat, jako určitou reakci organismu (psího i lidského) na podněty odpovídající síly. Po zaznamenání tohoto podnětu (například spatření utíkající srny) jde informace o podnětu nervovými drahami do centrální nervové soustavy (dále jen CNS) tzv. dostředivou drahou. Zde je informace zpracována a poslána dál k výkonným orgánům odstředivou drahou. V tomto případě pravděpodobně ke svalům a pes vyběhne za zvěří. To byl zjednodušený popis loveckého pudu. Stejně by ale měla pracovat také reakce ne náš povel, kdy pes uslyší povel, předá informaci do CNS a ta okamžitě zavelí patřičným svalům vykonat potřebné pohyby ke splnění cviku. Než si řekneme, jak toho docílit, seznámíme se s reflexy o něco blíže.
První důležitou skupinou reflexů, jsou reflexy nepodmíněné, tedy vrozené, dědičně zakódované. Tyto reflexy dělíme ještě na jednoduché, kam patří například dýchání, mrkání, močení, sání u štěňat a mnoho dalších. Druhým typem nepodmíněných reflexů jsou reflexy složité, nazývané také pudy či instinkty. Ty, na rozdíl od jednoduchých reflexů, už vyžadují určité učení nazývané facilitace, které pak usnadňuje průběh daného chování. Běžným příkladem bývá chování psa při krytí. Pokud dochází ke krytí tzv. naivním psem, tedy psem, u kterého dosud neproběhla patřičná facilitace, bude celý akt včetně seznamovacího ceremoniálu a předehry trvat dlouhou dobu. Po několika krytích však pes získá potřebné zkušennosti a pak již při spatření feny bude vše probíhat daleko rychleji a ke spojení dojde po krátkém seznámení.
Druhou důležitou skupinou reflexů, jsou reflexy podmíněné, tedy získané a upevněné během života. Podmíněné, je nazýváme proto, že k jejich vybudování a průběhu je potřeba určitých podmínek. Hlavní touto podmínkou je vybudování dočasných nervových spojení v mozkové kůře psa a jejich upevňování po celý život psa tak, aby nedošlo k jejich vyhasnutí.

Podněty

Reflexy jsme si již definovali jako reakci organismu na podněty odpovídající síly. A když už víme, copak to jsou ty reflexy, měli by jsme se podívat také na podněty. Těmi je v podstatě vše, co působí na organismus psa a má to určitou prahovou hodnotu, tedy hodnotu pro organismus podstatnou a důležitou tak, aby to zaznamenal. Stejně jako reflexy i podněty si rozdělíme do dvou skupin. Tou první jsou podněty nepodmíněné, tedy takové, na které pes reagovat musí. Ve výcviku to bývají nejčastěji poděty mechanické, tedy působení na psa určitou fyzickou silou. Ale patří sem také působení pamlskem, pokud je ten pro psa dostatečně lákavý.
Jek už jistě tušíte, druhou skupinou jsou podněty podmíněné, tedy takové, na které bude pes reagovat pouze za určitých podmínek. Sem řadíme především hlasové či posunkové povely, ale také pach stopy a podobně.

Klasické podmiňování

A teď, když už víme co to jsou nepodmíněné a podmíněné podněty, můžeme se vrátit k tomu, jak lze vybudovat podmíněný reflex pomocí klasického podmiňování
1) podmíněný i nepodmíněný podnět musí působit společně. Podmíněný podnět (povel) ale musí o 1 - 2 vteřiny předcházet podnět nepodmíněný (mechanické působení, navedení pamlskem)
2) nepodmíněný podnět musí být silnější než podět podmíněný.
3) pozornost psa nesmí být odváděna vedlejšími silnějšími podněty (jiní psi, zvěř, hárává fenka atd.)
4) pozornost psa musí být v dostatečném stavu dráždivosti - hladový pes při využítí pamlsků, pes nesmí být ochranném útlumu apod.
5) působení podmíněných a nepodmíněných podnětů musí být opakováno
-----------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------


REFLEXÍ OBLOUK

Dnes si vysvětlíme, co je to reflexní oblouk, jak funguje, proč je důležité znát jeho délku a k čemu vlastně slouží.

Reflexní oblouk je v podstatě proces, který má 4 části (podnět, receptor, CMS, efektor).

PODNĚT: Je například, když řekne psovi povel „SEDNI!"RECEPTOR: Pes zaznamená receptory váš povel. V tomto případě díky uším slyšel slovním povel, ale také díky jeho očím uviděl, jak rukou ukazujete gesto dolů.CMS: Tyto informace ihned putují z receptorů díky dostředivým vláknům přímo do centrální mozkové soustavy psa (CMS). V tuto chvíli se pes právě rozhoduje, co udělá. Mozek poté předá informace pomocí odstředivých vláken do EFEKTORŮ, což může být v podstatě jakýkoli sval nebo jakákoliv žláza.EFEKTOR: Tady v tomto případě informace putovala do svalů a pes si sedl.

Zjednodušeně můžeme říct, že reflexní oblouk je doba než si pes uvědomí, co po něm vlastně chcete, až po vykonání požadovaného povelu.

Příklad na člověku: Sáhnete na horké kamna (podnět), spálili jste si ruku (receptor), informace jde do mozku (CMS), ten rozhoduje urychleně uhnout rukou z kamen a vysílá informaci do svalů na ruce. Vy cukáte rukou pryč z kamen (efektor).

Tak nyní už všichni víme, co je to reflexní oblouk, ale proč je pro nás tak důležité to vědět?

Každý z nás už určitě slyšel hlášku „máš dlouhé vedení". Každý jedinec na světě (člověk, pes, kočka, kůň...) má reflexní oblouk jinak dlouhý. Některý pes dokáže zareagovat během 0,5 sekundy a jinému trvá zpracování informace déle a reflexní oblouk se tak prodlouží až na 3 sekundy. Velkou roli v tomto hraje plemenná příslušnost, stupeň výcviku nebo rozpoložení psa v dané chvíli. Jistě jste si již všimli, že některý pes vykoná povel rychle a naopak jinému to trvá déle. To samozřejmě neznamená, že byl pes hloupý nebo neposlušný, ale je to dáno jen jeho délkou reflexního oblouku. Myslete tedy při výcviku na to, že pokud váš pes nezareaguje na povel ihned, není to tím, že by vás nechtěl poslechnout, ale jen mu trvá déle, než informaci zpracuje.

Zároveň je potřeba dát si pozor na to, abyste nenechali svého psa přemýšlet dlouho, to by se poté mohlo rozvinout i v neposlušnost. Do této situace se můžete dostat například v případě, kdy pes vidí srnu nebo zajíce a vás nebo vašich povelů si vůbec nevšímá. Vždy vyčkejte maximálně 3 sekundy a poté si povel vynuťte – například u povelu „KE MNĚ" přitáhnutím vodítka nebo pokud vlastníte elektronický obojek korekčním impulsem. Pokaždé, když dáte psovi povel, dejte mu čas (možnost) ho vyřešit, než ho začnete fyzicky nutit nebo s ním manipulovat. Svůj povel zbytečně neopakujte, ničemu to nepomůže a opakováním si výcvik kazíte, protože pes toto slovo může časem začít ignorovat.

S reflexním obloukem úzce souvisí i pochvaly a tresty. Psa vždy chvalte a trestejte do 3 sekund, od doby co úkol/činnost provedl. Pes si vždy pochvalu či trest dokáže spojit pouze s tou činností, kterou provádí PRÁVĚ TEĎ. Jakmile psa pochválíte nebo potrestáte o půl hodiny později, pes už naprosto nebude vědět proč, „nemá buňky" na to, aby si to spojil.

Znát reflexní oblouk svého psa je tedy velice důležité. Pokud nevíte, jak dlouhý je reflexní oblouk vašeho psa, chvalte ho nebo trestejte nejpozději do 3 sekund od provedené činnosti. V případě elektronického obojku to platí stejně.


ZKO Krnov Hlubčická © 2013