Operant inlärning, alltså att man testar sig fram för att se vad som händer i olika situationer är en av vägarna som hundar lär sig på och som mycket av den moderna hundträningen bygger på. Ett beteende ökar i frekvens eller upphör beroende på vilka konsekvenser det får. Ett beteende som leder till något bra (för den som utför beteendet) ökar och ett beteende som leder till något dåligt minskar. För att kunna träna så rättvist och effektivt som möjligt är det viktigt att man förstår det som kallas Beteendets fyra konsekvenser. Här kommer en snabb genomgång av vilka de är och hur de fungerar.
R+ (positiv förstärkning) – beskrivs separat i texten Vad betyder egentligen R+ – är en av de fyra konsekvenserna som hundar (och alla andra djur) lär sig utifrån. Nu tänkte jag även presentera de övriga tre och ge exempel på hur de används i hundträning. Vi tar allt från början för det är lite knepigt att hålla rätt på alla R, P, plus och minus. Till att börja med vill jag att du helt glömmer alla värderingar du kan ha på ord som positiv, negativ, förstärkning och straff. Tills jag förklarat klart får du försöka tänka bort all laddning som orden har och se dem som nya ord utan innebörd.
Beteendets fyra konsekvenser är:
- Något positivt kan börja eller bli presenterat (R+)
- Något positivt kan upphöra eller tas bort (P-)
- Något negativt kan börja eller bli presenterat (P+)
- Något negativt kan upphöra eller tas bort (R-)
Positiv förstärkning (R+) innebär att någonting som hunden vill ha läggs till. Detta kommer att göra att beteendet belönas och alltså ökar eftersom hunden vill att det eftersträvansvärda ska hända igen.
Exempel: Hunden kommer till oss när vi ropar och får nåt smaskigt godis eller en rolig lekstund vilket gör att hunden kommer vilja komma till oss oftare. Hunden tar ögonkontakt och får hoppa ur bilen. Vi klickar och belönar hunden när den gör något vi tycker om. Hunden drar i kopplet och kommer dit den vill. Hunden springer efter en kanin och hinner ikapp den.
Negativt straff (P-) innebär att någonting som hunden vill ha tas bort. Detta kommer att göra att beteendet minskar i frekvens eftersom beteendet innebär att någonting hunden vill ha försvinner. Hunden hoppar på dig, du vänder ryggen till. Hunden drar i kopplet och du stannar. Du kopplar hunden när den kommer på inkallning (och det roliga buset stoppas).
Positivt straff (P+) innebär att någonting som hunden inte vill ha läggs till. Detta kommer att göra att beteendet minskar eftersom hunden vill undvika att bestraffningen händer igen.
Exempel: Hunden hoppar upp och sätter tassen på en varm platta. Hunden drar i kopplet och föraren rycker i kopplet. Hunden skäller på en katt och matte sprutar den i ansiktet med en blomspruta.
Negativ förstärkning (R-) innebär att någonting hunden inte vill ha tas bort.Obehaget försvinner när rätt beteende utförs vilket gör det till ett lönsamt beteende som alltså kommer att öka.
Exempel: Gå-fint-selen slutar skava när hunden inte drar. Man vrider om hundens öra och när hunden tar apporten i sin mun släpper man taget, så kallad ”tvångsapportering” (det är för mig ett stort mysterium att någon ens kommit på idén men det förekommer tyvärr!).
Så, med andra ord ligger det inga etiska värderingar i orden positiv och negativ. De talar bara om ifall man lägger till eller tar bort något för att påverka ett beteende. Positiv innebär inte automatiskt att man är schysst mot hunden eftersom positiv bestraffning kan innebära att man slår hunden i huvudet med en stekpanna. Negativ bestraffning låter ju fruktansvärt elakt men det kan innebära att man vänder ryggen åt en hoppig hund eller kopplar en hund som leker för stimmigt med de andra hundarna i parken.
Orden förstärkning och straff ska heller inte betraktas med etikbrillorna på, de är enbart beskrivningar på om beteendet ökar eller minskar i frekvens. Ett beteende som förstärks kommer att öka och ett beteende som straffas kommer att minska i frekvens. Det kan inte heller sägas för många gånger att det är individens upplevelse som är relevant, inte vad vi kallar det eller hur vi uppfattar det. Om hunden känt sig belönad så kommer beteendet att öka, har den känt sig bestraffad så kommer den inte göra om det lika ofta.
Hur påverkar då de olika träningsmetoderna hunden och varför har jag valt att kalla hundskolan R+ Hundskola istället för R+/R-/P+/P- Hundskola?
Den största anledningen till att jag valt att bygga min hundträning på positiv förstärkning är etiken. Jag har hund och tränar hundar för att jag tycker det är roligt och för att jag bryr mig om hundarna. Om de inte tycker det är roligt och mår bra så kan det lika gärna va. Alltså är det uteslutet att använda mig av positiv bestraffning (P+ är ute ur leken med andra ord). Även om det är den huvudsakliga anledningen så är det inte bara av etiska skäl jag är emot positiv bestraffning. Det är nämligen så fruktansvärt kontraproduktivt om man vill ha en bra kontakt och en välmående och välbalanserad hund.
Negativ förstärkning (R-) innebär att man måste använda sig av ett obehag som hunden vill slippa undan, och i och med att jag inte vill jobba med obehag, hot och våld när jag tränar hundar så är även R- uteslutet. Sist kvar blir P-, det negativa straffet som ju låter helt fruktansvärt men kanske bara innebär att man vänder ryggen till om hunden är hoppig eller stannar när hunden drar på promenad.
Jag använder negativt straff i min träning men jag försöker minimera det så mycket jag kan för det finns bättre sätt att jobba. Negativt straff är oftast ingen hållbar väg att jobba i längden och det händer framförallt när man själv planerat träningen för dåligt. Ett negativt straff riskerar att skapa frustration i hunden eftersom det inte talar om vad vi vill att hunden ska göra utan enbart vad vi inte vill att den ska göra. Om den då inte lärt sig vad vi vill att den ska göra eller väldigt snabbt kan lista ut det kommer den med största sannolikhet att testa samma beteende igen fast intensivare.
Om en hund är hoppig försöker jag alltså att alltid belöna den när den inte hoppar för att ge den ett beteende som är lönsamt och som den vet är uppskattat. Om den väl börjar hoppa för att jag tabbat mig och försatt den i en för svår situation (tränat för länge så den tappat fokus, den kanske är stressad eller så är det för mycket störningar) kan jag använda negativt straff för att ta bort belöningen när den hoppar så att detta beteende inte förstärks ytterligare. Om en hund drar på promenad kan jag använda negativt straff (stanna och ta bort möjligheten att dra) för att sedan ge den information om vad den ska göra istället – komma med mig så jag kan belöna ”rätt” beteende. Den positiva förstärkningen har med andra ord en väldigt central roll i den hundträning jag förespråkar. Dels för att den är schysstast mot hunden men minst lika mycket för att den är effektiv och ger väldigt mycket information. Genom att belöna precis det beteende man vill ha slipper man hålla på och straffa hunden och det måste ju vara alla mattars och hussars mål.
Utöver de fyra konsekvenserna finns även begreppet Utsläckning, vilket innebär att ett tidigare belönat beteende upphör att belönas. Detta är högst aktuellt i all hundträning och används medvetet och omedvetet av de allra flesta som har hund.
Exempel: Hunden tigger vid matbordet för att den har fått en smakbit men en dag bestämmer du dig för att sluta ge den mat när den tigger. Hunden får ingenting för sina ansträngningar och beteendet kommer att avta. Ett annat klassiskt exempel är när du kallar in hunden för femtionde gången och den kommer utan att få en rättvis belöning. Beteendet (=att hunden kommer till dig) kommer att släckas ut. Utsläckning spelar en stor roll i klickerträning där de beteenden som är önskvärda förstärks (R+) och de oönskade ignoreras (släcks ut). På så vis kan både hund och förare fokusera på det som faktiskt blir rätt istället för att hänga upp sig på de beteenden som just för tillfället inte är önskvärda. Detta skapar en trevlig kommunikation och ett samarbete som är helt ovärderligt när man jobbar med en hund.
Så sammanfattningsvis, när du tränar eller bara umgås med en hund, kom ihåg att hundar alltid gör rätt, dvs de gör det som de tjänar på. Det är just därför vi har en så fantastisk möjlighet att lära dem precis vad vi vill, vi måste bara hitta rätt motivation och sätt att belöna dem så de förstår att det vi vill att de ska göra är rätt.