Archives pour la catégorie chiot

Le « NRM » – on en parle?

fail1

Il y des questions qui reviennent régulièrement sur la table et suscitent une curiosité légitime en apprentissage… le NRM est, décidément, une de ces thématiques qui fait systématiquement l’objet de questions en stage ou pendant mes cours ou sur les pages d’éducation canine  ;-)

kesako

Qu’est-ce donc que le NRM avant tout ?

C’est, en anglais, le « non reward marker » ou, en français, « le marqueur de non renforcement »  : en plus clair, ce petit mot que bon nombre d’éducateurs utilisent et préconisent, du style « oops », « raté » « non » ou autre mot qui informe le chien, de manière présumée pacifique, que ce qu’il vient d’effectuer n’est pas ce que nous attendions.

On parle donc d’un marqueur (un mot spécifique, toujours le même) qui annonce au chien que le renforçateur (la friandise, le jeu ou autre) n’arrivera pas.

Tout comme le clicker annonce l’arrivée de choses plaisantes, le NRM annonce qu’elles n’arriveront pas  ;-)

noreward

Si cette thématique revient sans cesse, c’est généralement pour connaître la « valeur ajoutée » de cette pratique, en clair « mais est-ce que ça marche ? », c’est ce que voudraient savoir mes stagiaires en général  ;-)

Au delà de la valeur ajoutée, la question principale reste pour moi « cette pratique est-elle compatible avec une éducation dite positive » ?

Les éducateurs qui emploient ce fameux NRM, expliquent souvent que tout est information et que l’information est rassurante pour le chien : il reçoit un feedback immédiat sur ce qu’il vient de faire et pourrait, dès lors, éliminer cette action comme inefficace pour en adopter une autre.

Dans ce sens, le feedback serait rassurant et non punitif.

feedback

En effet et dans l’absolu, un « ne va pas par là » devrait être presque aussi utile qu’un « va par là » (presque, parce qu’évidemment, le « ne va pas par là » ne vous informe en rien sur le chemin à prendre). 

Avoir le plan de tous les pièges à ours dans une forêt est tout aussi utile qu’un plan qui vous montre le chemin à suivre… vous traversez la forêt en évitant les pièges (seule votre émotion change quand vous passez votre temps à éviter un aversif plutôt qu’à surfer sur un chemin sécurisé).

afraid

Je donne souvent l’exemple d’un jeu télévisé où, quand vous donnez une bonne réponse, vous obtenez un « jingle » qui vous annonce des gains et, en cas de mauvaise réponse, un «buzz » qui lui vous annonce clairement qu’aucune forme de récompense ne va arriver.

Si vous vous imaginez dans la situation où vous allez entendre le « buzz » encore et encore (et encore)je vous laisse imaginer votre émotionnel au moment où celui-ci se déclenche ?

Resteriez-vous neutre ? Ne modifie-t-il pas votre état émotionnel ?

J’en doute fortement.

depité

Le « buzz » sera conditionné à un état d’esprit spécifique qui, à mon sens, ne génère ni joie, ni envie d’entreprendre.

Il n’est pas punitif, me dit-on  ;-)

Difficile à croire pour moi… si on s’en tient à la définition même de la punition.

Une punition est quoi que ce soit qui, arrivant immédiatement après un comportement, diminue la fréquence de ce comportement à l’avenir, elle est, par définition aversive.

Un aversif conditionné est un quelconque stimulus qui, au départ est neutre (n’a pas de signification particulière, tout comme le clicker au départ n’en a pas non plus) mais qui, rattaché de manière systématique à quelque chose de déplaisant, devient également déplaisant (si je me réfère encore une fois à mon « buzz », il devient très rapidement aversif vu qu’il me prive de quelque chose que je souhaite ardemment obtenir).

Que la punition « fonctionne » est un fait en science du comportement (en effet, on ne peut parler de « punition » que quand le comportement a diminué – c’est donc le comportement futur qui va nous informer si ce que nous avons entrepris était punitif ou pas, que nous l’ayons fait volontairement ou pas).

En conséquence, si le NRM « fonctionne », il est par définition punitif (puisqu’il diminue la fréquence d’apparition d’un comportement) et s’il n’est pas punitif, il ne sert à rien ☺

logique

L’idée du NRM véhiculé de manière complètement neutre chez les êtres de langage et d’émotion que nous sommes me laisse plus que perplexe et dubitative : j’entends trop d’éducateurs s’éclater dans des « yeeeesss » ou « ouiiiii » euphoriques pour croire, un seul instant, que le « raté » ou le « oops » ne véhicule aucune émotion ☺

… et, si nous y mettons notre émotion, comment imaginer qu’elle n’influence pas, à son tour, l’émotionnel du chien ?

On pourrait concéder à la réflexion qu’un minimum d’émotion désagréable n’est pas un drame insurmontable s’il sert une stratégie spécifique qui doit emmener le chien vers le succès mais, en clicker training, il n’a jamais été question de laisser l’animal patauger dans l’erreur sans le moindre feedback, bien au contraire.

Refaire, encore et encore, la même chose en s’attendant à un résultat différent est, à mon sens, la plus grossière erreur qu’on peut commettre en clicker training.

Dès la première erreur, une modification de la stratégie (du shaping plan) s’impose immédiatement.

think

L’erreur est amplement utilisée par certains éducateurs et pas des moindres : « laissez-le sortir de la cage » (il va prendre la porte dans la poire) « laissez-le essayer de prendre les friandises dans la main »  (votre main se ferme devant le nez du chien)… dans tous ces cas, on voit clairement le chien détourner la tête, cligner des yeux, reculer imperceptiblement ou franchement aboyer sur l’éducateur  :-|  (encore vu dernièrement dans une vidéo d’une très célèbre trainer). 

bref, tous les signes de la frustration imminente ou déjà très présente.

frustrated

Personnellement, je ne le préconise absolument pas… dans une séance de clicker training, votre chien n’apprend pas juste le comportement que vous êtes en train de travailler mais il se fait une idée très précise de ce que signifie le fait de travailler avec vous.

L’erreur génère du stress et de la frustration, une diminution de la réponse (moins de comportement), voir, chez certains chiens, l’apathie totale (les pessimistes ou ceux qui ont un peu trop dégusté la punition dans le passé et, pour qui, le NRM est devenu le signal de l’arrivée imminente d’une punition plus musclée).

L’erreur ne génère ni enthousiasme ni envie, ni joie ni confiance.

Pour finir, parfois le NRM se métamorphose dans un espèce d’ultimatum « fais ça ou tu vas voir » – comme le « un-deux-trois » de nos parents qui nous façonnaient à ne répondre qu’au fatidique « deux et demi » ☺

doit

Je me rappelle d’une personne qui, en agility, répétait « raté » d’un ton de plus en plus excédé à son chien lors de ses erreurs successives (mais ne changeait absolument rien à ce qu’elle était en train de faire) avant de mettre le chien en voiture (ce qu’elle estimait être une punition et que, personnellement, je soupçonnais fortement d’être un magnifique renforcement négatif).

Je n’ai jamais vu son comportement évoluer dans le sens qu’elle souhaitait  :roll:

Ce qui ouvre tout grand la porte à la construction d’un comportement superstitieux : si le chien réussit ensuite (parce qu’elle aurait modifié la position de son corps par exemple, je peux vous en parler moi qui suis une si piètre conductrice), le « raté » prend une valeur qui n’existe pas dans les faits mais il sera considéré comme efficace par l’humain qui l’utilise.

superstition-1-638

Il est tout à fait plausible d’imaginer que, pour certains chiens ultra motivés dans une quelconque activité (notamment sportive), l’utilisation d’un NRM ne diminuerait pas la réponse des comportements suivants mais l’erreur, et la répétition et le manque de renforçateur, sont stressants même pour ces chiens et je doute que le travail en soit amélioré, au contraire.

Avec d’autres chiens, l’échec est dévastateur et le NRM suffit amplement à les désengager du travail.

Entre frustration et apprentissage sans erreurs (ce qui est évidemment un but à atteindre) à travers la modification immédiate d’une stratégie après un click manqué, mon choix est rapidement fait… et vous ?

Happy Training (avec ou sans NRM)  :-D

qu’importe le flacon…

article1

Il y a quelques jours, au hasard d’un statut Facebook, j’ai lu que demander « assis, couché debout » au chien était une preuve de notre besoin de contrôle et de domination sur celui-ci…

Si je peux parfaitement comprendre le concept que voulait certainement véhiculer ce statut, je l’ai trouvé symptomatique  d’une certaine conception du chien de compagnie (et, là dedans, j’inclus tous nos chiens sportifs et qui se consacrent, avec plus ou moins de plaisir et bonheur, à toutes les activités canines existantes sous le soleil).

Je me suis souvenue de ma présence à la SPA il y a bon nombre d’années, pendant que j’attendais patiemment l’employé qui devait me rendre mon chat égaré et retrouvé (et de fort méchante humeur par ailleurs, pas l’employé… mon chat) et que j’ai donc assisté aux dernières minutes d’une adoption : un Monsieur, trente secondes après avoir pris possession de la laisse à laquelle était attaché un jeune et grand chien fraîchement adopté, lance un très tonitruant « au pied !» :roll:

article9

Le chien qui avait l’air de comprendre cet « au pied » à peu près comme je comprends l’hébreu, a continué à faire ce que fait un chien de SPA fraîchement sorti de son box… à savoir, bondir dans tous les sens et tirer pour sortir de l’immeuble au plus vite (laisse = bénévoles plus ou moins compétents qui viennent me sortir de mon box, youpiiie).

article2

Le « au pied » est devenu plus péremptoire avec une 2ème tentative. Au 3ème « ordre » (le ton employé était tout à fait celui d’un chef de régiment), le chien s’est pris une secousse magistrale sur son collier :roll:

Oreilles qui se plaquent contre le crâne, queue qui descend, regard furtif : le chien accuse le coup… mais pas longtemps, il en a vu d’autres, et recommence à faire le fou cinq secondes plus tard  :roll:

Le Monsieur a quitté la SPA laisse très courte, tout en continuant de claironner un « au pied/au pied» non seulement parfaitement inefficace (vu qu’il n’est pas rattaché à un quelconque apprentissage) mais qui n’allait pas tarder à être associé à la crainte et à la douleur.

article4

Cet « ordre » restera porteur de ces émotions peu agréables, tant il est vrai que Pavlov «est toujours sur notre épaule» et que quelles que soient les couches de conditionnement qu’on va ensuite tenter de mettre par dessus par la suite, cette émotion ne s’en ira pas :-|

Si cet « au pied » est suivi d’une panoplie « d’ordres » tout aussi bien transmis, l’émotion néfaste risque allègrement de s’étendre à l’humain même qui la cause (ce qui ne va pas faciliter la vie du chien mais pas, non plus, celle du « maître »).

Tous les êtres vivants sont programmés pour réagir plus vivement et de manière plus définitive à ce qui est aversif (en clair : tout ce qui fait mal, peur ou met notre bien-être ou notre vie à mal ou carrément en danger) plutôt que à ce qui est agréable et positif.

Les raisons éthologiques sont parfaitement évidentes : si vous « ratez » un danger mortel, il n’y aura pas de 2ème chance de faire mieux, si vous ratez quelque chose de plaisant, c’est certes dommage, mais vous êtes toujours en vie et donc tout à fait susceptible de retrouver une autre gratification ou la même, répétée  ;-)

C’est un mécanisme de survie 8-)

Si ce chien finit par comprendre (malgré l’incohérence de son « maître ») que, pour échapper à cette secousse sur ses cervicales, il peut se tenir tranquille, il est possible que cela fonctionne et que le chien « obéisse » comme unique moyen de contrôle de son environnement (savoir comment échapper à la douleur et pouvoir le faire est un contrôle de son environnement en effet).

Avoir compris comment échapper à quelque chose de très déplaisant est plutôt une bonne affaire et peut donner des chiens très « obéissants »…

Si je vous donne un mode d’emploi pour échapper à une punition, disons « quand la lumière bleue s’allume, asseyez-vous pour éviter une secousse électrique » – vous m’en serez un peu reconnaissants… c’est déjà ça, personne n’a envie d’être électrocuté :-|

article5

Par contre, vous allez vivre dans la crainte et l’attente de cette lumière bleue, vous ne serez jamais serein, jamais tranquille, jamais détendu – il vous faudra toujours contrôler l’apparition de la lumière bleue et vous la redouterez (mais vous allez vous asseoir quand elle apparaît).

Pour un peu que vous ne n’ayez pas cru mon « mode d’emploi » sur parole, vous aurez pris la secousse la première fois et la lumière bleue vous fera peur pour le restant de vos jours  :-|

Tout ça pour en arriver au concept que, pour le chien « assis » « couché » « debout » mais également « twist », « roule » ou « donne la patte » sont juste des comportements, tous logés à la même enseigne a priori :lol:

learning

A savoir, l’humain émet un son que j’ai appris à reconnaître je produis un comportement il y a une conséquence = apprentissage (et une émotion qui s’y attache, inévitablement, toujours).

Ce qui, en apprentissage bienveillant, serait plutôt : je produis un comportement je l’associe à un son de l’humain conséquence plaisante (et ce signal devient un renforçateur secondaire).

Un signal qui aura valu une ou des punitions au chien ne sera jamais un renforçateur secondaire et, si vous l’incluez dans une chaîne de comportements, vous allez vite vous en apercevoir :-|

chain

Je travaille avec suffisamment de clients pour constater, encore et encore, que nous sommes ceux qui faisons cette distinction très humaine entre « obéissance » et « ludique » et nous ne la faisons pas à moitié  :lol:

Les « assis, couché, debout, reste, pas bouger » sont rarement véhiculés joyeusement et la menace est souvent limpide pour le chien, dès le début.

article7

Je le constate pratiquement tous les jours : on dit « twist » d’un ton joyeux et amusé et, si le chien fait « rouler-bouler » à la place parce que le signal n’est pas encore tout à fait en place, on en rit volontiers (« c’est pas bien grave »)  :lol:

Par contre, quand on dit « couché » au chien, c’est très souvent (presque toujours) d’un ton de sergent-major en pétard et on est dans une dynamique « d’ordre » et sûrement pas d’information, encore moins d’une opportunité de renforcement :-|

Je travaille souvent avec des chiens très craintifs, avec qui nous mettons tout en œuvre pour minimiser leur anxiété : arrive le mot de « rappel » (par exemple) et il est, dès le départ, tellement péremptoire et stressant, qu’il ressort comme celui à éviter absolument (tu as l’air fâché, je préfère rester éloigné).

article6

D’où l’utilité, puisque NOUS sommes des êtres verbaux (contrairement au chien) d’utiliser un terme qui nous met dans une émotion différente, comme « bingo » ou « bonbon » (ou ce que vous voudrez qui est, pour vous, rattaché à une émotion agréable)  ;-)

Si je dis « reste » à mon chien parce qu’une voiture va arriver, c’est sérieux : il en va de sa vie (notez qu’on peut le mettre en laisse).

Moins important pour le chien mais souvent très important pour nous, si je te dis « reste» en cours collectif d’éducation, je veux montrer à tout le monde que j’ai bien éduqué mon chien (et, donc, que je suis un humain compétent et capable, ce qui est gratifiant)  :-D

Ce que démontre le chien (ou pas) en faisant ce qu’on lui demande.

Si, justement, il n’exécute pas (parce qu’il a appris dans votre cuisine ou votre jardin et que l’apprentissage est trop léger pour résister à la présence de congénères, d’inconnus, des effluves de taupes que lui signale sa truffe), nous entrons immédiatement dans un mode « désobéissance » assez peu indulgent ;-)

bad

Pour des raisons morales, philosophiques, logiques, utilitaires la plupart d’entre nous sommes (plus ou moins) convaincus du bien de l’obéissance aux « lois » et du fait qu’elles sont nécessaires à la sécurité et nous protègent contre les risques et le mal – au moins autant que nous avons appris à craindre la sanction (légale ou la simple réprobation sociale).

…pour le coup, les quelques humains entre nous qui sont moins régis par ce besoin d’approbation sociale et le revendiquent vont souvent s’enorgueillir d’avoir un chien « mal élevé », « créatif » ou « rebelle » (nos définitions).

article8

C’est la preuve (par notre chien, ce qui assez amusant) que nous ne sommes pas des abrutis de l’obéissance, des fondus de la discipline, des obsédés de l’ordre convenu et du contrôle de l’autre et que nous reconnaissons la « liberté » du chien d’être lui-même.

Notons que cette interprétation du monde a ses limites à moins de vivre dans un désert… en effet, il y aura toujours un moment où nous serons obligés de limiter la liberté du chien (tout comme la nôtre d’ailleurs ou celle de nos enfants), ne serait-ce que pour sa sécurité et celle des autres (ou pour nous éviter des ennuis, aussi).

Tout le monde reste parfaitement libre d’enseigner 150 comportements à son chien ou d’en enseigner deux ou trois parce qu’ils sont nécessaires.

Il n’en reste pas moins vrai que travailler sur un comportement, est travailler sur un comportement et une même identique démarche quel que soit ce comportement :-D

Un « twist » peut être aussi solide, bien appris, renforcé, qu’un « reste » (ou autre « ordre ») et inversement.

Un « reste » peut être aussi fun, solidement attaché à du renforcement et donc à une belle émotion qu’un « rouler-bouler » et inversement.

Nous seuls faisons la distinction entre « important » ou « accessoire », entre « chien obéissant » et « chien rigolo » (ou « de cirque » pour les détracteurs), entre chien qui sauve des vies et chien qui fait du dog dancing… pour le chien, tout ça n’est QUE comportement (et émotion rattachée à celui-ci) :-D

trick

Si votre chien apprend « assis » « couché » « debout » de la même identique manière (haut taux de renforcement, renforcer la durée, un signal de libération clair, pas de menace ressentie) qu’il apprend des comportements ludiques – ces mots seront à tout jamais rattachés à une émotion agréable, plaisante — et donc souhaitable — et leur apparition dans votre langage sera tout à fait la bienvenue, un « feu vert » vers un renforçateur et quand, plus de renforçateur systématique, le comportement lui-même sera devenu un renforçateur secondaire, fort de sa portée émotionnelle positive (ou le contraire, évidemment).

Si tous les comportements de votre chien sont appris de cette manière, les produire sur signal est une excellente affaire pour le chien et, s’il ne les fait pas, à vous de vous demander si l’apprentissage est vraiment terminé, s’il est généralisé, conceptualisé, flexible ou encore uniquement inhérent à un contexte précis.

Bref, il faut encore travailler plutôt que « mon chien désobéit » ;-)

Il est évident que la manière de donner ces signaux est fondamentale : si le « couché » est utilisé pour interrompre quelque chose que le chien souhaite faire, il devient punitif, si le «assis » est donné après que le chien ait sauté sur vos invités et qu’il est, ensuite, renforcé, vous créez ainsi une jolie chaîne de comportements qui renforce le fait de sauter sur les invités.

article10

Si vous demandez quelque chose et que, face à l’inertie du chien, vous continuez de demander sans strictement rien changer dans l’environnement, vous construisez un signal qui devient « assis, assis, assis, assis » plutôt que, simplement « assis » (dans le premier cas, le chien finit par s’asseoir pour se débarrasser de la pression que vous êtes en train de créer)  :-|

En définitive, très peu importe ce que vous apprenez à votre chien, s’il doit faire donne la patte, cibler votre main ou faire couché quand les invités arrivent… ce qui importe c’est comment vous aurez appris un quelconque comportement.

Si vous vous dites que vos « assis » « couché » « débout » (ou tout autre comportement) pourraient être une meilleure nouvelle pour votre chien, considérez de changer vos signaux en reprenant l’apprentissage (pour ce que le chien en a à faire, ça pourrait être « fraise » «pistache » et «concombre » d’ailleurs).

Qu’un chien ait 150 comportements à son actif ou seulement trois, il peut être dans une émotion positive ou très désagréable quand ils ont donnés, selon quand, comment, ils sont donnés et comment ils ont été appris  :-D

Bref, le voyage est plus important que la destination :-D

Avoir une pochette pleine de « récompenses » n’est certainement pas suffisant ;-)

Happy training :-D

Il n’aime pas les friandises

Il existe des phrases qui sont le pain quotidien de l’éducateur canin et elles sont légion ;-)

Un grand classique de l’éducateur canin qui travaille essentiellement avec des renforçateurs alimentaires (pour faire simple « la friandise ») c’est «mon chien ne s’intéresse pas aux friandises»   :lol:

friandise1

… ce à quoi, je réponds le plus souvent « … pas encore »  :-D

friandise2

Précisons d’emblée qu’un être vivant qui ne mange pas est en danger : dans les zoos, le fait de ne pas manger correctement est souvent le premier signal d’alerte, qui précède souvent tout autre indice ou symptôme que quelque chose ne va pas (santé, anxiété, peur, méfiance, mauvaises conditions de détention) et il est immédiatement source d’inquiétude pour le soigneur consciencieux (quoi qu’on pense des zoos et autres parcs animaliers, il existe des soigneurs consciencieux). 

friandise3

J’héberge actuellement (momentanément) un perroquet sevré façon «McDonald», son assiduité et enthousiasme aux gamelles maison de graines germées, légumes, fruits (etc. etc.) que je lui prépare amoureusement restent pour moi la meilleure information (même si ce n’est pas la seule évidemment) de son bien-être général (en effet, je ne suis pas spécialiste du perroquet même si, en quelques semaines, mes connaissances rudimentaires ont augmenté de manière exponentielle). 

gamellePerrok copie

Ne pas « être motivé » par la nourriture est un concept inexistant : dès que votre chien se lève et marche vers sa gamelle, il est « motivé par la nourriture » (dans le cas contraire, il y a un ou des problèmes à considérer urgemment).  

friandise4

Je passerai brièvement sur le fait que cette affirmation arrive souvent alors que je me trouve face à un chien en léger (ou pas si léger que ça parfois) surpoids et, par conséquence, n’a pas une énorme motivation à produire des comportements pour un petit biscuit industriel inodore et insipide et dur comme un caillou (ce que certains propriétaires achètent souvent car « ça ne salit pas les poches »)  ;-)

Un conseil? Salissez vos poches et pochettes  :-D

Un chien en surpoids est, évidemment, un chien qui mange trop en relation à son rythme d’activité – quand la gamelle de croquettes est en « libre service », on a rarement l’impression de le voir manger goulument vu que, tout au long de la journée, il picore (et, à force, finit par trop manger). Par ailleurs, il est perpétuellement en train de digérer une alimentation qui n’est pas forcément la plus digestible possible  :-(

J’entends aussi souvent des clients m’affirmer que  «le véto a dit que son poids était bien comme ça » – n’oubliez pas que, au final, vous êtes les clients de votre vétérinaire et que, à moins d’une obésité morbide, son souci est souvent de ne pas vous vexer ou vous contrarier… il est fort possible que, quand il vous dit que « tout va bien comme ça » il n’ait pas envie de s’engager dans une croisade diététique qui vous mettrait peut-être dans des dispositions peu agréables  ;-)

Je vous suggère, dès lors, quand vous demandez à votre vétérinaire ce qu’il pense du poids de votre chien de l’informer que vous appréciez son avis réel et pas une version «courtoise» ou politiquement correcte de la chose  :-D

friandise5

Chez mes clients qui nourrissent BARF (c’est-à-dire frais et cru), le pourcentage quotidien qu’ingurgitent certains chiens menant une vie relativement sédentaire excède parfois celui de chiens qui sont de vrais sportifs : une simple baisse de ce pourcentage et pas mal de difficultés rencontrées par ces propriétaires se résolvent d’elles-mêmes  :-D

Il ne s’agit en aucun cas d’affamer le chien pour qu’il collabore avec nous mais il est évident qu’après un repas festif gargantuesque précédé d’un sérieux apéritif, je serai moins réceptive à des mignardises qu’après un repas normal ou léger (même si satisfaisant d’un point de vue nutritionnel). 

Vous aurez tous entendu parler du concept de « contrafreeloading »  (un comportement observé chez plusieurs espèces où le sujet, à qui on donne le choix de se servir librement de nourriture, choisit d’obtenir la même nourriture à travers des comportements).

On peut disserter longuement sur cette constatation qui semble peu intuitive (en effet, tout organisme cherche un effort minimal pour un résultat maximal) et on pourrait l’imputer, spécifiquement chez le chien, au plaisir d’interagir avec son propriétaire qui devient un renforçateur secondaire ou tertiaire (sauf que ce phénomène existe sans l’ombre d’un conditionnement préalable) mais il est intéressant de savoir que ce phénomène diminue avec l’augmentation de la faim il ne s’applique donc pas à des animaux « affamés » au contraire  ;-)

Au delà de la qualité, l’appétibilité d’une friandise et de l’appétit du chien, il y a l’art et la manière de la distribution à considérer. 

friandise6

En effet, utilisée comme « appât » (ou leurre) pour attirer le chien vers des activités ou des soins qu’on lui inflige, elle devient le signal de l’arrivée de quelque chose d’aversif (et devient, dès lors, une mauvaise nouvelle).

The Right Way to Do Lure Reward Dog Training

J’ai vu bon nombre de chiens montrer plein de comportements de stress face à la présentation de friandises fort appétissantes pourtant… le chien a intégré que quelque chose de très désagréable est en préparation.

Si vous sortez le « bonbon » du chien AVANT de lui imposer le bain qu’il exècre ou de débuter la pédicure qu’il redoute, vous transformez votre friandise en un signal d’alarme qui informe le chien que le pire va arriver…. d’où une méfiance considérable vis-à-vis de celle-ci.

Une méfiance qui, au fil du temps, peut se généraliser à tout environnement et situation – la peur se généralise très vite. 

Un renforçateur DOIT arriver APRES le comportement: il est une conséquence et pas un antécédent… quand on travaille avec un chien craintif, c’est absolument fondamental de vérifier que le chien (le chien, pas vous !) a vu, perçu ce qui fait peur pour, ensuite, l’associer à quelque chose de plaisant, pas l’inverse. 

friandise8

J’ai vu un jeune chien se précipiter dans la voiture dès que sa propriétaire sortait un ex-jouet adoré…

En effet, elle se servait de celui-ci pour attirer son chien sur du matériel d’agility où clairement, le chien n’était pas à l’aise.  Il était devenu l’information première du chien d’un moment anxiogène et contraignant.  A l’identique, ces méthodes anciennes de parsemer la « passerelle » ou la « balançoire » de friandises (le chien avance, capté par l’odeur pour s’apercevoir ensuite qu’on l’a emmené précisément là où il ne voulait pas aller). Sensibilisation, perte de confiance, méfiance envers les renforçateurs, voir envers la personne  :cry: 

Autre piège dans lequel nous tombons parfois, c’est la « surenchère » du renforçateur. Le chien ne produit pas de comportement avec la friandise X, on sort la friandise Y qui, elle, est plus appétente et, finalement, on finit par y aller avec Z, qui est le top absolu pour ce chien spécifique…

Certes,  il est plus que légitime (et même vivement recommandé) de prendre note que votre chien n’apprécie pas énormément X et seulement moyennement Y mais ne passez pas successivement de X à Z dans une même séance et contexte : votre chien aura vite fait de comprendre que, s’il ne participe pas, le salaire augmente (et donc pourquoi participerait-il  dès le départ ?)  ;-)

friandisesClicker

Des séances clicker training mal construites, improvisées sans « plan de shaping », un rythme de renforcement inadapté (et donc des critères trop exigeants) peuvent très bien finir par dégoûter votre chien de ces moments spécifiques… tout événement se voit associé à une émotion, attention  à celle que vous construisez, séance après séance. 

Shaping Plan

Dernièrement, je me suis retrouvée devant un chien très craintif au sujet duquel la propriétaire m’a tout de suite informée « oh, les friandises ne l’intéressent pas »… on a fini notre séance d’éducation avec un chien qui boulottait allègrement mes bouts de jambon-fromage et cherchait même à voler le contenu de ma pochette  :-D

Au début de notre rencontre, je me suis assise par terre, sans le regarder et j’ai joué avec mes « bonbons » tout en parlant avec la propriétaire. Après une dizaine de minutes, le chien s’est approché lentement de moi et j’ai lancé nonchalamment un bout de fromage… à partir de là, sur plusieurs séances de 2 minutes par séance,  il s’est mis à bosser avec moi en remuant la queue (à la stupéfaction de la propriétaire qui voulait, à tous prix, avoir la « marque du fromage »). 

friandise9

Je n’ai pas de fromage magique… le chien a surtout apprécié que j’enlève toute forme de pression de notre échange et la possibilité qu’il a eue d’avoir « le choix ». Interagir ou partir (il est parti quelques fois au début d’ailleurs, au moindre bruit extérieur… mais il est revenu). 

Le choix de mon critère à cliquer était évidemment plus que modeste et donc à la portée de ce chien très peu opérant. Nous avons ensuite pu continuer à travailler alors que le chien du voisin aboyait, ce qui, en temps normal, est son déclencheur ultime.

Si on vous servait du champagne à chaque fois que votre vie va mal ou que vous recevez une mauvaise nouvelle, il n’aurait pas pour vous cette dimension festive qui fait boire du champagne à tant de gens, sans même vraiment savoir s’ils aiment vraiment ça  ;-)

friandise10

Les éducateurs compétents en clicker training sont un peu les « rockstars » de la friandise – ils savent la manier, ils savent quand et comment l’utiliser, quand la donner et ils finissent souvent avec cette réputation du « bonbon magique »  qui fait que le chien travaille avec l’éducateur plus volontiers qu’avec le propriétaire alors que nous avons précisément la même chose dans nos pochettes respectives (mais, ce qui génial c’est que tout s’apprend)  :-D

On peut également se construire un chien qui veut bien manger mais donne l’impression qu’il n’est guère disposé à produire un quelconque comportement pour obtenir son « bonbon »…

Je vois beaucoup de mes clients, munis de pochette, tomber dans une distribution «mécanique »  : le chien les harcèle un peu, la friandise sort de la pochette presque machinalement (et ils écopent de ma candide question : « tu renforces quoi là ? »).

Je n’ai vraiment rien contre la friandise occasionnelle « pour la relation » (comme je l’appelle affectueusement)… bien au contraire, je la préconise et je l’applique à mes chiens assez souvent mais elle arrive malgré tout dans un moment où nous sommes en harmonie.

Par ailleurs, je reste convaincue que l’immense majorité des propriétaires renforcent bien trop peu souvent : nous avons tendance à considérer notre « bonbon » comme une espèce de légion d’honneur majeure qui n’est distribuée qu’en cas de mérite majeur  ;-)

friandise11

Quel gaspillage d’occasions de se construire un chien focalisé, attentif, calme, engagé, etc.

Le fait de renforcer souvent et avec générosité ne doit pas occulter le besoin de considérer ce qu’on est en train de renforcer.   

Quand certains de mes clients constatent mon rythme de renforcement, ils prennent peur…. « aaah mais, il faut donner aussi souvent que ça ? ».  

Oui, quand vous êtes en plein apprentissage, oui, pour éviter de voir arriver la frustration, oui pour éviter que votre chien se désengage, oui pour construire des comportements résistants à l’environnement, oui pour construire une émotion agréable, cent fois oui… mais toute friandise est là pour renforcer un comportement spécifique, malgré tout – elle n’est jamais distribuée sans réflexion, bien au contraire. 

En agility, on voit souvent des gens « tugger » avec leur chien de manière complètement irréfléchie, alors que ce jeu a une valeur immense pour leur chien – notamment quand le coach parle ou explique (question d’occuper le chien). Souvent, le jeu n’arrive pas suite à l’exercice pratiqué (on écoute le coach parce qu’on est polis) et arrive bien plus tard, alors que le chien nous a aboyé contre ou nous saute dessus (on sort le tug)  :-|

zoukjouet

La « contingence »  (c’est à dire la « liaison » entre un événement et un autre) est fondamentale quand elle doit faire office de renforçateur. 

Si votre chien n’est pas malade, s’il n’est pas soumis à un stress intense (autre sujet) et s’il «ne s’intéresse pas à la friandise », je vous le re-dis : la réponse est « pas encore »  :-D

Happy Training ☺  

Blazing clickers – Dog Event Science 2018

clicker

Dans ce qu’on appelle l’apprentissage des animaux par « marqueur » (clicker ou autre marqueur), cette procédure représente une communication que nous envoyons à l’animal pendant le processus d’apprentissage.

Le marqueur (que je vais désormais résumer à « clicker » par facilité de lecture, même si, évidemment, ce n’est pas l’unique marqueur possible) permet de marquer, avec une extrême précision (uniquement limitée par les compétences du « trainer »), un comportement spécifique et contribue à faire le lien entre ce comportement et sa conséquence. 

On l’appelle également « bridging stimulus » (bridge = pont) car il fait le lien (le pont) entre le comportement et sa conséquence.  Quand la conséquence est agréable pour l’animal, le comportement s’intensifie en fréquence d’apparition ou en force d’exécution ou les deux.

bridge

sans renforçateur, le click est un pont « vers nulle part »  :-D (Dr. Susan Friedman)

Pavlov et Skinner concluent, tous les deux, que pour qu’un renforçateur secondaire maintienne sa puissance, sa signifiance, chaque click doit être associé à un renforçateur. 

A l’identique pour Bob et Marian Bailey et leur infinie expérience de travail sur les animaux qui nous le confirment.

skinner

Il existe un épiphénomène que les anglophones appellent les « blazing clickers »  ;-) (est-ce la thématique qui est brûlante?). 

En très simple, quelques « experts » (ou non d’ailleurs) affirment qu’il ne serait pas nécessaire, voir qu’il serait contre productif d’associer chaque click à un renforçateur et que cette manière de faire (cliquer sans renforcer) obtiendrait (malgré tout ?) les résultats souhaités, voir, de meilleurs résultats.

Vu que cette thématique a été soulevée par le Dr. Simon Gadbois à Dog Event Science 2018, j’ai pensé apporter quelques explications à ce sujet… après, à chacun de se faire son opinion personnelle via, évidemment, des expériences personnelles appropriées (pas d’ambition évangélique chez moi)  :-D

dogevent

Que dit Gadbois ? que l’apprentissage arrive par la motivation et que la motivation est la résultante de l’anticipation.

Je suis toute prête à croire que notre organisme est plus intensément sollicité dans le processus de « recherche » du plaisir que dans le plaisir lui-même parfois ou, en tous cas, sollicité différemment.

ll reste que ce « seeking » ou « wanting » system dont parlent Panksepp et Berridge, s’il est très intense, ne promeut pas forcément le bien-être. 

wanting

C’est Gadbois lui-même qui a fait le parallèle avec l’addiction – j’en ai une justement : je fume (et j’adore fumer)   :mrgreen:

Si je suis privée de cigarettes sur une longue période (ou même pas si longue que ça), je suis à peu près certaine que mon cerveau est infiniment plus sollicité que quand, finalement, je l’allume et je tire dessus (liking system)  8-)

Toutefois, je suis tout aussi certaine que j’éprouve un plus grand bien être quand je fume que quand je cherche mes cigarettes partout sans les trouver  :-D

wanting

Peut-être, probablement que le « seeking » nous rend plus efficaces (puisqu’il sert à ça) mais nous rend-ils plus heureux ? sereins, détendus ? Je me pose la question.

Autre exemple donné par Gadbois – deux chats qui, selon son exposé à  Dog Event Science avaient été « renforcés » pour avoir touché une cible (un objet)… 

cats

On en déduit, assez logiquement, qu’ils ont reçu de la nourriture… (il parle bien de «récompense », j’ai vérifié sur notre support de cours).

Gadbois nous relate que les chats s’approchaient ensuite de l’objet qui ne leur avait valu aucun renforcement de préférence (ayant appris le comportement de toucher une cible à un nombre considérable d’espèces, j’étais très perplexe).

Jusqu’à ce que je me souvienne, post conférence, d’avoir lu cette expérimentation dans «Affective Neuroscience » de Jaak Panksepp… que je suis donc allée consulter.

Les chats ont reçu une stimulation cérébrale quand ils se rendaient dans une zone précise et pas de stimulation cérébrale quand ils se rendaient dans une autre… 

Panksepp lui-même relativise en n’excluant pas qu’ils aient pu développer une amnésie partielle suite aux stimulations et/ou que les dites stimulations cérébrales se soient finalement révélées aversives (personne n’est dans l’organisme du chat au fond). 

 Expérience des chats toute relative donc  8-)

Revenons à nos « blazing clickers »… via le papier de Martin and Friedman (2011).

  1. Le terme « click » fait référence à tout renforçateur conditionné utilisé dans l’apprentissage afin de renforcer de manière contigüe un comportement. Il est synonyme de renforçateur conditionné ou renforçateur secondaire, stimulus conditionné, bridge ou pont conditionné, marqueur d’événement et marqueur.
  1. Le terme « renforçateur » définit un renforçateur conditionné ou non qu’on exploite pour conditionner et maintenir la puissance de renforcement du click. Le mot renforçateur est remplacé, dans la terminologie courante, par le mot « friandise » ou « bonbon » – en effet, le plus souvent le renforçateur est de la nourriture.
  1. Le terme « blazing clickers » fait référence à la pratique de cliquer de manière répétée sans fournir un renforçateur immédiatement après.

 Blazing clickers 

Il est intéressant de constater que cette pratique est très répandue chez les « trainers » d’animaux sauvages captifs (zoos, aquariums, parcs animaliers mais également d’animaux domestiques en laboratoire), elle est très rarement préconisée dans les cours clicker training et relativement peu appliquée chez le chien de sport ou de famille.

Un des fondamentaux du clicker training est, précisément que « à chaque click, son renforçateur ».

Il existe bien des « agility people » qui cliquent tous les sauts et ne renforcement jamais mais, vu qu’ils travaillent avec des Borders pour qui travailler est déjà un énorme renforçateur en soi, je pense que nous sommes plus dans le comportement superstitieux qu’autre chose  ;-)

Les animaux captifs (zoos ou toute autre structure de ce style) n’ont guère d’alternatives gratifiantes en dehors de ces séances de « training » (le dauphin, dans son bassin où il s’ennuie prodigieusement, est certainement motivé à essayer encore… il n’a rien à perdre et quelque chose à gagner). Ils sont, parfois, légèrement sous alimentés également… pas systématiquement mais ça arrive  :roll:

(et, évidemment, tu repenses immédiatement à cette malheureuse Dawn Brancheau qui s’est fait dévorer justement… parce que Tillikum était en frustration ayant exécuté et PAS reçu de poisson).

orca

A l’identique avec le volatile dans une cage, mentionné pendant la présentation, qui picorait fortement sa cible (précédemment renforcée) alors qu’il n’y avait plus de renforçateurs à disposition : quelle autre option que cet unique comportement « payant »? et quel autre « choix » que de le mettre en pratique encore et encore, avec l’énergie du désespoir?  :cry:

Quand nous sommes enfermés dans un ascenseur en panne et que l’aide n’arrive pas, nous appuyons compulsivement sur le bouton « assistance » même s’il semble ne pas fonctionner… que pouvons-nous faire d’autre? et quelles sont nos émotions surtout?

ELEVATOR ALARM

Ce n’est de très loin pas le cas avec nos chiens qui, eux, ne sont ni affamés ni en privation de gratifications autres - ils peuvent aisément décider qu’aller ronger leur os ou renifler un trou de taupe est finalement tout aussi bien et demande moins d’efforts ;-)

Retriever with bone chewing

Ensuite : l’étude de l’apprentissage nous dit qu’un rythme de renforcement variable rend le comportement plus résistant à l’extinction et incite l’animal à produire plus de comportement afin d’obtenir son renforçateur.  

Quand cette information a atteint certains autres supporters de l’approche « blazing clickers », ils en ont déduit que cette « variabilité» s’appliquait uniquement au renforçateur primaire et pas au « bridge» (click).

A mon sens, c’est une piètre interprétation d’un concept clair  :roll:

En effet, en cliquant chaque comportement approprié et en distribuant un renforçateur sporadiquement, on n’est PAS dans un rythme de renforcement variable mais continu, techniquement parlant  (la seule chose qu’on accomplit c’est d’affaiblir le renforçateur secondaire). 

Pourquoi le font-ils alors ? Parce que cliquer est un renforçateur pour le trainer, il nous donne la preuve tangible que le comportement s’est vérifié, comme une confirmation pour nous-mêmes.

S’entendre cliquer 20 fois d’affilée est gratifiant pour l’humain, sans aucun doute, une manière de s’auto-congratuler  :-D

superstition

Revenons au papier de Martin et Friedman, 2011…

Martin et Friedman ont détaillé certains des points mis en avant par les supporters des «blazing clickers »…

Affirmation : le click est déjà un renforçateur (parfois juste aussi puissant, voir même plus puissant qu’un renforçateur secondaire), il n’y a pas besoin d’autre chose.

Remarques : 

  • Si le renforçateur secondaire est parfois aussi fort que le renforçateur primaire, il l’est parce que systématiquement associé à d’autres renforçateurs qui, justement, lui donnent sa puissance (sinon, il ne serait qu’un bruit sans signification)
  • Les renforçateurs primaires sont des renforçateurs par définition – alors que les renforçateurs secondaires ont besoin des primaires pour acquérir – et maintenir leur puissance et qualité de renforcement
  • A chaque fois qu’un click se produit sans être suivi d’un renforçateur, il perd un peu de sa capacité de se comporter comme un renforçateur
  • Si le click n’annonce plus l’arrivée du renforçateur, l’animal peut se mettre à chercher ailleurs dans l’environnement un signal prédictif de l’arrivée du renforçateur (comme la main du trainer qui s’approche de la pochette à friandises). L’animal peut se focaliser sur ce mouvement comme le « marqueur officiel » délaissant ensuite le click comme information non pertinente. 

Affirmation : les « blazing clickers » rendent le travail plus intéressant et moins prévisible pour l’animal

Remarques : 

  • Si la variété est, effectivement, importante, elle doit se situer dans les renforçateurs primaires et leur qualité, la difficulté des comportements travaillés et le rythme de la séance d’entraînement – pas par des clicks qui ne sont pas suivis par un renforçateur. 
  • Suite à des comportements marqués mais non renforcés, les animaux voient leur attention de dégrader (plusieurs comportements demandés successivement avec un click après chaque comportement correct et une unique, grosse récompense à la fin).

Affirmation : 

Le comportement sera plus résistant dans une approche de « blazing clickers » parce que sa résultante de renforcement variable procure l’excitation d’une machine à sous…

Remarques :

  • Un rythme de renforcement intermittent crée la persistance une fois qu’un comportement est bien établi et fluide mais, ne pas distribuer de renforçateur ne change rien au fait que, techniquement, on reste dans une dynamique de renforcement continu si on affirme que le click est un renforçateur (sinon, il n’est qu’un bruit sans signification et, dans ce cas, à quoi sert-il ?).
  • Quand on a besoin d’introduire une certaine persistance dans un comportement, il est préférable d’enseigner un comportement avec un rythme de renforcement continu et, ensuite, quand celui-ci est appris, passer à un rythme de renforcement variable. Chaque click reste associé à un renforçateur mais on demande graduellement plus de comportement, de durée, de persistance, d’affirmation.

Affirmation : 

L’approche du « blazing clicker » réduit la frustration et l’agressivité inhérente à la frustration parce que le chien ne s’y attend pas de manière automatique et systématique.

Réponse : 

  • Planifiez votre séance de travail avec des critères adéquats ou planifiez des séances plus courtes afin de minimiser / éviter de créer toute forme de frustration.
  • Nous avons des données qui confirment que ces clicks sans renforçateur favorisent l’apparition de comportements d’agression par frustration. 

Affirmation : 

Le clicker peut à la fois dire à l’animal qu’il a fait « juste » mais également qu’il doit continuer à faire ce qu’il est en train de faire. Le click peut avoir différentes significations.

Remarques :

  • Libre à vous de vous créer un « keep going signal » (continue à faire ce que tu fais) mais le click ne peut pas avoir 2 significations à la fois (tout comme le feu vert ne peut pas signifier « avance » et « reste sur place » à la fois). 
  • Un click qui implique « continue » et « le renforçateur arrive » est une communication plus laborieuse et créatrice d’une confusion inutile.

En clair, Martin et Friedman (2011), affirment clairement que chaque fois que nous cliquons sans renforcer, l’animal est soumis à une extinction qui diminue la portée du clicker, même identique son de cloche de Bob & Marian Bailey  :-D

Quand on clique un animal et qu’on associe le click à un renforçateur primaire (alimentaire), l’animal est à chaque fois soumis à un conditionnement classique (ou pavlovien). 

pavlov

Quand le stimulus conditionné est utilité de manière répétée sans le stimulus inconditionnel (donc click et pas de friandise), la réponse devient progressivement de plus en plus faible.

Ce processus s’appelle l’extinction (Chance, 2003). Plus un comportement aura été renforcé et plus il sera résistant à l’extinction.

En conclusion…   

Le matin, quand je rampe jusqu’à ma machine à café qui est un très gros renforçateur pour moi j’appuie sur un joli bouton vert et ma tasse se remplit de café qui me ramène à la vie.

Un joli renforcement négatif : en effet, mon manque de caféine, comme mon manque de nicotine d’ailleurs, me mettent dans un état d’inconfort – me débarrasser de cet inconfort fixe, très solidement, mon addiction au café (et à la clope, hélas).

coffee

Si c’est probablement ma première motivation à sortir du lit, c’est bien le café auquel j’aspire et certainement pas à la trépidante attente de savoir si, oui ou non, je vais obtenir mon précieux breuvage.  Si ma machine à café devait montrer le moindre « raté », non seulement j’en concevrais une intense frustration (la frustration s’apparente allègrement à la colère) mais un désir impérieux de rétablir les choses.

Je reconnais toutefois la puissance de mon « wanting system » qui, à Paris, m’a envoyée dans la rue déserte et toute seule à 6 heures du matin (à la recherche d’un café introuvable à l’hôtel)  :roll:

Le Dr. Simon Gadbois a suggéré le bénéfice de cette trépidante anticipation en imaginant que, quand il entend le click, le chien se dit « vais-je recevoir une friandise ou non ? » – ce qui l’engagerait à travailler plus efficacement (ce qui m’apparaît comme un audacieux pari).

Dans un labo, les chiens qui ne « performent » pas, sont écartés de l’expérimentation en définitive, les animaux captifs vont s’acharner faute de choix mais nos chiens? J’en reviens à l’option « je vais ronger mon os / je vais renifler le trou de taupe » cité plus haut. 

Quoi qu’il en soit, pour mes chiens, le click est une certitude inébranlable de voir arriver la friandise, pas une hypothèse, encore moins un pari.

La simple vue du clicker les branche, automatiquement, en mode travail (idem pour les friandises d’ailleurs).  

Cette dimension « prévisible » et « honnête » (je tiens mes promesses) est le fondement même d’une approche en clicker training.

Un dialogue fiable, un interlocuteur cohérent sur lequel on peut compter – n’est-ce pas la définition même de la confiance?

Evidemment, si je jouais aux machines à sous, je pourrais ressentir le grand frisson d’un hypothétique espoir de gain (je n’ai pas le goût du jeu, personnellement, et je ne ressens que l’irritation d’avoir gaspillé de l’argent) et accepter, peut-être, de ne rien gagner sans avoir envie de fracasser la machine.

slotmachine

Par contre, mon comportement de jeu s’arrêterait très vite après 2 ou 3 tentatives infructueuses (le mien, peut-être pas le vôtre… il existe bien des joueurs compulsifs qui se ruinent  dans ce type de jeu mais, là aussi, il y a des facteurs environnementaux majeurs à considérer). 

Et si gagnais de temps en temps ?

Je pense que mon comportement de jeu serait, effectivement renforcé mais toujours accompagné d’une forte d’irritation vis-à-vis de mes nombreux essais non renforcés.

A quel point mon comportement de jeu serait maintenu me semble individuel (motivating operations), environnemental et intimement relié au fait de gagner assez souvent ou pas très souvent (alors pourquoi pas ne pas gagner tout le temps ?).

Si, alors que j’ai très très soif, je mets 2 francs dans la machine parce que j’aspire à une canette de Coca Cola et que la machine ne distribue pas ma boisson, c’est essentiellement la frustration et la colère qui seraient mes émotions de base (et je ne remettrais pas 2 francs supplémentaires, encore et encore, dans l’hypothétique espoir d’obtenir ma boisson). 

cocavending

En clair, à vous de choisir – le clicker peut devenir une machine à sous, avec les émotions qui l’accompagnent (mais assurez-vous qu’il a le goût du jeu chevillé au corps ou des facteurs environnementaux propices) ou une machine qui distribue de manière tout à fait fiable, et gratifiante, le renforçateur auquel on aspire. 

 A mon sens, il ne peut pas être les deux, à vous de choisir  :lol:

Pour ma part, une émotion de prévisibilité, d’anticipation joyeuse et confiante sera toujours préférable à une anticipation fébrile, incompréhensible et souvent source de frustration  :lol:

happy

Au final, je pense sincèrement que tout « marche » (y compris certaines approches aversives d’ailleurs)… mais, outre au fait que le résultat ne peut être notre unique  préoccupation, quelle est la « added value » de cette option ?

A part économiser quelques centaines de grammes de fromage à l’année, je ne vois toujours pas  :roll:

En ayant dit tout ça, il est parfaitement vrai que je n’ai jamais pratiqué le « blazing clicker » et que, n’étant pas dans une optique de recherche (le bien-être de mes animaux me tenant plus à coeur qu’autre chose), je ne compte pas le mettre en pratique non plus – je vais devoir vivre avec mes « biais cognitifs » – comme la plupart d’entre nous  :lol:

Pour aller plus loin… 

Affective Neuroscience : the foundations of human and animal emotions (Jaak Panksepp)

Bailey, B., Bailey, M., (1998). « Clickersolutions Training Articles – Ratios, Schedules – Why And When ». Clickersolutions.com. N.p., Accessed 24 April 2016.

Chance, P., (2003). Learning and behavior (5th ed.). Belmont, CA: Wadsworth.

Egger, M. D., Miller, N. E., (1962). Secondary reinforcement in rats as a function of information value and reliability of the stimulus. Journal of Experimental Psychology, 64(2), 97-104.

Fernandez, E.J., (2001). Click or Treat: A Trick or Two in the Zoo. American Animal Trainer Magazine, 2, 41-44. Shedd Aquarium.

Langbein, J., Siebert, K., Nuernberg, G., Manteuffel, G., (2007). The impact of acoustical secondary reinforcement during shape discrimination learning of dwarf goats (Capra hircus). Applied Animal Behaviour Science. 103(1-2), 35–44.

Martin, S., Friedman, S.G., (2011, November). Blazing clickers. Paper present at Animal Behavior Management Alliance conference, Denver. Co.

McCall, C.A., Burgin, S.E., (2002). Equine utilization of secondary reinforcement during response extinction and acquisition. Applied Animal Behaviour Science. 78, 253–262.

Rilling, M., Caplan, H. J., (1973). Extinction-induced aggression during errorless discrimination learning. Journal of the Experimental Analysis of Behavior. 20, 85-92.

Smith, S.M., Davis, E.S., (2008) Clicker increases resistance to extinction but does not decrease training time of a simple operant task in domestic dogs (Canis familiaris). Applied Animal Behaviour Science. 110(3-4), 318-329.

Wennmacher, P. L. (2007). Effects of Click + Continuous Food Vs. Click + Intermittent Food on the Maintenance of Dog Behavior (Master’s Thesis). University of North Texas.

Williams, J.L., Friend, T.H., Nevill, C.H., Archer, G., (2004). The efficacy of a secondary reinforcer (clicker) during acquisition and extinction of an operant task in horses. Applied Animal Behaviour Science. 88, 331–341.

Zimmerman, D. W., (1957). Durable secondary reinforcement: Method and theory. Psychological Review. 64, 373-383.

Life is for learning / 2

« Le contrôle, une nécessité biologique »  par la Dr. Susan Friedman

En éducation canine, il n’est pas rare d’entendre, parfois sur un ton légèrement (ou résolument) moqueur : « ton chien est en train de t’éduquer »  :roll:

humans

Pourtant, il est à la fois logique et inévitable que cela se produise : tous, et nos chiens aussi, oeuvrons dans le sens d’une conséquence qui nous sera profitable, c’est le contraire qui serait aberrant  :lol:

En clicker training, nous rendons le comportement possible, nous signalons, l’animal produit et c’est un signal clair, pour nous, de cliquer et renforcer… un dialogue constant où, si le travail est bien fait, tout le monde trouve son compte (ajout personnel)  ;-)

pavlov

Nous fonctionnons tous sur une séquence « action ==> effet produit » qui va nous amener à répéter cette action… ou pas  :-)

Cela nous donne à la fois un certain contrôle sur notre environnement (nous choisissons) et un retour en terme d’information (« essaie encore » / « fais autre chose » / « abandonne »).

En effet, peu d’entre nous vont retoucher et retoucher encore un même objet qui vient les brûler  :-)

Imaginez un monde qui ne nous offrirait AUCUNE faculté de contrôler les conséquences de nos choix : une perspective véritablement terrifiante.

… et cela existe bel et bien, on le sait tous  :-(

Tous les jours, dans les media,  nous regardons, écoutons et lisons — avec plus ou moins de compassion, d’effroi et révolte — que des individus, des populations entières, des ethnies sont sujettes à ce type de frustration, de douleur et de colère : toutes les injustices de ce monde concernent cette incapacité  totale à contrôler un environnement hostile.  

justice

Toute forme d’injustice débute en retirant le contrôle à sa victime, en niant sa possibilité de choisir. Qu’il s’agisse d’animaux ou d’humains. 

Nous connaissons tous les renforçateurs primaires (naturellement renforçateurs et, donc, inhérents à la survie) – le contrôle en fait naturellement partie : en effet, que deviendrions-nous sans le contrôle de nous enfuir en cas de danger mortel ?  ;-)

Une étude sur des nourrissons de 4 mois a comparé deux groupes distincts sur l’intérêt qu’ils pouvaient porter à leur « mobile » musical (qui n’est pas un téléphone portable mais cette chose que tous les parents auront accroché, sous différentes formes, au dessus du berceau de notre progéniture).

mobile

Le premier groupe de nourrissons avait un contrôle direct sur le fonctionnement du mobile, le 2èmegroupe n’en avait pas et le mobile se mettait en mouvement de manière aléatoire (Watson, 1967, 1971).

Alors que, au début de l’expérience, le mobile provoquait sourires et mouvements chez tous les nourrissons, rapidement, seul le groupe de nourrissons qui avait un contrôle sur le mouvement de l’objet a continué à s’y intéresser de manière active.

Plus intéressant encore, le groupe de nourrissons qui pouvait contrôler le fonctionnement du mobile a montré une augmentation des comportements joyeux (sourires, vocalises, etc.) par rapport au groupe des nourrissons qui n’avaient aucun contrôle sur le fonctionnement de l’objet.

Si on se réfère, à l’étude britannique sur le contrôle en relation au « burn out » (mentionnée dans « Life is for learning 1″, ne pourrions-nous pas en déduire qu’un nombre grandissant de personnes dans notre monde a l’impression– justement – de ne rien contrôler du tout, de ne plus pouvoir choisir et de subir des circonstances qui les écrasent ?  Il n’y a qu’un pas à franchir entre cette constatation et le taux de « bonheur » dans certains pays.

happy

Un nombre impressionnant d’études sur les animaux (ouistitis, poules, veaux, cochons, etc.) démontre que, quand ces animaux peuvent contrôler, par un comportement préalablement appris, la chaleur, la lumière qui leur sont dispensées, leur comportement se révélait plus calme et moins agressif. 

Les animaux, comme les humains d’ailleurs, préfèrent qu’on leur donne un choix, même quand celui-ci n’apporte pas de plus value concrète (toutes les mamans savent qu’il vaut mieux dire « tu veux mettre tes chaussettes roses ou tes vertes ? » à son enfant récalcitrant plutôt que « mets tes chaussettes »)  :-)

socks

En maison de retraite, donner un certain nombre de choix aux résidents a démontré influencer l’humeur, la qualité de vie exprimée et la longévité (Leotti, 2010 – Langer, et al. 1976).

Sans même mentionner le concept du « contrafreeloading » (le fait que les animaux préfèrent obtenir de la nourriture sous forme de renforçateurs suite à des comportements appris, plutôt qu’en self service), maintes fois testé et répliqué sur les souris, les rats, les poules, les pigeons, les corbeaux, les gerbilles et les chats. Un concept qui s’applique à des animaux correctement nourris, en bonne santé et qui ne souffrent pas de la faim (un animal en privation sévère va se jeter sur la nourriture librement accessible). 

Manquer de contrôle sur son environnement est une source reconnue de stress (ce qui explique, par ailleurs, le faible taux de reproduction des animaux sauvages en captivité quand ils sont privés de comportements fondamentaux pour leur espèce).

Contraindre, lors d’une procédure vétérinaire par exemple, provoque une augmentation substantielle du rythme cardiaque et de la production de cortisol (aucun d’entre nous n’a besoin de connaître le taux de cortisol de son chien pour reconnaître ce stress). 

Ayant dit tout cela, la Dr. Susan Friedman nous rappelle que tout ne peut pas être un choix dans la vie de nos animaux et que si une approche la plus respectueuse possible est un but, nos animaux portent en eux la résilience nécessaire à la négation occasionnelle d’un choix.

La résilience fait cet heureux lien entre la contrainte totale et le choix absolu  :-)

resilience

En conclusion, nous sommes sur terre pour agir et donc choisir et non pas pour rester passifs et subir, cela nous concerne nous et cela concerne les animaux qui partagent nos vies.

choice

Le besoin de contrôler notre environnement est un concept inné, il fait partie de notre bagage biologique et il est le produit de notre évolution à travers les âges, quelle que soit notre espèce.

Avoir des choix, contrôler ce qui nous entoure nous est aussi nécessaire que boire et manger. 

A nous de savoir reconnaître quand l’animal dit non, l’écouter, à nous de faire des efforts pour mieux reconnaître ces refus et à nous de trouver une harmonie entre donner le choix et le « vivre ensemble »  :-)

« Life is for learning » / 1

… bref, je suis partie en Autriche suivre une conférence très joliment  intitulée « Life is for Learning » (la vie est faite pour apprendre… ou la vie est faite d’apprentissages ?).

Le savoir est le pouvoir  :-)

Happy-Fellow-KEY

C’est suite à un échange de messages avec Mary Hunter (dont je vous conseille sans réserve aucune le blog si vous ne le connaissez pas déjà, ce qui me surprendrait si vous lisez celui-ci) que j’ai découvert l’événement : passionnée de PORTL games, que j’ai introduit dans tous mes cours clicker depuis quelques années, je venais aux nouvelles au sujet de la sortie du manuel PORTL qu’elle nous promet depuis un temps certain (il n’est pas encore sorti, patience patience).

Si vous vous demandez ce qu’est le PORTL, rendez-vous sur l’article à venir à ce sujet, stay tuned ;-)

C’est donc Mary qui m’a informée de l’événement qui m’a donné l’opportunité bénie de la rencontrer pour la première fois  :lol:

Mary a un Master en Science du Comportement complété à l’UNT (University of North Texas, là où enseigne le Dr. Jésus Rosalez-Ruiz et  là où j’irai faire mes études dans ma prochaine vie ou dès que je gagne à la loterie dans celle-ci : en effet, la vie n’est-elle pas faite pour apprendre ?).

Elle y enseigne désormais en sus de ses nombreuses activités avec les animaux. Elle est de cette nouvelle génération de béhavioristes issue de la biologie qui contribuera, avec le temps, à faire de la science du comportement un acteur incontournable dans la compréhension du vivant. 

A la conférence,  présents également la Dr. Susan Friedman et le Dr. Jésus Rosalez-Ruiz…

Hélas (pour moi), j’avais déjà écouté l’intégralité de leurs interventions en d’autres occasions et lieux (y compris en ligne)  et, s’il est tout à fait vrai que, à chaque fois, on découvre une dimension supplémentaire aux notions présentées, j’ai été un peu déçue de découvrir que pas grand chose n’était nouveau.

… hey, ne vous méprenez pas : si je n’avais que ça à faire et (surtout, surtout) un budget illimité, je sautillerais avec délectation d’une conférence à une autre sans la moindre arrière pensée mais, comme le budget formations n’est pas extensible, pas plus que le temps que j’ai à y consacrer, je suis toujours avide de connaissances nouvelles.  

Fin du préambule  :-)

Cette conférence de quatre jours a donc été ouverte par la Dr. Susan Friedman (qu’on ne présente même plus), toujours avec son humour « coquin-mais-pas-trop » et sa voix si particulière (que je trouve incroyablement apaisante). 

Je vous conseille, encore une fois, si vous êtes comme moi un(e) geek du comportement, sa formation « Living & Learning with Animals for professionals » (uniquement si vous parlez bien l’anglais, car elle est exigeante et très dense).

J’ai le bonheur de l’avoir suivie et complétée il y a quelques années et c’est une des meilleures formations que j’ai à mon actif, un vrai petit bijou  :lol:

Susan a été clairement très marquée (comme beaucoup d’entre nous) par le livre de la Dr. Susan Schneider « The Science of Consequences » dont je vous ai déjà parlé dans ce blog et que je vous recommande encore une fois.  En effet, sa présentation « The Learning Planet » (la planète apprentissage) était largement inspirée de ses travaux.

Le message fondamental de cette présentation est que le comportement n’est JAMAIS indépendant des conditions environnementales – il n’est pas à « l’intérieur » d’un quelconque organisme mais toujours conditionnel et donc conditionné par l’environnement.

Pour nous éducateurs : votre animal n’est jamais « quelque chose » (buté, démotivé, motivé, gentil, méchant, etc.) mais agit par des comportements pour obtenir des conséquences et contrôler son environnement.

Quand on veut faire disparaître un comportement, on s’attaque à un renforçateur – plus l’animal est déterminé dans son comportement, plus le renforçateur est important pour lui. 

Ce qui est vrai pour la forme la plus simple de vie à la plus complexe : de la bactérie, les invertébrés à la plus complexe, c’est une organisation planétaire : agir pour un résultat. 

Plus l’organisme est complexe, plus sophistiquée sera sa capacité d’apprentissage et plus vaste son panel de renforçateurs. 

learning1

Une étude du gouvernement britannique qui n’étonnera personne je pense, a démontré une corrélation évidente entre notre capacité à contrôler notre environnement dans un contexte professionnel et notre santé physique et psychique (Mermot et al., 1978, 1991).

En effet, qu’est donc un « burn out » sinon une graduelle perte de contrôle (perçue ou réelle) sur notre environnement ? Quand nous avons l’impression de ne plus rien contrôler, de ne rien pouvoir changer, de devoir endurer et subir quoi qu’il nous en coûte, sans échappatoire possible, nous tombons malades (et nous allons mieux quand on reprend un certain contrôle). 

burnout

Une étude portant sur le « pacing » (comportement d’allées et venues des animaux captifs) chez les ours polaires a démontré qu’une distribution de nourriture « gratuite » et aléatoire ne réduisait en rien cette stéréotypie alors que la recherche volontaire de cette nourriture a apporté des effets positifs (Carlestead et al., 1996).

Cette recherche proactive,  leur a donné une forme de contrôle sur leur environnement avec un effet bénéfique considérable. A retenir quand nous parlons d’enrichissement de l’environnement : il est tel quand l’animal s’engage.

oui, je sais, ils seraient mieux dans leur environnement naturel… 

Contrôler son environnement, c’est-à-dire, décider et entreprendre dans le sens de conséquences désirables, est un renforçateur primaire.  

Comment ne pas en déduire qu’il est légitime de donner des compétences à nos animaux domestiques afin de leur permettre d’agir sur leur environnement par la pratique et mise en œuvre de ces apprentissages afin d’obtenir des conséquences opportunes à leurs yeux? 

Nos chiens vivent dans un contexte humain, plus ils auront d’apprentissages, plus ils obtiendront de liberté, plus ils obtiendront de la liberté et plus ils auront de contrôle sur leur vie.

Ce sont les conséquences qui créent la dite « motivation » et nous apprenons continuellement l’application de nouveaux comportements qui nous amènent à un choix   de renforçateurs de plus en plus vaste et riche. Plus nous acquérons de compétences, plus nous trouvons de renforçateurs dans notre environnement. 

learning2

Dans le contexte de cet article, être « vieux » à n’importe quel âge, n’est-ce pas tout simplement d’avoir abandonné la recherche de nouveaux renforçateurs?  8-)

henducks

Ce qu’on appelle l’instinct est continuellement affecté par les conséquences produites et les apprentissages : des canetons qui n’auraient pas entendu  les sons habituels de  leur espèce dans l’œuf et à qui on a passé des enregistrements d’une autre espèce, démontraient une préférence pour l’autre espèce.  La génétique est sensible à l’environnement et sujette à l’apprentissage. 

L’évolution et l’apprentissage marchent main dans la main et enfantent la « sélection» qui n’est rien d’autre qu’une conséquence. La nature sélectionne ce qui « fonctionne » au détriment de ce qui ne fonctionne pas. 

Dans la nature, un changement d’environnement va causer une sélection des réponses comportementales qui, à son tour, va influencer le bagage génétique…

Les parasites des plants du tabac ont appris à éviter certains insecticides quand ils ont été associés à un autre stimulus et 77% de leur progéniture savait, dès la naissance, éviter le même aversif.

On a mis des moustiques dans une machine qui reproduit l’agitation de nos mains (quand on essaie de chasser ces charmantes bestioles) et on a associé ces vibrations avec une odeur spécifique : les moustiques ont appris à éviter cette odeur (et on retenu l’information pendant plus de  24 heures).

J’ai moi-même toujours observé que, dès que j’empoigne la tapette à mouches, plus de mouches pendant plusieurs minutes.

La fascinante flexibilité de tout ce qui est vivant…

On ne peut pas changer un ADN : par contre, si l’environnement est modifié, le comportement l’est également et le comportement peut modifier le cerveau. 

En gros, et c’est passionnant, nous (comme tout ce qui est vivant) ne sommes pas les victimes inertes et sans contrôle de l’évolution : nous expérimentons continuellement des conséquences qui vont, à terme, influencer notre évolution future. 

Nous humains, nous émerveillons constamment de la capacité d’une quelconque espèce à apprendre alors que c’est un mécanisme fondamental à toute survie.

J’avais déjà lu un article absolument passionnant au sujet des apprentissages chez les plantes mené par Monica Gagliano (cliquer ici, en anglais) – des plantes qui ont appris à suivre une émission d’air indiquant la direction vers un renforçateur primaire (la lumière, indispensable pour elles).

Par la suite, ces mêmes plantes suivaient l’émission d’air même quand celle-ci ne les emmenait plus vers la lumière (parlons donc d’écologie cognitive – qu’est-ce donc d’autre que de l’apprentissage ?).

Les apprentissages deviennent des compétences, les compétences nous permettent d’agir sur notre environnement et donc de le contrôler dans notre intérêt et pour notre bien-être.

« Une fois que le vivant, tout le vivant, a pu apprendre des conséquences, la vie ne fut plus jamais la même »

(Dr. Susan Schneider).

earth

Nous vivons tous sur la « planète apprentissage » 

L’apprentissage sans erreurs

ou « errorless learning » :-D

Préambule 

L’apprentissage sans erreurs est une approche qui a été introduite Charles Ferster, psychologue, dans les années ’50 dans le cadre de recherches sur l’apprentissage.

B.F. Skinner a aussi énormément contribué au concept et a écrit : « … les erreurs ne sont pas une fonction de l’apprentissage et vice versa et elles ne doivent pas être imputées à l’apprenant. Les erreurs sont le résultat d’une piètre analyse du comportement, d’un piètre plan de shaping qui évolue trop vite d’une étape à une autre et ne se focalise pas sur les prérequis indispensables à une réussite spécifique ».

Plusieurs étudiants de Skinner ont continué sur cette lancée : en 1963, Herbert Terrace a publié une étude décrivant une expérience de discrimination de formes et couleurs avec des pigeons. Il travaillait à minimiser la réponse émotionnelle en cas d’erreur dans un apprentissage par conditionnement opérant.

… fin du préambule  :-D

Pyramid made of tick marks and yellow lamp.

Il y a très (très) longtemps, dans un cours d’agility, alors que mon jeune chien réussissait fort bien ce qu’on lui demandait, le coach du jour m’a fait monter le critère (le point de succès ou, plus simplement, notre exigence vis-à-vis de la performance du chien), à une allure telle que, rapidement, il ne pouvait que se confronter à l’échec… ce qui est évidemment arrivé et semblait réjouir le coach considérablement (contrairement à moi).

A la vue de ma mine dépitée face à cette approche, il m’a dit « comment veux-tu qu’il fasse la différence entre ce qui est juste et ce qui est faux s’il ne fait jamais faux ? Il ne peut pas faire toujours juste ».

Parce que mon coach était convaincu de travailler en « positif », il m’a suggéré de ne pas dire « non » au chien mais d’employer un autre mot comme « zut » « oups » ou « raté », selon lui moins « aversif » qu’un « non » tonitruant (ou qu’un coup de batte de baseball, on en convient aisément)  :lol:

Si on est tout à fait sincères toutefois, on veut faire tester au chien la différence entre un renforcement positif et une punition : en effet, en quelques répétions seulement, votre «oups» ou «raté» (ce qu’on appelle communément un « non reward marker » – un marqueur d’erreur)devient une information parfaitement aversive.

Imaginez-vous acteur dans un jeu télévisé : quand vous répondez juste, on entend un «jingle » immédiatement suivi d’un billet de mille euros.

Quand, au contraire, vous répondez faux, on entend un « buzzer » et rien n’arrive.

En très peu de répétitions, le « buzzer » causera chez vous une émotion parfaitement désagréable (même si personne ne vous assène un coup de batte de baseball : dans l’absolu, si vous receviez en prime un coup de batte de baseball suite au buzzer, vous finiriez rapidement par ne plus répondre du tout).

Cette émotion précisément (frustration, irritation, dépit, tristesse, etc.) sera très vite associée au buzzer et, si elle se répète trop souvent, versus le jingle qui annonce la réussite (et le renforçateur), elle s’étendra à l’activité entière («ce jeu n’est pas drôle» ou «je suis nul»:-(

… et donc, mon chien, mis en situation de « essaie toujours » a, évidemment, fini par faire faux, puis encore faux et faux encore – suscitant en moi (puisque je ne vais pas parler des émotions de mon chien que je ne peux prétendre connaître), une certaine irritation envers l’activité elle-même, le coach et, admettons-le, vis-à-vis de mon chien également  :-|

Au niveau du comportement de mon chien (qui lui est observable et quantifiable) –il s’est mis à renifler le sol avec une grande attention, comme si une odeur sublime avait soudainement fait son apparition (un clair « je n’ai plus envie de jouer avec toi »).

A force « d’erreurs » induites, suivies de divers « ratés », on crée avec une touchante application une réponse conditionnée à un signal, à une activité précise (dans ce cas, l’agility), à un environnement, voir même à une personne (moi en l’occurrence).

Et, comme si ça ne suffisait pas, on crée la mémoire du comportement inapproprié.

En dessous, une intéressante vidéo du Dr. Tedd Judd, professeur de psychologie. Elle est en anglais et, si vous êtes anglophones, je vous conseille de la visionner en entier.

Je la résume pour ceux qui ne sont pas copains avec la langue de Shakespeare

Il mentionne un de ses patients qui souffre d’une perte de mémoire suite à un accident.

Lors d’une séance, il demande au patient « vous souvenez-vous de mon nom ? » et le patient répond par la négative, il ne s’en souvient pas.

Le professeur incite donc le patient à se lancer « essayez quand même » et le patient lui répond « euh, Dr. Smith ? ».

Le praticien lui répond « non, je suis le Dr. Judd ». La séance suivante, il répète sa question «vous souvenez-vous de mon nom ? » et, encore une fois, le patient répond « non ».

Le praticien l’incite encore à « se lancer » et le patient répond « c’était pas Dr. Smith ? » et la réponse arrive « non, je suis le Dr. Judd ».

A leur troisième rencontre, le patient aperçoit le Dr. Judd et l’apostrophe allègrement «hey, bonjour Dr. Smith ».

Son cerveau a « appris » ce qu’il a le plus souvent répété, encore et encore, plutôt que la «bonne réponse ».

dommage

Je le dis souvent à mes clients : plus votre chien met en pratique un comportement et plus celui-ci devient son comportement « par défaut », celui qu’il retient (à considérer chez le chien qui déclenche et déclenche encore sur un quelconque élément de son environnement).

Quand on me répond « mais je ne peux pas l’empêcher de déclencher au jardin » (par exemple), je n’ai pas de baguette magique à vous fournir (il vous faudra limiter la visibilité du chien ou opter de ne plus le laisser seul au jardin en train d’aboyer cent millions de fois sur les passants car ce comportement spécifique, utilisé encore et encore, devient comme un muscle sur entraîné et surpassera tous les autres, moins fréquents).

barking

Prenons l’exemple de l’apprentissage d’une marche en laisse sans tirer, une des principales préoccupations de nombreux propriétaires : la plupart des procédures, méthodes et techniques (considérées comme « positives ») impliquent que le chien tire malgré tout d’abord : un comportement qu’on s’évertue ensuite à mettre sur extinction (c’est-à-dire qu’on veut faire disparaître le comportement de « tirer »), avec des résultats souvent peu probants.

dogpulling

La voie royale reste encore de rendre un comportement probable et de le renforcer (marcher à la hauteur de la cuisse de l’humain).

Dans une séance de shaping, une approche « sans erreurs » ne peut être construite sans un plan de shaping réfléchi, écrit, pensé et maintes et maintes fois revu (parfois).

think

Les gens travaillent souvent au clicker de cette manière « essayons toujours, on verra bien ce que ça donne » - ce qui est la porte (grande) ouverte à l’erreur, à la répétition de l’erreur (parfois encore et encore) et, au final, à l’irritation de l’humain qui conduit la séance…

… avec, en prime, un double effet Kiss-Cool : mémorisation de l’erreur ET réponse conditionnée frustrante à un exercice, un signal voir au travail de manière générale  :roll:

Un apprentissage sans erreurs est un but vers lequel on doit  travailler en réfléchissant à l’environnement, aux erreurs possibles (afin de les rendre improbables), pour – en définitive – réduire la difficulté et le temps d’apprentissage et, donc, construire un comportement qui, une fois rattaché à un signal, se comportera comme un renforçateur secondaire, fort de son historique de réussite et de confiance.

Happy Training

Il ne le fait pas « pour toi »…

SkinnerLove

« Il ne le fait pas pour toi, il le fait pour la friandise » : voilà comment certains asphyxient de leur jugement sans nuance les tentatives encore incertaines de ceux qui débutent dans une approche des apprentissages renforcés positivement.

Pour tempérer, certains arrivent en expliquant qu’un renforçateur (qui, dans ces groupes de discussion s’appelle toujours « récompense ») ce n’est pas « que la friandise mais aussi la caresse ou le jeu » (ouf, on est sauvés) afin de rassurer la personne en proie à ce doute atroce : « mon chien, bosse-t-il POUR MOI ou pour le petit morceau de fromage ? »

Passons aussi sur le fait que, nous humains, mangeons et ripaillons sans complexe aux naissances, aux fêtes religieuses (même quand on est un mécréant de première d’ailleurs), aux anniversaires de naissance, de mariage et même aux enterrements.   A peu près tous les moments importants – ou tout simplement plaisants, même les plus anodins –  de nos vies comportent une relation à la nourriture  d’une manière ou d’une autre ☺ 

Car le problème véritable et profond est de savoir si le chien se montre à ce point désintéressé pour « travailler » avec nous (ou pour nous) avec une abnégation absolue ou si, finalement, il n’est qu’un affreux petit opportuniste qui se mobilise uniquement si et quand une friandise est attendue?

En clair : nous aime-t-il « inconditionnellement » ?

Au delà de la technicité et la mécanique du clicker training (où la friandise est la conséquence d’un comportement et jamais son antécédent : en clair, c’est le comportement qui fait arriver la friandise et pas le contraire), au delà d’une approche au leurre, souvent conspuée et pourtant parfois tout à fait apte à diminuer le stress de manière générale, la question est bel et bien philosophique chez certains.

Elle s’inscrit dans cette vision parfois très poétique que nous avons du chien.  

« Fidèle » quoi qu’il en soit et qui qu’on soit et qui nous aime plus qu’il ne s’aime soi-même — ce qui lui confère une dimension sanctifiée tout à fait particulière à laquelle certains tiennent dur comme fer  :lol: 

En effet, on ne peut pas dire que l’amour inconditionnel coure les rues dans notre espèce  :-)

unconditional

L’amour « inconditionnel » est présumé ne rien demander en retour, absolument rien : ce qui m’apparaît comme une option peu raisonnable personnellement et qui implique potentiellement un léger souci d’estime de soi et de ses besoins personnels, je suis plutôt du genre pragmatique… un peu comme les chiens  ;-) 

Je ne pense pas que le chien n’attende rien en retour dans sa relation à l’humain… il demande qu’on comble ses besoins fondamentaux et moins fondamentaux et, parfois, spécifiques à sa race et, quand on ne le fait pas, les problèmes de comportement arrivent presque inévitablement (certes, il ne s’en va pas mais en a-t-il vraiment le choix au final?)

Je ne pense pas qu’un chien soit « fidèle » quoi qu’il arrive : j’ai récupéré un chien perdu dans la nature qui, en apercevant ses propriétaires chez qui je l’ai évidemment ramené, a ressauté dans mon coffre avec conviction et a pris son air le plus dépité possible quand on a du le rendre, contre son gré, à sa « vraie famille » (il n’a pas eu un très improbable coup de foudre pour ma personnalité charismatique mais, ayant peur de le perdre pendant notre balade, je l’ai gavé de dés de jambon pendant 4 heures créant probablement chez lui le premier historique de renforcement de sa vie).

Les besoins physiologiques et de sécurité comblés, arrivent les autres besoins (cognitifs notamment). 

Le clicker training active des circuits émotionnels fondamentaux au bien-être : celui de la compréhension de l’environnement (indispensable à tous les animaux, domestiques ou sauvages d’ailleurs) et celui du jeu… ce sont bel et bien ces émotions (qui favorisent la production d’hormones à l’effet euphorisant) qui rendent les chiens « accros » à un apprentissage bien présenté et maîtrisé, via cette minuscule friandise qui les réjouit et engage dans un premier temps. Il ne s’agit pas d’une distribution désordonnée de friandises mais planifiée et réfléchie. Il y a des conditions assez strictes au renforcement positif – que ses détracteurs ignorent complètement le plus souvent  8-) 

En répondant à toute cette panoplie des besoins de nos chiens, se construit ce qu’on appelle la « relation » – une myriade de renforçateurs qui, les uns après les autres, la rendent solide et empreinte de confiance mutuelle (« you are good news »). 

Ils ne sont guère différents de nous car, avec nos meilleurs amis, nos compagnons et compagnes, tous ceux que nous apprécions nous partageons également un historique de renforcements parfois kilométrique et qui, en raison de sa solidité, de ses répétitions innombrables, supporte parfois quelques coups de canifs occasionnels s’ils ne sont pas trop méchants (quand les coups de canifs deviennent répétés ou trop violents, étrangement, même les grandes amitiés s’arrêtent). A moins de confondre amour et dépendance, nous fonctionnons considérablement de la même manière  ;-)

Même notre action la plus désintéressée en apparence, est gratifiante, parce qu’elle nous apporte cette émotion confortable qui nourrit l’estime que nous avons de nous-mêmes…

feelinggood

Nous passons l’intégralité de nos vies à essayer d’échapper à des conséquences néfastes ou désagréables et à rechercher celles qui seront agréables, gratifiantes et plaisantes. Tout ce qui est gratifiant produit de la dopamine et votre cerveau va chercher à reproduire le comportement en question. 

C’est ce qu’on appelle communément le conditionnement par apprentissage opérant et qui nous motive même quand on croit que le conditionnement est un gros vilain mot

Quand vous bossez/jouez avec votre chien, au delà de l’apprentissage d’un quelconque comportement, vous lui apprenez, surtout et avant tout, si faire des choses avec nous est quelque chose de gratifiant, qui est générateur de bonheur, de confiance en soi, de confiance en nous ou, au contraire, source de stress, de frustration, d’ennui ou de mal être : à partir de ces conclusions, notre chien « aimera » travailler avec nous ou nettement moins.

On en fera un partenaire enthousiaste ou ce qu’on appelle un chien « distrait » « démotivé » « têtu » « borné » et mille autres étiquettes rassurantes (pour notre estime de nous-mêmes avant tout).

Ne vous culpabilisez pas, ne laissez pas les autres vous culpabiliser si vous souhaitez construire  la relation à coups de renforcement – c’est l’unique voie qui existe finalement et, peut-être, est-ce précisément ça « l’amour » ? ☺

gooddog

« Qu’est donc l’amour sinon une autre définition du renforcement positif ou vice versa? » (B.F. Skinner) 

Travailler du chapeau…

hats

Dans une autre vie, je travaillais dans une multinationale et si j’ai souvent eu envie d’ouvrir un blog sur les tribulations d’une anarchiste dans l’âme dans cet étrange milieu (que j’ai cordialement détesté) – rendons à César ce qui lui revient, elle m’a mis en contact avec des gens intéressants, très souvent.

Parce que ma hiérarchie s’est soudainement éprise de la méthode et de son auteur, nous avons vu débarquer, à Lausanne, un certain Edward de Bono (passons sur ma première question à mon patron qui me parle de «Bono » et à qui j’ai demandé s’il voulait vraiment faire venir le chanteur de U2….c’était pas lui, dommage) – auteur de la célèbre méthode des six chapeaux (« The 6 Hats Method »).

six-chapeaux_image

L’idée était de favoriser l’énergie créatrice et la résolution des problèmes lors des interminables réunions dont était fait notre quotidien – laisser une chance aux idées nouvelles sans les voir enterrées d’office parce que nouvelles. 

Bref, ce célèbre monsieur a débarqué des USA avec sa joyeuse équipe au grand complet et je n’oublierai jamais la vision de son bras droit, une femme d’une quarantaine d’années, qui dansait et virevoltait seule sur une gigantesque scène sur des musiques des « sixties » devant un parterre de cadres supérieurs médusés et complètement immobiles (elle leur avait d’ailleurs lancé un « ohhhh, you Europeans are soooo stiff » qui avait suscité chez moi une grande hilarité à cette époque).

Rigides ou pas, nous avons ensuite tous été sommés d’utiliser la méthode des chapeaux, dont le mode d’emploi était donné en réunion, sous forme de petites cartes élégantes imprimées à grands frais et mises en évidence dans tous les bureaux et salles de réunion (pour la petite histoire, peu de temps après l’hypothétique révolution des « 6 hats », les petites cartes sont restées dans un coin pendant que tout le monde reprenait ses vieilles habitudes tranquillement – la pensée latérale était clairement au dessus des forces de nos cadres supérieurs).

 Pour vous donner une idée (merci Wiki)les codes des chapeaux de couleur :

Le Chapeau blanc : la neutralité. Lorsqu’il porte le chapeau blanc, le penseur énonce des faits purement et simplement. C’est l’image de la froideur et la simplicité : le minimalisme.

 Le Chapeau rouge : la critique émotionnelle. Lorsqu’il porte le chapeau rouge, le penseur rapporte les faits teintés d’émotion, d’intuitions et de pressentiments. Il n’a as à se justifier auprès des autres chapeaux, le rouge c’est le feu, la passion, l’émotionnel et l’intuitif.

Le Chapeau noir : la critique négative. Lorsqu’il porte le chapeau noir, le penseur émet des objections qui soulignent les dangers, les risques en relation à l’idée. C’est l’avocat du diable, la prudence, le négatif.

Le Chapeau jaune : la critique positive. Lorsqu’il porte le chapeau jaune, le penseur admet ses rêves et ses idées les plus folles. Ses commentaires sont toujours constructifs et visent l’action. C’est le soleil, l’optimisme.

Le Chapeau vert : lorsqu’il porte le chapeau vert, le penseur provoque, cherche des solutions alternatives. Il s’inspire de la pensée latérale, il imagine une autre manière d’envisager le problème. Il sort des sentiers battus et propose des idées nouvelles. C’est la fertilité des plantes, la semence des idées, le renouveau.

Le Chapeau bleu : le meneur de jeu, l’animateur du groupe qui canalise les idées et les échanges entre tous les autres chapeaux. C’est le bleu du ciel qui englobe tout.

Cette approche « managériale » peut tout aussi bien s’appliquer en éducation canine et il est assez passionnant de déterminer sous quel chapeau votre client est installé et quel est le nôtre (et, en ce qui nous concerne, il est surtout intéressant de s’évertuer tous les chapeaux, un à un, tour à tour).

fluffy

En effet, prenons une propriétaire qui s’adresse à l’éducateur canin… elle vous appelle parce que Fluffy son caniche de 5 ans, récupéré d’une première famille, « aboie toute la journée, ne reste pas seul et veut mordre le voisin » : « il a certainement été frappé par un homme » – ajoute-t-elle  ;-)

« J’ai déjà tout essayé  et rien ne marche » vous dit-elle pour finir, « de toute façon, il est dominant ».

 Pour mieux comprendre, on peut, tour à tour, endosser tous les chapeaux  :lol:

 Le chapeau blanc (je ne peux pas écrire en blanc sur fond blanc) 

whitehat

L’absence de couleur, la neutralité s’attache uniquement aux faits. On reste donc neutre et objectif, en évitant l’interprétation.

A nous éducateurs canins de faire la part de ce qui est un fait (avéré), versus une opinion personnelle ou une anecdote peu significative.

  • Fluffy aboie (la propriétaire l’a entendu)
  • Fluffy aboie toute la journée (a-t-il été enregistré sur plusieurs heures ? comment le sait-on?)
  • Fluffy est un caniche (il a des papiers)
  • Fluffy est peut-être un caniche croisé (il n’a pas de papiers)

 Le chapeau rouge

redhatL’émotion se passe de justifications – la chapeau rouge nous informe sur comment la personne « se sent », ou ce qu’elle « ressent » rien de plus mais rien de moins et on doit en tenir compte absolument.

Si la propriétaire pense que Fluffy est « dominant », rien ne sert de balayer cette croyance d’une référence scientifique – si la propriétaire y croit, cela va influencer tout votre travail.

Le chapeau noir

blackhat

On reste dans la logique (qui n’est pas forcément objective d’ailleurs). Le chapeau noir est négatif mais sans émotions, c’est un pessimisme qui se veut réaliste.

Nos clients portent souvent le chapeau noir : « j’ai déjà tout essayé » (et rien n’a fonctionné), « j’ai déjà vu 3 éducateurs avant vous, vous savez », « j’ai déjà dépensé une fortune pour Fluffy», « tous les caniches sont collants, y’a rien à faire », « il est trop vieux pour changer » (etc.).

Le chapeau jaune

yellowhat

Le chapeau jaune respire l’optimisme : il pousse à l’espoir. Il n’est pas forcément créatif d’ailleurs (l’optimisme n’inclut pas, automatiquement, la créativité).

Quand votre propriétaire porte le chapeau jaune, il vous dira « Fluffy n’a jamais mordu le voisin quand même », « il suffit que je le garde en laisse après tout » mais également « je vais le faire castrer, ça va arranger les choses, ça a marché pour le chien de ma voisine », « il est gentil, je sais qu’il ne mordra jamais».

Le chapeau vert

greenhat

Avec le printemps, arrive le vert : le chapeau vert trouve des idées, des concepts, il est créatif et novateur. Il est à l’aise avec ce qui n’a jamais été essayé.

Les sessions « portons notre chapeau vert » sont utiles quand toutes les parties le portent en même temps – éducateur et propriétaire, à deux, on peut inventer des solutions, en écarter certaines, en retenir d’autres.

Lors d’une formation aux USA (Legacy Canine), nous avions fait une séance « chapeau vert» sur un mot tiré au hasard du dictionnaire… si certains concepts ou idées sont éminemment farfelues, d’autres avaient créé des associations d’idées intéressantes. 

Le chapeau bleu

bluehat

L’éducateur canin dans toute sa splendeur : il englobe tout (le bilan de santé donné par le vétérinaire, le bilan comportemental d’un éventuel vétérinaire comportementaliste et une possible médication, les objections et les limites de l’entourage, celles de l’environnement, les besoins du propriétaire, ses attentes, la connaissance des lois locales, etc.), il est comme un chef d’orchestre.

En outre, il fait le tri des informations données par les autres chapeaux et, à partir de là, dessine le chemin à suivre.

Prenez en considération ce que vous auront dit les chapeaux – apprenez à les reconnaître, à les porter, un après l’autre, écrivez vos conclusions  et mettez votre chapeau bleu  :-D 

Happy Thinking  :-D

Médicaments, le dernier recours?

 

La médication en thérapie comportementale, le dernier recours ?

Sujet évidemment sensible tant il suscite, chez pas mal de monde, une réponse ultime, absolue et peu nuancée… alors que, en comportement, TOUT est nuance justement  ;-)

relatif

Toutefois, je comprends ces réactions épidermiques de refus sans difficulté, tant l’idée semble, au premier abord, rebutante (j’avoue que, au fil des années, j’ai révisé mon approche et opinion). 

baddogsjoke

On parle, clairement, de médicaments psychotropes, délivrés exclusivement sur ordonnance par un vétérinaire (et pas de moyens dits « naturels » tels que la caséine, la L-théanine, les phéromones, l’homéopathie, les fleurs de Bach et autres précurseurs naturels de la sérotonine plus ou moins efficaces).

Evidemment, la médicalisation au sein d’une thérapie de modification du comportement est du seul ressort du vétérinaire comportementaliste, pas celui de l’éducateur donc, a priori, pas le mien  :lol:

Sauf que – dans la réalité du quotidien – c’est à nous que s’adresse, souvent en premier lieu, le propriétaire aux prises avec ce chien qu’on ne peut même plus sortir pour aller faire pipi alors qu’on habite en appartement, ce chien qui aboie pour tout et rien mille fois par jour, qui a des phobies handicapantes, qu’on ne peut plus sortir en voiture, qui agresse les autres chiens ou les humains… bref, qui constitue un danger pour les autres et pour lui-même.

dogblanket

Nous sommes ceux qui reçoivent et écoutent longuement, ce propriétaire à bouts de nerfs, de motivation, pris entre l’affection bien réelle qu’il porte à son chien (sinon, il ne serait pas là) et son exaspération parfois extrême car complètement désemparé par ce qu’il vit depuis des semaines, voir des mois ou même, parfois, des années. Ces personnes ont, souvent, à leur actif, un long parcours de promesses de « méthodes » et protocoles prometteurs qui n’ont rien changé et le scepticisme qui en découle  :roll:

Nous sommes ceux qui aident le propriétaire à jongler entre l’inévitable deuil à faire du chien « sympa et facile » et la motivation indispensable pour aider leur sujet réactif, voir hyper réactif ou tellement craintif que passer le seuil de l’habitation requiert une stratégie hautement élaborée, sans compter les inévitables échecs qui dépriment et démotivent (le «on ne va pas y arriver » fataliste et défaitiste).

reactif

Nous sommes là pour mettre en évidence le plus petit embryon de progrès, le célébrer, ne pas laisser ce début de succès se diluer dans la marée du chemin encore à parcourir.

Ce sont d’ailleurs des cas extrêmement lourds en termes d’énergie mentale et affective pour l’éducateur également et c’est toujours du « sans garantie » (petite mention ironique, je l’admets sans complexe, à ces « collègues » qui promettent des résultats « rapides et définitifs » à prix d’or d’ailleurs, confirmant à tout professionnel digne de ce nom leur ignorance absolue en comportement). 

S’il existait une approche ultime et garantie de modification du comportement, on se demande pourquoi les prisons sont pleines, les psychiatres se trompent régulièrement dans leur évaluation de la dangerosité de certains individus, etc.  

Le comportement, reste l’étude unique d’un cas dans un environnement et aucune réponse ne saurait être universelle et infaillible  ;-)

Moi aussi j’aimerais bien une méthode magique pour perdre dix kilos en avalant force chocolat et fromage mais, quoi que l’idée me semble tout à fait attrayante et même au-delà, mon réalisme foncier me sauve d’acheter le « thé magique » vendu à prix d’or sur internet  8-)

Modifier une émotion et, donc par voie de conséquence, modifier le comportement est un chemin qui ne connaît aucun raccourci, jamais (à moins, évidemment, de ne viser QUE la disparition temporaire du comportement gênant et de se contenter d’un chien inhibé et contraint et encore, le plus souvent ça tient le temps de tourner leurs vidéos promotionnelles).

 … et c’est là que, parfois, se pose la question d’une médication  :-)

La peur est une très vilaine émotion, n’importe quelle personne anxieuse comprendra cette phrase sans que je développe ultérieurement et longuement.

SHUTDOWN

Observer un chien couché au sol dans une mare de bave et qui n’ose plus bouger me remue au moins autant que de voir un chien physiquement blessé : les deux souffrent de la même manière, les deux ont besoin d’une aide urgente et efficace.

Quand on parle de psychotropes, il faut faire la distinction entre les médicaments à prendre au quotidien (comme la fluoxétine par exemple) – la molécule doit être constamment dans le système du chien pour faire son effet : ses effets s’observent, le plus souvent, après 3 ou 4 semaines après le début du traitement.

Ensuite, il y a les médicaments que l’on donne de manière ponctuelle (comme le Xanax par exemple) qui sont donnés chez les chiens qui souffrent de phobies au sujet de certains bruits par exemple (comme l’orage).

Ils font effet rapidement mais on un effet « sédatif » clairement plus important que les premiers. Ils créent une accoutumance et il faudra souvent augmenter les doses avec le temps. Avant de grimacer, je me dois de mentionner cette chienne qui lors d’un orage, à traversé une fenêtre fermée en panique (se blessant évidemment au passage), une autre qui s’est démontée la mâchoire pour sortir de la cage où elle était enfermée  :-|

La chimie du cerveau d’un chien qui considère certains déclencheurs comme une menace mortelle est telle qu’aucun apprentissage constructif et profitable n’est possible en l’état.

Dans un monde parfait et idéal, le chien ne serait jamais exposé à ce qui le terrorise et donc pourrait se passer de médication et apprendre dans un milieu « sécurisé », en augmentant l’exposition de manière rigoureusement contrôlée.

stressed

Sauf que, dans la vie réelle, c’est rarement possible, voir jamais (car il faut sortir le chien ne serait-ce que pour ses besoins physiologiques, il faut aller chez le vétérinaire, on ne peut pas vivre en reclus sans jamais recevoir d’inconnu, on ne peut pas contrôler les tirs, les feux d’artifice et la météo, on doit prendre la voiture, etc. etc.)

Les médicaments ne résolvent strictement rien, seuls.

Ils diffèrent (plus ou moins longtemps) la réponse comportementale du chien (qui réagit donc moins vite) et son intensité (il réagit moins intensément). Ce qui aide considérablement la mise en place d’une stratégie comportementale qui reste absolument indispensable et incontournable.

clicker

Comme ces ordonnances viennent obligatoirement d’un vétérinaire (choisissez-le avec la spécialisation en comportement de préférence), il saura prendre en considération une éventuelle pathologie, notamment au niveau du foie et discuter avec vous des possibles effets secondaires et de la posologie. 

Pour conclure, je précise que cette décision n’est jamais prise par pure « convenance » ou à légère et que, chez mes clients, elle a toujours fait l’objet d’une véritable réflexion dans l’intérêt premier de leur animal, avant même le leur (il est par ailleurs difficile de dissocier les deux). 

Comme toujours, une collaboration et communication franche et efficace entre propriétaire, éducateur et vétérinaire comportementaliste, chaque acteur respectant l’autre pour ses compétences, représente la meilleure option à prendre parfois sans tarder et non pas comme celle du « dernier recours » pour, parfois (mais pas toujours hélas) pouvoir, ensuite, s’en défaire  ;-)