Tous les articles par Cynthia

Le « NRM » – on en parle?

fail1

Il y des questions qui reviennent régulièrement sur la table et suscitent une curiosité légitime en apprentissage… le NRM est, décidément, une de ces thématiques qui fait systématiquement l’objet de questions en stage ou pendant mes cours ou sur les pages d’éducation canine  ;-)

kesako

Qu’est-ce donc que le NRM avant tout ?

C’est, en anglais, le « non reward marker » ou, en français, « le marqueur de non renforcement »  : en plus clair, ce petit mot que bon nombre d’éducateurs utilisent et préconisent, du style « oops », « raté » « non » ou autre mot qui informe le chien, de manière présumée pacifique, que ce qu’il vient d’effectuer n’est pas ce que nous attendions.

On parle donc d’un marqueur (un mot spécifique, toujours le même) qui annonce au chien que le renforçateur (la friandise, le jeu ou autre) n’arrivera pas.

Tout comme le clicker annonce l’arrivée de choses plaisantes, le NRM annonce qu’elles n’arriveront pas  ;-)

noreward

Si cette thématique revient sans cesse, c’est généralement pour connaître la « valeur ajoutée » de cette pratique, en clair « mais est-ce que ça marche ? », c’est ce que voudraient savoir mes stagiaires en général  ;-)

Au delà de la valeur ajoutée, la question principale reste pour moi « cette pratique est-elle compatible avec une éducation dite positive » ?

Les éducateurs qui emploient ce fameux NRM, expliquent souvent que tout est information et que l’information est rassurante pour le chien : il reçoit un feedback immédiat sur ce qu’il vient de faire et pourrait, dès lors, éliminer cette action comme inefficace pour en adopter une autre.

Dans ce sens, le feedback serait rassurant et non punitif.

feedback

En effet et dans l’absolu, un « ne va pas par là » devrait être presque aussi utile qu’un « va par là » (presque, parce qu’évidemment, le « ne va pas par là » ne vous informe en rien sur le chemin à prendre). 

Avoir le plan de tous les pièges à ours dans une forêt est tout aussi utile qu’un plan qui vous montre le chemin à suivre… vous traversez la forêt en évitant les pièges (seule votre émotion change quand vous passez votre temps à éviter un aversif plutôt qu’à surfer sur un chemin sécurisé).

afraid

Je donne souvent l’exemple d’un jeu télévisé où, quand vous donnez une bonne réponse, vous obtenez un « jingle » qui vous annonce des gains et, en cas de mauvaise réponse, un «buzz » qui lui vous annonce clairement qu’aucune forme de récompense ne va arriver.

Si vous vous imaginez dans la situation où vous allez entendre le « buzz » encore et encore (et encore)je vous laisse imaginer votre émotionnel au moment où celui-ci se déclenche ?

Resteriez-vous neutre ? Ne modifie-t-il pas votre état émotionnel ?

J’en doute fortement.

depité

Le « buzz » sera conditionné à un état d’esprit spécifique qui, à mon sens, ne génère ni joie, ni envie d’entreprendre.

Il n’est pas punitif, me dit-on  ;-)

Difficile à croire pour moi… si on s’en tient à la définition même de la punition.

Une punition est quoi que ce soit qui, arrivant immédiatement après un comportement, diminue la fréquence de ce comportement à l’avenir, elle est, par définition aversive.

Un aversif conditionné est un quelconque stimulus qui, au départ est neutre (n’a pas de signification particulière, tout comme le clicker au départ n’en a pas non plus) mais qui, rattaché de manière systématique à quelque chose de déplaisant, devient également déplaisant (si je me réfère encore une fois à mon « buzz », il devient très rapidement aversif vu qu’il me prive de quelque chose que je souhaite ardemment obtenir).

Que la punition « fonctionne » est un fait en science du comportement (en effet, on ne peut parler de « punition » que quand le comportement a diminué – c’est donc le comportement futur qui va nous informer si ce que nous avons entrepris était punitif ou pas, que nous l’ayons fait volontairement ou pas).

En conséquence, si le NRM « fonctionne », il est par définition punitif (puisqu’il diminue la fréquence d’apparition d’un comportement) et s’il n’est pas punitif, il ne sert à rien ☺

logique

L’idée du NRM véhiculé de manière complètement neutre chez les êtres de langage et d’émotion que nous sommes me laisse plus que perplexe et dubitative : j’entends trop d’éducateurs s’éclater dans des « yeeeesss » ou « ouiiiii » euphoriques pour croire, un seul instant, que le « raté » ou le « oops » ne véhicule aucune émotion ☺

… et, si nous y mettons notre émotion, comment imaginer qu’elle n’influence pas, à son tour, l’émotionnel du chien ?

On pourrait concéder à la réflexion qu’un minimum d’émotion désagréable n’est pas un drame insurmontable s’il sert une stratégie spécifique qui doit emmener le chien vers le succès mais, en clicker training, il n’a jamais été question de laisser l’animal patauger dans l’erreur sans le moindre feedback, bien au contraire.

Refaire, encore et encore, la même chose en s’attendant à un résultat différent est, à mon sens, la plus grossière erreur qu’on peut commettre en clicker training.

Dès la première erreur, une modification de la stratégie (du shaping plan) s’impose immédiatement.

think

L’erreur est amplement utilisée par certains éducateurs et pas des moindres : « laissez-le sortir de la cage » (il va prendre la porte dans la poire) « laissez-le essayer de prendre les friandises dans la main »  (votre main se ferme devant le nez du chien)… dans tous ces cas, on voit clairement le chien détourner la tête, cligner des yeux, reculer imperceptiblement ou franchement aboyer sur l’éducateur  :-|  (encore vu dernièrement dans une vidéo d’une très célèbre trainer). 

bref, tous les signes de la frustration imminente ou déjà très présente.

frustrated

Personnellement, je ne le préconise absolument pas… dans une séance de clicker training, votre chien n’apprend pas juste le comportement que vous êtes en train de travailler mais il se fait une idée très précise de ce que signifie le fait de travailler avec vous.

L’erreur génère du stress et de la frustration, une diminution de la réponse (moins de comportement), voir, chez certains chiens, l’apathie totale (les pessimistes ou ceux qui ont un peu trop dégusté la punition dans le passé et, pour qui, le NRM est devenu le signal de l’arrivée imminente d’une punition plus musclée).

L’erreur ne génère ni enthousiasme ni envie, ni joie ni confiance.

Pour finir, parfois le NRM se métamorphose dans un espèce d’ultimatum « fais ça ou tu vas voir » – comme le « un-deux-trois » de nos parents qui nous façonnaient à ne répondre qu’au fatidique « deux et demi » ☺

doit

Je me rappelle d’une personne qui, en agility, répétait « raté » d’un ton de plus en plus excédé à son chien lors de ses erreurs successives (mais ne changeait absolument rien à ce qu’elle était en train de faire) avant de mettre le chien en voiture (ce qu’elle estimait être une punition et que, personnellement, je soupçonnais fortement d’être un magnifique renforcement négatif).

Je n’ai jamais vu son comportement évoluer dans le sens qu’elle souhaitait  :roll:

Ce qui ouvre tout grand la porte à la construction d’un comportement superstitieux : si le chien réussit ensuite (parce qu’elle aurait modifié la position de son corps par exemple, je peux vous en parler moi qui suis une si piètre conductrice), le « raté » prend une valeur qui n’existe pas dans les faits mais il sera considéré comme efficace par l’humain qui l’utilise.

superstition-1-638

Il est tout à fait plausible d’imaginer que, pour certains chiens ultra motivés dans une quelconque activité (notamment sportive), l’utilisation d’un NRM ne diminuerait pas la réponse des comportements suivants mais l’erreur, et la répétition et le manque de renforçateur, sont stressants même pour ces chiens et je doute que le travail en soit amélioré, au contraire.

Avec d’autres chiens, l’échec est dévastateur et le NRM suffit amplement à les désengager du travail.

Entre frustration et apprentissage sans erreurs (ce qui est évidemment un but à atteindre) à travers la modification immédiate d’une stratégie après un click manqué, mon choix est rapidement fait… et vous ?

Happy Training (avec ou sans NRM)  :-D

qu’importe le flacon…

article1

Il y a quelques jours, au hasard d’un statut Facebook, j’ai lu que demander « assis, couché debout » au chien était une preuve de notre besoin de contrôle et de domination sur celui-ci…

Si je peux parfaitement comprendre le concept que voulait certainement véhiculer ce statut, je l’ai trouvé symptomatique  d’une certaine conception du chien de compagnie (et, là dedans, j’inclus tous nos chiens sportifs et qui se consacrent, avec plus ou moins de plaisir et bonheur, à toutes les activités canines existantes sous le soleil).

Je me suis souvenue de ma présence à la SPA il y a bon nombre d’années, pendant que j’attendais patiemment l’employé qui devait me rendre mon chat égaré et retrouvé (et de fort méchante humeur par ailleurs, pas l’employé… mon chat) et que j’ai donc assisté aux dernières minutes d’une adoption : un Monsieur, trente secondes après avoir pris possession de la laisse à laquelle était attaché un jeune et grand chien fraîchement adopté, lance un très tonitruant « au pied !» :roll:

article9

Le chien qui avait l’air de comprendre cet « au pied » à peu près comme je comprends l’hébreu, a continué à faire ce que fait un chien de SPA fraîchement sorti de son box… à savoir, bondir dans tous les sens et tirer pour sortir de l’immeuble au plus vite (laisse = bénévoles plus ou moins compétents qui viennent me sortir de mon box, youpiiie).

article2

Le « au pied » est devenu plus péremptoire avec une 2ème tentative. Au 3ème « ordre » (le ton employé était tout à fait celui d’un chef de régiment), le chien s’est pris une secousse magistrale sur son collier :roll:

Oreilles qui se plaquent contre le crâne, queue qui descend, regard furtif : le chien accuse le coup… mais pas longtemps, il en a vu d’autres, et recommence à faire le fou cinq secondes plus tard  :roll:

Le Monsieur a quitté la SPA laisse très courte, tout en continuant de claironner un « au pied/au pied» non seulement parfaitement inefficace (vu qu’il n’est pas rattaché à un quelconque apprentissage) mais qui n’allait pas tarder à être associé à la crainte et à la douleur.

article4

Cet « ordre » restera porteur de ces émotions peu agréables, tant il est vrai que Pavlov «est toujours sur notre épaule» et que quelles que soient les couches de conditionnement qu’on va ensuite tenter de mettre par dessus par la suite, cette émotion ne s’en ira pas :-|

Si cet « au pied » est suivi d’une panoplie « d’ordres » tout aussi bien transmis, l’émotion néfaste risque allègrement de s’étendre à l’humain même qui la cause (ce qui ne va pas faciliter la vie du chien mais pas, non plus, celle du « maître »).

Tous les êtres vivants sont programmés pour réagir plus vivement et de manière plus définitive à ce qui est aversif (en clair : tout ce qui fait mal, peur ou met notre bien-être ou notre vie à mal ou carrément en danger) plutôt que à ce qui est agréable et positif.

Les raisons éthologiques sont parfaitement évidentes : si vous « ratez » un danger mortel, il n’y aura pas de 2ème chance de faire mieux, si vous ratez quelque chose de plaisant, c’est certes dommage, mais vous êtes toujours en vie et donc tout à fait susceptible de retrouver une autre gratification ou la même, répétée  ;-)

C’est un mécanisme de survie 8-)

Si ce chien finit par comprendre (malgré l’incohérence de son « maître ») que, pour échapper à cette secousse sur ses cervicales, il peut se tenir tranquille, il est possible que cela fonctionne et que le chien « obéisse » comme unique moyen de contrôle de son environnement (savoir comment échapper à la douleur et pouvoir le faire est un contrôle de son environnement en effet).

Avoir compris comment échapper à quelque chose de très déplaisant est plutôt une bonne affaire et peut donner des chiens très « obéissants »…

Si je vous donne un mode d’emploi pour échapper à une punition, disons « quand la lumière bleue s’allume, asseyez-vous pour éviter une secousse électrique » – vous m’en serez un peu reconnaissants… c’est déjà ça, personne n’a envie d’être électrocuté :-|

article5

Par contre, vous allez vivre dans la crainte et l’attente de cette lumière bleue, vous ne serez jamais serein, jamais tranquille, jamais détendu – il vous faudra toujours contrôler l’apparition de la lumière bleue et vous la redouterez (mais vous allez vous asseoir quand elle apparaît).

Pour un peu que vous ne n’ayez pas cru mon « mode d’emploi » sur parole, vous aurez pris la secousse la première fois et la lumière bleue vous fera peur pour le restant de vos jours  :-|

Tout ça pour en arriver au concept que, pour le chien « assis » « couché » « debout » mais également « twist », « roule » ou « donne la patte » sont juste des comportements, tous logés à la même enseigne a priori :lol:

learning

A savoir, l’humain émet un son que j’ai appris à reconnaître je produis un comportement il y a une conséquence = apprentissage (et une émotion qui s’y attache, inévitablement, toujours).

Ce qui, en apprentissage bienveillant, serait plutôt : je produis un comportement je l’associe à un son de l’humain conséquence plaisante (et ce signal devient un renforçateur secondaire).

Un signal qui aura valu une ou des punitions au chien ne sera jamais un renforçateur secondaire et, si vous l’incluez dans une chaîne de comportements, vous allez vite vous en apercevoir :-|

chain

Je travaille avec suffisamment de clients pour constater, encore et encore, que nous sommes ceux qui faisons cette distinction très humaine entre « obéissance » et « ludique » et nous ne la faisons pas à moitié  :lol:

Les « assis, couché, debout, reste, pas bouger » sont rarement véhiculés joyeusement et la menace est souvent limpide pour le chien, dès le début.

article7

Je le constate pratiquement tous les jours : on dit « twist » d’un ton joyeux et amusé et, si le chien fait « rouler-bouler » à la place parce que le signal n’est pas encore tout à fait en place, on en rit volontiers (« c’est pas bien grave »)  :lol:

Par contre, quand on dit « couché » au chien, c’est très souvent (presque toujours) d’un ton de sergent-major en pétard et on est dans une dynamique « d’ordre » et sûrement pas d’information, encore moins d’une opportunité de renforcement :-|

Je travaille souvent avec des chiens très craintifs, avec qui nous mettons tout en œuvre pour minimiser leur anxiété : arrive le mot de « rappel » (par exemple) et il est, dès le départ, tellement péremptoire et stressant, qu’il ressort comme celui à éviter absolument (tu as l’air fâché, je préfère rester éloigné).

article6

D’où l’utilité, puisque NOUS sommes des êtres verbaux (contrairement au chien) d’utiliser un terme qui nous met dans une émotion différente, comme « bingo » ou « bonbon » (ou ce que vous voudrez qui est, pour vous, rattaché à une émotion agréable)  ;-)

Si je dis « reste » à mon chien parce qu’une voiture va arriver, c’est sérieux : il en va de sa vie (notez qu’on peut le mettre en laisse).

Moins important pour le chien mais souvent très important pour nous, si je te dis « reste» en cours collectif d’éducation, je veux montrer à tout le monde que j’ai bien éduqué mon chien (et, donc, que je suis un humain compétent et capable, ce qui est gratifiant)  :-D

Ce que démontre le chien (ou pas) en faisant ce qu’on lui demande.

Si, justement, il n’exécute pas (parce qu’il a appris dans votre cuisine ou votre jardin et que l’apprentissage est trop léger pour résister à la présence de congénères, d’inconnus, des effluves de taupes que lui signale sa truffe), nous entrons immédiatement dans un mode « désobéissance » assez peu indulgent ;-)

bad

Pour des raisons morales, philosophiques, logiques, utilitaires la plupart d’entre nous sommes (plus ou moins) convaincus du bien de l’obéissance aux « lois » et du fait qu’elles sont nécessaires à la sécurité et nous protègent contre les risques et le mal – au moins autant que nous avons appris à craindre la sanction (légale ou la simple réprobation sociale).

…pour le coup, les quelques humains entre nous qui sont moins régis par ce besoin d’approbation sociale et le revendiquent vont souvent s’enorgueillir d’avoir un chien « mal élevé », « créatif » ou « rebelle » (nos définitions).

article8

C’est la preuve (par notre chien, ce qui assez amusant) que nous ne sommes pas des abrutis de l’obéissance, des fondus de la discipline, des obsédés de l’ordre convenu et du contrôle de l’autre et que nous reconnaissons la « liberté » du chien d’être lui-même.

Notons que cette interprétation du monde a ses limites à moins de vivre dans un désert… en effet, il y aura toujours un moment où nous serons obligés de limiter la liberté du chien (tout comme la nôtre d’ailleurs ou celle de nos enfants), ne serait-ce que pour sa sécurité et celle des autres (ou pour nous éviter des ennuis, aussi).

Tout le monde reste parfaitement libre d’enseigner 150 comportements à son chien ou d’en enseigner deux ou trois parce qu’ils sont nécessaires.

Il n’en reste pas moins vrai que travailler sur un comportement, est travailler sur un comportement et une même identique démarche quel que soit ce comportement :-D

Un « twist » peut être aussi solide, bien appris, renforcé, qu’un « reste » (ou autre « ordre ») et inversement.

Un « reste » peut être aussi fun, solidement attaché à du renforcement et donc à une belle émotion qu’un « rouler-bouler » et inversement.

Nous seuls faisons la distinction entre « important » ou « accessoire », entre « chien obéissant » et « chien rigolo » (ou « de cirque » pour les détracteurs), entre chien qui sauve des vies et chien qui fait du dog dancing… pour le chien, tout ça n’est QUE comportement (et émotion rattachée à celui-ci) :-D

trick

Si votre chien apprend « assis » « couché » « debout » de la même identique manière (haut taux de renforcement, renforcer la durée, un signal de libération clair, pas de menace ressentie) qu’il apprend des comportements ludiques – ces mots seront à tout jamais rattachés à une émotion agréable, plaisante — et donc souhaitable — et leur apparition dans votre langage sera tout à fait la bienvenue, un « feu vert » vers un renforçateur et quand, plus de renforçateur systématique, le comportement lui-même sera devenu un renforçateur secondaire, fort de sa portée émotionnelle positive (ou le contraire, évidemment).

Si tous les comportements de votre chien sont appris de cette manière, les produire sur signal est une excellente affaire pour le chien et, s’il ne les fait pas, à vous de vous demander si l’apprentissage est vraiment terminé, s’il est généralisé, conceptualisé, flexible ou encore uniquement inhérent à un contexte précis.

Bref, il faut encore travailler plutôt que « mon chien désobéit » ;-)

Il est évident que la manière de donner ces signaux est fondamentale : si le « couché » est utilisé pour interrompre quelque chose que le chien souhaite faire, il devient punitif, si le «assis » est donné après que le chien ait sauté sur vos invités et qu’il est, ensuite, renforcé, vous créez ainsi une jolie chaîne de comportements qui renforce le fait de sauter sur les invités.

article10

Si vous demandez quelque chose et que, face à l’inertie du chien, vous continuez de demander sans strictement rien changer dans l’environnement, vous construisez un signal qui devient « assis, assis, assis, assis » plutôt que, simplement « assis » (dans le premier cas, le chien finit par s’asseoir pour se débarrasser de la pression que vous êtes en train de créer)  :-|

En définitive, très peu importe ce que vous apprenez à votre chien, s’il doit faire donne la patte, cibler votre main ou faire couché quand les invités arrivent… ce qui importe c’est comment vous aurez appris un quelconque comportement.

Si vous vous dites que vos « assis » « couché » « débout » (ou tout autre comportement) pourraient être une meilleure nouvelle pour votre chien, considérez de changer vos signaux en reprenant l’apprentissage (pour ce que le chien en a à faire, ça pourrait être « fraise » «pistache » et «concombre » d’ailleurs).

Qu’un chien ait 150 comportements à son actif ou seulement trois, il peut être dans une émotion positive ou très désagréable quand ils ont donnés, selon quand, comment, ils sont donnés et comment ils ont été appris  :-D

Bref, le voyage est plus important que la destination :-D

Avoir une pochette pleine de « récompenses » n’est certainement pas suffisant ;-)

Happy training :-D

Il n’aime pas les friandises

Il existe des phrases qui sont le pain quotidien de l’éducateur canin et elles sont légion ;-)

Un grand classique de l’éducateur canin qui travaille essentiellement avec des renforçateurs alimentaires (pour faire simple « la friandise ») c’est «mon chien ne s’intéresse pas aux friandises»   :lol:

friandise1

… ce à quoi, je réponds le plus souvent « … pas encore »  :-D

friandise2

Précisons d’emblée qu’un être vivant qui ne mange pas est en danger : dans les zoos, le fait de ne pas manger correctement est souvent le premier signal d’alerte, qui précède souvent tout autre indice ou symptôme que quelque chose ne va pas (santé, anxiété, peur, méfiance, mauvaises conditions de détention) et il est immédiatement source d’inquiétude pour le soigneur consciencieux (quoi qu’on pense des zoos et autres parcs animaliers, il existe des soigneurs consciencieux). 

friandise3

J’héberge actuellement (momentanément) un perroquet sevré façon «McDonald», son assiduité et enthousiasme aux gamelles maison de graines germées, légumes, fruits (etc. etc.) que je lui prépare amoureusement restent pour moi la meilleure information (même si ce n’est pas la seule évidemment) de son bien-être général (en effet, je ne suis pas spécialiste du perroquet même si, en quelques semaines, mes connaissances rudimentaires ont augmenté de manière exponentielle). 

gamellePerrok copie

Ne pas « être motivé » par la nourriture est un concept inexistant : dès que votre chien se lève et marche vers sa gamelle, il est « motivé par la nourriture » (dans le cas contraire, il y a un ou des problèmes à considérer urgemment).  

friandise4

Je passerai brièvement sur le fait que cette affirmation arrive souvent alors que je me trouve face à un chien en léger (ou pas si léger que ça parfois) surpoids et, par conséquence, n’a pas une énorme motivation à produire des comportements pour un petit biscuit industriel inodore et insipide et dur comme un caillou (ce que certains propriétaires achètent souvent car « ça ne salit pas les poches »)  ;-)

Un conseil? Salissez vos poches et pochettes  :-D

Un chien en surpoids est, évidemment, un chien qui mange trop en relation à son rythme d’activité – quand la gamelle de croquettes est en « libre service », on a rarement l’impression de le voir manger goulument vu que, tout au long de la journée, il picore (et, à force, finit par trop manger). Par ailleurs, il est perpétuellement en train de digérer une alimentation qui n’est pas forcément la plus digestible possible  :-(

J’entends aussi souvent des clients m’affirmer que  «le véto a dit que son poids était bien comme ça » – n’oubliez pas que, au final, vous êtes les clients de votre vétérinaire et que, à moins d’une obésité morbide, son souci est souvent de ne pas vous vexer ou vous contrarier… il est fort possible que, quand il vous dit que « tout va bien comme ça » il n’ait pas envie de s’engager dans une croisade diététique qui vous mettrait peut-être dans des dispositions peu agréables  ;-)

Je vous suggère, dès lors, quand vous demandez à votre vétérinaire ce qu’il pense du poids de votre chien de l’informer que vous appréciez son avis réel et pas une version «courtoise» ou politiquement correcte de la chose  :-D

friandise5

Chez mes clients qui nourrissent BARF (c’est-à-dire frais et cru), le pourcentage quotidien qu’ingurgitent certains chiens menant une vie relativement sédentaire excède parfois celui de chiens qui sont de vrais sportifs : une simple baisse de ce pourcentage et pas mal de difficultés rencontrées par ces propriétaires se résolvent d’elles-mêmes  :-D

Il ne s’agit en aucun cas d’affamer le chien pour qu’il collabore avec nous mais il est évident qu’après un repas festif gargantuesque précédé d’un sérieux apéritif, je serai moins réceptive à des mignardises qu’après un repas normal ou léger (même si satisfaisant d’un point de vue nutritionnel). 

Vous aurez tous entendu parler du concept de « contrafreeloading »  (un comportement observé chez plusieurs espèces où le sujet, à qui on donne le choix de se servir librement de nourriture, choisit d’obtenir la même nourriture à travers des comportements).

On peut disserter longuement sur cette constatation qui semble peu intuitive (en effet, tout organisme cherche un effort minimal pour un résultat maximal) et on pourrait l’imputer, spécifiquement chez le chien, au plaisir d’interagir avec son propriétaire qui devient un renforçateur secondaire ou tertiaire (sauf que ce phénomène existe sans l’ombre d’un conditionnement préalable) mais il est intéressant de savoir que ce phénomène diminue avec l’augmentation de la faim il ne s’applique donc pas à des animaux « affamés » au contraire  ;-)

Au delà de la qualité, l’appétibilité d’une friandise et de l’appétit du chien, il y a l’art et la manière de la distribution à considérer. 

friandise6

En effet, utilisée comme « appât » (ou leurre) pour attirer le chien vers des activités ou des soins qu’on lui inflige, elle devient le signal de l’arrivée de quelque chose d’aversif (et devient, dès lors, une mauvaise nouvelle).

The Right Way to Do Lure Reward Dog Training

J’ai vu bon nombre de chiens montrer plein de comportements de stress face à la présentation de friandises fort appétissantes pourtant… le chien a intégré que quelque chose de très désagréable est en préparation.

Si vous sortez le « bonbon » du chien AVANT de lui imposer le bain qu’il exècre ou de débuter la pédicure qu’il redoute, vous transformez votre friandise en un signal d’alarme qui informe le chien que le pire va arriver…. d’où une méfiance considérable vis-à-vis de celle-ci.

Une méfiance qui, au fil du temps, peut se généraliser à tout environnement et situation – la peur se généralise très vite. 

Un renforçateur DOIT arriver APRES le comportement: il est une conséquence et pas un antécédent… quand on travaille avec un chien craintif, c’est absolument fondamental de vérifier que le chien (le chien, pas vous !) a vu, perçu ce qui fait peur pour, ensuite, l’associer à quelque chose de plaisant, pas l’inverse. 

friandise8

J’ai vu un jeune chien se précipiter dans la voiture dès que sa propriétaire sortait un ex-jouet adoré…

En effet, elle se servait de celui-ci pour attirer son chien sur du matériel d’agility où clairement, le chien n’était pas à l’aise.  Il était devenu l’information première du chien d’un moment anxiogène et contraignant.  A l’identique, ces méthodes anciennes de parsemer la « passerelle » ou la « balançoire » de friandises (le chien avance, capté par l’odeur pour s’apercevoir ensuite qu’on l’a emmené précisément là où il ne voulait pas aller). Sensibilisation, perte de confiance, méfiance envers les renforçateurs, voir envers la personne  :cry: 

Autre piège dans lequel nous tombons parfois, c’est la « surenchère » du renforçateur. Le chien ne produit pas de comportement avec la friandise X, on sort la friandise Y qui, elle, est plus appétente et, finalement, on finit par y aller avec Z, qui est le top absolu pour ce chien spécifique…

Certes,  il est plus que légitime (et même vivement recommandé) de prendre note que votre chien n’apprécie pas énormément X et seulement moyennement Y mais ne passez pas successivement de X à Z dans une même séance et contexte : votre chien aura vite fait de comprendre que, s’il ne participe pas, le salaire augmente (et donc pourquoi participerait-il  dès le départ ?)  ;-)

friandisesClicker

Des séances clicker training mal construites, improvisées sans « plan de shaping », un rythme de renforcement inadapté (et donc des critères trop exigeants) peuvent très bien finir par dégoûter votre chien de ces moments spécifiques… tout événement se voit associé à une émotion, attention  à celle que vous construisez, séance après séance. 

Shaping Plan

Dernièrement, je me suis retrouvée devant un chien très craintif au sujet duquel la propriétaire m’a tout de suite informée « oh, les friandises ne l’intéressent pas »… on a fini notre séance d’éducation avec un chien qui boulottait allègrement mes bouts de jambon-fromage et cherchait même à voler le contenu de ma pochette  :-D

Au début de notre rencontre, je me suis assise par terre, sans le regarder et j’ai joué avec mes « bonbons » tout en parlant avec la propriétaire. Après une dizaine de minutes, le chien s’est approché lentement de moi et j’ai lancé nonchalamment un bout de fromage… à partir de là, sur plusieurs séances de 2 minutes par séance,  il s’est mis à bosser avec moi en remuant la queue (à la stupéfaction de la propriétaire qui voulait, à tous prix, avoir la « marque du fromage »). 

friandise9

Je n’ai pas de fromage magique… le chien a surtout apprécié que j’enlève toute forme de pression de notre échange et la possibilité qu’il a eue d’avoir « le choix ». Interagir ou partir (il est parti quelques fois au début d’ailleurs, au moindre bruit extérieur… mais il est revenu). 

Le choix de mon critère à cliquer était évidemment plus que modeste et donc à la portée de ce chien très peu opérant. Nous avons ensuite pu continuer à travailler alors que le chien du voisin aboyait, ce qui, en temps normal, est son déclencheur ultime.

Si on vous servait du champagne à chaque fois que votre vie va mal ou que vous recevez une mauvaise nouvelle, il n’aurait pas pour vous cette dimension festive qui fait boire du champagne à tant de gens, sans même vraiment savoir s’ils aiment vraiment ça  ;-)

friandise10

Les éducateurs compétents en clicker training sont un peu les « rockstars » de la friandise – ils savent la manier, ils savent quand et comment l’utiliser, quand la donner et ils finissent souvent avec cette réputation du « bonbon magique »  qui fait que le chien travaille avec l’éducateur plus volontiers qu’avec le propriétaire alors que nous avons précisément la même chose dans nos pochettes respectives (mais, ce qui génial c’est que tout s’apprend)  :-D

On peut également se construire un chien qui veut bien manger mais donne l’impression qu’il n’est guère disposé à produire un quelconque comportement pour obtenir son « bonbon »…

Je vois beaucoup de mes clients, munis de pochette, tomber dans une distribution «mécanique »  : le chien les harcèle un peu, la friandise sort de la pochette presque machinalement (et ils écopent de ma candide question : « tu renforces quoi là ? »).

Je n’ai vraiment rien contre la friandise occasionnelle « pour la relation » (comme je l’appelle affectueusement)… bien au contraire, je la préconise et je l’applique à mes chiens assez souvent mais elle arrive malgré tout dans un moment où nous sommes en harmonie.

Par ailleurs, je reste convaincue que l’immense majorité des propriétaires renforcent bien trop peu souvent : nous avons tendance à considérer notre « bonbon » comme une espèce de légion d’honneur majeure qui n’est distribuée qu’en cas de mérite majeur  ;-)

friandise11

Quel gaspillage d’occasions de se construire un chien focalisé, attentif, calme, engagé, etc.

Le fait de renforcer souvent et avec générosité ne doit pas occulter le besoin de considérer ce qu’on est en train de renforcer.   

Quand certains de mes clients constatent mon rythme de renforcement, ils prennent peur…. « aaah mais, il faut donner aussi souvent que ça ? ».  

Oui, quand vous êtes en plein apprentissage, oui, pour éviter de voir arriver la frustration, oui pour éviter que votre chien se désengage, oui pour construire des comportements résistants à l’environnement, oui pour construire une émotion agréable, cent fois oui… mais toute friandise est là pour renforcer un comportement spécifique, malgré tout – elle n’est jamais distribuée sans réflexion, bien au contraire. 

En agility, on voit souvent des gens « tugger » avec leur chien de manière complètement irréfléchie, alors que ce jeu a une valeur immense pour leur chien – notamment quand le coach parle ou explique (question d’occuper le chien). Souvent, le jeu n’arrive pas suite à l’exercice pratiqué (on écoute le coach parce qu’on est polis) et arrive bien plus tard, alors que le chien nous a aboyé contre ou nous saute dessus (on sort le tug)  :-|

zoukjouet

La « contingence »  (c’est à dire la « liaison » entre un événement et un autre) est fondamentale quand elle doit faire office de renforçateur. 

Si votre chien n’est pas malade, s’il n’est pas soumis à un stress intense (autre sujet) et s’il «ne s’intéresse pas à la friandise », je vous le re-dis : la réponse est « pas encore »  :-D

Happy Training ☺  

Blazing clickers – Dog Event Science 2018

clicker

Dans ce qu’on appelle l’apprentissage des animaux par « marqueur » (clicker ou autre marqueur), cette procédure représente une communication que nous envoyons à l’animal pendant le processus d’apprentissage.

Le marqueur (que je vais désormais résumer à « clicker » par facilité de lecture, même si, évidemment, ce n’est pas l’unique marqueur possible) permet de marquer, avec une extrême précision (uniquement limitée par les compétences du « trainer »), un comportement spécifique et contribue à faire le lien entre ce comportement et sa conséquence. 

On l’appelle également « bridging stimulus » (bridge = pont) car il fait le lien (le pont) entre le comportement et sa conséquence.  Quand la conséquence est agréable pour l’animal, le comportement s’intensifie en fréquence d’apparition ou en force d’exécution ou les deux.

bridge

sans renforçateur, le click est un pont « vers nulle part »  :-D (Dr. Susan Friedman)

Pavlov et Skinner concluent, tous les deux, que pour qu’un renforçateur secondaire maintienne sa puissance, sa signifiance, chaque click doit être associé à un renforçateur. 

A l’identique pour Bob et Marian Bailey et leur infinie expérience de travail sur les animaux qui nous le confirment.

skinner

Il existe un épiphénomène que les anglophones appellent les « blazing clickers »  ;-) (est-ce la thématique qui est brûlante?). 

En très simple, quelques « experts » (ou non d’ailleurs) affirment qu’il ne serait pas nécessaire, voir qu’il serait contre productif d’associer chaque click à un renforçateur et que cette manière de faire (cliquer sans renforcer) obtiendrait (malgré tout ?) les résultats souhaités, voir, de meilleurs résultats.

Vu que cette thématique a été soulevée par le Dr. Simon Gadbois à Dog Event Science 2018, j’ai pensé apporter quelques explications à ce sujet… après, à chacun de se faire son opinion personnelle via, évidemment, des expériences personnelles appropriées (pas d’ambition évangélique chez moi)  :-D

dogevent

Que dit Gadbois ? que l’apprentissage arrive par la motivation et que la motivation est la résultante de l’anticipation.

Je suis toute prête à croire que notre organisme est plus intensément sollicité dans le processus de « recherche » du plaisir que dans le plaisir lui-même parfois ou, en tous cas, sollicité différemment.

ll reste que ce « seeking » ou « wanting » system dont parlent Panksepp et Berridge, s’il est très intense, ne promeut pas forcément le bien-être. 

wanting

C’est Gadbois lui-même qui a fait le parallèle avec l’addiction – j’en ai une justement : je fume (et j’adore fumer)   :mrgreen:

Si je suis privée de cigarettes sur une longue période (ou même pas si longue que ça), je suis à peu près certaine que mon cerveau est infiniment plus sollicité que quand, finalement, je l’allume et je tire dessus (liking system)  8-)

Toutefois, je suis tout aussi certaine que j’éprouve un plus grand bien être quand je fume que quand je cherche mes cigarettes partout sans les trouver  :-D

wanting

Peut-être, probablement que le « seeking » nous rend plus efficaces (puisqu’il sert à ça) mais nous rend-ils plus heureux ? sereins, détendus ? Je me pose la question.

Autre exemple donné par Gadbois – deux chats qui, selon son exposé à  Dog Event Science avaient été « renforcés » pour avoir touché une cible (un objet)… 

cats

On en déduit, assez logiquement, qu’ils ont reçu de la nourriture… (il parle bien de «récompense », j’ai vérifié sur notre support de cours).

Gadbois nous relate que les chats s’approchaient ensuite de l’objet qui ne leur avait valu aucun renforcement de préférence (ayant appris le comportement de toucher une cible à un nombre considérable d’espèces, j’étais très perplexe).

Jusqu’à ce que je me souvienne, post conférence, d’avoir lu cette expérimentation dans «Affective Neuroscience » de Jaak Panksepp… que je suis donc allée consulter.

Les chats ont reçu une stimulation cérébrale quand ils se rendaient dans une zone précise et pas de stimulation cérébrale quand ils se rendaient dans une autre… 

Panksepp lui-même relativise en n’excluant pas qu’ils aient pu développer une amnésie partielle suite aux stimulations et/ou que les dites stimulations cérébrales se soient finalement révélées aversives (personne n’est dans l’organisme du chat au fond). 

 Expérience des chats toute relative donc  8-)

Revenons à nos « blazing clickers »… via le papier de Martin and Friedman (2011).

  1. Le terme « click » fait référence à tout renforçateur conditionné utilisé dans l’apprentissage afin de renforcer de manière contigüe un comportement. Il est synonyme de renforçateur conditionné ou renforçateur secondaire, stimulus conditionné, bridge ou pont conditionné, marqueur d’événement et marqueur.
  1. Le terme « renforçateur » définit un renforçateur conditionné ou non qu’on exploite pour conditionner et maintenir la puissance de renforcement du click. Le mot renforçateur est remplacé, dans la terminologie courante, par le mot « friandise » ou « bonbon » – en effet, le plus souvent le renforçateur est de la nourriture.
  1. Le terme « blazing clickers » fait référence à la pratique de cliquer de manière répétée sans fournir un renforçateur immédiatement après.

 Blazing clickers 

Il est intéressant de constater que cette pratique est très répandue chez les « trainers » d’animaux sauvages captifs (zoos, aquariums, parcs animaliers mais également d’animaux domestiques en laboratoire), elle est très rarement préconisée dans les cours clicker training et relativement peu appliquée chez le chien de sport ou de famille.

Un des fondamentaux du clicker training est, précisément que « à chaque click, son renforçateur ».

Il existe bien des « agility people » qui cliquent tous les sauts et ne renforcement jamais mais, vu qu’ils travaillent avec des Borders pour qui travailler est déjà un énorme renforçateur en soi, je pense que nous sommes plus dans le comportement superstitieux qu’autre chose  ;-)

Les animaux captifs (zoos ou toute autre structure de ce style) n’ont guère d’alternatives gratifiantes en dehors de ces séances de « training » (le dauphin, dans son bassin où il s’ennuie prodigieusement, est certainement motivé à essayer encore… il n’a rien à perdre et quelque chose à gagner). Ils sont, parfois, légèrement sous alimentés également… pas systématiquement mais ça arrive  :roll:

(et, évidemment, tu repenses immédiatement à cette malheureuse Dawn Brancheau qui s’est fait dévorer justement… parce que Tillikum était en frustration ayant exécuté et PAS reçu de poisson).

orca

A l’identique avec le volatile dans une cage, mentionné pendant la présentation, qui picorait fortement sa cible (précédemment renforcée) alors qu’il n’y avait plus de renforçateurs à disposition : quelle autre option que cet unique comportement « payant »? et quel autre « choix » que de le mettre en pratique encore et encore, avec l’énergie du désespoir?  :cry:

Quand nous sommes enfermés dans un ascenseur en panne et que l’aide n’arrive pas, nous appuyons compulsivement sur le bouton « assistance » même s’il semble ne pas fonctionner… que pouvons-nous faire d’autre? et quelles sont nos émotions surtout?

ELEVATOR ALARM

Ce n’est de très loin pas le cas avec nos chiens qui, eux, ne sont ni affamés ni en privation de gratifications autres - ils peuvent aisément décider qu’aller ronger leur os ou renifler un trou de taupe est finalement tout aussi bien et demande moins d’efforts ;-)

Retriever with bone chewing

Ensuite : l’étude de l’apprentissage nous dit qu’un rythme de renforcement variable rend le comportement plus résistant à l’extinction et incite l’animal à produire plus de comportement afin d’obtenir son renforçateur.  

Quand cette information a atteint certains autres supporters de l’approche « blazing clickers », ils en ont déduit que cette « variabilité» s’appliquait uniquement au renforçateur primaire et pas au « bridge» (click).

A mon sens, c’est une piètre interprétation d’un concept clair  :roll:

En effet, en cliquant chaque comportement approprié et en distribuant un renforçateur sporadiquement, on n’est PAS dans un rythme de renforcement variable mais continu, techniquement parlant  (la seule chose qu’on accomplit c’est d’affaiblir le renforçateur secondaire). 

Pourquoi le font-ils alors ? Parce que cliquer est un renforçateur pour le trainer, il nous donne la preuve tangible que le comportement s’est vérifié, comme une confirmation pour nous-mêmes.

S’entendre cliquer 20 fois d’affilée est gratifiant pour l’humain, sans aucun doute, une manière de s’auto-congratuler  :-D

superstition

Revenons au papier de Martin et Friedman, 2011…

Martin et Friedman ont détaillé certains des points mis en avant par les supporters des «blazing clickers »…

Affirmation : le click est déjà un renforçateur (parfois juste aussi puissant, voir même plus puissant qu’un renforçateur secondaire), il n’y a pas besoin d’autre chose.

Remarques : 

  • Si le renforçateur secondaire est parfois aussi fort que le renforçateur primaire, il l’est parce que systématiquement associé à d’autres renforçateurs qui, justement, lui donnent sa puissance (sinon, il ne serait qu’un bruit sans signification)
  • Les renforçateurs primaires sont des renforçateurs par définition – alors que les renforçateurs secondaires ont besoin des primaires pour acquérir – et maintenir leur puissance et qualité de renforcement
  • A chaque fois qu’un click se produit sans être suivi d’un renforçateur, il perd un peu de sa capacité de se comporter comme un renforçateur
  • Si le click n’annonce plus l’arrivée du renforçateur, l’animal peut se mettre à chercher ailleurs dans l’environnement un signal prédictif de l’arrivée du renforçateur (comme la main du trainer qui s’approche de la pochette à friandises). L’animal peut se focaliser sur ce mouvement comme le « marqueur officiel » délaissant ensuite le click comme information non pertinente. 

Affirmation : les « blazing clickers » rendent le travail plus intéressant et moins prévisible pour l’animal

Remarques : 

  • Si la variété est, effectivement, importante, elle doit se situer dans les renforçateurs primaires et leur qualité, la difficulté des comportements travaillés et le rythme de la séance d’entraînement – pas par des clicks qui ne sont pas suivis par un renforçateur. 
  • Suite à des comportements marqués mais non renforcés, les animaux voient leur attention de dégrader (plusieurs comportements demandés successivement avec un click après chaque comportement correct et une unique, grosse récompense à la fin).

Affirmation : 

Le comportement sera plus résistant dans une approche de « blazing clickers » parce que sa résultante de renforcement variable procure l’excitation d’une machine à sous…

Remarques :

  • Un rythme de renforcement intermittent crée la persistance une fois qu’un comportement est bien établi et fluide mais, ne pas distribuer de renforçateur ne change rien au fait que, techniquement, on reste dans une dynamique de renforcement continu si on affirme que le click est un renforçateur (sinon, il n’est qu’un bruit sans signification et, dans ce cas, à quoi sert-il ?).
  • Quand on a besoin d’introduire une certaine persistance dans un comportement, il est préférable d’enseigner un comportement avec un rythme de renforcement continu et, ensuite, quand celui-ci est appris, passer à un rythme de renforcement variable. Chaque click reste associé à un renforçateur mais on demande graduellement plus de comportement, de durée, de persistance, d’affirmation.

Affirmation : 

L’approche du « blazing clicker » réduit la frustration et l’agressivité inhérente à la frustration parce que le chien ne s’y attend pas de manière automatique et systématique.

Réponse : 

  • Planifiez votre séance de travail avec des critères adéquats ou planifiez des séances plus courtes afin de minimiser / éviter de créer toute forme de frustration.
  • Nous avons des données qui confirment que ces clicks sans renforçateur favorisent l’apparition de comportements d’agression par frustration. 

Affirmation : 

Le clicker peut à la fois dire à l’animal qu’il a fait « juste » mais également qu’il doit continuer à faire ce qu’il est en train de faire. Le click peut avoir différentes significations.

Remarques :

  • Libre à vous de vous créer un « keep going signal » (continue à faire ce que tu fais) mais le click ne peut pas avoir 2 significations à la fois (tout comme le feu vert ne peut pas signifier « avance » et « reste sur place » à la fois). 
  • Un click qui implique « continue » et « le renforçateur arrive » est une communication plus laborieuse et créatrice d’une confusion inutile.

En clair, Martin et Friedman (2011), affirment clairement que chaque fois que nous cliquons sans renforcer, l’animal est soumis à une extinction qui diminue la portée du clicker, même identique son de cloche de Bob & Marian Bailey  :-D

Quand on clique un animal et qu’on associe le click à un renforçateur primaire (alimentaire), l’animal est à chaque fois soumis à un conditionnement classique (ou pavlovien). 

pavlov

Quand le stimulus conditionné est utilité de manière répétée sans le stimulus inconditionnel (donc click et pas de friandise), la réponse devient progressivement de plus en plus faible.

Ce processus s’appelle l’extinction (Chance, 2003). Plus un comportement aura été renforcé et plus il sera résistant à l’extinction.

En conclusion…   

Le matin, quand je rampe jusqu’à ma machine à café qui est un très gros renforçateur pour moi j’appuie sur un joli bouton vert et ma tasse se remplit de café qui me ramène à la vie.

Un joli renforcement négatif : en effet, mon manque de caféine, comme mon manque de nicotine d’ailleurs, me mettent dans un état d’inconfort – me débarrasser de cet inconfort fixe, très solidement, mon addiction au café (et à la clope, hélas).

coffee

Si c’est probablement ma première motivation à sortir du lit, c’est bien le café auquel j’aspire et certainement pas à la trépidante attente de savoir si, oui ou non, je vais obtenir mon précieux breuvage.  Si ma machine à café devait montrer le moindre « raté », non seulement j’en concevrais une intense frustration (la frustration s’apparente allègrement à la colère) mais un désir impérieux de rétablir les choses.

Je reconnais toutefois la puissance de mon « wanting system » qui, à Paris, m’a envoyée dans la rue déserte et toute seule à 6 heures du matin (à la recherche d’un café introuvable à l’hôtel)  :roll:

Le Dr. Simon Gadbois a suggéré le bénéfice de cette trépidante anticipation en imaginant que, quand il entend le click, le chien se dit « vais-je recevoir une friandise ou non ? » – ce qui l’engagerait à travailler plus efficacement (ce qui m’apparaît comme un audacieux pari).

Dans un labo, les chiens qui ne « performent » pas, sont écartés de l’expérimentation en définitive, les animaux captifs vont s’acharner faute de choix mais nos chiens? J’en reviens à l’option « je vais ronger mon os / je vais renifler le trou de taupe » cité plus haut. 

Quoi qu’il en soit, pour mes chiens, le click est une certitude inébranlable de voir arriver la friandise, pas une hypothèse, encore moins un pari.

La simple vue du clicker les branche, automatiquement, en mode travail (idem pour les friandises d’ailleurs).  

Cette dimension « prévisible » et « honnête » (je tiens mes promesses) est le fondement même d’une approche en clicker training.

Un dialogue fiable, un interlocuteur cohérent sur lequel on peut compter – n’est-ce pas la définition même de la confiance?

Evidemment, si je jouais aux machines à sous, je pourrais ressentir le grand frisson d’un hypothétique espoir de gain (je n’ai pas le goût du jeu, personnellement, et je ne ressens que l’irritation d’avoir gaspillé de l’argent) et accepter, peut-être, de ne rien gagner sans avoir envie de fracasser la machine.

slotmachine

Par contre, mon comportement de jeu s’arrêterait très vite après 2 ou 3 tentatives infructueuses (le mien, peut-être pas le vôtre… il existe bien des joueurs compulsifs qui se ruinent  dans ce type de jeu mais, là aussi, il y a des facteurs environnementaux majeurs à considérer). 

Et si gagnais de temps en temps ?

Je pense que mon comportement de jeu serait, effectivement renforcé mais toujours accompagné d’une forte d’irritation vis-à-vis de mes nombreux essais non renforcés.

A quel point mon comportement de jeu serait maintenu me semble individuel (motivating operations), environnemental et intimement relié au fait de gagner assez souvent ou pas très souvent (alors pourquoi pas ne pas gagner tout le temps ?).

Si, alors que j’ai très très soif, je mets 2 francs dans la machine parce que j’aspire à une canette de Coca Cola et que la machine ne distribue pas ma boisson, c’est essentiellement la frustration et la colère qui seraient mes émotions de base (et je ne remettrais pas 2 francs supplémentaires, encore et encore, dans l’hypothétique espoir d’obtenir ma boisson). 

cocavending

En clair, à vous de choisir – le clicker peut devenir une machine à sous, avec les émotions qui l’accompagnent (mais assurez-vous qu’il a le goût du jeu chevillé au corps ou des facteurs environnementaux propices) ou une machine qui distribue de manière tout à fait fiable, et gratifiante, le renforçateur auquel on aspire. 

 A mon sens, il ne peut pas être les deux, à vous de choisir  :lol:

Pour ma part, une émotion de prévisibilité, d’anticipation joyeuse et confiante sera toujours préférable à une anticipation fébrile, incompréhensible et souvent source de frustration  :lol:

happy

Au final, je pense sincèrement que tout « marche » (y compris certaines approches aversives d’ailleurs)… mais, outre au fait que le résultat ne peut être notre unique  préoccupation, quelle est la « added value » de cette option ?

A part économiser quelques centaines de grammes de fromage à l’année, je ne vois toujours pas  :roll:

En ayant dit tout ça, il est parfaitement vrai que je n’ai jamais pratiqué le « blazing clicker » et que, n’étant pas dans une optique de recherche (le bien-être de mes animaux me tenant plus à coeur qu’autre chose), je ne compte pas le mettre en pratique non plus – je vais devoir vivre avec mes « biais cognitifs » – comme la plupart d’entre nous  :lol:

Pour aller plus loin… 

Affective Neuroscience : the foundations of human and animal emotions (Jaak Panksepp)

Bailey, B., Bailey, M., (1998). « Clickersolutions Training Articles – Ratios, Schedules – Why And When ». Clickersolutions.com. N.p., Accessed 24 April 2016.

Chance, P., (2003). Learning and behavior (5th ed.). Belmont, CA: Wadsworth.

Egger, M. D., Miller, N. E., (1962). Secondary reinforcement in rats as a function of information value and reliability of the stimulus. Journal of Experimental Psychology, 64(2), 97-104.

Fernandez, E.J., (2001). Click or Treat: A Trick or Two in the Zoo. American Animal Trainer Magazine, 2, 41-44. Shedd Aquarium.

Langbein, J., Siebert, K., Nuernberg, G., Manteuffel, G., (2007). The impact of acoustical secondary reinforcement during shape discrimination learning of dwarf goats (Capra hircus). Applied Animal Behaviour Science. 103(1-2), 35–44.

Martin, S., Friedman, S.G., (2011, November). Blazing clickers. Paper present at Animal Behavior Management Alliance conference, Denver. Co.

McCall, C.A., Burgin, S.E., (2002). Equine utilization of secondary reinforcement during response extinction and acquisition. Applied Animal Behaviour Science. 78, 253–262.

Rilling, M., Caplan, H. J., (1973). Extinction-induced aggression during errorless discrimination learning. Journal of the Experimental Analysis of Behavior. 20, 85-92.

Smith, S.M., Davis, E.S., (2008) Clicker increases resistance to extinction but does not decrease training time of a simple operant task in domestic dogs (Canis familiaris). Applied Animal Behaviour Science. 110(3-4), 318-329.

Wennmacher, P. L. (2007). Effects of Click + Continuous Food Vs. Click + Intermittent Food on the Maintenance of Dog Behavior (Master’s Thesis). University of North Texas.

Williams, J.L., Friend, T.H., Nevill, C.H., Archer, G., (2004). The efficacy of a secondary reinforcer (clicker) during acquisition and extinction of an operant task in horses. Applied Animal Behaviour Science. 88, 331–341.

Zimmerman, D. W., (1957). Durable secondary reinforcement: Method and theory. Psychological Review. 64, 373-383.

PORTL games

portlpicture

 … et, donc, après les deux présentations de la Dr. Susan Friedman (voir Life is for Learning 1 et 2) et un buffet qui avait le mérite d’être végétarien et même vegan (et 24 cafés pour ne pas piquer du nez pour moi), on est revenus terminer la première journée par un atelier PORTL, évidemment animé par Mary Hunter  :-D

Pour ceux qui n’ont jamais suivi mes cours où on y joue régulièrement, une petite introduction au « Portable Operant Research Training (or Teaching) Laboratory » (laboratoire portable de recherche sur le comportement opérant). 

Le « PORTL » nous arrive de son prédécesseur Genabacab (qui était, à l’époque, un affixe d’élevage) et il a été imaginé par la très talentueuse Kay Laurence.

Le jeu se déroule autour d’une table, sur une zone de travail déterminée (feuille A4 par exemple) et par le biais d’une multitude de petits objets : ma propre collection commence à être plutôt conséquente (un tout petit aperçu en dessous)  :-D

portlphoto

Il est évidemment une version (très) améliorée de ces abominables jeux de « chaud-froid » que les moins jeunes d’entre nous avons vécu dans nos toutes premières formations clicker training  8-)

A l’époque, le déroulement de la séance était de faire quitter la pièce à un apprenant, pendant que le groupe décidait d’un comportement à lui faire exécuter. Ensuite, on le faisait rentrer pour qu’il ou elle atteigne le comportement par le clicker training : « click = chaud / pas de click = froid ».

Les salles où se tenaient ces séances étaient généralement immenses, blindées de monde et d’objets… la chance d’arriver rapidement au comportement décidé par le groupe, était pratiquement inexistante (ou il fallait compter sur la chance, ce que nous faisons pas mal avec nos animaux  d’ailleurs : ce que j’appelle, avec mes élèves « l’éducation de l’espoir » – genre « allons-y et on verra bien »)  ;-) 

Quand les alternatives sont trop nombreuses, voir infinies, elles multiplient de manière exponentielle l’opportunité de nous tromper… exactement ce qui arrive quand, dans une séance de shaping, on met l’animal dans un environnement trop riche, trop distrayant, sans lui apprendre à se « stationner » à un endroit spécifique (les pre-requis au shaping à mon sens).

Ces séances ont donné naissance à l’épouvantable adage  « le clicker training c’est le jeu du chaud-froid » qui nous a ensuite poursuivis très longtemps (on l’entend d’ailleurs encore)

(évidemment, elle me fait personnellement saigner les yeux)  :lol:

chaudfroid

Le clicker training, au contraire, c’est le jeu du chaud-chaud car tout sera mis en place pour arriver au succès vite et bien, en gérant l’environnement et l’apprentissage de manière à diminuer de manière draconienne les possibilités d’erreur et en maintenant son apprenant dans une dynamique de renforcement continuel.

Si tout le processus était souvent émaillé de rires (surtout de l’assistance d’ailleurs), c’était parfois aux dépends de l’apprenant qui pouvait aller de 25 comportements à la minute au «shut down» total, en passant par des petits rires gênés et d’autres comportements de stress divers et variés… j’ai même vu quelques personnes aller jusqu’aux larmes (ceux là étaient qualifiés de « trop sensibles »). 

On se souciait assez peu de l’émotion dans l’apprentissage à cette époque, même quand elle nous crevait les yeux  ;-)

emotions

Je me rappelle avoir souvent entendu « pour elle, il faut trouver quelque chose de difficile »comme si enseigner n’était pas transmettre avec efficacité tout en renforçant la confiance en soi de l’apprenant mais, au contraire, mettre la personne en échec.

Il faut dire que notre propre expérience avec l’enseignement nous a, parfois, fait profondément intégrer un certain concept de souffrance et, surtout, de sélection « les meilleurs y arrivent, les autres pas » (tant mieux pour les uns et tant pis pour les autres).

better

Suggérer que tout le monde peut y arriver, à sa manière et à son rythme, est assez révolutionnaire comme concept dans une société où tout est axé sur la sélection (les chefs et les subalternes… les maîtres, les esclaves, toussa toussa).

Ensuite, on s’étonne avec candeur de cet attachement profond pour le concept de la «dominance » dans nos relations avec le chien – et avec tous les animaux domestiques – alors qu’il correspond à notre perception culturelle depuis la maternelle)  ;-)

Life

Kay Laurence a transformé tout ça en un jeu à la table, entre un coach et un apprenant (avec, parfois, un co-coach qui prend des notes).

portlGermany

Le but de l’apprenant – et donc la seule instruction qu’on lui donne avant de cesser de parler – est qu’il est là pour récolter autant de renforçateurs que possible. 

Le but du coach est d’y arriver avec la plus grande aisance possible, dans le concept d’un apprentissage où les erreurs sont réduites au minimum, afin d’obtenir un comportement final dont on ne voit pas les « coutures » et un apprenant confiant et sûr de lui pendant toute la durée du jeu  :-D

Si le rythme de renforcement baisse… on voit apparaître des comportements de substitution (bonjour la résurgence)  ;-)

Evidemment, l’idée est toujours celle de « faires ses armes » (et donc ses erreurs d’enseignement) sur un humain volontaire et informé plutôt que sur un animal chez qui on va créer une confusion certaine (et, parfois, un désengagement évident). 

Kay Laurence me disait une fois que personne ne devrait jamais cliquer un animal sans avoir joué, de manière très extensive, à cliquer d’autres humains à une table, dans un milieu limité et contrôlé par le coach :-D  (je le pense aussi d’ailleurs mais compliqué à transmettre parfois). 

En réalité, quand on clique depuis quelques années, on repense parfois avec gêne à nos débuts (et on a parfois envie de demander pardon à quelques animaux et, si ce n’est pas votre cas, c’est que vous  ne cliquez pas depuis assez longtemps)  ;-)

Le jeu a été ensuite repris par le Dr. Jésus Rosalez-Ruiz qui l’utilise à la UTN (University of North Texas) où on enseigne la Science du Comportement et successivement structuré par Mary Hunter, d’abord son élève et désormais également prof dans la même université (notre intervenante dans cet atelier).

Les étudiants en science du comportement y jouent de manière extensive afin d’expérimenter toutes les subtilités du comportement.

science-dude-2

A une époque où les expériences sur les animaux deviennent de moins en moins acceptables, c’est un excellent laboratoire de recherche sur le comportement.  

Bref, une Skinner box pour humains volontaires  ;-)

On voit apparaître dans nos jeux la généralisation (voulue ou non), la répétition qui fait la mémorisation, on se bute à l’extinction frustrante et à la résurgence parfois inattendue.

On prend surtout conscience que, sans un plan de « shaping » bien ficelé et maintes fois revu sans pitié, on ne va nulle part dès lors que le comportement est à peine complexe.  

Je suis certaine que certains d’entre vous se disent « bah, moi j’y arrive quand même » : souvent, c’est, précisément ce « quand même »  qui implique des émotions qu’on ne souhaite pas vraiment associer à nos apprentissages… et pourtant  ;-)

En cas de piètre enseignement, on se confronte rapidement  à la perplexité, l’hésitation, la frustration de notre apprenant.

A ce stade, nous avons la possibilité « d’étiqueter » l’autre (il est stupide, il ne comprend rien) ou de repenser notre manière de transmettre (je peux mieux faire et, surtout, faire autrement). 

On parle beaucoup  de « signaux d’apaisement » chez le chien (on a même développé une véritable adoration pour ce concept)il est parfois absolument stupéfiant de voir à quel point nous ignorons allègrement ceux de notre propre espèce (quand votre apprenant commence à écarquiller les yeux, se gratter la tête, grimace, hésite, se trompe de manière répétée… autant de signaux d’alerte qui devraient nous amener à stopper la séance, revoir notre apprentissage et notre plan de shaping de toute urgence).  

stress

En général, confrontés à ce scénario, nous développons plutôt une irritation sourde mais bien réelle vis-à-vis de l’autre qui ne « fait pas » ce que nous trouvons absolument évident qu’il fasse (quel est donc SON problème ? difficile d’admettre que « son » problème c’est nous, justement).

stupid

« Le rat a toujours raison » disait Skinner… 

On lit souvent les doléances d’éducateurs au sujet des humains dans leurs cours… et, effectivement, certains comportements nous irritent mais, un humain qui est pendu à son téléphone, qui ne suit pas les consignes cherche-t-il à nous éviter (et, surtout, pourquoi ?), c’est un comportement de substitution, pourquoi ? Complexe, riche et fascinant.

On constate qu’un simple « click du désespoir » (ce click qu’on donne à notre animal après une série de comportements inappropriés  question de le ramener sur un semblant de « droit chemin »)on peut renforcer toute une chaîne de comportements dont on ne voulait absolument pas et dont aura, ensuite, toute la difficulté du monde à se défaire.

chaos

On s’aperçoit qu’on peut fixer solidement un comportement « superstitieux » – celui que l’apprenant aura identifié comme celui qui lui vaut le marqueur et le renforçateur alors qu’il s’est vérifié par hasard… en un mot comme en cent : on apprend à transmettre un comportement de manière propre, précise et adaptée à notre apprenant du moment.

J’ai été l’apprenante d’une personne (qui ne risque pas de me lire, pas de panique) qui, pendant mon apprentissage, m’a littéralement arraché les objets des mains quand je « faisais faux », m’a fusillée du regard à plusieurs reprises et a stoppé physiquement certains de mes comportements qui ne lui convenaient pas  :lol:

En fin de séance, on demande rituellement à son apprenant comment il a vécu l’apprentissage et je lui ai répondu, suavement (même si en vrai j’étais plutôt amusée), que j’avais vécu une expérience très désagréable et que je n’avais plus vraiment envie de jouer encore avec elle (ce qui m’a valu un ultérieur regard noir).

La preuve, s’il en fallait encore une, qu’il ne suffit pas d’être armé d’un clicker et de renforçateurs pour créer une atmosphère propice à l’apprentissage  ;-)

amused

Pas facile d’accepter de ne pas faire porter à l’autre la responsabilité de notre parfois piètre enseignement (toutefois, j’avoue humblement y arriver mieux avec les animaux – et les enfants – qu’avec les humains adultes) ;-)

 … et, mine de rien, sommes-nous absolument sûrs que nos animaux ne nous en diraient pas autant lors de certaines séances de shaping que nous laissons aller complètement de travers ?  

En gros, le PORTL – même si vous n’avez pas le bonheur (tout comme moi d’ailleurs, quel dommage) d’étudier la science du comportement à NTU, nous apprend que, si nous voulons un comportement propre, nous devons travailler de manière propre, si nous voulons emmener notre apprenant vers la réussite, nous devons gérer l’environnement et rendre le succès plus probable que l’erreur. 

Vous voulez jouer ? 

Munissez-vous d’objets (n’importe lesquels), de « renforçateurs » (nul besoin qu’ils soient comestibles, l’humain bosse volontiers pour un sentiment de compétence et ce dès le plus jeune âge), déterminez un comportement dans votre tête, expliquez uniquement à votre apprenant que son but est de récolter un maximum de renforçateurs. 

… des idées de comportements ? Votre imagination est votre seule limite  :-D

Soyez créatifs mais débutez par des choses simples  (qui sont, au final, moins simples que vous ne le pensez)

  • Prendre un objet en main
  • Prendre un objet en main et le poser à un endroit spécifique
  • Mettre un objet dans un autre objet
  • Toucher un objet d’un seul doigt
  • Faire pivoter un objet
  • Secouer un objet
  • Faire tomber un objet de haut
  • Faire pivoter un objet
  • Secouer un objet
  • Mettre un objet improbable sur un autre objet (puis 3 objets)

On ne parle pas, on n’écrit pas, on ne gesticule pas…  on utilise son clicker et ses renforçateurs.

En Autriche, j’ai pioché le petit papier suivant quand j’ai du être coach :

« si la voiture est sur son toit, la soulever  / si elle couchée sur le côté droit, il faut la faire tourner sur elle-même » 

Ensuite, vous préparez votre plan de shaping  :-D

Première phase

  • Soulever un objet – mémorisation du geste
  • Soulever un 2èmeobjet – généralisation de l’apprentissage
  • Soulever un 3èmeobjet  -  conceptualisation
  • Soulever le même objet renversé

 ==> Introduire la voiture renversée (revenir en arrière si erreur)

(je n’ai pas débuté avec la voiture car, en raison de notre historique d’apprentissage humain, j’ai estimé qu’un apprenant humain l’aurait remise sur ses roues)

Deuxième phase 

  • Proposer la toupie à mon apprenant (probable phénomène de généralisation sur le premier comportement, ce qui n’a pas manqué d’arriver – on change l’objet pour redonner rapidement une chance de succès)
  • 2èmetoupie, 3ème toupie
  • Introduire un autre objet facile à faire tourner (étape sautée finalement)

==> Introduire la voiture  sur le flanc (si erreur, retour en arrière)

Vous verrez dans la vidéo que mon apprenant à montré quelques hésitations au moment préciser où se fait l’apprentissage… c’est, précisément, ce que nous cherchons au clicker: ce moment de réflexion, de compréhension qui n’est PAS le blocage, l’incompréhension, la frustration et l’erreur ;-) (ce que les anglophones appellent le «ah ah moment »)  8-)

Alterner les comportements de « soulever la voiture » et « faire pivoter la voiture ».

En Autriche, je n’avais pas de toupie donc le comportement du « spinning » a du être construit par l’utilisation de cibles (mini « post its » qui traînaient dans ma trousse) et il a comporté plusieurs étapes intermédiaires (touche la cible, suis la cible, effectue un tour complet).

Je n’avais pas de voiture non plus, j’ai donc utilisé un petit pot à glace qui roulait sur la table quand je le positionnais sur le côté, ce qui a considérablement compliqué l’apprentissage, qui a souffert d’une préparation un peu bâclée  ;-)

Au final, mon apprenante est arrivée aux deux comportements mais, quand je lui ai demandé ce qu’elle avait appris, elle n’en avait juste aucune idée (alors qu’elle le faisait parfaitement devant moi)  ;-)

Cela nous rend humbles : ce n’est pas parce que l’apprenant fait qu’il a forcément conceptualisé  :lol:

A la maison, avec des objets adaptés, mon apprenant à su me dire « voiture renversée, je soulève, voiture sur le côté, je tourne »  ;-)

Parce que je suis nulle en traitement de vidéo, j’ai tout balancé en une séance presque continue  -  PAS bonne idée  ;-)

En temps normal, je ferais une pause tous les dix clicks et je reverrais mon shaping plan… mais, mon apprenant suivait parfaitement et avait l’air tout de très bien gérer la succession des apprentissages (ce qui aurait été différent avec un autre apprenant)  :-D

J’ai très envie de mettre sur pied une journée PORTL pour éducateurs canins…  (et, par éducateurs, j’entends des personnes qui éduquent tout simplement)  :-D

si ça vous inspire… dites-le dans les commentaires  :-D :-D :-D

Happy Training  :-D

Life is for learning / 2

« Le contrôle, une nécessité biologique »  par la Dr. Susan Friedman

En éducation canine, il n’est pas rare d’entendre, parfois sur un ton légèrement (ou résolument) moqueur : « ton chien est en train de t’éduquer »  :roll:

humans

Pourtant, il est à la fois logique et inévitable que cela se produise : tous, et nos chiens aussi, oeuvrons dans le sens d’une conséquence qui nous sera profitable, c’est le contraire qui serait aberrant  :lol:

En clicker training, nous rendons le comportement possible, nous signalons, l’animal produit et c’est un signal clair, pour nous, de cliquer et renforcer… un dialogue constant où, si le travail est bien fait, tout le monde trouve son compte (ajout personnel)  ;-)

pavlov

Nous fonctionnons tous sur une séquence « action ==> effet produit » qui va nous amener à répéter cette action… ou pas  :-)

Cela nous donne à la fois un certain contrôle sur notre environnement (nous choisissons) et un retour en terme d’information (« essaie encore » / « fais autre chose » / « abandonne »).

En effet, peu d’entre nous vont retoucher et retoucher encore un même objet qui vient les brûler  :-)

Imaginez un monde qui ne nous offrirait AUCUNE faculté de contrôler les conséquences de nos choix : une perspective véritablement terrifiante.

… et cela existe bel et bien, on le sait tous  :-(

Tous les jours, dans les media,  nous regardons, écoutons et lisons — avec plus ou moins de compassion, d’effroi et révolte — que des individus, des populations entières, des ethnies sont sujettes à ce type de frustration, de douleur et de colère : toutes les injustices de ce monde concernent cette incapacité  totale à contrôler un environnement hostile.  

justice

Toute forme d’injustice débute en retirant le contrôle à sa victime, en niant sa possibilité de choisir. Qu’il s’agisse d’animaux ou d’humains. 

Nous connaissons tous les renforçateurs primaires (naturellement renforçateurs et, donc, inhérents à la survie) – le contrôle en fait naturellement partie : en effet, que deviendrions-nous sans le contrôle de nous enfuir en cas de danger mortel ?  ;-)

Une étude sur des nourrissons de 4 mois a comparé deux groupes distincts sur l’intérêt qu’ils pouvaient porter à leur « mobile » musical (qui n’est pas un téléphone portable mais cette chose que tous les parents auront accroché, sous différentes formes, au dessus du berceau de notre progéniture).

mobile

Le premier groupe de nourrissons avait un contrôle direct sur le fonctionnement du mobile, le 2èmegroupe n’en avait pas et le mobile se mettait en mouvement de manière aléatoire (Watson, 1967, 1971).

Alors que, au début de l’expérience, le mobile provoquait sourires et mouvements chez tous les nourrissons, rapidement, seul le groupe de nourrissons qui avait un contrôle sur le mouvement de l’objet a continué à s’y intéresser de manière active.

Plus intéressant encore, le groupe de nourrissons qui pouvait contrôler le fonctionnement du mobile a montré une augmentation des comportements joyeux (sourires, vocalises, etc.) par rapport au groupe des nourrissons qui n’avaient aucun contrôle sur le fonctionnement de l’objet.

Si on se réfère, à l’étude britannique sur le contrôle en relation au « burn out » (mentionnée dans « Life is for learning 1″, ne pourrions-nous pas en déduire qu’un nombre grandissant de personnes dans notre monde a l’impression– justement – de ne rien contrôler du tout, de ne plus pouvoir choisir et de subir des circonstances qui les écrasent ?  Il n’y a qu’un pas à franchir entre cette constatation et le taux de « bonheur » dans certains pays.

happy

Un nombre impressionnant d’études sur les animaux (ouistitis, poules, veaux, cochons, etc.) démontre que, quand ces animaux peuvent contrôler, par un comportement préalablement appris, la chaleur, la lumière qui leur sont dispensées, leur comportement se révélait plus calme et moins agressif. 

Les animaux, comme les humains d’ailleurs, préfèrent qu’on leur donne un choix, même quand celui-ci n’apporte pas de plus value concrète (toutes les mamans savent qu’il vaut mieux dire « tu veux mettre tes chaussettes roses ou tes vertes ? » à son enfant récalcitrant plutôt que « mets tes chaussettes »)  :-)

socks

En maison de retraite, donner un certain nombre de choix aux résidents a démontré influencer l’humeur, la qualité de vie exprimée et la longévité (Leotti, 2010 – Langer, et al. 1976).

Sans même mentionner le concept du « contrafreeloading » (le fait que les animaux préfèrent obtenir de la nourriture sous forme de renforçateurs suite à des comportements appris, plutôt qu’en self service), maintes fois testé et répliqué sur les souris, les rats, les poules, les pigeons, les corbeaux, les gerbilles et les chats. Un concept qui s’applique à des animaux correctement nourris, en bonne santé et qui ne souffrent pas de la faim (un animal en privation sévère va se jeter sur la nourriture librement accessible). 

Manquer de contrôle sur son environnement est une source reconnue de stress (ce qui explique, par ailleurs, le faible taux de reproduction des animaux sauvages en captivité quand ils sont privés de comportements fondamentaux pour leur espèce).

Contraindre, lors d’une procédure vétérinaire par exemple, provoque une augmentation substantielle du rythme cardiaque et de la production de cortisol (aucun d’entre nous n’a besoin de connaître le taux de cortisol de son chien pour reconnaître ce stress). 

Ayant dit tout cela, la Dr. Susan Friedman nous rappelle que tout ne peut pas être un choix dans la vie de nos animaux et que si une approche la plus respectueuse possible est un but, nos animaux portent en eux la résilience nécessaire à la négation occasionnelle d’un choix.

La résilience fait cet heureux lien entre la contrainte totale et le choix absolu  :-)

resilience

En conclusion, nous sommes sur terre pour agir et donc choisir et non pas pour rester passifs et subir, cela nous concerne nous et cela concerne les animaux qui partagent nos vies.

choice

Le besoin de contrôler notre environnement est un concept inné, il fait partie de notre bagage biologique et il est le produit de notre évolution à travers les âges, quelle que soit notre espèce.

Avoir des choix, contrôler ce qui nous entoure nous est aussi nécessaire que boire et manger. 

A nous de savoir reconnaître quand l’animal dit non, l’écouter, à nous de faire des efforts pour mieux reconnaître ces refus et à nous de trouver une harmonie entre donner le choix et le « vivre ensemble »  :-)

« Life is for learning » / 1

… bref, je suis partie en Autriche suivre une conférence très joliment  intitulée « Life is for Learning » (la vie est faite pour apprendre… ou la vie est faite d’apprentissages ?).

Le savoir est le pouvoir  :-)

Happy-Fellow-KEY

C’est suite à un échange de messages avec Mary Hunter (dont je vous conseille sans réserve aucune le blog si vous ne le connaissez pas déjà, ce qui me surprendrait si vous lisez celui-ci) que j’ai découvert l’événement : passionnée de PORTL games, que j’ai introduit dans tous mes cours clicker depuis quelques années, je venais aux nouvelles au sujet de la sortie du manuel PORTL qu’elle nous promet depuis un temps certain (il n’est pas encore sorti, patience patience).

Si vous vous demandez ce qu’est le PORTL, rendez-vous sur l’article à venir à ce sujet, stay tuned ;-)

C’est donc Mary qui m’a informée de l’événement qui m’a donné l’opportunité bénie de la rencontrer pour la première fois  :lol:

Mary a un Master en Science du Comportement complété à l’UNT (University of North Texas, là où enseigne le Dr. Jésus Rosalez-Ruiz et  là où j’irai faire mes études dans ma prochaine vie ou dès que je gagne à la loterie dans celle-ci : en effet, la vie n’est-elle pas faite pour apprendre ?).

Elle y enseigne désormais en sus de ses nombreuses activités avec les animaux. Elle est de cette nouvelle génération de béhavioristes issue de la biologie qui contribuera, avec le temps, à faire de la science du comportement un acteur incontournable dans la compréhension du vivant. 

A la conférence,  présents également la Dr. Susan Friedman et le Dr. Jésus Rosalez-Ruiz…

Hélas (pour moi), j’avais déjà écouté l’intégralité de leurs interventions en d’autres occasions et lieux (y compris en ligne)  et, s’il est tout à fait vrai que, à chaque fois, on découvre une dimension supplémentaire aux notions présentées, j’ai été un peu déçue de découvrir que pas grand chose n’était nouveau.

… hey, ne vous méprenez pas : si je n’avais que ça à faire et (surtout, surtout) un budget illimité, je sautillerais avec délectation d’une conférence à une autre sans la moindre arrière pensée mais, comme le budget formations n’est pas extensible, pas plus que le temps que j’ai à y consacrer, je suis toujours avide de connaissances nouvelles.  

Fin du préambule  :-)

Cette conférence de quatre jours a donc été ouverte par la Dr. Susan Friedman (qu’on ne présente même plus), toujours avec son humour « coquin-mais-pas-trop » et sa voix si particulière (que je trouve incroyablement apaisante). 

Je vous conseille, encore une fois, si vous êtes comme moi un(e) geek du comportement, sa formation « Living & Learning with Animals for professionals » (uniquement si vous parlez bien l’anglais, car elle est exigeante et très dense).

J’ai le bonheur de l’avoir suivie et complétée il y a quelques années et c’est une des meilleures formations que j’ai à mon actif, un vrai petit bijou  :lol:

Susan a été clairement très marquée (comme beaucoup d’entre nous) par le livre de la Dr. Susan Schneider « The Science of Consequences » dont je vous ai déjà parlé dans ce blog et que je vous recommande encore une fois.  En effet, sa présentation « The Learning Planet » (la planète apprentissage) était largement inspirée de ses travaux.

Le message fondamental de cette présentation est que le comportement n’est JAMAIS indépendant des conditions environnementales – il n’est pas à « l’intérieur » d’un quelconque organisme mais toujours conditionnel et donc conditionné par l’environnement.

Pour nous éducateurs : votre animal n’est jamais « quelque chose » (buté, démotivé, motivé, gentil, méchant, etc.) mais agit par des comportements pour obtenir des conséquences et contrôler son environnement.

Quand on veut faire disparaître un comportement, on s’attaque à un renforçateur – plus l’animal est déterminé dans son comportement, plus le renforçateur est important pour lui. 

Ce qui est vrai pour la forme la plus simple de vie à la plus complexe : de la bactérie, les invertébrés à la plus complexe, c’est une organisation planétaire : agir pour un résultat. 

Plus l’organisme est complexe, plus sophistiquée sera sa capacité d’apprentissage et plus vaste son panel de renforçateurs. 

learning1

Une étude du gouvernement britannique qui n’étonnera personne je pense, a démontré une corrélation évidente entre notre capacité à contrôler notre environnement dans un contexte professionnel et notre santé physique et psychique (Mermot et al., 1978, 1991).

En effet, qu’est donc un « burn out » sinon une graduelle perte de contrôle (perçue ou réelle) sur notre environnement ? Quand nous avons l’impression de ne plus rien contrôler, de ne rien pouvoir changer, de devoir endurer et subir quoi qu’il nous en coûte, sans échappatoire possible, nous tombons malades (et nous allons mieux quand on reprend un certain contrôle). 

burnout

Une étude portant sur le « pacing » (comportement d’allées et venues des animaux captifs) chez les ours polaires a démontré qu’une distribution de nourriture « gratuite » et aléatoire ne réduisait en rien cette stéréotypie alors que la recherche volontaire de cette nourriture a apporté des effets positifs (Carlestead et al., 1996).

Cette recherche proactive,  leur a donné une forme de contrôle sur leur environnement avec un effet bénéfique considérable. A retenir quand nous parlons d’enrichissement de l’environnement : il est tel quand l’animal s’engage.

oui, je sais, ils seraient mieux dans leur environnement naturel… 

Contrôler son environnement, c’est-à-dire, décider et entreprendre dans le sens de conséquences désirables, est un renforçateur primaire.  

Comment ne pas en déduire qu’il est légitime de donner des compétences à nos animaux domestiques afin de leur permettre d’agir sur leur environnement par la pratique et mise en œuvre de ces apprentissages afin d’obtenir des conséquences opportunes à leurs yeux? 

Nos chiens vivent dans un contexte humain, plus ils auront d’apprentissages, plus ils obtiendront de liberté, plus ils obtiendront de la liberté et plus ils auront de contrôle sur leur vie.

Ce sont les conséquences qui créent la dite « motivation » et nous apprenons continuellement l’application de nouveaux comportements qui nous amènent à un choix   de renforçateurs de plus en plus vaste et riche. Plus nous acquérons de compétences, plus nous trouvons de renforçateurs dans notre environnement. 

learning2

Dans le contexte de cet article, être « vieux » à n’importe quel âge, n’est-ce pas tout simplement d’avoir abandonné la recherche de nouveaux renforçateurs?  8-)

henducks

Ce qu’on appelle l’instinct est continuellement affecté par les conséquences produites et les apprentissages : des canetons qui n’auraient pas entendu  les sons habituels de  leur espèce dans l’œuf et à qui on a passé des enregistrements d’une autre espèce, démontraient une préférence pour l’autre espèce.  La génétique est sensible à l’environnement et sujette à l’apprentissage. 

L’évolution et l’apprentissage marchent main dans la main et enfantent la « sélection» qui n’est rien d’autre qu’une conséquence. La nature sélectionne ce qui « fonctionne » au détriment de ce qui ne fonctionne pas. 

Dans la nature, un changement d’environnement va causer une sélection des réponses comportementales qui, à son tour, va influencer le bagage génétique…

Les parasites des plants du tabac ont appris à éviter certains insecticides quand ils ont été associés à un autre stimulus et 77% de leur progéniture savait, dès la naissance, éviter le même aversif.

On a mis des moustiques dans une machine qui reproduit l’agitation de nos mains (quand on essaie de chasser ces charmantes bestioles) et on a associé ces vibrations avec une odeur spécifique : les moustiques ont appris à éviter cette odeur (et on retenu l’information pendant plus de  24 heures).

J’ai moi-même toujours observé que, dès que j’empoigne la tapette à mouches, plus de mouches pendant plusieurs minutes.

La fascinante flexibilité de tout ce qui est vivant…

On ne peut pas changer un ADN : par contre, si l’environnement est modifié, le comportement l’est également et le comportement peut modifier le cerveau. 

En gros, et c’est passionnant, nous (comme tout ce qui est vivant) ne sommes pas les victimes inertes et sans contrôle de l’évolution : nous expérimentons continuellement des conséquences qui vont, à terme, influencer notre évolution future. 

Nous humains, nous émerveillons constamment de la capacité d’une quelconque espèce à apprendre alors que c’est un mécanisme fondamental à toute survie.

J’avais déjà lu un article absolument passionnant au sujet des apprentissages chez les plantes mené par Monica Gagliano (cliquer ici, en anglais) – des plantes qui ont appris à suivre une émission d’air indiquant la direction vers un renforçateur primaire (la lumière, indispensable pour elles).

Par la suite, ces mêmes plantes suivaient l’émission d’air même quand celle-ci ne les emmenait plus vers la lumière (parlons donc d’écologie cognitive – qu’est-ce donc d’autre que de l’apprentissage ?).

Les apprentissages deviennent des compétences, les compétences nous permettent d’agir sur notre environnement et donc de le contrôler dans notre intérêt et pour notre bien-être.

« Une fois que le vivant, tout le vivant, a pu apprendre des conséquences, la vie ne fut plus jamais la même »

(Dr. Susan Schneider).

earth

Nous vivons tous sur la « planète apprentissage » 

L’apprentissage sans erreurs

ou « errorless learning » :-D

Préambule 

L’apprentissage sans erreurs est une approche qui a été introduite Charles Ferster, psychologue, dans les années ’50 dans le cadre de recherches sur l’apprentissage.

B.F. Skinner a aussi énormément contribué au concept et a écrit : « … les erreurs ne sont pas une fonction de l’apprentissage et vice versa et elles ne doivent pas être imputées à l’apprenant. Les erreurs sont le résultat d’une piètre analyse du comportement, d’un piètre plan de shaping qui évolue trop vite d’une étape à une autre et ne se focalise pas sur les prérequis indispensables à une réussite spécifique ».

Plusieurs étudiants de Skinner ont continué sur cette lancée : en 1963, Herbert Terrace a publié une étude décrivant une expérience de discrimination de formes et couleurs avec des pigeons. Il travaillait à minimiser la réponse émotionnelle en cas d’erreur dans un apprentissage par conditionnement opérant.

… fin du préambule  :-D

Pyramid made of tick marks and yellow lamp.

Il y a très (très) longtemps, dans un cours d’agility, alors que mon jeune chien réussissait fort bien ce qu’on lui demandait, le coach du jour m’a fait monter le critère (le point de succès ou, plus simplement, notre exigence vis-à-vis de la performance du chien), à une allure telle que, rapidement, il ne pouvait que se confronter à l’échec… ce qui est évidemment arrivé et semblait réjouir le coach considérablement (contrairement à moi).

A la vue de ma mine dépitée face à cette approche, il m’a dit « comment veux-tu qu’il fasse la différence entre ce qui est juste et ce qui est faux s’il ne fait jamais faux ? Il ne peut pas faire toujours juste ».

Parce que mon coach était convaincu de travailler en « positif », il m’a suggéré de ne pas dire « non » au chien mais d’employer un autre mot comme « zut » « oups » ou « raté », selon lui moins « aversif » qu’un « non » tonitruant (ou qu’un coup de batte de baseball, on en convient aisément)  :lol:

Si on est tout à fait sincères toutefois, on veut faire tester au chien la différence entre un renforcement positif et une punition : en effet, en quelques répétions seulement, votre «oups» ou «raté» (ce qu’on appelle communément un « non reward marker » – un marqueur d’erreur)devient une information parfaitement aversive.

Imaginez-vous acteur dans un jeu télévisé : quand vous répondez juste, on entend un «jingle » immédiatement suivi d’un billet de mille euros.

Quand, au contraire, vous répondez faux, on entend un « buzzer » et rien n’arrive.

En très peu de répétitions, le « buzzer » causera chez vous une émotion parfaitement désagréable (même si personne ne vous assène un coup de batte de baseball : dans l’absolu, si vous receviez en prime un coup de batte de baseball suite au buzzer, vous finiriez rapidement par ne plus répondre du tout).

Cette émotion précisément (frustration, irritation, dépit, tristesse, etc.) sera très vite associée au buzzer et, si elle se répète trop souvent, versus le jingle qui annonce la réussite (et le renforçateur), elle s’étendra à l’activité entière («ce jeu n’est pas drôle» ou «je suis nul»:-(

… et donc, mon chien, mis en situation de « essaie toujours » a, évidemment, fini par faire faux, puis encore faux et faux encore – suscitant en moi (puisque je ne vais pas parler des émotions de mon chien que je ne peux prétendre connaître), une certaine irritation envers l’activité elle-même, le coach et, admettons-le, vis-à-vis de mon chien également  :-|

Au niveau du comportement de mon chien (qui lui est observable et quantifiable) –il s’est mis à renifler le sol avec une grande attention, comme si une odeur sublime avait soudainement fait son apparition (un clair « je n’ai plus envie de jouer avec toi »).

A force « d’erreurs » induites, suivies de divers « ratés », on crée avec une touchante application une réponse conditionnée à un signal, à une activité précise (dans ce cas, l’agility), à un environnement, voir même à une personne (moi en l’occurrence).

Et, comme si ça ne suffisait pas, on crée la mémoire du comportement inapproprié.

En dessous, une intéressante vidéo du Dr. Tedd Judd, professeur de psychologie. Elle est en anglais et, si vous êtes anglophones, je vous conseille de la visionner en entier.

Je la résume pour ceux qui ne sont pas copains avec la langue de Shakespeare

Il mentionne un de ses patients qui souffre d’une perte de mémoire suite à un accident.

Lors d’une séance, il demande au patient « vous souvenez-vous de mon nom ? » et le patient répond par la négative, il ne s’en souvient pas.

Le professeur incite donc le patient à se lancer « essayez quand même » et le patient lui répond « euh, Dr. Smith ? ».

Le praticien lui répond « non, je suis le Dr. Judd ». La séance suivante, il répète sa question «vous souvenez-vous de mon nom ? » et, encore une fois, le patient répond « non ».

Le praticien l’incite encore à « se lancer » et le patient répond « c’était pas Dr. Smith ? » et la réponse arrive « non, je suis le Dr. Judd ».

A leur troisième rencontre, le patient aperçoit le Dr. Judd et l’apostrophe allègrement «hey, bonjour Dr. Smith ».

Son cerveau a « appris » ce qu’il a le plus souvent répété, encore et encore, plutôt que la «bonne réponse ».

dommage

Je le dis souvent à mes clients : plus votre chien met en pratique un comportement et plus celui-ci devient son comportement « par défaut », celui qu’il retient (à considérer chez le chien qui déclenche et déclenche encore sur un quelconque élément de son environnement).

Quand on me répond « mais je ne peux pas l’empêcher de déclencher au jardin » (par exemple), je n’ai pas de baguette magique à vous fournir (il vous faudra limiter la visibilité du chien ou opter de ne plus le laisser seul au jardin en train d’aboyer cent millions de fois sur les passants car ce comportement spécifique, utilisé encore et encore, devient comme un muscle sur entraîné et surpassera tous les autres, moins fréquents).

barking

Prenons l’exemple de l’apprentissage d’une marche en laisse sans tirer, une des principales préoccupations de nombreux propriétaires : la plupart des procédures, méthodes et techniques (considérées comme « positives ») impliquent que le chien tire malgré tout d’abord : un comportement qu’on s’évertue ensuite à mettre sur extinction (c’est-à-dire qu’on veut faire disparaître le comportement de « tirer »), avec des résultats souvent peu probants.

dogpulling

La voie royale reste encore de rendre un comportement probable et de le renforcer (marcher à la hauteur de la cuisse de l’humain).

Dans une séance de shaping, une approche « sans erreurs » ne peut être construite sans un plan de shaping réfléchi, écrit, pensé et maintes et maintes fois revu (parfois).

think

Les gens travaillent souvent au clicker de cette manière « essayons toujours, on verra bien ce que ça donne » - ce qui est la porte (grande) ouverte à l’erreur, à la répétition de l’erreur (parfois encore et encore) et, au final, à l’irritation de l’humain qui conduit la séance…

… avec, en prime, un double effet Kiss-Cool : mémorisation de l’erreur ET réponse conditionnée frustrante à un exercice, un signal voir au travail de manière générale  :roll:

Un apprentissage sans erreurs est un but vers lequel on doit  travailler en réfléchissant à l’environnement, aux erreurs possibles (afin de les rendre improbables), pour – en définitive – réduire la difficulté et le temps d’apprentissage et, donc, construire un comportement qui, une fois rattaché à un signal, se comportera comme un renforçateur secondaire, fort de son historique de réussite et de confiance.

Happy Training

Graines et amandes fermentées

neige2

Comme il a fait très (très) froid, que le chemin de ma maison était impraticable à cause de la neige et que j’ai du rester guetter l’installateur sanitaire pendant deux jours entiers pour qu’il vienne me sauver de mes canalisations congelées (bonheur), on a décidé de faire quelques stocks pour les chiens… on est parés en mix de légumes, bouillon d’os gélatineux pour un bon moment  :lol:

Dans la foulée, j’ai décidé de fermenter des graines de tournesol et courge et des amandes biologiques que j’avais dans mon armoire – destination :  la gamelle des chiens  :lol:

graines

 Intérêt nutritionnel des graines de courge : 

  • pour leur effet vermifuge naturel (les graines de courges contiennent un acide aminé qui a un effet paralysant puis évacuateur des vers dans le tract digestif)
  • elles sont riches en magnésium (un minéral qui est souvent trop peu présent dans une alimentation crue)
  • elles sont une source de zinc (autre minéral souvent trop peu présent dans une alimentation crue)
  • elles contiennent des acides alpha-linoléiques
  • elles sont riches en tryptophane
  • elles sont une source de fibres

Intérêt nutritionnel des graines de tournesol

  • elles sont riches en vitamine E et sélénium
  • elles sont une source de manganèse, de cuivre et de thiamine
  • elles contiennent de l’acide linoléique
  • elles sont une source de fibres

 Intérêt nutritionnel des amandes

  • elles sont riches en vitamine E et magnésium
  • elles sont une source de cuivre
  • elles apportent de la riboflavine et des antioxydants
  • elles sont riches en fibres

 … et la fermentation alors, pourquoi faire ?

Post fermentation, les nutriments des graines et des amandes seront plus bio disponibles pour le chien – en effet, elles sont ainsi « prédigérées » par les bactéries produites lors de la fermentation et leurs nutriments sont beaucoup mieux assimilés que si on devait les donner telles quelles.

En utilisant la partie claire de mon kéfir que j’ai laissé volontairement se séparer (voir photo ==> ce petit lait active la fermentation), les chiens bénéficient, dans la foulée, des bienfaits des probiotiques du kéfir et des fibres en tant que prébiotiques.

petitlait

Si vous ne faites pas de kéfir (de lait) pour vous ou vos chiens, vous pouvez acheter un sachet tel que celui-ci pour l’occasion et utiliser du lait de chèvre au lieu d’utiliser l’eau (ou un mélange des deux).

 sachetkefir

Fermentez de quoi suffire à vos chiens pour moins d’une semaine si vous comptez garder votre réserve au frigo (les graines et les noix rancissent rapidement, comptez une conservation de 4 ou 5 jours maximum).

germees

Je congèle ce que j’ai en excès (ce qui diminue légèrement les probiotiques mais reste intéressant).

Ingrédients (quantités à adapter à vos besoins)

  • Environ une demi tasse de graines de courge, une demi tasse de graines de tournesol et une demi tasse d’amandes (non salées et crues, si issues de la culture biologique évidemment, c’est mieux).
  • Environ une grande tasse d’eau filtrée ou faiblement minéralisée.
  • 10-15 cuillères à soupe (non métallique la cuillère) du petit lait de kéfir.

Comment faire?

Mettre tous les ingrédients dans un contenant adapté (non métallique, idéalement en céramique) et laisser fermenter pendant 24 ou 36 heures (selon température ambiante).

Mixer sans égoutter, garder ce qu’il vous faudra pour 4 ou 5 jours au frigo et congeler le reste.

mixees

Combien en donner ?

J’ajoute ce paragraphe car je sais que vous allez me poser la question dix mille fois… mais on parle d’aliments et non de médicaments, il n’y a donc pas de posologie et tout dépend de ce que contient la gamelle BARF de votre chien et quelles sont vos autres sources de ces mêmes nutriments (notamment manganèse, zinc, magnésium et vitamine E)mais la variété étant source d’équilibre, cette préparation est une alternative intéressante.

Une cuillère à soupe pour un chien d’environ 20-25 kilos 2 ou 3 fois par mois est une bonne base  :-D (une « patte » fait une cuillère à soupe)  :lol:

Attention : les graines de courges peuvent se révéler irritantes donc, quelle que soit la forme sous laquelle vous en donnez, elles ne doivent pas être données en continu mais occasionnellement (2-3 jours par mois). 

… et voilà le produit fini, prêt à l’emploi ces prochaines semaines (accompagné de son pote bouillon d’os)  :-D

congelées

Niveau appétence, ceux qui connaissent mes chiens savent qu’ils ne sont pas une référence : ils auraient tendance à manger d’abord et réfléchir ensuite (ce qui, avouons-le, est très pratique mais parfois un peu frustrant)  :-D

La prochaine fois, je vous parlerai de comment je fais fermenter les légumes des chiens également  :-D

Happy cooking 

Il ne le fait pas « pour toi »…

SkinnerLove

« Il ne le fait pas pour toi, il le fait pour la friandise » : voilà comment certains asphyxient de leur jugement sans nuance les tentatives encore incertaines de ceux qui débutent dans une approche des apprentissages renforcés positivement.

Pour tempérer, certains arrivent en expliquant qu’un renforçateur (qui, dans ces groupes de discussion s’appelle toujours « récompense ») ce n’est pas « que la friandise mais aussi la caresse ou le jeu » (ouf, on est sauvés) afin de rassurer la personne en proie à ce doute atroce : « mon chien, bosse-t-il POUR MOI ou pour le petit morceau de fromage ? »

Passons aussi sur le fait que, nous humains, mangeons et ripaillons sans complexe aux naissances, aux fêtes religieuses (même quand on est un mécréant de première d’ailleurs), aux anniversaires de naissance, de mariage et même aux enterrements.   A peu près tous les moments importants – ou tout simplement plaisants, même les plus anodins –  de nos vies comportent une relation à la nourriture  d’une manière ou d’une autre ☺ 

Car le problème véritable et profond est de savoir si le chien se montre à ce point désintéressé pour « travailler » avec nous (ou pour nous) avec une abnégation absolue ou si, finalement, il n’est qu’un affreux petit opportuniste qui se mobilise uniquement si et quand une friandise est attendue?

En clair : nous aime-t-il « inconditionnellement » ?

Au delà de la technicité et la mécanique du clicker training (où la friandise est la conséquence d’un comportement et jamais son antécédent : en clair, c’est le comportement qui fait arriver la friandise et pas le contraire), au delà d’une approche au leurre, souvent conspuée et pourtant parfois tout à fait apte à diminuer le stress de manière générale, la question est bel et bien philosophique chez certains.

Elle s’inscrit dans cette vision parfois très poétique que nous avons du chien.  

« Fidèle » quoi qu’il en soit et qui qu’on soit et qui nous aime plus qu’il ne s’aime soi-même — ce qui lui confère une dimension sanctifiée tout à fait particulière à laquelle certains tiennent dur comme fer  :lol: 

En effet, on ne peut pas dire que l’amour inconditionnel coure les rues dans notre espèce  :-)

unconditional

L’amour « inconditionnel » est présumé ne rien demander en retour, absolument rien : ce qui m’apparaît comme une option peu raisonnable personnellement et qui implique potentiellement un léger souci d’estime de soi et de ses besoins personnels, je suis plutôt du genre pragmatique… un peu comme les chiens  ;-) 

Je ne pense pas que le chien n’attende rien en retour dans sa relation à l’humain… il demande qu’on comble ses besoins fondamentaux et moins fondamentaux et, parfois, spécifiques à sa race et, quand on ne le fait pas, les problèmes de comportement arrivent presque inévitablement (certes, il ne s’en va pas mais en a-t-il vraiment le choix au final?)

Je ne pense pas qu’un chien soit « fidèle » quoi qu’il arrive : j’ai récupéré un chien perdu dans la nature qui, en apercevant ses propriétaires chez qui je l’ai évidemment ramené, a ressauté dans mon coffre avec conviction et a pris son air le plus dépité possible quand on a du le rendre, contre son gré, à sa « vraie famille » (il n’a pas eu un très improbable coup de foudre pour ma personnalité charismatique mais, ayant peur de le perdre pendant notre balade, je l’ai gavé de dés de jambon pendant 4 heures créant probablement chez lui le premier historique de renforcement de sa vie).

Les besoins physiologiques et de sécurité comblés, arrivent les autres besoins (cognitifs notamment). 

Le clicker training active des circuits émotionnels fondamentaux au bien-être : celui de la compréhension de l’environnement (indispensable à tous les animaux, domestiques ou sauvages d’ailleurs) et celui du jeu… ce sont bel et bien ces émotions (qui favorisent la production d’hormones à l’effet euphorisant) qui rendent les chiens « accros » à un apprentissage bien présenté et maîtrisé, via cette minuscule friandise qui les réjouit et engage dans un premier temps. Il ne s’agit pas d’une distribution désordonnée de friandises mais planifiée et réfléchie. Il y a des conditions assez strictes au renforcement positif – que ses détracteurs ignorent complètement le plus souvent  8-) 

En répondant à toute cette panoplie des besoins de nos chiens, se construit ce qu’on appelle la « relation » – une myriade de renforçateurs qui, les uns après les autres, la rendent solide et empreinte de confiance mutuelle (« you are good news »). 

Ils ne sont guère différents de nous car, avec nos meilleurs amis, nos compagnons et compagnes, tous ceux que nous apprécions nous partageons également un historique de renforcements parfois kilométrique et qui, en raison de sa solidité, de ses répétitions innombrables, supporte parfois quelques coups de canifs occasionnels s’ils ne sont pas trop méchants (quand les coups de canifs deviennent répétés ou trop violents, étrangement, même les grandes amitiés s’arrêtent). A moins de confondre amour et dépendance, nous fonctionnons considérablement de la même manière  ;-)

Même notre action la plus désintéressée en apparence, est gratifiante, parce qu’elle nous apporte cette émotion confortable qui nourrit l’estime que nous avons de nous-mêmes…

feelinggood

Nous passons l’intégralité de nos vies à essayer d’échapper à des conséquences néfastes ou désagréables et à rechercher celles qui seront agréables, gratifiantes et plaisantes. Tout ce qui est gratifiant produit de la dopamine et votre cerveau va chercher à reproduire le comportement en question. 

C’est ce qu’on appelle communément le conditionnement par apprentissage opérant et qui nous motive même quand on croit que le conditionnement est un gros vilain mot

Quand vous bossez/jouez avec votre chien, au delà de l’apprentissage d’un quelconque comportement, vous lui apprenez, surtout et avant tout, si faire des choses avec nous est quelque chose de gratifiant, qui est générateur de bonheur, de confiance en soi, de confiance en nous ou, au contraire, source de stress, de frustration, d’ennui ou de mal être : à partir de ces conclusions, notre chien « aimera » travailler avec nous ou nettement moins.

On en fera un partenaire enthousiaste ou ce qu’on appelle un chien « distrait » « démotivé » « têtu » « borné » et mille autres étiquettes rassurantes (pour notre estime de nous-mêmes avant tout).

Ne vous culpabilisez pas, ne laissez pas les autres vous culpabiliser si vous souhaitez construire  la relation à coups de renforcement – c’est l’unique voie qui existe finalement et, peut-être, est-ce précisément ça « l’amour » ? ☺

gooddog

« Qu’est donc l’amour sinon une autre définition du renforcement positif ou vice versa? » (B.F. Skinner)