Le « NRM » – on en parle?

Partager :Share on FacebookTweet about this on TwitterPin on Pinterest

fail1

Il y des questions qui reviennent régulièrement sur la table et suscitent une curiosité légitime en apprentissage… le NRM est, décidément, une de ces thématiques qui fait systématiquement l’objet de questions en stage ou pendant mes cours ou sur les pages d’éducation canine  ;-)

kesako

Qu’est-ce donc que le NRM avant tout ?

C’est, en anglais, le « non reward marker » ou, en français, « le marqueur de non renforcement »  : en plus clair, ce petit mot que bon nombre d’éducateurs utilisent et préconisent, du style « oops », « raté » « non » ou autre mot qui informe le chien, de manière présumée pacifique, que ce qu’il vient d’effectuer n’est pas ce que nous attendions.

On parle donc d’un marqueur (un mot spécifique, toujours le même) qui annonce au chien que le renforçateur (la friandise, le jeu ou autre) n’arrivera pas.

Tout comme le clicker annonce l’arrivée de choses plaisantes, le NRM annonce qu’elles n’arriveront pas  ;-)

noreward

Si cette thématique revient sans cesse, c’est généralement pour connaître la « valeur ajoutée » de cette pratique, en clair « mais est-ce que ça marche ? », c’est ce que voudraient savoir mes stagiaires en général  ;-)

Au delà de la valeur ajoutée, la question principale reste pour moi « cette pratique est-elle compatible avec une éducation dite positive » ?

Les éducateurs qui emploient ce fameux NRM, expliquent souvent que tout est information et que l’information est rassurante pour le chien : il reçoit un feedback immédiat sur ce qu’il vient de faire et pourrait, dès lors, éliminer cette action comme inefficace pour en adopter une autre.

Dans ce sens, le feedback serait rassurant et non punitif.

feedback

En effet et dans l’absolu, un « ne va pas par là » devrait être presque aussi utile qu’un « va par là » (presque, parce qu’évidemment, le « ne va pas par là » ne vous informe en rien sur le chemin à prendre). 

Avoir le plan de tous les pièges à ours dans une forêt est tout aussi utile qu’un plan qui vous montre le chemin à suivre… vous traversez la forêt en évitant les pièges (seule votre émotion change quand vous passez votre temps à éviter un aversif plutôt qu’à surfer sur un chemin sécurisé).

afraid

Je donne souvent l’exemple d’un jeu télévisé où, quand vous donnez une bonne réponse, vous obtenez un « jingle » qui vous annonce des gains et, en cas de mauvaise réponse, un «buzz » qui lui vous annonce clairement qu’aucune forme de récompense ne va arriver.

Si vous vous imaginez dans la situation où vous allez entendre le « buzz » encore et encore (et encore)je vous laisse imaginer votre émotionnel au moment où celui-ci se déclenche ?

Resteriez-vous neutre ? Ne modifie-t-il pas votre état émotionnel ?

J’en doute fortement.

depité

Le « buzz » sera conditionné à un état d’esprit spécifique qui, à mon sens, ne génère ni joie, ni envie d’entreprendre.

Il n’est pas punitif, me dit-on  ;-)

Difficile à croire pour moi… si on s’en tient à la définition même de la punition.

Une punition est quoi que ce soit qui, arrivant immédiatement après un comportement, diminue la fréquence de ce comportement à l’avenir, elle est, par définition aversive.

Un aversif conditionné est un quelconque stimulus qui, au départ est neutre (n’a pas de signification particulière, tout comme le clicker au départ n’en a pas non plus) mais qui, rattaché de manière systématique à quelque chose de déplaisant, devient également déplaisant (si je me réfère encore une fois à mon « buzz », il devient très rapidement aversif vu qu’il me prive de quelque chose que je souhaite ardemment obtenir).

Que la punition « fonctionne » est un fait en science du comportement (en effet, on ne peut parler de « punition » que quand le comportement a diminué – c’est donc le comportement futur qui va nous informer si ce que nous avons entrepris était punitif ou pas, que nous l’ayons fait volontairement ou pas).

En conséquence, si le NRM « fonctionne », il est par définition punitif (puisqu’il diminue la fréquence d’apparition d’un comportement) et s’il n’est pas punitif, il ne sert à rien ☺

logique

L’idée du NRM véhiculé de manière complètement neutre chez les êtres de langage et d’émotion que nous sommes me laisse plus que perplexe et dubitative : j’entends trop d’éducateurs s’éclater dans des « yeeeesss » ou « ouiiiii » euphoriques pour croire, un seul instant, que le « raté » ou le « oops » ne véhicule aucune émotion ☺

… et, si nous y mettons notre émotion, comment imaginer qu’elle n’influence pas, à son tour, l’émotionnel du chien ?

On pourrait concéder à la réflexion qu’un minimum d’émotion désagréable n’est pas un drame insurmontable s’il sert une stratégie spécifique qui doit emmener le chien vers le succès mais, en clicker training, il n’a jamais été question de laisser l’animal patauger dans l’erreur sans le moindre feedback, bien au contraire.

Refaire, encore et encore, la même chose en s’attendant à un résultat différent est, à mon sens, la plus grossière erreur qu’on peut commettre en clicker training.

Dès la première erreur, une modification de la stratégie (du shaping plan) s’impose immédiatement.

think

L’erreur est amplement utilisée par certains éducateurs et pas des moindres : « laissez-le sortir de la cage » (il va prendre la porte dans la poire) « laissez-le essayer de prendre les friandises dans la main »  (votre main se ferme devant le nez du chien)… dans tous ces cas, on voit clairement le chien détourner la tête, cligner des yeux, reculer imperceptiblement ou franchement aboyer sur l’éducateur  :-|  (encore vu dernièrement dans une vidéo d’une très célèbre trainer). 

bref, tous les signes de la frustration imminente ou déjà très présente.

frustrated

Personnellement, je ne le préconise absolument pas… dans une séance de clicker training, votre chien n’apprend pas juste le comportement que vous êtes en train de travailler mais il se fait une idée très précise de ce que signifie le fait de travailler avec vous.

L’erreur génère du stress et de la frustration, une diminution de la réponse (moins de comportement), voir, chez certains chiens, l’apathie totale (les pessimistes ou ceux qui ont un peu trop dégusté la punition dans le passé et, pour qui, le NRM est devenu le signal de l’arrivée imminente d’une punition plus musclée).

L’erreur ne génère ni enthousiasme ni envie, ni joie ni confiance.

Pour finir, parfois le NRM se métamorphose dans un espèce d’ultimatum « fais ça ou tu vas voir » – comme le « un-deux-trois » de nos parents qui nous façonnaient à ne répondre qu’au fatidique « deux et demi » ☺

doit

Je me rappelle d’une personne qui, en agility, répétait « raté » d’un ton de plus en plus excédé à son chien lors de ses erreurs successives (mais ne changeait absolument rien à ce qu’elle était en train de faire) avant de mettre le chien en voiture (ce qu’elle estimait être une punition et que, personnellement, je soupçonnais fortement d’être un magnifique renforcement négatif).

Je n’ai jamais vu son comportement évoluer dans le sens qu’elle souhaitait  :roll:

Ce qui ouvre tout grand la porte à la construction d’un comportement superstitieux : si le chien réussit ensuite (parce qu’elle aurait modifié la position de son corps par exemple, je peux vous en parler moi qui suis une si piètre conductrice), le « raté » prend une valeur qui n’existe pas dans les faits mais il sera considéré comme efficace par l’humain qui l’utilise.

superstition-1-638

Il est tout à fait plausible d’imaginer que, pour certains chiens ultra motivés dans une quelconque activité (notamment sportive), l’utilisation d’un NRM ne diminuerait pas la réponse des comportements suivants mais l’erreur, et la répétition et le manque de renforçateur, sont stressants même pour ces chiens et je doute que le travail en soit amélioré, au contraire.

Avec d’autres chiens, l’échec est dévastateur et le NRM suffit amplement à les désengager du travail.

Entre frustration et apprentissage sans erreurs (ce qui est évidemment un but à atteindre) à travers la modification immédiate d’une stratégie après un click manqué, mon choix est rapidement fait… et vous ?

Happy Training (avec ou sans NRM)  :-D

Laisser un commentaire