Signature
La boîte noire (on ne s’intéresse pas de savoir ce à quoi le chien ou l’enfant pense, on se concentre sur le résultat produit après exercice d’un stimulus).
Figure 1 – Comportement initial > boîte noire > comportement final
Description
Le béhaviorisme se concentre sur la description scientifique du comportement (Pavlov, Thorndike, Skinner sur les animaux, et Watson et Bandura sur les humains). L’apprentissage est une histoire d’interactions du sujet avec son environnement ; le formateur manipule l’environnement dans le but de susciter des réactions.
Pour les béhavioristes[1], apprendre consiste à acquérir un nouveau comportement, ou modifier un comportement préexistant. Évolution de l’empirisme, le béhaviorisme postule que l’intelligence se réduit aux habitudes acquises. Plus finement, il cerne l’activité intellectuelle qui s’attache aux corrélations entre les stimuli extérieurs et les comportements[2] observables. Les behaviorismes adoptent une attitude empiriste selon laquelle l’explication de nos comportements doit être fondée sur l’expérience et sur l’observation, car l’expérience sensible – c’est-à-dire ressentie – est considérée comme le réel. Cette conception a inspiré les premiers travaux de la pédagogie par objectifs, qui s’efforçaient de traduire systématiquement les contenus des programmes en comportements attendus de l’apprenant. De nombreuses critiques portent sur la généralisation à l’être humain d’expériences conduites sur des animaux : les situations dans la réalité ne présentent pas de conditionnement aussi tranché ou inévitable, et l’assujettissement de l’homme n’est sans doute pas aussi fort. Les résistances de l’individu, ses choix, ses opinions, son libre arbitre déstabilisent le conditionnement simple révélé par les expériences. Loin de contester tout fondement, ces critiques insistent sur la nécessité de complexifier les schémas proposés par les béhavioristes, en tenant compte des spécificités humaines[3].
Figure 2 – Les quatre étapes du processus d’apprentissage, selon Abraham Maslow
Si on se réfère aux étapes de l’apprentissage, tel que le définit A. Maslow, le béhaviorisme vise à s’exprimer à l’étape ultime (l’inconscience compétence).
À la première étape (inconscience incompétence) l’apprenant n’a ni les compétences ni la conscience de ce manque de compétence. À cette étape il y a donc insuffisance de savoir ou d’expérience pour comprendre ou mettre en œuvre un principe d’action, utiliser une compétence. La personne ne sait pas qu’elle n’a pas la capacité à comprendre et faire. Lorsque j’étais tout jeune enfant, je voyais des musiciens jouer : je m’imaginais moi-même pouvoir jouer sans problème, j’étais bien entendu incompétent, mais je ne le savais pas.
À la deuxième étape (la conscience incompétence), l’apprenant prend conscience de son manque de compétence. Il possède assez de savoir et/ou d’expérience pour réaliser qu’il n’est pas capable de comprendre ou d’appliquer une règle, ou utiliser une aptitude. Un noël, on m’a offert une guitare. Après quelques malheureux essais, j’ai pris conscience que je ne savais pas jouer de cet instrument.
À la troisième étape (la conscience compétence), l’apprenant s’engage dans le processus conscient d’acquisition de la compétence manquante. La personne a atteint le seuil de savoir suffisant pour comprendre et communiquer sur un principe d’action. Cependant l’expérience reste insuffisante pour faire de façon efficace. On m’a inscrit au conservatoire de musique, j’ai appris le solfège, je sais bien tenir ma guitare, je sais lire une partition, et jouer le morceau qui y est supporté.
À la quatrième étape (inconscience compétence), l’apprenant atteint un stade où la compétence est complètement installée et ne nécessite plus d’accompagnement. La personne a atteint un seuil d’expérience suffisant pour appliquer un principe d’action, utiliser une procédure. Cette personne n’a cependant pas le savoir suffisant pour comprendre la compétence et communiquer à son propos. La performance des experts est basée sur une compétence inconsciente. Cela fait 10 ans que je joue de la guitare, je n’ai plus besoin de partition et je sais accompagner beaucoup d’artistes, spontanément, par automatisme.
S’oppose à…
Le béhaviorisme est apparu en réaction aux approches dites mentalistes qui voyant dans le mental la cause de toute action défendait l’introspection en tant que méthode d’accès à la compréhension de l’esprit. Suivant l’impact de Sigmund Freud et ses théories structuralistes, la psychologie s’est partagée entre les Européens et les Américains, qui ont poursuivi respectivement la perception, la psychanalyse, l’introspection, et le béhaviorisme.
Les grandes figures
Le physiologiste russe Yvan PAVLOV (1849-1936), et ses célèbres expériences avec un chien[4], a permis de mettre en évidence le processus de conditionnement répondant – conditionnement classique – qui s’effectue par l’association de deux stimuli selon le principe de contiguïté. Il propose aussi des étapes pour le processus d’extinction d’un comportement.
Herman EBBINGHAUS (1850-1909) a contribué à détacher la psychologie de la philosophie, en revendiquant d’asseoir la première sur une approche scientifique (psychologie expérimentale[5]). Il s’est particulièrement attaché à observer la mémorisation de syllabes sans signification[6] pour définir des lois dont la plus connue décrit le principe de l’oubli : en début de période observée, il est important puis décroît progressivement bien plus lentement. Il définit également la courbe d’apprentissage : celui-ci s’améliore avec les répétitions, d’abord rapidement puis plus lentement jusqu’à la maîtrise de la liste. Il en conclut que la répétition fréquente peut fixer plus fermement en mémoire les associations mentales et, par extension, que la répétition favorise l’apprentissage. Il montra également que les items en début de liste sont plus accessibles au rappel que les items du milieu (effet de primauté). Les items de la fin de la liste sont également plus accessibles au rappel que les items du milieu (effet de récence). Enfin, il démontre la notion d’association, comme facilitateur de l’apprentissage.
Edward THORNDIKE (1874-1949) met en œuvre un dispositif simple : il enferme un chat[7] dans une cage dont la porte est équipée d’un loquet. Une nourriture est placée à l’extérieur de la cage, et l’expérience consiste à observer les comportements (exploratoires) du chat qui doit manœuvrer le loquet pour l’atteindre. Le hasard le guide, mais si l’expérience est reproduite plusieurs fois, le temps d’évasion est de plus en plus rapide, jusqu’à être nul à partir d’un certain nombre d’essais : l’apprentissage est alors jugé réalisé. Thorndike va donc énoncer ses lois de l’apprentissage, dont les principales sont la loi de l’exercice et de l’effet : la première stipulant que la répétition d’une réponse conditionnée renforce le lien entre le stimulus et la réponse (autrement dit, plus un sujet se comporte d’une certaine façon dans une situation donnée, plus l’association entre cette situation et ce comportement sera renforcée) ; la deuxième voulant qu’une réponse suivie d’un stimulus agréable sera renforcée alors que celle suivie d’un stimulus désagréable diminuera (si la nourriture pour le chat est particulièrement alléchante, les chances de sortie sont plus grandes). Pour Thorndike, les deux lois sont nécessaires et complémentaires à l’apprentissage[8]. Il insiste sur le fait que le sujet doit être actif pour qu’il y ait apprentissage, et il désignera la phase de tentatives infructueuses par l’expression « apprentissage par essai et erreur » (théorie connexionniste[9] de l’esprit).
John Broadus WATSON (1878-1958) a lui aussi impulsé la fondation du béhaviorisme. Désireux d’objectiver la psychologie, il défend l’idée que celle-ci doit se cantonner à l’étude rigoureuse des comportements observables tels qu’ils se produisent en réponse à un stimulus défini, et en excluant tout recours à l’introspection. Convaincu par l’intérêt de l’approche behavioriste pour les applications de la psychologie, les recherches de Watson se portent sur l’étude du comportement animal, la publicité et l’éducation des enfants, notamment à travers l’expérience très controversée dite « du petit Albert[10] »
Et en e-learning ?
De nos jours, le béhaviorisme est décrié et fait figure de modèle du passé, caricaturé par les expériences des réflexes conditionnels de son origine. En réalité, le concept béhavioriste a installé quelques principes largement repris en e-learning :
l’exécution de tâches, sanctionnées par un conditionnement externe (feed-back positif ou négatif : encouragements, félicitations, reproches…), entraînant un « réflexe », un comportement recherché : en ce sens, certains serious game tirent profit de cette approche, en créant un scénario libre imitant plus ou moins la réalité (par exemple la procédure de chargement de containers dans des avions cargo), en y intégrant des perturbateurs (incidents réalistes comme une erreur d’étiquetage, un contre ordre tardif, une nouvelle consigne d’organisation…), et un résultat calculé dynamiquement (sanction : retard, échec, mauvais résultat – récompense : délai imparti respecté, satisfaction du client ou de la hiérarchie…). Les bons comportements, entraînés lors des passations, sont reproduits dans la réalité, et contribuent à améliorer l’efficacité des chargements.
la décomposition d’une tâche complexe en tâches élémentaires[11]. En effet, pour Thorndike, l’enseignement d’une compétence repose sur une division de celle-ci en composantes élémentaires. Ainsi, pour savoir résoudre une addition à deux nombres de deux chiffres (tâche complexe), il convient d’abord de maîtriser l’alignement des chiffres sous le bon rang, savoir additionner deux nombres d’un seul chiffre, savoir reporter une éventuelle retenue (tâches élémentaires). Cette architecture a guidé bon nombre de développements en EAO (Enseignement Assisté par Ordinateur), puis en e-learning :
Figure 54 – Comportement initial > savoirs décomposés[12] > comportement final
Figure 3 – La décomposition d’un problème complexe, selon Thorndike
- Dans l’organisation pédagogique, si on opère de telle sorte qu’il faille prouver la maîtrise de chaque strate avant de passer à celle qui lui est supérieure, on définit l’enseignement programmé. Le béhaviorisme semble être à la base de bien des ressources en e-learning.
- Certaines formations préparant à des tâches très cadrées, très protocolaires, sont particulièrement clientes du béhaviorisme. En conduite ou en pilotage d’engins, par exemple, l’apprentissage et le maintien en compétence sont emprunts de conditionnements : il faut réagir selon une procédure, ne rien en oublier, l’exécuter mécaniquement et méthodiquement.
- Cette pédagogie s’adapte parfaitement à l’usage des nouvelles technologies (TICE) et c’est dans les dispositifs éducatifs de type « presse-boutons » qui fleurissent dans certaines expositions qu’on la retrouve le plus souvent, ces expositions prétendant abusivement offrir un environnement « interactif » …
En conclusion, les théories béhavioristes (puis néo béhavioristes, décrites ci-après), exprimées notamment par EAO ont marqué le début de l’usage de l’ordinateur dans l’apprentissage. Les programmes se centrent alors sur les objectifs à atteindre en proposant un découpage d’un contenu d’enseignement en unités réduites (les grains[13]), considérées comme plus facilement assimilables par l’apprenant, et organisées selon une progression conçue pour en faciliter la maîtrise. Malgré les limites mises en avant par les chercheurs[14] cette approche pédagogique connaît encore actuellement un franc succès auprès des enseignants investis dans des pratiques éducatives supportées par les technologies.
Figure 4 – quelques grands acteurs et concepts marquants du béhaviorisme
1 : L’association se manifeste par la connexion établie par un apprenant entre une action et un résultat. Thorndike a été le premier à formaliser l’apprentissage associatif : ses expériences avec des chats, placés dans des boîtes « à problèmes » (dont l’ouverture est liée à un mécanisme caché à manœuvrer – comme un levier sur le plancher, ou une ficelle au plafond), tendent à démontrer qu’au fur et à mesure des essais infructueux, les erreurs diminuent. Les chats « apprennent » de leurs erreurs car la réussite accidentelle leur permet de sélectionner la bonne action. En 1898, on ne parle pas encore de béhaviorisme et les psychologues sont à la recherche d’une psychologie scientifique.
2 : Le conditionnement : mode d’apprentissage étudié par Pavlov (puis par Skinner). Il existe deux types de conditionnement : le conditionnement répondant (Pavlov) encore appelé conditionnement classique, qui met en jeu un réflexe, une réaction physiologique, un état émotionnel (cf. expérience avec la salivation du chien de Pavlov). Le second conditionnement est dit opérant, ou instrumental : cette fois il ne s’agit plus de réflexe mais de comportement volontaire, déclenché par un stimulus, renforcé positivement si la réaction est celle recherchée.
3 : La loi de l’effet : bien après que Thorndike ait mis en lumière l’apprentissage par essais/erreurs (l’association), il énonce après de nombreuses expériences la loi de l’effet (l’effet de l’action sur le résultat). Il s’agit ici de mettre en œuvre l’apprentissage par conditionnement opérant. La loi de l’effet postule qu’une réponse est plus susceptible d’être reproduite si elle entraîne une satisfaction pour l’organisme et d’être abandonnée s’il en résulte une insatisfaction. En d’autres termes, si la connexion « situation–réponse » est suivie d’un état de satisfaction (donc la récompense) le comportement appris à plus de chance d’être reproduit. Il devient ainsi le premier représentant des théories stimulus/réponse, clé de voûte du béhaviorisme[15]. Plus tard, il a ajouté la loi de l’exercice, qui stipule que les connexions sont renforcées par la pratique, et affaiblies si l’usage est interrompu.
4 : Le comportement : en 1913 Watson écrit un article considéré depuis comme le manifeste du béhaviorisme. En réaction aux pratiques introspectives, il affirme que la psychologie ne doit pas être la science de la vie mentale, mais la science du comportement (behavior en anglais). L’objet de la psychologie devient alors l’observation du comportement humain – et non l’étude de ses idées, motivations, états de conscience, sensations…
5 : Tabula rasa : Watson exprime le concept philosophique épistémologique selon lequel l’esprit humain naîtrait vierge et serait par la suite, par l’exercice et l’expérience, progressivement marqué, formé, impressionné comme pourrait l’être une pellicule ou une plaque de cire mole. L’esprit est donc passif face à l’expérience sensible. Il s’agit donc d’un concept opposé à l’innéisme des idées, et à l’activité de l’esprit.
6 : Le renforcement : c’est l’événement qui maintient ou accroît la probabilité d’une réponse. Il est qualifié de positif s’il conduit à une satisfaction (le pigeon qui appuie sur le bon bouton reçoit des graines), ou négatif, lorsqu’il conduit à une punition (le pigeon perçoit une décharge électrique s’il n’appuie pas sur le bon bouton). Si on demande à un apprenant de se lever lorsque son formateur entre en classe, et qu’on lui donne un bonbon lorsqu’il s’exécute, il y a renforcement positif. Si on le gifle s’il ne répond pas à cette exigence, il y a renforcement négatif. En dehors de ces exemples caricaturaux, bon nombre de renforcements accompagnent la formation : félicitations, indifférences, réprimandes, punitions, encouragements… Sur cette base Skinner[16] fait apparaître la notion de « contingence de renforcement » pour désigner l’environnement qui va produire le comportement. Il se caractérise par trois aspects :
- Les circonstances dans lesquelles le comportement survient,
- Le comportement lui-même,
- Les conséquences renforçantes.
7 : La discrimination : Une réponse à un stimulus et pas un autre est appelé discrimination. Les sujets peuvent être entraînés à discriminer, en renforçant un stimulus plutôt qu’un autre.
8 : La modélisation (ou imitation) : Elle consiste à l’imitation du comportement d’un autre. Albert Bandura (1961) l’a mis en lumière dans sa théorie du déterminisme réciproque[17]. Il décrit l’imitation ou la modélisation comme une source majeure de l’apprentissage. Selon lui, le comportement humain est plutôt le fruit de l’apprentissage social et de l’imitation, que déterminé par les facteurs génétiques et innés.
Apprendre, selon la conception béhavioriste, c’est :
- Modifier durablement son comportement
- Donner une nouvelle réponse à un stimulus (ou un groupe de stimuli) qui jusqu’alors ne le provoquait pas
Les béhavioristes s’interdisent de faire quelque hypothèse que ce soit sur les processus invisibles du cerveau : ils ne les nient pas, mais n’y ayant pas accès, ils sont exogènes à leur théorie.
[1] De « behavior » (comportement), mot inventé par John Broadus Watson (anglais américain). Le terme fut utilisé pour la première fois par John B. Watson en 1913 dans un article portant sur la nécessité d’observer des comportements pour pouvoir les étudier : Psychology as the behaviorist views it. Psychological Review, 20, pp. 158-177.
[2] On distinguera le comportement du réflexe : reculer sa main d’une plaque chaude, c’est un réflexe ; ne plus avancer sa main vers l’endroit brûlant est un comportement.
[3] Certains, comme Carl Rogers, polémiqueront avec Skinner sur les problèmes de la liberté et du contrôle du comportement des actes humains – Psychologie clinique: Carl Rogers (1902-1987) et l’Approche Centrée sur la Personne, à écouter en podcast sur http://www.podcastscience.fm/dossiers/2012/11/20/psychologie-clinique-carl-rogers-1902-1987-et-lapproche-centree-sur-la-personne/.
[4] La présentation d’un stimulus neutre, le tintement d’une cloche, n’entraîne pas de réaction salivaire chez le chien, au contraire de la présentation d’un stimulus inconditionnel, comme un aliment. La présentation simultanée des deux stimuli, tintement plus aliment, entraînent une réponse dite inconditionnelle, la salivation. Après un certain nombre de reproductions, on constate que le seul stimulus neutre parvient à entraîner la salivation. On parle alors de conditionnement répondant. Les travaux de Pavlov pointeront également le phénomène d’extinction, lorsque le stimulus neutre « à la longue » ne parvient plus à faire saliver le chien, ou effrayer l’enfant, et le possible conditionnement en chaîne, associant un stimulus conditionnel, un second, un troisième…
[5] Hermann Ebbinghaus : La mémoire. Recherches de psychologie expérimentale, Ed. : L’Harmattan, 2011
[6] Avant Ebbinghaus, la mémoire était étudiée via l’apprentissage de textes communs, non interchangeables. Il va supprimer la syntaxe et remplacer ces textes par des listes de mots, et supprimer le contenu significatif pour arriver à des simples syllabes sans signification. Il instaure ainsi 2300 syllabes du type consonne/voyelle/consonne (CVC) comme TUT, POL, BAT, TIC….
[7] Habité par l’hypothèse de Charles Darwin, Thorndike mise sur la continuité des espèces entre l’homme et l’animal. Ainsi, il lui apparaît normal que l’étude du comportement animal sert à comprendre celui de l’homme.
[8] Dans une situation d’apprentissage où l’on demande au sujet de tracer, les yeux fermés, une ligne d’une longueur déterminée, la seule répétition des essais ne conduit à aucune amélioration des performances. Pour qu’il y ait apprentissage, il faut, à chaque essai, fournir des indications précises sur le résultat de son comportement : trop long, trop court… On voit ici apparaître la notion de feed-back qui constituera une composante essentielle de l’approche de Skinner.
[9] Contrairement au connexionnisme moderne, Thorndike ne s’est pas intéressé en détail aux connexions entre neurones mais surtout aux associations entre percepts et comportements. La parenté avec le connexionnisme neuronal apparait cependant clairement dans les explications qu’il donne de phénomènes comme la diffusion d’un renforcement aux associations précédentes et suivantes dans le déroulement de l’expérience. Thorndike considérait également l’intelligence comme le reflet du nombre de connexions neuronales dont disposait une personne.
[10] Watson a repris la théorie du conditionnement simple de Pavlov, avec ses chiens. La méthode était la suivante : Watson présentait le rat au petit Albert, et à chaque fois qu’il le touche, l’expert produit un son violent, effrayant l’enfant en frappant une barre métallique avec un marteau. Au bout de quelques répétitions, le petit Albert finit par avoir peur du rat, rien qu’en le voyant. Il a associé le rat au bruit effrayant. Les expérimentateurs auront constaté également que le conditionnement s’est généralisé à d’autres objets (lapin, chien…). Albert avait développé une peur de ce qui se rapprochait du rat (fourrure, autre animal…). Watson a ainsi pu prouver que le conditionnement simple, qui n’était observé que chez les animaux, pouvait également s’appliquer aux humains.
[11] Travaux de Thorndike, 1922 « the psychology of arithmetic ».
[12] Gradus ad parnassum.
[13] Selon l’UNT http://www.universites-numeriques.fr/ , un grain pédagogique (pour l’enseignant) correspond à la plus petite unité d’un scénario pédagogique :
- Comprend une intentionnalité pédagogique,
- S’appuie sur une ou plusieurs ressources d’apprentissage,
- S’accomplit à travers une ou plusieurs activités,
- Doit pouvoir donner lieu à une évaluation de l’apprentissage,
- Doit pouvoir être réutilisé/réapproprié par d’autres enseignants,
- S’intègre dans une séquence d’apprentissage,
- Un guide d’usage est nécessaire.
[14] Par exemple, Piaget ne défend pas les théories behavioristes ; Pour lui en effet, un enseignement mécanisé n’a pas pour seul but de « faire répéter correctement ce qui a été exposé », mais bien de provoquer, grâce au renforcement, un véritable apprentissage. La définition du rôle de la machine à enseigner procède directement de la définition du but de l’enseignement donnée par cet auteur.
[15] De nombreuses recherches contemporaines invalident le mécanisme strictement béhavioriste stimulus/réponse que Thorndike défendait. On pense aujourd’hui que lorsqu’un individu apprend par essais/erreurs (ce qui est extrêmement courant), la sélection de la réponse provient d’une activité cognitive consciente, basée sur la présence d’informations rétroactives. Georges C., Apprendre par l’action, PUF Paris 1989 2ème édition.
[16] Skinner a travaillé sur de nombreuses expériences impliquant des animaux (chats, pigeons…). Il a ensuite étendu sa théorie à l’homme.
[17] L’expérience de la poupée Bobo (Bobo doll experiment) fut conduite par le psychologue Albert Bandura pour tester sa théorie de l’apprentissage social dans l’agressivité. L’expérience consistait à exposer des enfants à des scènes dans lesquelles des adultes se comportaient de manière agressive envers une poupée puis à mesurer si les enfants imiteraient spontanément ces comportements lorsqu’eux-mêmes seraient en présence de la poupée. Bien que critiquée pour certains de ses aspects méthodologiques et pour le problème éthique qui consistait à exposer, pour le but de l’expérience, des enfants à des comportements agressifs, l’expérience de la poupée Bobo a eu un fort retentissement dans le champ de la psychologie scientifique en contribuant à l’émergence de l’approche cognitive face au béhaviorisme qui dominait alors. Elle reste une référence majeure en psychologie mais aussi dans d’autres domaines des sciences humaines et sociales.
le 17/11/17