© photo by randall meng on unsplash

L’apprentissage et ses mécanismes selon B.F. Skinner

Burrhus Frederic Skinner (1904 – 2990) définit l’apprentissage comme une « mise en relation entre un évènement provoqué par l’extérieur (le stimulus) et une réaction adéquate du sujet » qui va entrainer un changement de comportement persistant, mesurable et spécifique.

    L’apprentissage opérant

    Skinner invente en 1931 la Skinner Box. Il met en scène une expérience où, dans un contexte donné, un certain comportement est toujours suivi d’un même effet.

    Un rat et mis dans une cage. S’il adopte le comportement d’appuyer sur un levier avec sa patte, alors s’ouvre une boite dans laquelle il trouve de la nourriture. Il est toujours récompensé de la sorte quand il adopte ce comportement.

    Skinner démontre aussi que plongé dans des circonstances similaires, un sujet reproduira le même comportement.

    C’est l’apprentissage opérant. Il s’agit d’apprendre à l’apprenant que dans telles conditions, tel comportement produit tel effet.

    C’est mécanique !

    Le stimulus.

    Dans la boite de Skinner, le stimulus est une lampe installée dans la boite. Quand elle s’allume, le rat « comprend » qu’il doit déclencher son comportement d’appuyer sur la pédale. Skinner décide d’installer un  stimulus pour gérer le comportement du rat. Le comportement est émis sur demande !

    Les renforçateurs

    Il existe deux types de renforçateurs qu’il convient de gérer : les renforçateurs et les punitions.

    Les renforcements.

    Leur but : ils augmentent  l’apparition du comportement. Ils vont réitérer le comportement attendu. Ils sont positifs ou négatifs

    Les punitions

    Leur but : elles diminuent l’apparition du comportement. Elles sont positives ou négatives.

    Le renforcement positif.

    C’est l’apparition d’un effet positif du comportement (la nourriture offerte au rat). Ce renforcement positif va renforcer le comportement du rat.

    Avec un renforcement positif, on donne quelque chose (de la nourriture).

    Exemple : la carte de fidélité délivrée par un magasin au client. Il offre au client pour chaque achat un point de bonus sur sa carte. Ce qui incite le client à reproduire voire à augmenter son comportement d’achat puisqu’il est toujours suivi d’un effet positif : un point de bonus offert.

    Autre exemple : on « donne » un compliment, un sourire, le titre d’« employé du mois », une paie …

    Le renforcement négatif.

    On retire quelque chose pour obtenir une augmentation du comportement.

    Exemple : on retire une corvée.

    La punition positive.

    On donne une réprimande pour faire disparaitre le comportement

    Si le sujet ne se comporte pas comme il se doit, on lui donne une sanction en continu jusqu’à ce que son comportement change « dans la bonne direction ».

    La punition négative

    Ex : on retire des points au permis de conduire pour diminuer le comportement imprudent de l’automobiliste.

    Façonnage

    Il faut avant tout façonner le parcours : bien identifier le comportement initial et le comportement terminal.

    On peut décomposer un comportement complexe visé en des comportements intermédiaires que l’on va conditionner de façon opérante pour aller au comportement visé.

    La superstition

    Certains humains font un lien entre un objet fétiche et un comportement. C’est la superstition !