Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
20 décembre 2009 7 20 /12 /décembre /2009 22:42

I.Principe
Le conditionnement opérant (aussi appelé conditionnement instrumental, apprentissage skinnerien ou conditionnement de type II) est un concept du behaviorisme qui s'intéresse à l'apprentissage duquel résulte une action, tenant compte des conséquences de cette dernière rendant plus ou moins probable la reproduction du  comportement. Skinner distingue le conditionnement opérant du conditionnement classique (de type I ou Pavlovien) par ses conséquences sur l'environnement et par le fait que la réponse ne soit pas une réaction réflexe de l'organisme.

I.1>Procédures expérimentales

          "Boîte à problèmes" (Thorndike)                                              "Conditionnement opérant"  (Skinner)


I.2>Principe de l'apprentissage instrumental:
- L'apprentissage s'effectue suite à une réponse active de l'organisme. Par exemple pour obtenir un renforçateur positif (de la nourriture, de l'affection etc) ou éviter un renforçateur négatif (décharge électrique par exemple), l'organisme va devoir produire une réponse. Et de par ce fait, la réponse elle-même est agent de renforcement.

NB: Attention à ne pas confondre renforçement négatif qui cherche à entretenir une réponse de l'organisme et punition, (par exemple la féssée que l'on administre à l'enfant) qui cherche à faire disparaître ou diminuer un comportement.

II. Programmes de renforcement de l'apprentissage instrumental

II.1>Programme à renforcement continu et constant:(CRf)
C'est un programme de renforcement surtout utilisé en laboratoire et donc quasiment jamais observé en situation écologique.L'agent de renforcement est constant et est délivré de manière régulière (programme à intervalles fixes) et/ou aussi en même proportions c'est à dire proportions fixes (par exemple on récompense toujours le pigeon quand il aura donné 5 coups de bec)

Les effets c'est que cela permet l'acquisition et le maintien de la réponse instrumentale avec un débit de réponse certes stable mais modéré. Ce type de « programme » de renforcement est peu observé dans la nature. La plupart du temps l'agent de renforcement est intermittent (par période et dans une certaine proportion).
-Avantage: l'organisme aprend plus vite
-Inconvénient: Réponse "modérée" et extinction rapide du comportement en l'absence de renforçateur.


II.2>Programmes à renforcement intermittent.
C'est ce qui est normalement observé en situation naturelle. L'agent de renforcement n'est pas délivré de manière continu mais irrégulière (programme à intervalles variables) et en poportions variables (programme à proportions variables: par exemple on va donner la récompense au pigeon une fois pour 10 coups de becs, une autre fois pour 2, une autre fois pour 7 etc)
-Avantage: Le comportement est mieux conservé car l'organisme n'est pas toujours sur d'obtenir (ou non) rapidement (ou non) le renforçateur.
-Inconvénient: Le renforcement intermittent permet un apprentissage moins rapide que pour le renforcement continu.

II.3>Programme en chaînes:
Quand il a appris à répondre à une programme, l'animal ensuite va apprendre à répondre à un second programme puis il est récompensé au second. Ensuite on lui fait apprendre un troisième puis à sa troisième réponse il est récompensé. Puis une quatrième programme, puis récompensé à la quatrième réponse etc etc.... Du coup après on peut faire faire des trucs de fou aux animaux (du genre pigeon, rats...).

II.4>Programme concurrents:( choix et décision) :
On donne à l'animal la possibilité de répondre sur des programmes qui fonctionnent en même temps (par ex un levier à droite et un autre à gauche). Les 2 programmes se déclenchent donc en même temps. Comment l'animal répartir les réponses?

En fonction des conditionnements sur chacun d'eux!:

Sur l'un il a une récompense une fois sur 5 et l'autre 1 fois sur 10. Les résultats montrent que les rats utilisent les deux programmes et ils vont les utiliser de telle sorte que les renforcements obtenus sur les deux programmes soient équivalents.
Soit les rats augmentent leur débit de réponse sur le programme le plus exigeant et va un peu plus doucement sur l'autre soit ils vont passer beaucoup plus de temps sur un programme que sur l'autre
===>L'animal répartit son temps! Il passe 2 fois plus de temps sur le programme qui est deux fois plus exigeant. l'intérêt de cette stratégie est que l'énergie qu'il dépense est équivalente dans les deux cas. Pourquoi dans cette situation où les probabilités de renforcements (récompenses) ils utilisent tout de même les deux programmes au lieu du plus rentable? Il semble que ce soient des stratégies utilisés par les espèces animales pour leur approvisionnement.....

III.Un type d'apprentissage du conditionnement opérant: l'apprentissage instrumental discriminatif
Cela consiste à apprendre à un organisme à produire un réponse quand on présente un stimulus et ne pas répondre quand on lui présente un autre stimulus.
(ex: le pigeon doit appuyer sur le bouton rouge s'il veut manger mais pas sur le bouton bleu qui donne rien: il doit discriminer.).


  



On présente un stimulus lumineux d'une longueur d'onde donnée, le pigeon va répondre également à des valeurs de stimuli relativement proches en longueur d'ondes. Mais petit à petit lors de l'apprentissage les réponses vont se limiter progressivement à la valeur plus ou moins « exacte » du stimulus.

               Ca pourrait être sympa de leur apprendre certains trucs aux pigeons =)

Partager cet article

Repost 0

commentaires

Présentation

  • : site-psychologie (ressources)
  • site-psychologie (ressources)
  • : psychologie générale, psychologie cognitive et expérimentale, psychologie sociale, psychologie clinique/psychopathologie, psychologie du développement et différentielle, Psychophysiologie/Neuropsychologie.
  • Contact

Recherche