Concepts de conditionnement opérationnels et techniques principales
Dans les procédures comportementales, le conditionnement opérant ou instrumental est probablement celui qui a les applications les plus nombreuses et les plus variées.
Du traitement des phobies au dépassement des dépendances telles que le tabagisme ou l'alcoolisme, le schéma opératoire permet de conceptualiser et de modifier pratiquement n'importe quelle habitude de l'intervention sur quelques éléments.
Mais En quoi consiste exactement le conditionnement opérant?? Dans cet article, nous passons en revue les concepts clés pour comprendre ce paradigme et détailler ses applications les plus fréquentes, à la fois pour augmenter les comportements et pour les réduire..
Antécédents de conditionnement opérant
Le conditionnement opérant tel que nous le connaissons a été formulé et systématisé par Burrhus Frederic Skinner à partir des idées précédemment avancées par d'autres auteurs..
Ivan Pavlov et John B. Watson avaient décrit la Conditionnement classique, également appelé conditionnement simple ou pavlovien.
Pour sa part, Edward Thorndike a introduit la loi de l'effet, l'antécédent le plus clair du conditionnement opérant. La loi de l'effet stipule que si un comportement a des conséquences positives pour la personne qui le pratique, il aura plus de chance de se répéter, tandis que s'il a des conséquences négatives, cette probabilité diminue. Dans le contexte du travail de Thorndike, le conditionnement opérant est appelé "instrumental".
- Article connexe: "Behaviorism: histoire, concepts et principaux auteurs"
Différence entre le conditionnement classique et le conditionnement opérant
La principale différence entre le conditionnement classique et le conditionnement opérant réside dans le fait que le premier se réfère à l'apprentissage d'informations sur un stimulus, implique d'apprendre sur les conséquences de la réponse.
Skinner pensait que le comportement était beaucoup plus facile à modifier si ses conséquences étaient manipulées que si des stimuli lui étaient simplement associés, comme dans le conditionnement classique. Le conditionnement classique est basé sur l'acquisition de réponses réflexes, ce qui explique une quantité d'apprentissage inférieure et ses utilisations sont plus limitées que celles de l'opérateur, car il s'agit de comportements que le sujet peut contrôler à sa guise..
- Article connexe: "Le conditionnement classique et ses expériences les plus importantes"
Notions de conditionnement opérant
Ensuite, nous définirons les concepts de base du conditionnement opérant pour mieux comprendre cette procédure et ses applications..
Bon nombre de ces termes sont partagés par les directives comportementales en général, bien qu'ils puissent avoir des connotations spécifiques dans le paradigme opérant..
Réponse instrumentale ou opérante
Ce terme désigne tout comportement qui entraîne une certaine conséquence et il est susceptible de changer en fonction de cela. Son nom indique qu'il sert à obtenir quelque chose (instrumental) et qu'il agit sur le médium (opérant) au lieu d'être provoqué par celui-ci, comme cela arrive dans le cas du conditionnement classique ou du répondant.
Dans la théorie du comportement, le mot "réponse" est fondamentalement équivalent à "comportement" et "action", bien que "réponse" semble faire davantage référence à la présence de stimuli de fond.
La conséquence
En psychologie comportementale et cognitivo-comportementale, une conséquence est le résultat d'une réponse. La conséquence peut être positive (renforcement) ou négative (punition) pour le sujet qui exécute le comportement; dans le premier cas, la probabilité que la réponse se produise augmente et dans le second cas, elle diminue.
Il est important de garder à l'esprit que les conséquences affectent la réponse et qu'en conséquence, ce qui est renforcé ou puni est dit comportement, et non la personne ou l'animal qui le met en œuvre. En tout temps, nous travaillons dans l’intention de influencer la manière dont les stimuli et les réponses sont liés, dans la mesure où la philosophie comportementale évite de sortir d'une vision essentialiste du peuple, insister davantage sur ce qui peut changer que sur ce qui semble toujours rester le même.
Renfort
Ce terme désigne conséquences des comportements quand ils le rendent plus probable qu'ils se donnent à nouveau. Le renforcement peut être positif, auquel cas nous allons parler d'obtenir une récompense ou une récompense pour l'exécution d'une réponse, ou négatif, ce qui inclut la disparition de stimuli aversifs..
Dans le renfort négatif on peut distinguer les réponses d'évitement et d'évasion. Les comportements d'évitement empêchent ou empêchent l'apparition d'un stimulus aversif; Par exemple, une personne atteinte d'agoraphobie qui ne quitte pas son domicile parce qu'elle ne ressent pas d'anxiété évite cette émotion. Au lieu de cela, les réponses d'échappement font disparaître le stimulus quand il est déjà présent.
La différence avec le mot "renforçateur" est qu’il fait référence à l’événement qui résulte du comportement au lieu de la procédure de récompense ou de punition. Par conséquent, "renforcement" est un terme plus proche de "récompense" et "récompense" que de "renforcement".
Punition
Une punition est n'importe quelle conséquence d'un comportement déterminé qui diminue la probabilité que celui-ci se répète.
En tant que renforcement, la punition peut être positive ou négative. La punition positive correspond à la présentation d'un stimulus aversif après la réponse, tandis que la punition négative est le retrait d'un stimulus appétitif en raison du comportement..
La punition positive peut être liée à l’utilisation qui est généralement donnée au mot "punition", tandis que la punition négative se réfère davantage à un type de sanction ou d’amende. Si un enfant n'arrête pas de crier et reçoit une gifle de sa mère, il appliquera une punition positive, tandis que s'il retire la console sur laquelle il joue, il recevra une punition négative..
- Article connexe: "8 raisons de ne pas utiliser les châtiments corporels à l'égard des enfants"
Stimulus discriminant et delta stimulus
En psychologie, le mot "stimulus" est utilisé pour désigner des événements qui provoquent une réponse d'une personne ou d'un animal. Dans le paradigme opérant, le stimulus discriminatif est un stimulus dont la présence indique au sujet de l’apprentissage que, s’il adopte un certain comportement, il aura conséquence l'apparition d'un renfort ou d'une punition.
En revanche, l’expression "stimulus delta" désigne les signaux qui, le cas échéant, indiquent que l’exécution de la réponse n’entraînera pas de conséquences.
En quoi consiste le conditionnement opérant??
Le conditionnement instrumental ou opérant est une procédure d'apprentissage basée sur la probabilité qu'il se produise une certaine réponse dépend des conséquences attendu. Dans le comportement de conditionnement opérant est contrôlé par des stimuli discriminants présents dans la situation d'apprentissage qui transmettent des informations sur les conséquences probables de la réponse.
Par exemple, un signe "Ouvrir" sur une porte nous indique que si nous essayons de tourner le bouton, celui-ci s'ouvrira très probablement. Dans ce cas, l’affiche serait le stimulus discriminant et l’ouverture de la porte constituerait un renforcement positif de la réponse instrumentale consistant à tourner le bouton..
L'analyse comportementale appliquée de B. F. Skinner
Skinner a développé des techniques de conditionnement opérant qui sont englobés dans ce que nous appelons "analyse appliquée du comportement". Cela s'est avéré particulièrement efficace dans l'éducation des enfants, avec un accent particulier sur les enfants ayant des difficultés de développement.
Le schéma de base de l'analyse comportementale appliquée est le suivant. Tout d'abord, un objectif comportemental est défini, qui consistera en l'augmentation ou la réduction de certains comportements. Sur cette base, les comportements à développer seront renforcés et les incitations existantes réduites pour permettre les comportements destinés à inhiber.
En général le retrait des renforts est plus souhaitable que la peine positif car il génère moins de rejet et d’hostilité de la part du sujet. Cependant, la punition peut être utile dans les cas où le comportement problématique est très perturbant et nécessite une réduction rapide, par exemple en cas de violence..
Tout au long du processus, il est essentiel de suivre systématiquement les progrès afin de vérifier de manière objective si les objectifs souhaités sont atteints. Cela se fait principalement par l'enregistrement de données.
Techniques opérantes pour développer des comportements
Compte tenu de l’importance et de l’efficacité du renforcement positif, les techniques opérantes visant à améliorer le comportement ont une utilité démontrée. Ci-dessous, nous décrirons les plus pertinentes parmi ces procédures..
1. Techniques d'instigation
Les techniques incitatives sont considérées comme celles qui ils dépendent de la manipulation des stimuli discriminants augmenter la probabilité de comportement.
Ce terme inclut les instructions qui augmentent certains comportements, le guidage physique, qui consiste à déplacer ou à placer des parties du corps de la personne formée, et la modélisation, dans laquelle un modèle est observé en train de reproduire un comportement afin de l’imiter et d’en apprendre le conséquences. Ces trois procédures ont en commun de se concentrer sur enseigner directement au sujet comment exécuter une action déterminé, verbalement ou physiquement.
2. moulage
Elle consiste à approcher progressivement un comportement donné du comportement objectif, en commençant par une réponse relativement similaire que le sujet peut effectuer et en le modifiant peu à peu. Il est réalisé par étapes (approximations successives) auxquelles le ferraillage est appliqué.
La mise en forme est considérée comme particulièrement utile pour établir des comportements chez des sujets qui ne peuvent pas communiquer verbalement, tels que les personnes ayant une déficience intellectuelle profonde ou les animaux..
3. décoloration
La décoloration fait référence à la retrait progressif des aides ou des instigateurs qui avait été utilisé pour renforcer un comportement objectif. Il est prévu que le sujet consolide une réponse et puisse ensuite la réaliser sans aide extérieure.
C’est l’un des concepts clés du conditionnement opérant, car il permet que les progrès réalisés en thérapie ou en entraînement puissent être généralisés à de nombreux autres domaines de la vie.
Cette procédure consiste essentiellement à remplacer un stimulus discriminant par un stimulus différent..
4. chaîne
Une chaîne comportementale, c'est-à-dire un comportement composé de plusieurs comportements simples, est séparée en différentes étapes (liens). Ensuite, le sujet doit apprendre à exécuter les liens un à un jusqu'à l'achèvement de la chaîne complète..
Le chaînage peut être fait en avant ou en arrière et a la particularité que chaque lien renforce le précédent et fonctionne comme un stimulus discriminatif de ce qui suit.
Sous certains aspects, une bonne partie des compétences considérées comme des talents pour leur montrer un haut degré de compétence et une spécialisation (comme jouer très bien d'un instrument de musique, très bien danser, etc.) peuvent être considérées comme le fruit d'une forme de enchaînement, car depuis les compétences de base, il progresse pour atteindre d’autres.
5. Programmes de renforcement
Dans une procédure d’apprentissage opérant, les programmes de renforcement sont les des directives qui établissent quand le comportement sera récompensé et quand pas.
Il existe deux types de base de programmes de renforcement: ceux de la raison et ceux de l'intervalle. Dans les programmes de motif, le renforcement est obtenu après qu'un nombre spécifique de réponses est donné, tandis que dans les programmes d'intervalle, cela se produit après qu'un certain temps s'est écoulé depuis le dernier comportement renforcé et que cela se reproduise.
Les deux types de programme peuvent être fixes ou variables, ce qui indique que le nombre de réponses ou l'intervalle de temps nécessaire pour obtenir le renforçateur peut être constant ou osciller autour d'une valeur moyenne. Ils peuvent aussi être continus ou intermittents; cela signifie que la récompense peut être donnée chaque fois que le sujet adopte le comportement objectif ou occasionnellement (bien que toujours à la suite d'une diffusion de la réponse souhaitée).
Le renforcement continu est plus utile pour établir des comportements et l'intermittent pour les garder. Ainsi, théoriquement, un chien apprendra plus vite à donner la jambe si nous lui donnons un prix à chaque fois qu'il nous offre la jambe, mais une fois appris, il sera plus difficile de cesser ce comportement si nous donnons au renforçateur une tentative sur trois ou cinq..
Techniques opérantes pour réduire ou éliminer les comportements
Lors de l’application de techniques opérantes visant à réduire les comportements, il convient de garder à l’esprit que, ces procédures pouvant être désagréables pour les sujets, il est toujours préférable d’utiliser celles qui sont moins aversives lorsque cela est possible. De même ces techniques sont préférables aux punitions positives.
Nous présentons ci-dessous une liste de ces techniques, du plus petit au plus grand potentiel pour générer de l'aversion..
1. Extinction
Il cesse de récompenser un comportement qui avait été renforcé avant. Cela réduit la probabilité que la réponse se reproduise. Formellement, l'extinction est le contraire du renforcement positif.
Extinction à long terme est plus efficace pour éliminer les réponses que les punitions et le reste des techniques opérantes pour réduire les comportements, bien que cela puisse être plus lent.
Un exemple fondamental d'extinction consiste à faire arrêter un enfant à un enfant en le négligeant jusqu'à ce qu'il se rende compte que son comportement n'a pas les conséquences souhaitées (par exemple la colère des parents, qui ferait office de renforçateur) et en avoir marre..
2. Formation à l'omission
Dans cette procédure, le comportement du sujet est suivi de l'absence de la récompense; c'est-à-dire, si la réponse est donnée, le renforcement ne sera pas obtenu. Un exemple de formation aux omissions pourrait être que les parents empêchent leur fille de regarder la télévision ce soir-là en leur ayant parlé de manière irrespectueuse. Un autre exemple serait le fait de ne pas acheter des jouets que les enfants demandent s'ils se comportent mal.
Dans les environnements éducatifs, il sert également à favoriser que les efforts que font les autres sont plus valorisés pour faire plaisir aux petits et que ceux-ci, habitués à ces offres, ne valorisent pas.
3. Programmes de renforcement différentiel
Il s’agit d’un sous-type particulier de programme de renforcement utilisé pour réduire (pas éliminer) les comportements cibles en augmentant le nombre de personnes réponses alternatives Par exemple, un enfant pourrait être récompensé pour sa lecture et son exercice et non pour jouer de la console si ce dernier comportement est destiné à perdre de la valeur de renforcement.
Dans le renforcement différentiel des taux bas, la réponse est renforcée s'il reste un certain temps après la dernière fois. Dans le renforcement différentiel d'omission, le renforcement est obtenu si, après un certain temps, la réponse ne s'est pas produite. Le renforcement différentiel des comportements incompatibles consiste en renforcer les réponses incompatibles avec le comportement problématique; cette dernière procédure s'applique aux tics et à l'onychophagie, entre autres troubles.
4. Coût de la réponse
Variante de la peine négative dans laquelle l'exécution du comportement problématique provoque la perte d'un renfort. La carte de points de conducteur introduite en Espagne il y a quelques années est un bon exemple de programme de réponse aux coûts..
5. Temps mort
Le temps mort consiste à isoler le sujet, en général les enfants, dans un environnement non stimulant en cas de comportement problématique. Aussi une variante de la peine négative, diffère du coût de la réponse en ce que ce qui est perdu est la possibilité d'accéder au ferraillage, pas le renforcement lui-même.
6. Saciation
Le renforcement obtenu en effectuant le comportement est si intense ou grand qu'il perd de la valeur J'ai eu pour un sujet. Cela peut se faire par une réponse satisfaisante ou une pratique de masse (répétez le comportement jusqu'à ce qu'il cesse d'être appétitif) ou par satiété de stimulus (le renforçateur perd l'appétit d'excès).
7. Surcorrection
La surcorrection consiste à appliquer un punition positive liée au comportement problématique. Par exemple, il est largement utilisé en cas d'énurésie nocturne, dans lequel on demande à l'enfant de laver les draps après avoir été mouillé pendant la nuit..
Techniques d'organisation des imprévus
Les systèmes d’organisation des imprévus sont des procédures complexes à travers lesquelles vous pouvez renforcer certains comportements et punir les autres.
L'économie de la puce est un exemple bien connu de ce type de technique. Il consiste à distribuer des puces (ou d’autres renforçateurs génériques équivalents) en récompense des performances des comportements cibles; les sujets ultérieurs peuvent échanger leurs jetons contre des prix de valeur variable. Il est utilisé dans les écoles, les prisons et les hôpitaux psychiatriques.
Les contrats comportementaux ou de contingence sont des accords passés entre plusieurs personnes, généralement deux, par lesquels ils s'engagent à exécuter (ou non) certains comportements. Les contrats détaillent les conséquences si les conditions convenues sont remplies ou non remplies.
Références bibliographiques:
- Domjam, M. (2010). Principes de base de l'apprentissage et du comportement. Madrid: Thomson.
- Labrador, F. J. (2008). Techniques de modification du comportement. Madrid: pyramide.