El condicionamiento instrumental es otro término para el condicionamiento operante, un proceso de aprendizaje descrito por primera vez por BF Skinner.En el condicionamiento instrumental, el refuerzo o el castigo se utilizan para aumentar o disminuir la probabilidad de que una conducta vuelva a ocurrir en el futuro.
Ejemplos de condicionamiento instrumental
Por ejemplo, si un estudiante es recompensado con elogios cada vez que levanta la mano en clase, es más probable que vuelva a levantar la mano en el futuro.
Si también la regañan cuando habla fuera de su turno, es menos probable que interrumpa la clase. En estos ejemplos, el maestro está usando el refuerzo para fortalecer el comportamiento de levantar la mano y el castigo para debilitar el comportamiento de hablar fuera de turno.
El condicionamiento instrumental también se usa a menudo en el entrenamiento de animales. Por ejemplo, entrenar a un perro para dar la mano implicaría ofrecer una recompensa cada vez que se produzca el comportamiento deseado.
Historia del condicionamiento instrumental
El psicólogo EL Thorndike fue uno de los primeros en observar el impacto del refuerzo en los experimentos con cajas de rompecabezas con gatos.Durante estos experimentos, Thorndike observó un proceso de aprendizaje al que se refirió como aprendizaje de «ensayo y error».
Los experimentos consistían en colocar a un gato hambriento en una caja de rompecabezas y, para liberarse, el gato tenía que descubrir cómo escapar. Thorndike luego anotó cuánto tiempo les tomó a los gatos liberarse en cada prueba experimental. Inicialmente, los gatos se involucraron en métodos de escape ineficaces, arañando y cavando en los lados o en la parte superior de la caja. Eventualmente, el ensayo y error llevaría a los gatos a empujar o jalar con éxito la ruta de escape. Después de cada prueba sucesiva, los gatos se involucraron cada vez menos en los comportamientos de escape ineficaces y respondieron más rápidamente con las acciones de escape correctas.
Thorndike se refirió a sus observaciones como la Ley del Efecto. La fuerza de una respuesta aumenta cuando es seguida inmediatamente por un «satisfactor» (reforzador).Por otro lado, es más probable que se debiliten las acciones seguidas de efectos desagradables.
En los experimentos con la caja del rompecabezas de Thorndike, escapar de la caja era el satisfactor. Cada vez que los gatos escaparon con éxito de la caja, se reforzó y fortaleció el comportamiento que precedió inmediatamente al escape.
El trabajo de Thorndike tuvo un efecto tremendo en la investigación posterior de BF Skinner sobre el condicionamiento operante. Skinner incluso creó su propia versión de las cajas de rompecabezas de Thorndike, a las que se refirió como una cámara operante, también conocida como caja de Skinner.
Cómo funciona el condicionamiento instrumental
Skinner identificó dos tipos clave de comportamientos. El primer tipo son los comportamientos de los encuestados. Estas son simplemente acciones que ocurren reflexivamente sin ningún tipo de aprendizaje.Si tocas algo caliente, inmediatamente retirarás tu mano como respuesta. El condicionamiento clásico se enfoca en estos comportamientos respondientes.
En los experimentos clásicos de Pavlov con perros, la salivación ante la presentación de la comida fue el comportamiento del encuestado. Sin embargo, al formar una asociación entre el sonido de un zumbador y la presentación de la comida, Pavlov pudo entrenar a los perros para que realmente salivaran simplemente con el sonido de ese zumbador.
Skinner se dio cuenta de que, si bien el condicionamiento clásico podía explicar cómo los comportamientos de los encuestados podían conducir al aprendizaje, no podía explicar todos los tipos de aprendizaje. En cambio, sugirió que eran las consecuencias de las acciones voluntarias las que conducían a la mayor cantidad de aprendizaje.
El segundo tipo de comportamientos es lo que Skinner denomina comportamientos operantes. Los definió como cualquier comportamiento voluntario que actúa sobre el medio ambiente para crear una respuesta.Estos son los comportamientos voluntarios que están bajo nuestro control consciente. Estas también son acciones que se pueden aprender. Las consecuencias de nuestras acciones juegan un papel importante en el proceso de aprendizaje.
Refuerzo y Castigo
Skinner identificó dos aspectos clave del proceso de condicionamiento operante. El refuerzo sirve para aumentar el comportamiento, mientras que el castigo sirve para disminuir el comportamiento. También hay dos tipos diferentes de refuerzo y dos tipos diferentes de castigo.
- El refuerzo positivo implica presentar un resultado favorable, como darle un premio a un niño después de que limpie su habitación.
- El refuerzo negativo implica la eliminación de un estímulo desagradable, como decirle a un niño que si come todas sus papas, no tendrá que comerse el brócoli. Dado que el niño considera que comer brócoli es desagradable y comer papas conduce a la eliminación de esta tarea indeseable, comer papas se refuerza negativamente.
- El castigo positivo significa aplicar un evento desagradable después de un comportamiento. Nalgadas, por ejemplo, es un ejemplo común de castigo positivo. Este tipo de castigo a menudo se denomina castigo por aplicación. Una consecuencia negativa se aplica directamente para reducir el comportamiento no deseado.
- El castigo negativo consiste en quitar algo agradable después de que se produce un comportamiento. Por ejemplo, si un niño no limpia su habitación, sus padres pueden decirle que no puede ir al centro comercial con sus amigos. Quitar la actividad deseable actúa como un castigo negativo sobre el comportamiento anterior.