Condicionamiento instrumental o la historia de las religiones, R.E.M. Losing My Religion

El origen de la indefensión aprendida o el futuro del estrés postraumático



 
R.E.M. Losing My Religion

 
LIFE IS BIGGER.
IT´S BIGGER THAN YOU,
AND YOU ARE NOT ME.
THE LENGTHS THAT I WILL GO TO,
THE DISTANCE IN YOUR EYES.
OH, NO, I´VE SAID TOO MUCH.
I SET IT UP.

 
THAT´S ME IN THE CORNER.
THAT´S ME IN THE SPOTLIGHT,
LOSING MY RELIGION,
TRYING TO KEEP UP WITH YOU.
AND I DON´T KNOW IF I CAN DO IT.
OH, NO, I´VE SAID TOO MUCH.
I HAVEN´T SAID ENOUGH.
I THOUGHT THAT I HEARD YOU LAUGHING.
I THOUGHT THAT I HEARD YOU SING.
I THINK I THOUGHT I SAW YOU TRY.

 
EVERY WHISPER
OF EVERY WAKING HOU
I´M CHOOSING MY CONFESSIONS,
TRYING TO KEEP AN EYE ON YOU,
LIKE A HURT, LOST AND BLINDED FOOL.
OH, NO, I´VE SAID TOO MUCH.
I SET IT UP.

 
CONSIDER THIS
THE HINT OF THE CENTURY.
CONSIDER THIS
THE SLIP THAT BROUGHT ME
TO MY KNEES, FAILED.
WHAT IF ALL THESE FANTASIES
COME FLAILING AROUND.
NOW I´VE SAID TOO MUCH.
I THOUGHT THAT I HEARD YOU LAUGHING.
I THOUGHT THAT I HEARD YOU SING.
I THINK I THOUGHT I SAW YOU TRY.

 
BUT THAT WAS JUST A DREAM,
THAT WAS JUST A DREAM

 

 ¿Está escrito en la piedra la historia de las religiones?

 

 

Un poco de humor

 

 


 
Condicionamiento instrumental: Fundamentos

 
La conducta dirigida a una meta. Descubrimiento de respuestas instrumentales

 
Primeras investigaciones sobre ele condicionamiento instrumental

 
 
Edward L. Thorndike (1874-1949), formuló la ley del efecto que establece que si una respuesta en presencia de un estímulo es seguida por un suceso satisfactorio, la asociación entre el estímulo y la respuesta se fortalece. Si la respuesta es seguida por un suceso molesto, la asociación E-R se debilita. La ley del efecto de Thorndike implica un aprendizaje E-R.

 
Aproximaciones modernas al estudio del condicionamiento instrumental

 

Procedimientos de ensayo discreto

 
Las investigaciones de ensayo discreto de la conducta instrumental a menudo se ha llevado a cabo en algún tipo de laberinto. La utilización de laberintos en las investigaciones de aprendizaje fue introducida hacia comienzos del siglo XX  por el psicólogo norteamericano W. S. Small (1899. 1900).

 
La conducta en el laberinto puede cuantificarse midiendo la velocidad de la carrera (rapidez con que se desplaza el animal desde la salida hata la meta). La velocidad de la carrera normalmente aumenta con ensayos de entrenamiento repetidos. Otra medida común de la conducta en los corredores es la latencia (el tiempo que tarda el animal en abandonar la caja de salida y en empezar a desplazarse por el pasadizo). Normalmente, las latencias se hacen más cortas a medida que progresa el entrenamiento.

 

 

Procedimientos de operante libre

 
Permiten al animal que repita la respuesta instrumental una y otra vez sin restrinciones. Ideado por Skinner (1938) para estudiar la conducta de una manera más continuada de lo que es posible en los laberintos. Propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado.

 
Una respuesta operante, se define a partir del efecto que produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se consideran ejemplos de la misma respuesta operante. El elemento fundamental es la forma en que la conducta opera en el ambiente.

 
Entrenamiento y moldeamiento al comedero

 
El organismo está preparado para aprender:

 
1- Aprender cuándo está disponible la comida, comprende un condicionamiento clásico. Tras suficientes emparejamientos, el sonido del dispensador de comida con la entrega de comida, el sonido llega a elicitar una respuesta del seguimiento del signo: el animal se dirige al comedero y recoge la bolita de comida. Esta fase preliminar de condicionamiento se llama entrenamiento al comedero.

 
2- El organismo está preparado para aprender la respuesta instrumental requerida. Una secuencia de pasos de entrenamiento se denomina moldeamiento, que incluye dos tácticas complementarias: reforzamiento de aproximaciones sucesivas a la respuesta requerid y no reforzamiento de las formas de respuestas más tempranas.

 
Moldeamiento y nueva conducta

 
El condicionamiento instrumental incluye la construcción o síntesis de una nueva unidad conductual a partir de componentes de respuestas preexistentes que ya se encuentran en el repertorio del sujeto.

 
El condicionamiento instrumental puede utilizarse para producir respuestas que no se parecen en nada a lo que el individuo es probable que haga sin entrenamiento. Estas nuevas respuestas se crean por moldeamiento.

 
La tasa de respuesta como medida en la conducta operante

 
Frente a las técnicas de ensayo discreto para la conducta instrumental, los métodos de operante libre permiten una observación continua durante largos períodos. Es el organismo quien determina la frecuencia de su respuesta instrumental. Las técnicas de operante libre proporcionan una ocasión especial para observar cambios en la probabilidad de la conducta a lo largo del tiempo.

 
Las medida de velocidad y de latencia que se emplean en los ensayos discretos no permite que se repita la respuesta. Skinner propuso una tasa de ocurrencia de una conducta operante (frecuencia de la respuesta por minuto por ejemplo), que se utilizase como una medida de la probabilidad de respuesta. Las respuestas más probables ocurren con frecuencia y muestran una tasa alta. Por el contrario las respuestas improbables ocurren esporádicamente y muestran una tasa baja.

 
Procedimientos de condicionamiento instrumental

 
En todas las situaciones del condicionamiento instrumental, el sujeto realiza una respuesta y por tanto produce una consecuencia.

 
Los procedimiento difieren en qué tipo de estímulo
(apetitivo o aversivo) es controlado por la respuesta
instrumental y si la respuesta produce o elimina el
estímulo
 
Reforzamiento positivo
 
Es un procedimiento en que la respuesta instrumental aproxima o produce un estímulo apetitivo. Si se da la respuesta, es estímulo apetitivo  se presenta, si no se da la respuesta el estímulo apetitivo no se presenta. Por tanto, existe una contingencia positiva entre la respuesta instrumental y el estímulo positivo. El reforzamiento positivo produce un incremento en la tasa de respuesta.
 
Castigo
 
En un procedimiento de castigo la respuesta instrumental produce o aproxima un estímulo molesto o aversivo. Hay una contingencia positiva entre la respuesta instrumental y el estímulo consecuente, pero el resultado es un esetímulo aversivo. Los procedimetnos de castigo producen una disminución en la respuesta instrumental.
 
Tanto el reforzamiento positivo como el castigo incluyen una contingencia positiva entre la respuesta instrumental o el estímulo resultante
 
Reforzamiento negativo
 
En una contingencia negativa, la respuesta retira o previene la presentación de un suceso ambiental.
 
Escape: el estímulo aversivo se presenta pero puede ser eliminado por la respuesta instrumental. La presencia de un estímulo aversivo establece la ocasión para la ocurrencia de la respuesta instrumental. La respuesta instrumental entonces es reforzada por la terminación del estímulo aversivo.
 
Evitación: implica la programación de un estímulo aversivo para ser presentado en algún momento de futuro. En este caso la respuesta instrumental previene la entrega  del estímulo aversivo.
 
Entrenamiento de omisión
 
La respuesta instrumental previene la presentación de un estímulo apetitivo o placentero. Es el método ideal para disuadir la conducta humana debido a que, al contrario que el castigo, no implica la presentación de un estímulo aversivo, pero, se retiran fuentes de reforzamiento positivo.
 
Los procedimientos de entrenamiento de omisión se denominan en ocasiones reforzamiento diferencial de otras conductas (RDO). Refleja el hecho de que el individuo recibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otra conducta diferente de la respuesta especificada por el procedimiento. La realización de la conducta crítica deviene en la omisión de la recompensa que podría haber sido obtenida si el individuo hubiese llevado a cabo alguna "otra" conducta. Por tanto, el entrenaiento de omisión implica el reforzamiento de "otras" conductas.
 
Elementos fundamentales del condicionamento instrumental
 
El condicionamiento instrumental consta de tres elementos clave:
  • una respuesta
  • una consecuencia (el reforzador)
  • una relación, o contingencia, entre la respuesta y la consecuencia 
 
La respuesta instrumental

 
La naturaleza de la respuesta determina los resultados de los procedimientos de reforzamiento positivo.

 
Variabilidad conductual versus estereotipia

 
El reforzamiento incrementa la probabilidad de que la respuesta instrumental se repita en el futuro.  Pero, esto no significa que el condicionaiento instrumental no pueda también verse involucrado en la producción de respuestas creativas o variables.

 
La variabilidad de la respuesta  puede ser la base para el reforzamiento instrumental. La variabilidad de la respuesta puede mantenerse e incrementarse por reforzamiento. La variabilidad de la respuesta puesde establecerse como una operante.

 
Los resultados también muestran que en ausencia de reforzamiento explícito de la variabilidad, la respuesta llega a ser más estereotipada con un condicionamiento instrumental continuado.  EL resultado típico del reforzamiento instrumental es un disminución de la variabilidad de la respuesta.

 
Relevancia o pertinencia en el condicionamiento instrumental.

 
El condicionamiento instrumental puede actuar sobre componentes manifiestos de la respuesta o sobre dimensiones abstractas de la conducta (como la variabilidad).

 
Evidencias recientes indican que hay importantes limitaciones en las unidades conductuales o dimensiones de la respuesta que pueden ser modificados por condicionamiento instrumental.

 
Hemos visto cómo el condicionamiento clásico se da a diferentes tasas dependiendo de la combinación del EC y el EI que se utilice. Se aprende a asociar sabores con enfermedad. Para que el condicionamiento ocurra rápidamente, el EC tiene que se relevante para el EI. En el condicionamiento instrumental tienen lugar  relaciones análogas de pertinencia o relevancia.

 
Thorndike observó las difeerencias en la facilidad de condicionamiento de varias respuestas.
 Propuso el concepto de pertinencia para explicar fallos en el entrenamiento de sus experimentos con gatos. Según esto, ciertas respuestas se corresponderían de forma natural con el reforzador debido a la historia evolutiva del animal.

 
Los Breland llamaron deriva instintiva al desarrollo de respuestas como la de hozar en los cerdos y frotar monedas en las mapaches. Estas respuestas naturales relacionadas con la comida eran aparentemente muy fuertes y competían con las respuestas requeridas por el experimentador. Los Breland pusieron de manifiesto que estas tendencias de respuesta institintiva debían tenerse en cuenta en el análisis del comportamiento.

 
Sistemas de conducta y limitaciones en el condicionamiento instrumental.

 
De acuerdo con la teoría de los sistemas de conducta, cuando un animal está privado de comida y se encuentra en una situación donde podría encontrarla, su sistema de alimentación se activa, y se dedica al forrajeo y otras actividades relacionadas con la comida.

 
Sobre este sistema de conducta se superpone un procedimiento de condicionamiento instrumental. La efectividad del procedimiento para el incremento de una respuesta instrumental dependerá de la compartibilidad de esa respuesta con la organización preexistente del sistema de alimentación.

 
La naturaleza de otras respuestas que emergen durante el transcurso del entrenamiento (o deriva instintiva) dependerá de los componentes conductuales del sistema de alimentación que se activen debido al procedimiento de condicionamiento instrumental.

 
La deriva instintiva representa la intrusión de respuestas apropiadas al sistema de condicta activado durante el desarrollo del condicionamiento instrumental.

 
El reforzador  instrumental

 
Los aspectos del reforzador que determinan sus efectos sobre el aprendizaje y la ejecución de la conducta instrumental son:
  • Efectos directos sobre la contidad y naturaleza del reforzador sobre la conducta instrumental.
  • La respuesta a un tipo y magnitud particular de reforzador depende de la experiencia pasada del organismos con otros reforzadores.

 
Cantidad y naturaleza del reforzador

 
En situaciones de operante libre los efectos de la magnitud del reforzador son complejos y dependen del programa de reforzamiento utilizado y de otras factores.

 
Cambios en la naturaleza y la cantidad del reforzador

 
Después de un cambio en la magnitud de la recompensa, aumentaron los efectos de esta nueva recompensa por la experiencia previa con una recompensa contratada.

 
Los resutados que obtuvo Mellgren ilustran el fenómeno del contrate sucesivo positivo y negativo. El contraste positivo se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva. La recompensa favorable parece especialmente buena a los individuos que experimentaron previamente una recompensa mejor.

 
El contraste negativo se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor. La recompensa desfavorable parece ser mala a los individuos que han experimentado previamente una recompensa mejor. Se denomina contraste sucesivo positivo o negativo si las condiciones de recompensa se modifican una y otra vez, con una clave diferente señalando cada condición de recompensa.

 
Los diferentes efectos de contraste están mediados por diferentes mecanismos. Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situación está determinada en parte por las experiencias del organismo con reforzadores en otra situación.

 
El contraste negativo se ha obtenido de forma más clara que el contraste positivo. El contraste negativo se ha atribuido a los efectos aversivos o frustrantes que supone la obtención de una recompensa inesperadamente pequeña. El desencanto emocional se establece cuando las respuestas de búsqueda no tiene éxito y el sujeto tiene que conformarse con la recompensa pequeña. Esto es seguido por una acomodación a la continua disponibilidad de sólo una recompensa pequeña.
La relación respuesta-reforzador
 
La conducta instrumental produce y es controlada por sus consecuencias. Esta relación también puede ser probabilística. Para ser eficiente se tiene que saber cuando se debe hacer algo para obtener un reforzador y cuándo el reforzador es menos probable que sea entregado independientemente de cualquier acción. La conducta instrumental eficiente requiere sensibilidad a la relación respuesta-reforzador.
 
Los tipos de relaciones entre una respuesta y un reforzador:
  • -Relación temporal: Tiempo que transcurre entre la respuesta y el reforzador
La contigüidad temporal se refiere a la entrega del reforzador  inmediatamente posterior a la conducta.
  • -Relación causal: Contingencia respuesta-reforzador, la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.

 
Efectos de contigüidad temporal
 
El reforzamiento inmediato es preferible al demorado. El condicionamiento instrumental es  sensible a la demora del reforzador, proporcionando reforzador condicionado o secundario inmediatamente después de la conducta, el organismo puede distinguir de alguna forma la respuesta a este estímulo que previamente hemos condicionado, son reforzadores condicionados que pueden proporcionar reforzamiento inmediato para la conducta adecuada. Los reforzadores condicionados pueden servir para aliviar una demora entre la respuesta instrumental y la entrega del reforzador primario.

Otra técnica que facilita el aprendizaje con reforzamiento demorado es marcar la respuesta instrumental criterio de alguna manera para hacerla distnguible de otras actividades del organismo. La efectividad de un procedimiento de marcado. 

Estas técnicas se centran en conectar mejor la respuesta instrumental crítica con el reforzador demorado, el reforzador sucede independientemente de la conducta, por lo que el sujeto, no puede predecir cuando será reforzado.

Otra consecuencia del reforzamiento independiente de la respuesta es el condicionamiento de claves contextuales. Si hay una demora entre la respuesta crítica y la entrega del reforzador, el reforzador ocurrirá en el contexto experimental sin ser señalado por la respuesta, lo que permite condicionar las claves contextuales. Mediante su asociación con el reforzador, estas claves contextuales pueden bloquear la formación de una asociación entre la respuesta crítica y el reforzador. Los procedimientos que interrumpen el condicionamiento de claves contextuales ayudadn a neutralizar los efectos perjudiciales del reforzamiento domorado en el condicionamiento instrumental.

La contingencia respuesta-reforzador

La contingencia respuesta-reforzador se refiere al hecho de que la entrega del reforzador es dependiente de la ocurrencia  previa de la respuesta instrumental. La contigüidad respuesta-reforzador más que la contingencia era el factor crítico que produce el aprendizaje instrumental.

El experimento de superstición de Skinner

En 1948 Skinner planteó un experimento que fue un hito en el debate acerca del papel  de la contigüidad frente a la contingencia en el aprendizaje instrumental. Las palomas parecían estar respondiendo como si su conducta controlara la entrega del reforzador, cuando, de hecho, la comida era proporcionada independientemente de su conducta, Skinner denominó a esto conducta supersticiosa.

la explicación de Skinner de la conducta superticiosa descansa en la idea de reforzamiento accidental o adventicio. El reforzamiento adventicio se refiere al emparejamiento accidental de una respuesta con la entrega del reforzador.

Reinterpretación del experimento de superstición

Skinner afirmaba que la contigüidad respuesta-reforzador más que la contigencia es lo más importante para el condicionamiento instrumental.

Se denominó respuestas terminales y respuestas de ínterin, para que las investigaciones fueran más ricas y exactas.

Esta afirmación de Skinner se puso en duda en 1971, sacaron como conclusiones que las presentaciones periódicas de un reforzador producen regularidades conductuales.

Explicación de la periodicidad de las respuestas de ínterin y terminales.

Se sugiere que las respuestas terminales son respuestas típicas de la especie que reflejan la anticipación de la comida a medida que el tiempo se encuentra más cerca de la presentación de la comida.

Las respuestas de ínterin son como una manifestación de otras fuentes de motivación que eran màs importantes al comienzo del intervalo entre comidas, cuando la presentación de comida era improbable.

De acuerdo con la teoría de los sistemas de conducta, la distribución de las actividades que se desarrollan con la entrega periódica de un reforzador depende de la naturaleza de ese reforzador.

Efectos de la controlabilidad de los reforzadores
  
Una contingencia fuerte entre una respuesta instrumental y un reforzador esencialmente significa que la respuesta controla el reforzador. Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental.

Efecto de indefensión aprendida


Pablo Picasso, Guernica, 1937

http://www.psicothema.com/pdf/3102.pdf

http://redalyc.uaemex.mx/pdf/805/80524305.pdf



Hipótesis de la indefensión aprendida

Basada en la percepción de que se puede percibir la contingencia entre la conducta y la entrega de un reforzador. Se asume que durante la exposición a estímulos aversivos incontrolables, se aprende que el estímulo aversivo es independiente a la conducta, pues (aparentemente) no se puede hacer nada por evitarlo.

Esta expectativa de una ausencia de control futura debilita la habilidad para aprender una nueva respuesta instrumental. El déficit de aprendizaje ocurre por:
  • La expectativa de falta de control reduce la motivación de los sujetos para realizar una respuesta instrumental
  • La expectativa previamente aprendida de falta de control hace más difícil para los sujetos aprender que su conducta es ahora  efectiva para producir reforzamiento.
Distinguir la hipótesis de indefensión aprendida del efecto de indefensión aprendida es importante:
  • Hipótesis:  Esplicación sugestivva y controvertida del efecto de indefensión aprendida
  • Efecto: Patrón de resultados obtenidos con el diseño triádico
Déficit de actividad

La hipótesis de la inactividad aprendida no puede explicar todos los ejemplos de efectos de indefensión aprendida. El resultado del grupo A asume que los sujetos aprenden a ser inactivos en respuesta al estímulo aversivo durante la fase de exposición.

Déficit atencional

La falta de control sobre los reforzadores puede producir un déficit en el aprendizaje. La falta de atención a las acciones propias o su conducta, tiene dificultad para asociar sus acciones con los reforzadores en el escape-evitación o en otras formas de condicionamiento instrumental.

El problema de identificar qué respuesta es responsable del reforzamiento demorado puede resolverse mediante el marcado de la respuesta crítica  con algún tipo de estímulo inmediato externo de retroalimentación.

Marcar la respuesta  instrumental supera el déficit de indefensión aprendida. La reducción de la atención a las respuestas que el sujeto realiza es una de las fuentes del déficit de aprendizaje.

Relaciones estimulares en el condicionamiento de escape

El rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminación de un estímulo aversivo. Realizar la respuesta de escape tiene como resultado claves internas de retroalimentación de la señal de seguridad.

Estas claves contextuales llegan a convertirse en inhibidores condicionados de miedo y limitan o inhiben el miedo elicitado por las claves contextuales.

 Contigüidad y contingencia

Los organismos son sensibles tanto a la contigüidad como a la contingencia entre una respuesta instrumental y un reforzador. Estos dos aspectos entre la respuesta y el reforzador actúan en conjunto para producir el aprendizaje. Ambos factores sirven para entender los efectos del reforzamiento en la respuesta instrumental. La relación causal o contingencia, asegura que el reforzador es entregado sólo tras la ocurrencia de la respuesta instrumental especificada. La relación de contigüidad asegura que otras actividades no se interpongan entre la respuesta especificada y el reforzador para interferir en el condicionamiento de la respuesta crítica.



Comentarios

  1. excelentes tus articulos me han servido muchas gracias

    ResponderEliminar
  2. Hola, Matilde. Tus artículos me han sido de enorme utilidad... Estoy empezando la carrera, y ver todo esta información aquí, detallada y de agradable lectura, me ha facilitado un muy buen aprendizaje. ¡Gracias!

    ResponderEliminar

Publicar un comentario

Entradas populares