Prepara tus exámenes
Consigue puntos
Orientación Universidad

Vende en Docsity

Inicia sesión

Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Inicia sesión

Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca documentos en el Store

Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Busca entre todos los recursos para el estudio

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Busca ofertas educativasNEW

Ponte en contacto con las mejores universidades del mundo y elige tu plan de estudios

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ranking de las universidades

Descubre las mejores universidades de tu país según los usuarios de Docsity

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

Del blog

Actualidad

Becas y ayuda

Ve al blog

Condicionamiento resumen libro completo, Resúmenes de Psicología

Universidad de Salamanca (USAL)Psicología

Asignatura: Condicionamiento, Profesor: José Antonio, Carrera: Psicología, Universidad: USAL

Tipo: Resúmenes

2010/2011

Subido el 21/01/2011

cynthiae662 🇪🇸

4.7

(3)

1 documento

1 / 82

Documentos relacionados

Anatomía 1 resumen completo del libro de rouviere

(15)

resumen completo del capitulo 9 y 10 del libro de baynes

J sandel resumen completo libro

(6)

Libro la meta un resumen completo capitulo por capitulo

(2)

Apuntes Historia del Cine (Resumen libro completo)

(31)

RESUMEN CONDICIONAMIENTO

Resumen Libro Slosse Completo (Auditoria)

(6)

Resumen completo del libro Macbeth

resumen libro condicionamiento

(2)

resumen libro condicionamiento

(3)

resumen libro condicionamiento

resumen libro

(1)

Resumen de Libro completo

Resumen libro ejercicios completos

Libro de Esteve - resumen completo

(12)

Aprendizaje y condicionamiento completos

temario completo condicionamiento

(3)

Resumen del libro completo La Regenta

Resumen completo del libro Trafalgar

Resumen libro completo "Conectados en el ciberespacio"

(10)

resumen psicologia del aprendizaje (libro manuel froufe)

(26)

resumen completo del libro del profesor

Sociologia resumen libro completo

Derecho Constitucional II Temario Completo - Resumen Libro

(39)

RESUMEN COMPLETO LIBRO LIJPHART "MODELOS DE DEMOCRACIA"

(18)

Capitulos 1-7 Libro+clase Psicofisio. Resúmenes completos

(14)

Vista previa parcial del texto

¡Descarga Condicionamiento resumen libro completo y más Resúmenes en PDF de Psicología solo en Docsity! PSICOLOGÍA DEL CONDICIONAMIENTO Y EL APRENDIZAJE FACULTA D DE PSICOLOGÍA Tema 1: INTRODUCCIÓN 1. DEFINICIÓN DE APRENDIZAJE El aprendizaje es un cambio duradero en los mecanismos de conducta que implica estímulos y/o respuestas específicas y que es resultado de las experiencias previas con esos estímulos y respuestas o con otros similares. 1.1.. Distinción entre aprendizaje y ejecución. Con el aprendizaje observamos la aparición de un cambio en el comportamiento – la ejecución de una nueva respuesta o la supresión de una respuesta que previamente tenía lugar. El aprendizaje es un cambio en los mecanismos de la conducta, NO un cambio directo en la conducta. La ejecución se refiere a las acciones de un organismo en un momento concreto. Viene determinada por muchos factores (motivación, capacidades sensoriales y motoras,...), además del aprendizaje. Por lo tanto, un cambio en la actuación no puede ser automáticamente considerado como una manifestación de aprendizaje. Se utiliza como prueba de aprendizaje. PAGE 84 1.2.. El aprendizaje y otras fuentes de cambio conductual. Existen varios mecanismos que dan lugar a cambios en la conducta que son excesivamente breves para ser considerados como ejemplos de aprendizaje: • Fatiga: el esfuerzo físico puede provocar una disminución en la fuerza de una respuesta. • Cambios en las condiciones estimulares. • Cambios que implican alteraciones en el estado fisiológico o motivacional: hambre, sed, drogas,... • Maduración: cambios persistentes en la conducta sin necesidad de la experiencia. Ocurre por el mero paso del tiempo. Distinción aprendizaje – maduración: importancia de las experiencias. 1.. Diferentes tipos de mecanismos causales. Cuatro tipos: 1. Causa eficiente: condiciones necesarias y suficientes para producir un resultado en la conducta. 2. Causa material: cambios físicos. 3. Causa formales: constructos teóricos. 4. Causa final: éxito reproductivo. Científicos de orientación biológica distinguen entre causas próximas o inmediatas y causas últimas. 2. ASPECTOS METODOLÓGICOS DEL ESTUDIO DEL APRENDIZAJE. La investigación sobre los procesos de aprendizaje utiliza dos metodologías principales: • Investigación experimental. • Perspectiva de proceso general. 2.. El aprendizaje como ciencia experimental. Los estudios sobre el aprendizaje hacen hincapié en identificar los factores causales responsables de los cambios persistentes en la conducta que resultan de la experiencia previa. Las causas no pueden observarse directamente, tan solo pueden ser inferidas a partir de los resultados de las manipulaciones experimentales. El aprendizaje sólo puede estudiarse mediante técnicas experimentales. PAGE 84 Patrón de respuesta exhibido de forma similar por la mayoría de los miembros de una misma especie. Las pautas de acción modal se utilizan como unidades básicas de conducta en las investigaciones etológicas del comportamiento. (PAM). 1.3.. Estímulos elicitantes de las PAM Los rasgos específicos para elicitar la conducta reciben el nombre de estímulo señal o estímulo desencadenante; suficiente para elicitar una PAM. Fabricar un objeto que fuera más efecto que el natural como elicitador de la PAM, que son inusualmente efectivos, reciben el nombre de estímulos supranormales. (Pag. 33). 1.4.. La organización secuencial de la conducta Las respuestas no tienen lugar aisladas unas de otras. Más bien, las acciones individuales se organizan en secuencias de comportamiento funcionalmente efectivas. Los etólogos denominaron conducta apetitiva a los primeros componentes de la secuencia de comportamiento y conducta consumatoria a los últimos (Craig, 1918). Conductas Consumatorias Conductas Apetitivas • Altamente estereotipadas. • Conductas específicas de cada especie que tienen estímulos elicitantes o desencadenantes específicos. • Son PAM específicas de la especie. • Menos estereotipadas. • Pueden tomar formas muy diversas, dependiendo de la situación. • Son PAM más variables. Al estudiar cómo los animales obtiene comida, por ejemplo, es normal considerar que la secuencia de respuestas de búsqueda comienza por un modo de búsqueda general, seguido de un modo de búsqueda focalizada, y termina con un modo de manipulación del alimento. Así pues, en la teoría moderna del aprendizaje, la categoría de respuestas apetitivas se ha subdividido en las categorías de búsqueda general y búsqueda focalizada (Timberlake, 2001). 2. EFECTOS DE LA ESTIMULACIÓN REPETIDA. La conducta elicitada no es inmutable. Uno de los rasgos más característicos de la conducta elicitada es su plasticidad. 1.5.. Atención visual en los bebés humanos. PAGE 84 Las claves visuales elicitan una respuesta de observación, que puede medirse por el tiempo que los bebés mantienen sus ojos en un objeto antes de mirar a otra parte. Estudios han revelado que la atención visual provocada por un estímulo novedoso cambia a medida que el bebé se familiariza con el estímulo. La naturaleza del cambio está determinada por la naturaleza del estímulo. 1.6.. Salivación y evaluación del sabor en humanos. El sabor de la comida elicita la salivación como respuesta refleja. En un estudio se muestra que a medida que el estímulo se repite perdía su eficacia para elicitar tanto las respuestas de salivación como las hedónicas. 1.7.. Respuesta de sobresalto en ratas. Es una respuesta defensiva que aparece en muchas especies. Consiste en un salto repentino y una contracción de los músculos de la parte superior del cuerpo, con frecuencia acompañado de una elevación de los hombros. En las ratas, la respuesta de sobresalto puede medirse situando al animal en una cámara estabilimétrica, que se sostiene sobre sensores de presión. Estos sensores se usan como indicadores de la intensidad de la reacción de sobresalto. 3. LOS CONCEPTOS DE HABITUACIÓN Y SENSIBILIZACIÓN La presentación repetida de un estímulo elicitante puede provocar tanto disminuciones como incrementos en la respuesta. Efecto de habituación: Disminuciones de la tendencia a responder producidas por la estimulación repetida. Efecto de sensibilización: Incrementos de la tendencia a responder producidos por la estimulación repetida. Los efectos de habituación y sensibilización son dos tipos básicos de cambios conductuales que resultan de la experiencia previa. 3.1.. Adaptabilidad y generalidad de la habituación y la sensibilización. Estos efectos nos ayudan a decidir qué estímulos ignorar y a cuáles debemos responder. Ayudan a organizar y focalizar la conducta en el caótico mundo de estímulos en el que vivimos. 3.2.. Diferencias entre habituación, adaptación sensorial y fatiga. PAGE 84 La principal característica del efecto de habituación es una disminución en la respuesta inicialmente elicitada por un estímulo. Sin embargo, la habituación no es el único efecto que da lugar a una disminución en la respuesta. Existen varias razones por las cuales una respuesta elicitada puede no ocurrir: • Adaptación sensorial: Los órganos sensoriales pierden temporalmente sensibilidad a la estimulación. • Fatiga: Los músculos involucrados quedan incapacitados. Ambas impiden la respuesta a nivel de los órganos sensoriales y de los músculos, sin la intervención del sistema nervioso. Por tanto, pueden distinguirse de la habituación. Se asume que la habituación y la sensibilización conllevan cambios neurofisiológicos que dificultan o facilitan la transmisión de los impulsos neuronales desde las neuronas sensoriales a las motoras. En la habituación, el organismo deja de responder a un estímulo aunque mantiene la capacidad de percibirlo y de realizar los movimientos musculares requeridos por la respuesta. La respuesta no tiene lugar debido a que los cambios en el sistema nervioso bloquean la transmisión del impulso nervioso a las neuronas motoras. En los estudios sobre habituación, la adaptación sensorial puede descartarse ya que existe evidencia de que la habituación es específica de la respuesta. Un organismo puede dejar de responder a un estímulo con un aspecto de su conducta, mientras que continúa respondiendo al mismo de otras formas. La fatiga también puede descartarse como causa de la habituación por medio de evidencia que muestra que la habituación es específica del estímulo. Una respuesta habituada se recupera rápidamente cuando se introduce un estímulo novedoso. • La adaptación sensorial ocurre en los órganos sensoriales. • La fatiga tiene lugar en los músculos efectores. • La habituación y sensibilización ocurren en el sistema nervioso. 1.. Teoría del proceso dual de la habituación y la sensibilización. Propuesta por Groves y Thompson en 1970. La teoría del proceso dual presupone que los incrementos y disminuciones en la tendencia a responder a un estímulo son producto de procesos neurales diferentes. Uno de estos procesos neurales, el proceso de habituación, provoca una disminución en la tendencia a responder. Otro, el proceso de sensibilización, produce un incremento en la tendencia a responder. PAGE 84 considerablemente más en ciertas condiciones. La explicación más aceptada de la habituación a largo plazo es la teoría de la activación de Wagner. 1.9.. Especificidad del estímulo Especificidad del estímulo en la habituación. Una respuesta a un estímulo previamente habituada puede manifestarse plenamente alterando alguna característica importante del estímulo. Después de que la respuesta de orientación a un estímulo se ha habituado completamente, dicha respuesta se manifestará en su intensidad habitual si se presenta un estímulo suficientemente novedoso. La especificidad del estímulo se ha considerado como una de las características definitorias de la habituación. Aunque la habituación es específica del estímulo, puede darse cierta generalización. Si nos hemos habituado a un determinado sonido del reloj, es posible que tampoco respondamos al sonido de otro reloj que es similar al original. Este fenómeno recibe el nombre de generalización del estímulo de la habituación. No especificidad del estímulo en la sensibilización. La sensibilización no es muy específica del estímulo. 1.10.. Efecto de un estímulo externo intenso La respuesta habituada también puede restablecerse sensibilizando al organismo con la exposición a un estímulo externo. Este fenómeno recibe el nombre de deshabituación. La deshabituación hace referencia a la recuperación de la respuesta al estimulo previamente habituado. 5. APLICACIÓN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA. Los estímulos también pueden provocar emociones complejas. 3.3.. Reacciones emocionales y sus efectos posteriores. Primero, las reacciones emocionales intensas a menudo constan de dos fases. Una emoción tiene lugar durante la presentación del estímulo elicitante, y la opuesta se observa cuando el estímulo desaparece. Cambian con la experiencia. La reacción primaria se hace más débil y su postefecto se hace más fuerte. PAGE 84 La habituación de la primera reacción a la droga se llama tolerancia a la droga, lo que hace referencia a la disminución en la efectividad de una droga con las exposiciones repetidas. 3.4.. La teoría del proceso oponente. Tres características comunes de las reacciones emocionales: 1. Las reacciones emocionales son bifásicas; a una reacción primaria sigue un postefecto opuesto. 2. La reacción primaría se debilita con la estimulación repetida. 3. El debilitamiento de la reacción primaria va acompañado por un fortalecimiento del postefecto. La teoría del proceso oponente de la motivación se diseñó para explicar estos tres rasgos característicos de las emociones. La teoría del proceso oponente asume que los mecanismos neurofisiológicos involucrados en la conducta emocional tratan de mantener la estabilidad emocional, así pues es una teoría homeostática. Mantener cualquier sistema estable o neutral requiere que las perturbaciones que mueven al sistema en una dirección se encuentren con una fuerza opuesta que compense la perturbación. El concepto de fuerzas opuestas o procesos destinados a mantener la estabilidad es central para la teoría del proceso oponente. Un estímulo emocional activador desvía de la neutralidad el estado emocional de una persona. Este desplazamiento pone en marcha un proceso oponente que compensa el cambio. Los patrones de conducta emocional observados tanto inicialmente como después de la experiencia repetida con un estímulo son el resultado neto de los procesos oponentes y de los cambios en los mismos como resultado de la experiencia La presentación de un estímulo emocional elicita inicialmente lo que se denomina el proceso primario, o proceso a, que tiene lugar en presencia del estímulo. El proceso primario, elicita a su vez un proceso oponente, o proceso b, que genera la reacción emocional opuesta. La fuerza del proceso oponente se resta de la fuerza del proceso primario para dar lugar a las emociones que realmente ocurren. Por tanto, los procesos primario y oponente son mecanismos internos cuyos efectos son los cambios emocionales observados. El proceso oponente es ligeramente ineficiente, no es lo suficientemente fuerte para compensar por completo la emoción primaria. Al principio no es lo suficientemente fuerte para compensar por completo la emoción primaria. Sin embargo, el proceso oponente se hace más rápido y potente con la práctica. Se sensibiliza como resultado de la activación repetida. Progresivamente se va haciendo lo suficientemente fuerte como para bloquear la mayor parte de la reacción emocional primaria. PAGE 84 2.. Variaciones en la conducta dirigida a metas Responder para escapar de la molestia producida por la retirada de un estímulo es sólo uno de los tipos de conducta motivada o dirigida a metas. Un objeto meta gratificante recibe el nombre de reforzador. Las situaciones en las que los organismos responden repetidamente para obtener un reforzador muestran muchas de las propiedades comunes de la habituación y la sensibilización. Escuchar una misma canción (habituación), encontrarnos con un amigo (sensibilización). La habituación y la sensibilización son frecuentes con reforzadores sensoriales. PAGE 84 2. PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO EXCITATORIO. El estímulo condicionado adquiere la capacidad de activar la conducta relacionada con el EI asociado. 2.1. Procedimientos típicos de condicionamiento pavloviano El tiempo entre el final de un ensayo de condicionamiento y el comienzo del siguiente se llama intervalo entre ensayos. El tiempo entre el comienzo del EC y el comienzo del EI dentro de un mismo ensayo de condicionamiento se llama intervalo entre estímulos o intervalo EC-EI. Para que se desarrolle la respuesta condicionada el intervalo entre estímulos debe ser mucho más corto que el intervalo entre ensayos. 1. Condicionamiento de demora corta: Es el más frecuente. Cada ensayo comienza con el EC, y el EI se presenta tras una breve demora (1 minuto). El EC puede continuar durante el EI o terminar cuando empieza el mismo. 2. Condicionamiento de huella: Se parece al procedimiento de demora corta en que el EC se presenta primero y va seguido del EI. Sin embargo, en el condicionamiento de huella el EI no se presenta hasta que ha transcurrido cierto tiempo desde la terminación del EC. Esto deja un espacio temporal llamando intervalo de huella. 3. Condicionamiento de demora larga: El EC comienza antes que el EI. El EI se demora durante más tiempo (5-10 minutos) que en el procedimiento de demora corta. El EC dura hasta que el EI empieza. 4. Condicionamiento simultáneo. El EC y el EI se presentan a la vez. 5. Condicionamiento hacia atrás: El EI ocurre un poco antes, en lugar de después del EC. Se presentan en el orden contrario al de los otros procedimientos. PAGE 84 2.2. Medida de las respuestas condicionadas Se realizaron estudios para descubrir de qué modo el condicionamiento de un EC depende de la relación temporal entre el EC y el EI. Para poder comparar los diferentes procedimientos los investigadores deben utilizar un método para medir el condicionamiento para que sea igualmente aplicable a todos los procedimientos. Esto se hace mediante un ensayo de prueba. Un ensayo de prueba consiste en la presentación del estímulo condicionado aislado (sin el EI). La conducta que tiene lugar durante el EC puede cuantificarse de varias maneras: • Un aspecto de la conducta es la cantidad de la misma que tiene lugar. Esto es la magnitud de la respuesta condicionada. • La fuerza de la respuesta también puede medirse por la frecuencia con la que el EC provoca una respuesta condicionada. Esta medida suele utilizarse en los estudios de condicionamiento palpebral y alude a la probabilidad de respuesta. • Un tercer aspecto es la rapidez con que tiene lugar la respuesta tras la aparición del EC. Esta medida de la fuerza de la conducta se llama latencia. Es la cantidad de tiempo que pasa entre el principio del EC y la aparición de la RC. En los procedimientos de demora y huella, el EC aparece de forma aislada al principio de cada ensayo. El EC aislado no está contaminado por la conducta provocada por el EI y, por tanto, puede ser utilizada como medida del aprendizaje. Sin embargo, en el condicionamiento simultáneo y hacia atrás se dan las condiciones contrarias, por lo que los ensayos de prueba resultan cruciales para evaluar el aprendizaje. 2.3. Procedimientos de control en el condicionamiento clásico. Para estar seguros de que un procedimiento de condicionamiento es el causante de determinados cambios, deben compararse esos cambios con los efectos de un procedimiento de control. Los casos en los que la mera exposición al EI da lugar a respuestas similares a la respuesta condicionada reciben el nombre de pseudocondicionamiento. Un procedimiento de control ideal para el aprendizaje de una asociación debería tener el mismo número y distribución de presentaciones del EC y del EI que el procedimiento experimental. • Control aleatorio: el EC y el EI se presentan de forma aleatoria para que no queden asociados (no es muy eficaz). PAGE 84 • Un procedimiento de control útil consiste en la presentación de EC y EI en diferentes ensayos. Este procedimiento se denomina control desemparejado explícito. El EC y el EI se presentan lo suficientemente separados para evitar que se asocien. La cantidad de tiempo que debe pasar entre ellos depende del sistema de respuesta. 2.4. Eficacia de los procedimientos típicos de condicionamiento. • En general se observa poco condicionamiento en los procedimientos de condicionamiento simultáneo en los que el intervalo EC – EI es cero. • Una ligera demora a menudo facilita la respuesta condicionada, sin embargo es limitada. • Tradicionalmente se ha considerado que el condicionamiento de huella es menos efectivo que el condicionamiento de demora. En el condicionamiento de huella el EC desaparece un poco antes de que el EI aparezca, lo que da lugar a un intervalo de huella. Al igual que en el condicionamiento de demora, se observa menos condicionamiento con el procedimiento de huella cuando se incrementa el intervalo entre el EC y el EI. • El valor de señal del EC es mejor en el procedimiento de demora corta, en el que el EI tiene lugar poco después de la aparición del EC. El valor de señal del EC se reduce a medida que se incrementa el intervalo EC – EI. El EC también es un mal predictor del El en los procedimientos simultáneo y de huella. • El condicionamiento hacia atrás produce resultados ambiguos (condicionamiento excitatorio e inhibitorio). • Las perspectivas actuales afirman que los procedimientos de demora, simultáneo, de huella y hacia atrás producen todos un aprendizaje sólido, pero lo que los sujetos aprenden es diferente en cada caso. Se asume que el sujeto aprende cuándo aparece el EI en relación al EC, que el EI ocurre a la vez que el EC, antes del EC o con una pequeña demora con respecto al EC. El sujeto no sólo aprende que el EC está asociado con el EI, sino también cuándo ocurre el EI en relación al EC. Esto es lo que se denomina hipótesis de la codificación temporal. 3. CONDICIÓNAMIENTO PAVLOVIANO INHIBITORIO. Existe otro tipo de condicionamiento: aquel en el que se aprende a predecir la ausencia del EI. La capacidad de predecir la aparición de un evento aversivo también permite predecir la ausencia de estimulación aversiva. Las señales que predicen la ausencia de un estímulo aversivo son estímulos condicionados inhibitorios. Aunque es posible aprender a predecir la ausencia de un EI positivo del mismo modo que la de un EI negativo o aversivo, gran parte de la investigación sobre la inhibición condicionada ha empleado estimulación aversiva. PAGE 84 prueba más sofisticados. Uno de estos procedimientos es la prueba de sumación o del estimulo compuesto. La inhibición condicionada se mide a partir de la reducción o inhibición de la respuesta condicionada. Por tanto, la prueba requiere observar los efectos de un EC- o inhibitorio en compuesto con un EC+ o excitatorio. También puede entenderse el procedimiento como la observación de la sumación de los efectos del estímulo inhibitorio (EC-) y del estímulo excitatorio (EC+) • Ejemplo: Los sujetos recibieron un condicionamiento inhibitorio en el que la presentación de una luz terminaba siempre con una breve descarga (A+), y la presentación de una clave auditiva (X) junto con la luz terminaba sin la descarga (AX-). Se utilizó un procedimiento estándar de inhibición condicionada. Los sujetos también recibieron entrenamiento con otro estímulo auditivo (B) que siempre terminada con una breve descarga (B+). El objetivo de este procedimiento era establecer una excitación condicionada a dos estímulos diferentes, A y B, y una inhibición condicionada al estímulo X. Resultados: Cuando los estímulos excitatorios A y B se presentaron de forma aislada, los sujetos tardaron una cantidad de tiempo considerable en completar el criterio conductual exigido. Por el contrario, cuando los estímulos excitatorios se presentaron junto con el inhibidor condicionado (AX y BX), el criterio conductual exigido se completó más rápidamente. Se incluyó otra condición de prueba en la que el estímulo B se puso a prueba junto con otra clave auditiva Y. El estímulo Y no se había condicionado previamente como inhibidor y se presentó para asegurarse de que su mera introducción como estímulo novedoso junto con el estímulo B no daría lugar a una alteración de la respuesta condicionada al miedo. Y así fue. El procedimiento de prueba del estímulo compuesto para la inhibición condicionada sugiere que la presentación de un inhibidor condicionado o de una señal de seguridad puede reducir los efectos estresantes de una experiencia aversiva. c) La prueba del retraso en la adquisición. Si un estímulo inhibe de forma activa una respuesta particular, entonces debería ser especialmente difícil de condicionar ese estímulo para que provoque la conducta. Es decir, la velocidad de adquisición de una respuesta excitatoria debería disminuir si el EC es un inhibidor condicionado. • Siguiendo con el ejemplo del apartado anterior: Se tomó el estímulo X (condicionado como inhibidor) y el estímulo Y (sin condicionar). Y realizaron una prueba de retraso en la PAGE 84 adquisición emparejando tres veces cada uno de estos estímulos con una descarga. En los resultados se observó como el estímulo X previamente condicionado como inhibidor retrasó la adquisición de propiedades excitatorias de miedo condicionado. Rescorla propuso usar tanto la prueba del estímulo compuesto como la del retraso en la adquisición para comprobar si un estímulo había adquirido propiedades inhibitorias. Tema 4: CC, MECANISMOS 1. ¿A QUÉ DEBEN SU EFICACIA LOS ESTÍMULOS CONDICIONADOS E INCONDICIONADOS? Respuestas iniciales a los estímulos Las definiciones de Pavlov estaban formuladas en términos de elicitación de una respuesta particular (aquella que se trataba de condicionar). Debido a esto, la identificación de Ecs y Eis potenciales requiere que se comparen las respuestas provocadas por cada uno de ellos antes del condicionamiento. La novedad de los estímulos condicionados e incondicionados El efecto conductual de un estímulo depende de su novedad. Los estímulos familiares no suscitan reacciones tan intensas cono los estímulos novedosos. PAGE 84 • Efecto de preexposición al EC o efecto de inhibición latente. Los estudios sobre el papel de la novedad de los estímulos en el CC suelen realizarse en dos fases. Primero se expone repetidamente a los sujetos al estímulo que posteriormente va a utilizarse como EC. El EC se presenta siempre de forma aislada. Tras esta fase de preexposición se da la segunda fase en la que el EC se empareja con un EI utilizando los procedimientos convencionales de CC. La familiarización inicial con un estímulo presentado aisladamente suele retrasar el condicionamiento posterior de dicho estímulo. El efecto de preexposición al EC sirve para limitar la cantidad de procesamiento y atención a los estímulos que se sabe que carecen de consecuencias. La inhibición latente sirve para sesgar el aprendizaje a favor de los estímulos novedosos. • Efecto de preexposición al EI. Los experimentos sobre la importancia de la novedad del EI tienen un diseño similar al anterior. Al principio los sujetos reciben exposiciones repetidas al EI aislado. Posteriormente el EI se empareja con un EC. Los sujetos familiarizados con un EI antes de su emparejamiento con un EC desarrollan la respuesta condicionada al EC más lentamente que los participantes para los cuales el EI es novedoso durante los emparejamientos EC – EI. • Mecanismos de los efectos de preexposición al EC y al EI: • Interferencia asociativa: las preexposiciones al EC o al EI disminuyen la capacidad de estos estímulos. • Interferencia de la memoria: la respuesta condicionada resulta alterada debido a que los participantes recuerdan lo sucedido en ambas fases del experimento. Intensidad y saliencia del EC y del EI La intensidad del estímulo es uno de los factores que contribuyen al concepto más general de saliencia del estímulo. El término saliencia carece de una definición clara, pero se corresponde más o menos con la significación o la perceptibilidad. Las teorías del aprendizaje suelen asumir que el aprendizaje tendrá lugar de forma más rápida si se utilizan estímulos más salientes. Un estímulo puede adquirir saliencia o significación aumentando su intensidad, lo que hace que despierte mayor atención. Ejemplo: se puede aumentar la saliencia de un estímulo haciéndolo más relevante en relación a las necesidades biológicas del organismo. Los animales prestan más atención al sabor de la sal si sufren déficit nutricional de sal. PAGE 84 2. ¿QUÉ DETERMINA LA NATURALEZA DE LA RC? El modelo de sustitución del estímulo. La primera y más duradera explicación acerca de la naturaleza de la respuesta condicionada (RC) es el modelo de sustitución del estímulo de Pavlov. De acuerdo con este modelo, el EC adquiere la capacidad de funcionar de forma similar a como el EI lo hacía previamente. Por tanto, se asume que el EC activa los circuitos neuronales que previamente activaba sólo el EI y elicita respuestas similares a las del EI. El EI como factor determinante de la RC: ECs diferentes elicitan RCs diferentes. La comida elicita salivación y aproximación; las descargas elicitan aversión y alejamiento. Si el condicionamiento convierte al EC en un sustituto del EI, entonces los ECs condicionados con diferentes EIs deberían provocar diferentes tipos de respuesta condicionada. Ejemplo: Los animales aprenden a salivar cuando se les condiciona con comida y a parpadear cuando se les condiciona con un soplo de aire en el ojo. Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo. Walter Cannon introdujo el concepto de homeostasis para referirse a los mecanismos fisiológicos que mantiene los aspectos críticos del cuerpo dentro de los límites aceptables. Mantener los parámetros del sistema dentro de un intervalo deseable requiere que las alteraciones que modifican los valores del sistema en una dirección se compensen por medio de procesos oponentes que contrarresten dicha alteración. El EC como determinante de la forma de la RC Hasta el momento hemos considerado cómo la forma de la RC está determinada por el EI. Sin embargo, el EI no es el único factor importante. La forma de la RC también está influida por la naturaleza del EC. Timberlake y Grant estudiaron el CC en ratas utilizando comida como EI. En lugar de la luz o el tono, el EC fue la presentación de otra rata justo antes de la administración de comida. El modelo de sustitución predice que los emparejamientos EC – EI harán que las respuestas producidas por el EC sean similares a las respuestas elicitadas por la comida. Ya que la comida elicita conductas de roer y morder, se esperaba que el EC elicitara también estas respuestas. Contrariamente a esta predicción la presentación de otra rata como EC, a PAGE 84 medida que se emparejaba con la comida, se observó que elicitaba respuestas de orientación, aproximación y olfateo, así como contactos de tipo social. Por tanto, el patrón de RCs estuvieron determinadas por la naturaleza del EC. Conducta condicionada y sistemas de conducta La teoría de los sistemas de conducta asume que la presentación del EI en un procedimiento de condicionamiento pavloviano activa el sistema de conducta relevante para ese EI. Por ejemplo: Los EI relacionados con la comida activan los sistemas de búsqueda y alimentación. Un EI sexual activará el sistema de conducta sexual. Los procedimientos de CC superponen una relación EC – EI sobre el sistema conductual activado por el EI. Cuando un EC se asocia con el EI, se integra en su sistema conductual y adquiere la capacidad de elicitar las repuestas que forman parte de dicho sistema. Una predicción provocadora de esta teoría es que la forma de la RC dependerá del intervalo EC – EI que se utilice. La razón es que el intervalo EC – EI determina el lugar en el que se incorporará el EC dentro de la secuencia de respuestas el sistema de conducta. De acuerdo con esta teoría, el EC no sustituye ni compensa al EI. En lugar de eso sustituye a un estímulo en un punto del sistema de conducta determinado por el intervalo EC – EI. Se espera que la naturaleza del EC determine cómo se incorpora el EC al sistema de conducta. Aprendizaje E-R frente a aprendizaje E-E Forma en que el EC produce la respuesta. De acuerdo con la perspectiva del aprendizaje E-R, el condicionamiento establece una nueva conexión E-R entre el EC y la RC. Una visión alternativa más moderna es que los sujetos aprenden una asociación E-E entre el EC y el EI. De acuerdo con al perspectiva del aprendizaje E-E los sujetos responden al EC, no porque éste elicite directamente la RC, sino porque el EC activa una representación del EI. ¿Cómo pueden los investigadores decidir entre estas dos interpretaciones? Un método que se ha utilizado es el de la devaluación del EI: con este método se reduce el atractivo de un EI, normalmente obtenida mediante la aversión o la saciedad. Existe evidencia de aprendizaje E-E proveniente de una gran variedad de situaciones de CC. Sin embargo, no todos los casos de CC conllevan aprendizaje E-E. En algunos casos, los PAGE 84 participantes parecen aprender una asociación directa entre el EC y la RC. Estudios sobre condicionamiento de segundo orden proporcionan evidencia de este aprendizaje E-R; pero también de aprendizaje E-E. 3. ¿CÓMO SE ASOCIAN LOS ESTÍMULOS CONDICIONADO E INCONDICIONADO? Efecto de bloqueo El efecto de bloqueo conlleva una secuencia de eventos: primero se establece una asociación entre un EC (estímulo A) y un EI. Una vez que el ECA está bien condicionado, se añade un segundo estímulo (estímulo B) al estímulo A se presentan los dos juntos en los ensayos de condicionamiento. El hallazgo básico es que el condicionamiento previo de A interfiere, o bloquea, el desarrollo de la respuesta condicionada al estímulo añadido B. Desde los tiempos de Aristóteles, se consideraba que la contigüidad temporal era el medio principal por el cual se asociaban los estímulos. El efecto de bloqueo se ha convertido en un fenómeno clave del CC debido a que puso en duda el presupuesto de que la contigüidad temporal es suficiente para el aprendizaje. El efecto de bloqueo muestra claramente que no es suficiente emparejar un EC con un Ei para que se desarrolle la respuesta condicionada. ¿Por qué la presencia del estímulo A previamente condicionado bloquea la adquisición de la respuesta a la clave añadida B? Kamin, el descubridor del efecto de bloqueo, explicó el fenómeno proponiendo que, para que se produjera aprendizaje de forma efectiva, el EI debía ser sorprendente. Si el EI va señalado por un estímulo previamente condicionado (A), no sorprenderá al sujeto y, por tanto, no funcionará bien a la hora de condicionar al estímulo añadido (B). El modelo de Rescorla y Wagner La idea de que la efectividad de un EI está determinada por el grado en que resulta sorprendente es la base de un modelo matemático formal del CC propuesto por Rescorla y Wagner. ¿Qué quiere decir que algo es sorprendente? ¿Cómo pueden los observadores medir la sorpresividad de un EI? Por definición, un evento es sorprendente si es diferente de lo que se espera. De acuerdo con el modelo Rescorla – Wagner un EI inesperadamente grande es la base del condicionamiento excitatorio o del incremento de la fuerza asociativa, y un EI inesperadamente pequeño es la base del condicionamiento inhibitorio o de la disminución de la fuerza asociativa. Rescorla y Wagner asumieron que la sorpresividad, y por tanto la efectividad, de un EI depende de lo diferente que el EI sea en comparación con lo que el sujeto espera. También asumieron que la expectativa del EI está relacionada con las propiedades condicionadas o PAGE 84 tiene que sumar cero (valor que representa la ausencia del EI). ¿Cómo puede lograrse eso? Como el EC+ tiene un valor asociativo positivo, la única forma de lograr una expectativa del EI de valor cero en los ensayos NO reforzados es hacer que el valor asociativo del EC- sea negativo. Por tanto, el modelo Rescorla – Wagner explica la inhibición condicionada asumiendo que el EC- adquiere un valor asociativo negativo. 4. Extinción de la (1) excitación y de la (2) inhibición En un procedimiento de extinción, el estímulo condicionado se presenta repetidamente sin el EI. • Extinción de la excitación: Si un EC a adquirido propiedades excitatorias habrá un exceso de expectativa del Ei la primera vez que el EC se presente sin el EI en la fase de extinción. Al continuar con los ensayos del EC solo, la expectativa elicitada por el EC se va acercando a la línea que representa la ausencia del Ei por medio de una reducción gradual del valor asociativo del EC+ hasta llegar a cero. • Extinción de la inhibición: Al principio de la extinción, el EC- tiene un valor asociativo negativo. Esto puede considerarse una predicción excesivamente baja del EI; el organismo predice un EI con un valor menor del valor cero con el que de hecho aparece el EI. Para ajustar las expectativas a la ausencia del EI, l valor asociativo negativo del EC- se va perdiendo gradualmente y el EC- termina con una fuerza asociativa igual a cero. 5. Problemas del modelo Rescorla – Wagner • Análisis de la extinción en inhibición condicionada es incorrecto: El modelo predice que la presentación repetida de un inhibidor condicionado (EC-) sin el EI debería dar lugar a una pérdida de la inhibición condicionada, pero esto no sucede. Por el contrario, algunos investigadores han encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedades inhibitorias. En lugar de eso, cosiste en extinguir las propiedades excitatorias del EC+ juntos con el que se presentaba el EC- durante el entrenamiento inhibitorio. • Considera la extinción como lo opuesto a la excitación, o la vuelta a un valor asociativo 0: La extinción parece involucrar el aprendizaje de una nueva relación entre el EC y el EI (el aprendizaje de que el Ei ya no sigue al EC). El mismo EC puede tener tanto propiedades excitatorias como inhibitorias. En el modelo sólo se permite que los estímulos condicionados tengan un único valor asociativo: puede ser o excitatorio o inhibitorio, pero no ambas cosas a la vez. PAGE 84 • En la aversión al sabor y el olor: En lugar de encontrar bloqueo de un estímulo sobre otro, encontró lo opuesto, un efecto de aumento o de contrabloqueo (aumento de condicionamiento del EC añadido, en lugar de deteriorar el condicionamiento). Tema 5: CO, FUNDAMENTOS La conducta que sucede debido a que ha servido previamente como instrumento para producir ciertas consecuencias se denomina conducta instrumental u operante. Primeras investigaciones sobre el Condicionamiento Operante Los análisis teóricos y de laboratorio del CO comenzaron formalmente con el trabajo de Thorndike. Sobre la base su investigación formuló la ley del efecto. Esta ley establece que si una respuesta en presencia de un estímulo es seguida por un suceso satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la respuesta es seguida por un suceso molesto, la asociación E – R se debilita. 1. APROXIMACIONES MODERNAS AL ESTUDIO DEL CO. Procedimientos de ensayo discreto Los procedimientos de ensayo discreto son similares al método que Thorndike utilizó, en el que cada ensayo de entrenamiento acaba con la retirada del animal del aparato, y la respuesta instrumental se realiza sólo una vez durante cada ensayo. Las investigaciones de ensayo discreto de la conducta instrumental a menudo se han llevado a cabo en algún tipo de laberinto. • La conducta en el laberinto puede cuantificarse midiendo la velocidad de carrera (con qué rapidez se desplaza el animal desde la caja de salida hasta la caja de meta). La velocidad de carrera normalmente aumenta con ensayos de entrenamiento repetidos. PAGE 84 • Otra medida común de la conducta en los corredores es la latencia (tiempo que tarda el animal en abandonar la caja de salida y empezar a desplazarse pro el pasadizo). Normalmente, las latencias se hacen más cortas a medida que progresa el entrenamiento. Procedimientos de operante libre En un corredor o laberinto, después de alcanzar la caja de meta, el animal es retirado del aparato durante en momento antes de ser devuelto a la caja de salida para le próximo ensayo. El animal, por tanto, tienen limitadas oportunidades para responder, y esas oportunidades están programadas pro el experimentador. En contraste, los procedimientos de operante libre que permiten al animal que repita la respuesta instrumental una y otra vez sin restricciones. El concepto de operante fue ideado por Skinner, con el fin de dividir la conducta en unidades medibles con significado. Skinner también ideo la ‘caja de Skinner’, utilizada para estudiar la conducta operante libre en ratas. La caja es una pequeña cámara que contiene una palanca que la rata puede empujar hacia abajo repetidamente. La cámara también consta de un mecanismo que puede proporcionar un reforzador, como comida o agua. En el experimento más simple, si sitúa una rata hambrienta en la cámara. La palanca está conectada electrónicamente al sistema dispensador de comida. Cuando la rata aprieta la palanca hacia abajo, cae automáticamente una bolita de comida en el cuenco. Una respuesta operante, como presionar una palanca, se define a partir del efecto que produce en el ambiente. • Entrenamiento y moldeamiento al comedero La mayoría de las ratas situadas en una caja de Skinner no presionan la palanca con frecuencia. Hay algunos pasos preliminares para establecer esta conducta. Tras suficientes emparejamientos del sonido del dispensador de comida con la entrega de comida, el sonido llega a elicitar una respuesta de seguimiento del signo: el animal se dirige al comedor y recoge la bolita de comida. Esta fase preliminar de condicionamientos se llama entrenamiento al comedero. Después de este entrenamiento el organismo está preparado para aprender la respuesta instrumental requerida. Para facilitar la adquisición de una nueva respuesta operante, los experimentadores emplean una estrategia que ha sido utilizada por los entrenadores de animales. Ejemplo: inicialmente se puede dar a una rata una bolita de comida cada vez que se levanta sobre sus patas traseras en cualquier lugar de la cámara experimental. Una vez que la respuesta de alzamiento ha sido establecida, la bolita de comida se entrega sólo si la rata realiza la respuesta de alzamiento sobre la palanca de respuesta. Levantarse en otras partes de la cámara NO se reforzaría más. Una vez que el alzamiento sobre la PAGE 84 Ejemplo: se le dice a un niño que se vaya a su habitación después de haber hecho algo malo. El niño no recibe un estímulo aversivo cuando se le dice que se vaya a su habitación. No hay nada aversivo en relación con la habitación, el padre está retirando fuentes de reforzamiento positivo, como jugar con los amigos o ver la televisión. Los procedimientos de entrenamiento de omisión se denominan en ocasiones reforzamiento diferencial de otras conductas o RDO. Este término refleja el hecho de que el individuo recibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otra conducta diferente de la respuesta especificada por el procedimiento. La realización de la respuesta crítica deviene en la omisión de la recompensa que podría haber sido obtenida si el individuo hubiese llevado a cabo alguna ‘otra’ conducta. Por tanto, el entrenamiento de omisión implica el reforzamiento de ‘otras’ conductas. 3. ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRUMENTAL La respuesta instrumental El resultado de los procedimientos de CO depende en parte de la naturaleza de la respuesta que se esté condicionando. La sección siguiente describe cómo la naturaleza de la respuesta determina los resultados de los procedimientos de reforzamiento positivo. • Viabilidad conductual vs. estereotipia Tanto Thorndike como Skinner fueron pioneros en enfatizar que el reforzamiento incrementa la probabilidad de que la respuesta instrumental se repita en el futuro. Este énfasis alentó la creencia de que los procedimientos de CO producían repeticiones de la misma respuesta (que producían uniformidad o estereotipia en la conducta). Esto no significa que el CO no pueda también verse involucrado en al producción de respuestas creativas o variables. Por ejemplo: los organismos pueden aprender a obtener reforzamiento en una situación donde se requiera hacer algo nuevo. La variabilidad de la respuesta puede ser la base para el reforzamiento instrumental. Un estudio mostró que la variabilidad de la respuesta puede mantenerse e incrementarse por el reforzamiento. Por tanto, la variabilidad de la respuesta puede establecerse como una operante. Los resultados también muestran que en ausencia de reforzamiento explícito de la variabilidad, la respuesta llega a ser más estereotipada con un condicionamiento instrumental continuado. Por tanto, el resultado típico del reforzamiento instrumental es una disminución de la variabilidad de la respuesta. • Relevancia o pertinencia en el CO PAGE 84 ¿Hay límites en los tipos de nuevas unidades conductuales o dimensiones de la respuesta que pueden ser modificados por condicionamiento instrumental? En el CC para que el condicionamiento ocurra rápidamente, el EC tiene que ‘competer’ al EI, o ser ‘relevante’ para el EI. En el CO tienen lugar relaciones análogas de pertinencia o relevancia. Thorndike propuso el concepto de pertinencia para explicar los fallos en el entrenamiento del rascado y el bostezo en gatos. Ciertas respuestas ‘ se correspondían’ de forma natural con el reforzador debido a la historia evolutiva del animal. Manipular un picaporte y empujar un anillo son respuestas manipulatorias que están relacionadas de forma natural con escapar del confinamiento. Por el contrario, rascar y bostezar no ayudan normalmente a los animales a escapar del confinamiento y, en consecuencia, no ‘se corresponden’ con escapar de una caja problema. Los Breland tuvieron dificultades parecidas con otras especias. Los cerdos, por ejemplo, tampoco podían aprender a introducir monedas en una hucha. Tras el entrenamiento inicial, empezaron a hozar las monedas por el suelo. Los Breland llamaron deriva instintiva al desarrollo de respuestas como esta. • Sistemas de conducta y limitaciones en el CO Las limitaciones de respuesta en el CO que se han descrito son consecuentes con la teoría de los sistemas de conducta. De acuerdo con la aproximación de los sistemas de conducta, deberíamos ser capaces de predecir qué respuestas se incrementarán con un reforzamiento de comida mediante el estudio de lo que los animales hacen cuando su sistema de alimentación está activado en ausencia de condicionamiento instrumental. Esta predicción ha sido confirmada. En un estudio con hámsters, Shettleworth encontró que la privación de comida disminuía la probabilidad de respuestas de autocuidado, como el lavado de la cara y rascarse, pero incrementaba la probabilidad de actividades dirigidas al ambiente, como cavar o rascar una pared (escarbar) y erguirse sobre las patas traseras. Estos resultados sugieren que las respuestas de autocuidado no son parte del sistema de alimentación activado por el hambre, mientras que las actividades dirigidas al ambiente sí lo son. El reforzador instrumental Varios aspectos del reforzador determinan sus efectos sobre el aprendizaje y la ejecución de la conducta instrumental. • Cantidad y naturaleza del reforzador Aunque la cantidad y la naturaleza del reforzador son lógicamente características diferentes, a veces es difícil separarlas experimentalmente. Un cambio en la cantidad del reforzador puede también hacer al reforzador cualitativamente distinto. PAGE 84 • Cambios en la naturaleza y cantidad del reforzador En el estudio de Hutt, un grupo dado de ratas recibió sólo una cantidad y tipo particular de comida líquida a lo largo del experimento. ¿Qué pasaría si la cantidad o naturaleza del reforzador modificaran su valor para el mismo individuo? ¿Hay efectos análogos en el CO con el modelo de Rescorla – Wagner en el CC? Ejemplo: Si se ha estado trabajando por 9’50 euros la hora durante los seis últimos meses, conseguir ese mismo salario no resultará muy emocionante. Sin embargo, si se ha estado trabajando por 7’50 euros la hora, un aumento a 9’50 resultará especialmente atractivo. La evidencia experimental confirma esta impresión. Numerosos estudios han mostrado que los efectos de una cantidad y tipo de reforzador particular dependen de la cantidad y naturaleza de los reforzadores que el individuo ha experimentado previamente. Contraste positivo: se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia menso atractiva. De n modo más informal, la recompensa favorable les parece especialmente buena a los individuos que experimentaron previamente una consecuencia peor. Contraste negativo: se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor. En este caso, la recompensa desfavorable les parece especialmente mala a los individuos que han experimentado previamente una recompensa mejor. Contraste conductual simultáneo: Los efectos de contraste también se dan si las condiciones de recompensa se modifican una y otra vez, con una clave diferente señalando cada condición de recompensa. Los diferentes efectos de contraste están mediados por diferentes mecanismos. Sin embargo, todos los efectos de contraste ilustran que la efectividad de un reforzador en una situación está determinada en parte por las experiencias del organismo con reforzadores en otras situaciones. Por razones que no están totalmente claras, el contraste negativo se ha obtenido de forma más clara que el contraste positivo. La relación respuesta – reforzador Como se ha dicho, la conducta instrumental produce y es controlada por sus consecuencias. Puede ser también probabilística. Por ejemplo, se pueden tener que hacer varias llamadas telefónicas antes de encontrar a alguien que esté dispuesto a ayudarte con un problema. PAGE 84 circunstancias es un reflejo de un sistema preorganizado de forrajeo típico de la especia y de conducta de alimentación. Ocurren diferentes conductas dependiendo de cuándo se entregó la última comida y cuándo la comida va a aparecer de nuevo. Justo después de la entrega de comida, se asume que el organismo desarrolla respuestas de búsqueda focalizada poscomida que involucran actividades cerca del comedero. En medio del intervalo ente entregas de comida ocurren respuestas de búsqueda general que alejan al sujeto del cuenco de comida. Según se aproxima el momento de la próxima entrega de comida, los sujetos exhiben respuestas de búsqueda focalizada que están de nuevo concentradas cerca del comedero. • Efectos de la controlabilidad de los reforzadores Una contingencia fuerte entre una respuesta instrumental y un reforzador esencialmente significa que la respuesta controla el reforzador. Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. La investigación contemporánea sobre los efectos de la controlabilidad de la estimulación aversiva en el aprendizaje se originó con los estudios pioneros de Seligman y cols. quienes investigaron los efectos de la exposición a una descarga incontrolable en el aprendizaje posterior de escape – evitación en perros. El hallazgo más importante fue que la exposición a una descarga incontrolable dificultaba el aprendizaje posterior. Este fenómeno se denominó efecto de indefensión aprendida. 1. El diseño triádico Los experimentos de indefensión aprendida se realizan normalmente usando el diseño triádico. El diseño incluye dos fases: la exposición y el condicionamiento. Durante la fase de exposición, un grupo de ratas (E, escape) es expuesto a descargas periódicas que pueden finalizar mediante la realización de una respuesta de escape (girar una pequeña rueda, por ejemplo). Cada sujeto del segundo grupo (A, por acoplado) es acoplado a un animal del Grupo E y recibe las mismas descargas que el compañero del Grupo E. Sin embargo, los animales del Grupo A no pueden hacer nada para evitar las descargas. El tercer grupo (C, por confinado) no recibe descargas durante la fase de exposición pero está confinado en el aparato tanto tiempo como los otros grupos. Durante la fase de condicionamiento, los tres grupos reciben entrenamiento de escape – evitación. Éste se realiza normalmente en una caja de lanzadera que tiene dos compartimento adyacentes. Los animales tienen que ir de un lado a otro entre los dos compartimentos para evitar la descarga. 2. La hipótesis de la indefensión aprendida. La hipótesis de la indefensión aprendida asume que durante la exposición a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta (que no pueden hacer nada para controlar las descargas). Es más, llegan a esperar que los reforzadores continuarán siendo independientes de su conducta en el PAGE 84 futuro. Esta expectativa de una ausencia de control futura debilita su habilidad para aprender una nueva respuesta instrumental. El déficit de aprendizaje ocurre por dos razones: • Primero, la expectativa de falta de control reduce la motivación de los sujetos para realizar una respuesta instrumental • Segundo, incluso si realizan la respuesta y son reforzados en la fase de condicionamiento, la expectativa previamente aprendida de falta de control hace más difícil para los sujetos aprender que su conducta es ahora efectiva para producir reforzamiento. Es importante distinguir la hipótesis de indefensión aprendida del efecto de indefensión aprendida. El efecto de indefensión aprendida es el patrón de resultados obtenido con el diseño triádico. 3. Déficit de actividad El déficit de aprendizaje observado en el Grupo A era resultado de que estos animales aprendían a ser inactivos en respuesta a la descarga durante la fase de exposición. La hipótesis de la inactividad aprendida no puede explicar todos los ejemplos de indefensión aprendida. 4. Déficit atencional ¿Por qué la falta de control sobre los reforzadores podría producir un déficit en el aprendizaje si el efecto no es debido a una disminución en la actividad? Una posibilidad interesante es que la descarga inescapable provoque que los animales presenten menos atención a sus acciones. Si un animal no presta atención a su conducta, tendrá dificultad para asociar sus acciones con los reforzadores en el escape – evitación o en otras formas de condicionamiento instrumental 5. Relaciones estimulares en el condicionamiento de escape ¿Qué ocurre cuando a los animales se les permite escapar de la descarga en la fase de exposición del diseño triádico? El rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminación de un estímulo aversivo. Sin embargo, en un procedimiento de escape hay también relaciones especiales estimulares que son potencialmente muy importantes. Realizar la respuesta de escape tiene como resultado claves internas de retroalimentación de la respuesta. Algunos de estos estímulos producidos por la respuesta son experimentados cal comienzo de la respuesta de escape, justo antes de que la descarga se retire, y se denominan claves de retroalimentación de la terminación de la descarga. Oros estímulos producidos por la respuesta son experimentados cuando el animal completa la respuesta, justo después de que la descarga se haya retirado al comienzo del intervalo entre ensayos. Éstos se denominan claves de retroalimentación de la señal de seguridad. PAGE 84 Tema 6: PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN Un programa de reforzamiento es un programa, o regla, que determina cómo y cuándo la ocurrencia de una respuesta irá seguida de un reforzador. 1. PROGRAMAS SIMPLES DE REFORZAMEINTO INTERMITENTE Los procesos que organizan y dirigen la ejecución instrumental se activan de diferentes formas por los distintos programas de reforzamiento. En los programas ‘simples’, un solo factor determina qué ocurrencia de la respuesta instrumental se refuerza. Programas de razón La característica definitoria de un programa de razón es que el reforzamiento depende sólo del número de respuestas que el organismo realiza. Si este número es uno, cada ocurrencia de la respuesta instrumental provocará la entrega del reforzador. Este tipo de programa se denomina técnicamente reforzamiento continuo (RFC). Las situaciones en las que la respuesta se refuerza sólo alguna vez involucran un reforzamiento parcial o intermitente. • Razón fija Ejemplo: consideremos la entrega de un reforzador después de cada décima respuesta de presión de palanca en un estudio con ratas de laboratorio. En un programa como éste, hay una razón fija entre el número de respuestas que la rata realiza y el número de reforzadores que consigue. Esto convierte al procedimiento en un programa de razón fija. Específicamente, el procedimiento podría denominarte programa de reforzamiento de razón fija 10 (RF10). Se da una tasa constante y alta una vez que la conducta se ha iniciado, pro se puede tardar un tiempo antes de comenzar el número requerido de respuestas. Estas características de la respuesta se muestran con claridad en un registro acumulativo de la conducta. Un registro acumulativo es una forma especial de representar la forma de repetirse una respuesta a lo largo del tiempo. PAGE 84 En los programas de intervalo simples, una vez que el reforzador está disponible, permanece así hasta que se realiza la respuesta instrumental. No importa el tiempo que tarde el sujeto. Pero fuera del laboratorio existe una restricción en cuanto al tiempo que permanece el reforzador disponible. A esto se le llama espera limitada. Comparación de los programas de razón y de intervalo Semejanzas • Tanto en los programas de RF como los de IF producen una pausa posreforzamiento después de la administración de cada reforzador. • Tanto los programas de RF como los de IF producen altas tasas de respuesta justo antes de la administración del siguiente reforzador. • Los programas de RV y de IV mantienen tasas estables de respuesta, sin pausas predecibles. Diferencias • Los programas de RV motivan conductas instrumentales mucho más vigorosas que los programas de IV. • Reforzamiento diferencial del tiempo interrespuesta ¿Por qué los programas de razón son capaces de producir tasas de respuesta más altas que los programas de intervalo? Un factor crítico es el espaciamiento entre respuestas que se da justo antes del reforzamiento: tiempo interrespuesta o TIR. • Si se refuerzan TIRs cortos, será más probable que el sujeto realice TIRs cortos. Idem con TIRs largos. • Un sujeto que produce sobre todo TIRs cortos responderá a una tasa alta. Si un sujeto produce TIRs largos, responderá a una tasa baja. ¿Cómo determinan los programas de intervalo y de razón el reforzamiento de los TIRs? • En un programa de razón, no existen restricciones acerca de cuando cuentas las respuestas para conseguir el reforzador. De hecho, cuanto más rápido complete el sujeto el requerimiento de la razón, más rápido recibirá el reforzador. Por tanto, un programa de razón favorece TIRs cortos. • Los programas de intervalo favorecen TIRs largos. Si un sujeto espera un largo tiempo entre respuestas (emitiendo TIRs largos) es más probable que su respuesta ocurra después de que el reforzador esté disponible, y en consecuencia sea reforzada. Programas de reforzamiento de tasas de respuesta PAGE 84 A pesar de que los programas de razón producen tasas de respuesta mayores que los programas de intervalo, ni uno ni otro requieren una tasa específica de respuesta para conseguir el reforzamiento. Sin embargo, los programas de tasas de respuestas requieren específicamente que el organismo responda a una tasa particular para obtener el reforzador. En el reforzamiento diferencial de tasas altas o RDA una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Fomentan que los sujetos respondan rápidamente. En el reforzamiento diferencial de tasas bajas o RDB se refuerza una respuesta sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa. Estos programas fomentan que los sujetos respondan lentamente. 2. CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES La conducta es algo más que la repetición de respuestas individuales. La situación de elección más simple consta de dos respuestas alternativas, cada una de éstas seguida por un reforzador de acuerdo con su propio programa de reforzamiento. Las aproximaciones recientes al estudio de la conducta de elección utilizan cajas de Skinner equipadas con dos manipulandos, como dos teclas de picoteo. En el experimento típico, responder en cada tecla es reforzado según algún programa de reforzamiento. Los dos programas funcionan al mismo tiempo (o concurrentemente), y el sujeto es libre de cambiar de una tecla de respuesta a la otra. Este tipo de procedimiento se denomina programa concurrente. Éste permite una medición continua de la elección porque el organismo el libre para cambiar de un lado a otro entre las alternativas. Medidas de la conducta de elección La conducta de elección de un individuo en un programa concurrente se refleja en la distribución de su conducta entre dos respuestas alternativas. Esto se puede medir de varias formas. Una técnica común es calcular la tasa relativa de respuesta de cada alternativa. La tasa relativa de respuesta en la tecla A, por ejemplo, se calcula dividiendo la tasa de respuesta en la tecla A por la tasa de respuesta total (la tasa en la tecla A más la tasa en la tecla B): RA / (RA + RB) Donde RA es la tasa de respuesta en la tecla A y RB es la tasa de respuesta en la tecla B. Ejemplo: Si una paloma picotea igualmente en las dos teclas de respuesta, esta razón será 0,5. Si la tasa de respuesta en la tecla A es mayor que en la B, la razón será mayor que 0,5. Por el PAGE 84 contrario, si la tasa de respuesta en la tecla A es menor que en la B, la razón será menor que 0,5. La forma en que un organismo distribuye su conducta entre las dos alternativas de respuesta está muy influida por el programa de reforzamiento que funciona para cada respuesta. La tasa relativa de reforzamiento conseguido para cada alternativa de respuesta puede calcularse de una manera semejante a la tasa relativa de respuesta: Por ejemplo: la tasa relativa de reforzamiento para la alternativa A es la tasa de reforzamiento de la respuesta A dividida por la tasa total de reforzamiento (la suma de la tasa de recompensa conseguida en el lado A más la tasa de recompensa conseguida en el lado B): rA / (rA + rB) Donde rA y rB representan las tasa de reforzamiento obtenidas en cada alternativa de respuesta. Ley de la igualación Herrnstein estudió los efectos de varios programas concurrentes IV- IV. No había restricción acerca de en qué lado podían picotear las palomas. Podían responder exclusivamente en un lado o en otro, o podían distribuir sus picotazos entre los dos lados. Lo que se obtuvo fue que las palomas distribuyeron sus respuestas de una manera altamente predecible. Los resultados indican que la tasa relativa de respuesta en una alternativa dada estaba siempre muy cercana a igualar la tasa relativa de reforzamiento logrado en esa alternativa. Si las palomas obtenían una proporción mayor de reforzadores en la alternativa A, realizaban de forma correspondiente una proporción mayor de respuestas en dicha alternativa. Por tanto, la tasa relativa de respuesta en una alternativa se iguala con la tasa relativa de reforzamiento en esa alternativa: RA / (RA + RB) = rA / (rA + rB) F 0 E 8 RA / RB = rA / rB Ambas expresiones matemáticas de la ley de la igualación representan el mimo principio básico, a saber, que las tasas relativas de respuesta se igualan con las tasas relativas de reforzamiento • Infraigualación, supraigualación y sesgo de respuesta La ley de igualación indica claramente que las elecciones no se hacen de forma caprichosa (son una función ordenada de las tasas de reforzamiento). la mayoría de los ejemplos ne los que la conducta PAGE 84 ocasionalmente en el componente de IV. La evidencia muestra que los animales favorecen el componente de RV pero no de forma tan fuerte como predice la maximización molar. 3. Mejoramiento Los mecanismos de mejoramiento operan en una escala temporal que está entre la escala temporal de las teorías molar y molecular. Muchos aspectos de la conducta no son óptimos a largo plazo. El término mejoramiento se refiere a hacer algo mejor. Adviértase que el mejoramiento no se refiere a elegir la mejor alternativa en ese momento (maximización molecular) o hacer que a largo plazo algo sea tan bueno como se pueda (maximización molar). El mejoramiento se refiere a la meta más modesta de sólo hacer que la situación sea mejor. Un término importante en la traducción de estas ideas a predicciones experimentales comprobables es la tasa local de respuesta y reforzamiento. Las tasas locales están calculadas sólo sobre el período de tiempo que un sujeto dedica a una alternativa particular de respuesta. La teoría del mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra para mejorar la tasa local de reforzamiento que están recibiendo. Se asume que los ajustes en la distribución de la conducta entre las alternativas continúan hasta que el organismo está obteniendo la mima tasa local de recompensa en todas las alternativas. Puede demostrarse matemáticamente que cuando los sujetos distribuyen sus respuestas para obtener la misma tasa local de reforzamiento en cada alternativa de respuesta, se están comportando de acuerdo con la ley de la igualación. Por tanto, el mecanismo del mejoramiento da como resultado la igualación. 3. ELECCIÓN CON COMPROMISO Las elecciones importantes en la vida a menudo implican un beneficio pequeño a corto plazo frente a un beneficio más demorado, pero mayor. Éste es fundamentalmente el problema del autocontrol. Programas concurrentes encadenados La técnica básica en esta área de investigación es el programa concurrente encadenado de reforzamiento. involucra al menos dos fases o eslabones: • Eslabón de elección: se permite al participante elegir entre dos programas alternativos realizando una de dos respuestas. PAGE 84 • Eslabón terminal: la oportunidad para el reforzamiento sucede sólo después de que la elección inicial haya sido realizada y el sujeto se encuentre en esta fase. Una característica importante del programa concurrente encadenado es que una vez que el participante ha realizado la elección, está comprometido con esa elección hasta el final del eslabón terminal del programa. Por tanto, los programas concurrentes encadenados implican elección con compromiso. Ejemplo: si la paloma selecciona la alternativa A, su patrón de picoteo durante el componente terminal será semejante al patrón normal de respuesta para un programa de RV10. Si la paloma selecciona la alternativa B, su patrón de picoteo durante el componente terminal será característico de un programa de RF10. Los estudios de este tipo han mostrado que los sujetos prefieren la alternativa de RV. La preferencia por este programa está guiada por el hecho de que ocasionalmente un programa de RV proporciona reforzamiento por un número relativamente pequeño de respuestas. La consecuencia inmediata de una respuesta en un eslabón inicial es un estímulo que está asociado con el eslabón terminal elegido. Como este estímulo está presente cuando se proporciona el reforzador primario, el estímulo del eslabón terminal se convierte en un reforzador condicionado. Por tanto, se puede caracterizar un programa concurrente como aquél en que las respuestas al eslabón inicial se refuerzan por la presentación de un reforzador condicionado. Las diferencias en le valor del reforzador condicionado determinarán entonces la tasa relativa de cada respuesta de elección en el eslabón inicial. Estudios de autocontrol • El autocontrol es a menudo cuestión de elegir una recompensa grande demorada sobre una recompensa pequeña inmediata. • El autocontrol es más fácil si la alternativa tentadora no está tan claramente disponible. • Las preferencias cambian a favor de cualquier recompensa grande demorada si se requiere que los participantes esperen más tiempo para recibir cualquier recompensa tras realizar su elección. • Si las recompensas se entregan rápidamente tras una respuesta de elección, los sujetos generalmente prefieren una recompensa pequeña inmediata más que una recompensa grande demorada. • Sin embargo, si se añade una demora constante a la entrega de ambas recompensas, es más probable que los individuos muestren autocontrol y prefieren la recompensa grande demorada. PAGE 84 • Explicaciones del autocontrol Un principio general que es la clave de las explicaciones conductuales del autocontrol, a saber, que el valor de un reforzador se reduce en función de cuánto tiempo se tiene que esperar para obtenerlo. La función matemática que describe esta disminución en el valor se denomina función descontadora del valor. El consenso actual es que el valor de un reforzador (V) está directamente relacionado con la magnitud de la recompensa (M) e inversamente relacionado con la demora de la recompensa (D): V = M / (1 + KD) Donde K es el parámetro de la tasa descontadora. Esta ecuación se denomina función del decaimiento hiperbólico. De acuerdo con esta ecuación, si el reforzador es entregado sin demora (D = 0), el valor del reforzador está directamente relacionado con su magnitud (los reforzadores más grandes tiene valores mayores). Cuanto más se demora el reforzador, menor es su valor. • ¿Puede entrenarse el autocontrol? Una persona que no puede tolerar esperar el tiempo necesario para obtener recompensas grandes tiene que olvidarse de obtener esos reforzadores. El autocontrol, o la preferencia por una recompensa grande demorada frente a una recompensa pequeña inmediata, es a menudo una estrategia sensible. De hecho, algunos han sugerido que el autocontrol es un componente crítico de la socialización y del ajuste emocional. Afortunadamente, el autocontrol se puede entrenar. TEMA 7: CO, MECANISMOS MOTIVACIONALES La aproximación asociativa toma una perspectiva molar. Se centra en las respuestas individuales y sus antecedentes estimulares y consecuencias específicas. Para alcanzar este PAGE 84 ¿Cómo responderán los sujetos si se les presentase un EC pavloviano que hubiese sido emparejado con comida (y presumiblemente elicitase ‘esperanza’)? La emoción elicitada por el EC pavloviano será compatible con la emoción establecida durante el CO, y debería ocurrir un aumento en la respuesta durante la señal pavloviana. • Interacciones de respuesta en los experimentos de transferencia de control. Los estímulos condicionados clásicamente elicitan no solamente estados emocionales, sino también respuestas abiertas. Los investigadores han estado muy interesados en la posibilidad de que los resultados de los experimentos de transferencia de control sean debidos a que los ECs pavlovianos elicitan respuetas abiertas que interfieren o facilitan la conducta requerida por el reforzamiento instrumental. • ¿Estados emocionales centrales condicionados o expectativas específicas de recompensa? La teoría moderna de los dos procesos asume el CC media la conducta instrumental a través del condicionamiento de estados emocionales centrales como la esperanza (en el caso del reforzamiento positivo) o el miedo (en el caso del reforzamiento negativo). Sin embargo, los animales también adquieren expectativas específicas de recompensa en lugar de estados emocionales centrales más generales durante el CO y CC. El aprendizaje de expectativa específica de recompensa es una alternativa importante a la teoría moderna de los dos procesos para explicar ciertos tipos de resultados. Esta alternativa está basada, no obstante, en la asunción de que el CO incluye el aprendizaje de una asociación E – C. Las asociaciones E – C parece ser fundamentales para la motivación de la conducta instrumental. En un análisis reciente, Berridge apuntó que la asociación E-C es la base para el proceso central de ‘desear’ el reforzador. A través de la asociación E-C, E llega a ser un estímulo de incentivo, E en sí mismo llega a ser atractivo. Esta motivación adquirida de incentivo contribuye significativamente a la motivación de la respuesta instrumental Relaciones R-C Y E(R-C) en el condicionamiento instrumental Hasta ahora se han explicado 2 asociaciones diferentes que pueden motivar la conducta instrumental, la asociación de Thorndike E-R y la asociación E-C, que activa una expectativa específica de recompensa o un estado emocional. Dos razones hacen que resulte extraño explicar toda la motivación de la conducta instrumental en términos de estas dos asociaciones: PAGE 84 • Adviértase que ni la asociación E-R ni la asociación E-C incluyen una conexión directa entre la respuesta R y el reforzador, o consecuencia de la respuesta, C. • Los emparejamientos EC-EI no son suficientes para el desarrollo de asociaciones pavlovianas. El EC debe también proporcionar información acerca del EI, o estar de alguna manera relacionado con el EI. En una situación de CO, el reforzador C no puede predecirse a partir de E solamente. Más bien, C ocurre si el participante realiza la respuesta R en presencia de E. En consecuencia, el CO incluye una relación condicional en la que E es seguido por C sólo si ocurre R. • Evidencia de asociaciones R-C Algunas investigaciones han sugerido que el CO lleva al aprendizaje de asociaciones respuesta – consecuencia, y se han obtenido evidencias varias en apoyo de esta posibilidad. Una técnica común incluye devaluar el reforzador después del condicionamiento para ver si esto disminuye la respuesta instrumental. Ejemplo: reforzaron primero a las ratas por empujar una barra vertical a la izquierda o a la derecha. Responder en cualquier dirección fuer reforzado mediante un programa de reforzamiento de IV1’. Ambas alternativas de respuesta estuvieron siempre disponibles durante las sesiones de entrenamiento. La única diferencia era que as respuestas en una dirección se reforzaban con bolitas de comida y las repuestas en la otra dirección con un poco de solución azucarada. Después de que ambas respuestas estuvieron bien establecidas, se retiró la barra y se introdujo el procedimiento de devaluación del reforzador. La devaluación del reforzador debilitó selectivamente la respuesta particular que fue entrenada con ese reforzador. Esto indica que cada respuesta estaba asociada separadamente con su propio reforzador. Los sujetos evidentemente aprendieron asociaciones R-C independientes. • Evidencia del aprendizaje de una relación jerárquica E-(R-C). La evidencia citada anteriormente muestra de forma clara que los organismos aprenden a asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-C no pueden actuar aisladamente para producir la conducta instrumental. Se necesita un factor adicional para activar la asociación R-C. Una posibilidad es que la asociación R-C sea activada por los estímulos E que están presentes cuando la respuesta es reforzada. De PAGE 84 acuerdo con este punto de vista, E no activa directamente R, sino que activa la asociación R-C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental. Skinner sugirió una relación condicional E- (R-C). 2. REGULACIÓN CONDUCTUAL Se centra en cómo las contingencias instrumentales ponen limitaciones a las actividades de un organismo. Antecedentes de la regulación conductual • La teoría de la respuesta consumatoria El primer reto a la idea de que los reforzadores eran estímulos vino de Red Sheffield. Muchos reforzadores, como la comida y el agua, elicitan respuestas incondicionadas típicas de la especia, como masticar, lamer o tragar. Se establece que las respuestas consumatorias típicas de la especia son en sí mismas el rasgo crítico de los reforzadores. Se consideró que las respuestas reforzadoras eran especiales porque involucraban la consumación o el completamiento de una secuencia instintiva de conducta. • El principio de Premack Premack apuntó que las respuestas incluidas en los reforzadores comúnmente utilizados eran actividades que es altamente probable que realicen los animales. Por ejemplo: los animales en un experimento de reforzamiento con comida están normalmente privados de comida y, por tanto, es muy probable que se dedique a la conducta de comer. Por el contrario, las respuestas instrumentales son actividades que normalmente ocurren a una baja probabilidad. Premack propuso que esta diferencia era clave. Principio de Premack: Dadas dos respuestas de diferente probabilidad, A y B, la oportunidad para realizar la respuesta de alta probabilidad A después de la respuesta de baja probabilidad B tendrá como resultado el reforzamiento de la respuesta B (B F 0 E 0 A refuerza B). La oportunidad para realizar la respuesta B de baja probabilidad después de la respuesta A de alta probabilidad no dará como resultado el reforzamiento de la respuesta A (A F 0 E 0 B no refuerza A). Este principio se centra en la diferencia en la probabilidad de las respuestas instrumental y reforzadora; en consecuencia, también es denominado el principio de la probabilidad diferencial. Ejemplo: comer reforzará la presión de la palanca porque comer es normalmente más probable que presionar la palanca. En circunstancias normales, la presión de la palanca no puede reforzar el comer. PAGE 84 PAGE 84 Tema 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA La extinción implica la omisión del EI o reforzador. • La extinción en el CC incluye presentaciones repetidas del estímulo condicionado por sí solo • La extinción en el CO implica no volver a presentar el reforzador como una consecuencia de la respuesta instrumental. El resultado típico es que la respuesta condicionada, sea clásica o instrumental, disminuye. La extinción aunque parece ser lo contrario de la adquisición, no lo es. Es importante puntualizar que la pérdida de la respuesta condicionada que sucede como resultado de la extinción no es lo mimo que la pérdida de conducta que puede suceder debido PAGE 84 al olvido. El olvido es una disminución de la respuesta condicionada que se da simplemente con el paso del tiempo. La extinción NO revierte los efectos de la adquisición. En lugar de ello, implica el aprendizaje de algo nuevo que se superpone sobre lo que se aprendió antes (sin la pérdida de lo que se aprendió anteriormente). 1. EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCIÓN Dos efectos conductuales de la extinción: • La respuesta disminuye cuando no vuelve a producir reforzamiento. • Aumenta la variabilidad de la respuesta. La extinción disminuye la tasa de respuesta e incrementa variabilidad de la respuesta, pero no altera de otro modo la estructura de la conducta. Además de los efectos conductuales, los procedimientos de extinción pueden producir efectos emocionales. Si un organismo está acostumbrado a recibir reforzamiento por una respuesta particular puede trastornarse cuando no se vuelven a entregar los reforzadores. La reacción emocional inducida por la falta de un reforzador esperado se denomina frustración. La ausencia frustrante de recompensa proporciona energía a la conducta. Incluso puede implicar reacciones agresivas. 2. EXTINCIÓN Y APRENDIZAJE ORIGINAL Aunque la extinción produce importante efectos conductuales y emocionales, no revierte los efectos de la adquisición. La evidencia de que la extinción no elimina lo que se aprendió originalmente se ha obtenido a través de estudios sobre la recuperación espontánea, la renovación, el restablecimiento y los efectos de la devaluación del reforzador. Recuperación espontánea • La recuperación espontánea tras el CC Una de las características principales de la extinción es que se disipa con el tiempo. La consecuencia de esta pérdida del efecto de la extinción a lo largo del tiempo es que la respuesta condicionada original vuelve a presentarse si el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción. Es decir, primero se da una fase de PAGE 84 propiedades excitatorias de las claves contextuales y en consecuencia permitir que esas claves sean más efectivas para reactivar la memoria del condicionamiento excitatorio del EC. Sensibilidad a la devaluación del reforzador Rescorla ha utilizado la técnica de devaluación del EI para determinar si la asociación EC – EI (CC) establecida a través de condicionamiento pavloviano persiste a lo largo de la extinción. Si la extinción no deteriora la asociación EC – EI, entonces la devaluación del EI alterará la respuesta a un EC extinguido, como lo hace con la respuesta a un EC que no ha sido sometido a extinción. Destaca el hecho de que a pesar del gran efecto de la extinción en la respuesta condicionada, la manipulación de dicha extinción no redujo la sensibilidad de los sujetos a la devaluación del EI, lo que indica que la asociación EC-EI permaneció intacta. Se han llevado a acabo experimentos semejantes al estudio descrito más arriba con procedimientos de CO, en los que los sujetos tienen que realizar una respuesta específica para obtener una consecuencia reforzante (R F 0 E 0 C). Si el procedimiento de CO da como resultado el aprendizaje de una asociación R-C, entonces la devaluación del reforzador producirá una disminución de la respuesta instrumental. Rescorla ha investigado si esta susceptibilidad de la respuetas instrumental a la devaluación del reforzador se mantiene intacta a lo largo de la extinción. La conclusión es que la extinción no elimina las asociaciones R-C y E-C que se aprenden durante el CO. Las asociaciones R-C una vez entrenadas son relativamente impermeables a su modificación. 3. ¿QUÉ SE APRENDE EN LA EXTINCIÓN? Asociaciones E-R inhibitorias Si la conducta condicionada se apoya fundamentalmente en asociaciones E-E y E-C y estas asociaciones no se degradan durante la extinción, ¿por qué la extinción produce una disminución en la respuesta? En un intento por responder a esta pregunta, los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. Sin embargo, en lugar de centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han llegado a la conclusión de que la falta de reforzamiento produce una asociación E-R inhibitoria. Esto es, la falta de reforzamiento de una respuesta en presencia de un estímulo específico produce una asociación E-R inhibitoria que sirve para suprimir esa respuesta siempre y cuando el E PAGE 84 esté presente. Esta hipótesis, consistente con el efecto de renovación, predice que los efectos de la extinción serán altamente específicos del contexto en el que la respuesta fue extinguida. ¿Por qué debería la ausencia de reforzamiento producir una asociación E-R inhibitoria? Para responder esta pregunta es importante recordar que la extinción implica un tipo especial de ausencia de reforzamiento. Implica la ausencia de reforzamiento tras una historia previa de reforzamiento. Por tanto, los efectos emocionales de la ausencia de reforzamiento dependen de forma crítica de la historia previa del sujeto. Sólo la omisión de una recompensa esperada genera desilusión o frustración. Es más, estos efectos emocionales se presume que desempeñan un papel crítico en la disminución conductual que se da en la extinción. La afirmación de que la extinción implica el aprendizaje de una asociación inhibitoria resulta controvertida frente a las teorías que las consideraban como procesos diferentes. Efectos ‘paradójicos’ de la recompensa Cuanto más entrenamiento con reforzamiento se proporciona, más fuerte será la expectativa de recompensa, y en consecuencia más fuerte será la frustración que se da cuando se introduce la extinción. Si la disminución en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, un entrenamiento e reforzamiento más extenso debería producir una extinción más rápida. Esta predicción ha sido confirmada y se denomina efecto del sobreentrenamiento en la extinción. Otro efecto paradójico de la recompensa que refleja mecanismos semejantes es el efecto de la magnitud del reforzamiento en la extinción. Este fenómeno se refiere al hecho de que la respuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con un reforzador mayor. Este fenómeno también es más evidente cuando el entrenamiento incluye reforzamiento continuo, y es fácilmente explicable en términos de los efectos frustrantes de la ausencia de recompensa. La ausencia de reforzamiento resulta más frustrante si el individuo espera una gran recompensa que si espera una recompensa pequeña. El efecto paradójico de la recompensa más ampliamente investigado es el efecto del reforzamiento parcial en la extinción. la característica dominante del programa que determina los efectos de la extinción es si la respuesta instrumental se reforzó cada vez que ocurría (reforzamiento continuo) o sólo algunas veces (reforzamiento intermitente, o parcial). El hallazgo general es que la extinción es mucho más lenta y produce menos reacciones de frustración si estaba en activo un programa de reforzamiento parcial en lugar de uno continuo antes de la introducción de la extinción. Este fenómeno se denomina el efecto del reforzamiento parcial en la extinción o ERPE. PAGE 84 Aunque la mayoría de los estudios sobre la extinción del reforzamiento parcial han utilizado procedimientos de CO, también se ha demostrado el ERPE en el CC. • En estudios pioneros, el ERPE se halló sólo en las investigaciones que comparaban los efectos del entrenamiento con reforzamiento continuo y con reforzamiento parcial en diferentes grupos de sujetos. • Estudios recientes han demostrado que el ERPE también puede darse en los mismos sujetos si experimentan reforzamiento continuo en presencia de un conjunto de claves y reforzamiento intermitente en presencia de otros estímulos. Este ERPE intrasujeto presenta retos teóricos que todavía no se han explorado por completo. Mecanismos del efecto del reforzamiento parcial en la extinción Tal vez la explicación más evidente del ERPE es que la introducción de la extinción es más fácil de detectar tras el reforzamiento continuo que tras el reforzamiento parcial. Si no se recibe el reforzador tras cada respuesta durante el entrenamiento, puede no notarse inmediatamente cuándo los reforzadores se omiten por completo. La ausencia de reforzamiento es presumiblemente mucha más fácil de detectar tras el reforzamiento continuo. Esta explicación del efecto del reforzamiento parcial en la extinción se denomina hipótesis de la discriminación. ¿Qué aprenden los sujetos durante el reforzamiento parcial que les hace más persistentes al enfrentarse a una racha de mala suerte o de fracasos? La evidencia indica que el reforzamiento parcial favorece la persistencia de dos formas diferentes. • Una explicación sería la teoría de la frustración, basada en lo que los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial. • La otra explicación, la teoría secuencial, está basada en lo que los sujetos aprenden sobre la memoria de al ausencia de recompensa. • Teoría de la frustración La teoría de la frustración caracteriza el aprendizaje que se produce durante el curso del reforzamiento intermitente en términos de estadios. El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Los ensayos recompensados les llevan a esperar la ausencia de reforzamiento, y los no recompensados les llevan a esperar la ausencia de recompensa. En consecuencia, el reforzamiento intermitente produce el aprendizaje de expectativas tanto de recompensa como de no recompensa. Al principio, la expectativa de recompensa alienta a los sujetos a responder, y la anticipación de la ausencia de reforzamiento desalienta la respuesta. Por tanto, al principio del enterramiento, los sujetos entrenados con reforzamiento intermitente están en conflicto con los que se ha de hacer. Sus expectativas motivan tendencias de respuesta opuestas. Sin embargo, a medida que el entrenamiento continúa, el conflicto se resuelve a favor de responder. PAGE 84 No se puede entender el estudio de la conducta de evitación sin considerar sus raíces históricas. Aunque el experimento de Becheterev fue visto como un ejemplo estándar de CC, los participantes determinaron por sí mismos si se exponían o no al EI. Los resultados obtenidos por Brodgen y sus colaboradores demostraron que el condicionamiento de evitación es diferente del CC estándar y fueron el origen de la investigación. El procedimiento de evitación discriminada Entre las características del procedimiento de evitación discriminada o señalada se incluyen ensayos discretos. Cada ensayo se inicia con el EC o estímulo de aviso. Los sucesos que ocurren tras él dependen de lo que haga el sujeto. Hay dos posibilidades. Si el sujeto realiza la respuesta requerida para la evitación durante el EC pero antes de que se dispense la descarga, el EC se retira y el El se omite en ese ensayo. Este es un ensayo de evitación con éxito. Si el sujeto no realiza la respuesta requerida durante el intervalo EC-EI, la descarga programada se presenta y permanece hasta que se ejecuta la respuesta, provocando la finalización tanto del EC como del EI. En este caso la respuesta instrumental da como resultado un escape de la descarga; por tanto, este tipo de ensayo se denomina ensayo de escape. Durante los estadios tempranos del entrenamiento la mayoría de los ensayos son de escape, pero a medida que el entrenamiento progresa, llegan a predominar los ensayos de evitación. La teoría de los dos procesos de la evitación Los procedimientos de evitación implican una contingencia negativa entre la respuesta y el estímulo aversivo. ¿Cómo puede la ausencia de algo proporcionar reforzamiento para la conducta instrumental? Mower y Miller propusieron teoría de los dos procesos de la evitación. Ésta teoría asume que están involucrados dos mecanismos en el aprendizaje de evitación: • El primero es un proceso de CC activado por los emparejamientos del estímulo de aviso (EC) con el estímulo aversivo (El) en los ensayos en los que el organismo no realiza la respuesta de evitación. Debido a que el EI es un estímulo aversivo, a través del CC el EC también llega a ser aversivo. Debido a su aversividad, el EC llega a elicitar miedo. Por tanto, el primer componente de la teoría de los dos procesos es el CC del miedo al EC. • El segundo proceso en la teoría de los dos procesos está basado en el reforzamiento negativo. Mowrer asumió el aprendizaje de una respuesta instrumental de evitación se da porque la respuesta finaliza el EC y en consecuencia reduce el miedo condicionado elicitado por el EC. Por tanto, el segundo componente en la teoría de los dos procesos es el reforzamiento instrumental de la respuesta de evitación a través de la reducción del miedo. PAGE 84 Los procesos clásico e instrumental dependen uno del otro. El reforzamiento instrumental a través de la reducción del miedo no puede ocurrir hasta que el miedo se haya condicionado al EC. En consecuencia, el proceso de CC tiene que ocurrir primero. Tras esto, el proceso de CO puede proporcionar los ensayos de extinción para el proceso de CC. Esto sucede porque cada respuesta de evitación con éxito previene la ocurrencia del EI. • Por tanto, la teoría dé los dos procesos predice una continua interacción entre los procesos clásico e instrumental. La teoría de los dos procesos también explica la conducía de evitación en términos del escape del miedo condicionado más que en términos de la prevención de la descarga. El hecho de que la respuesta de evitación prevenga la descarga se considera como un subproducto, no como el suceso crítico que motiva la conducta de evitación. El escape del miedo condicionado proporciona el reforzamiento crítico de la conducta de evitación. • Por tanto, la respuesta instrumental es reforzada por un suceso tangible (la reducción del miedo) más que por la mera ausencia de algo (estimulación aversiva). Análisis experimental de la conducta de evitación. • Experimentos sobre impulso adquirido El procedimiento de evitación debe demostrarse en situaciones donde los dos tipos de condicionamiento no estén entremezclados. Éste es el objetivo de los experimentos sobre impulso adquirido. La estrategia básica es condicionar en primer lugar el miedo al EC con un procedimiento ‘puro’ de CC en el que el EC se empareja con el EI independientemente de la conducta del sujeto. En la fase siguiente del experimento, los sujetos son periódicamente expuestos al EC elicitador de miedo y se les permite realizar una respuesta instrumental que sea efectiva para finalizar el EC (y, en consecuencia, reducir el miedo). No se programan descargas en esta fase. Por tanto, la respuesta instrumental no es necesaria para evitar la descarga. Si el escape del EC elicitador de miedo puede reforzar la conducta instrumental, entonces la respuesta instrumental debería condicionarse en la segunda fase del experimento clásico. No se trata de un impulso innato. La finalización de un estímulo condicionado de miedo es suficiente para proporcionar reforzamiento para una respuesta instrumental. • Medición independiente del miedo durante la adquisición de la conducta de evitación. PAGE 84 Otra estrategia importante que ha sido utilizada en las investigaciones sobre conducta de evitación implica la medición independiente del miedo y de la respuesta instrumental de evitación. Esta aproximación está basada en la asunción de que el miedo motiva y refuerza la conducta de evitación, por lo que el condicionamiento del miedo y el condicionamiento de la conducta de evitación instrumental deberían darse conjuntamente. Sin embargo, el miedo condicionado y la respuesta de evitación no siempre están muy bien correlacionados. Una técnica conductual popular para medir el miedo incluye el procedimiento de supresión condicionada. El grado de supresión refleja la cantidad de miedo elicitado por el EC. Si la señal de aviso en un procedimiento de evitación llega a elicitar miedo entonces la presentación de ese estímulo de aviso en un procedimiento de supresión condicionada debería dar como resultado una supresión de la conducta reforzada por comida. Esto se ha comprobado. La disminución del miedo a l EC con un entrenamiento de evitación extenso plantea un problema para la teoría de los dos procesos. Sin embargo, la evidencia reciente sugiere que la teoría puede acomodarse a este hallazgo. Aunque el miedo disminuye a medida que la evitación condicionada progresa, el EC continúa elicitando algún miedo (es decir, que el miedo no disminuye hasta cero). Se apunto que mientras el EC elicite algún nivel de miedo, la terminación del EC puede producir una reducción del miedo y, por tanto, reforzar la conducta de evitación. • Ejecución asintótica de evitación. La teoría no sólo especifica los mecanismos responsables de la adquisición de la conducta de evitación, sino que también realiza predicciones sobre la naturaleza de la ejecución una vez que la respuesta ha sido bien aprendida. • Predice que la fuerza de la respecta de evitación fluctuará en ciclos. Aunque se ha obtenido evidencia de respuesta de evitación cíclica asintótica, ésta no siempre se observa. Algunos investigadores han argumentado que una de las características propias de la conducta de evitación es su persistencia. Según la teoría existen explicaciones para los casos en los que la conducta de evitación persiste después de que no se dispensa el estímulo aversivo incondicionado. Se basan en la observación de que una vez que una respuesta de evitación ha sido bien aprendida, ocurre con una latencia corta. Debido a que el animal responde rápidamente para terminar el EC, nunca se experimentan los segmentos posteriores del EC y en consecuencia no tiene la oportunidad de extinguirse. La latencia corta de las respuetas de evitación bien aprendidas sirve para proteger los segmentos posteriores del EC de la extinción y contribuye, por tanto, a la persistencia de la conducta de evitación. Este mecanismo, se denomina conservación del miedo. PAGE 84 Existen semejanzas y diferencias entre el reforzamiento positivo de la conducta de evitación a través de la inhibición condicionada y el proceso de reforzamiento negativo asumido por la teoría de los dos procesos: • Ambos mecanismos implican una reducción del miedo, pero la forma en que esto ocurre difiere en los dos casos. Mientras que un inhibidor condicionado inhibe activamente el miedo, se asume que la terminación del EC lo disipa de forma pasiva. • Debido a que ambos mecanismos incluyen la reducción del miedo, el funcionamiento de ambos procesos depende de la existencia de miedo. Sin embargo, el proceso de reforzamiento por la inhibición condicionada es menos restrictivo en cuanto a la fuente del miedo. El miedo puede ser elicitado por un estímulo explícito de aviso o por claves contextuales o claves del ambiente en el que se lleva a cabo el procedimiento de evitación. El reforzamiento negativo a través de la terminación del EC y el reforzamiento positivo a través de las claves de retroalimentación de la inhibición condicionada podrían funcionar simultáneamente, contribuyendo ambos procesos al fortalecimiento de la conducta de evitación. • Reforzamiento de la evitación a través de la reducción de la frecuencia de la descarga. Se ha propuesto la reducción de la frecuencia de la descarga como una alternativa a la teoría de los dos procesos. Esta hipótesis considera la evitación de la descarga como un factor crítico para el reforzamiento de la conducta de evitación. Varios experimentos han demostrado que los animales pueden aprender a realizar una respuesta de evitación aunque la respuesta no reduzca la frecuencia de las descargas administradas. La respuesta en estos estudios demoraba la presentación de la siguiente descarga programada pero no prevenía su administración. Por tanto, no se modificó la frecuencia total de las descargas por la ocurrencia de la respuesta instrumental. Estos resultados pueden explicarse a partir de la hipótesis de la reducción de la frecuencia de la descarga asumiendo que los organismos calculan las frecuencias de la descarga sólo por un período limitado después de la respuesta de evitación. Sin embargo, si se admite esta posibilidad, la hipótesis de la reducción de la frecuencia de la descarga no se diferencia con facilidad del reforzamiento de inhibición condicionaba. Si una respuesta reduce la frecuencia de las descargas a corto plazo, los estímulos externos y propioceptivos implicados al realizar la respuesta serán señal para esta reducción de la descarga y se convertirán en inhibidores condicionados del miedo. Las propiedades inhibitorias condicionadas de estos estímulos pueden entonces reforzar la conducta de evitación. PAGE 84 • La evitación y las reacciones de defensa específicas de la especie (RDEEs) Para que un mecanismo de evitación sea útil en condiciones naturales, tiene que generar rápidamente respuestas de evitación satisfactorias. Bolles reconoció este problema y se centró en lo que controla la conducta de un organismo durante los primeros estadios del entrenamiento de evitación. Bolles asumió que los estímulos y las situaciones aversivas elicitan respuestas incondicionadas fuertes o innatas. Se asume que estas respuestas innatas han evolucionado porque tienen éxito en la defensa contra el dolor y el daño. Bolles las llamó reacciones de defensa específicas de la especie (RDEEs). Bolles propuso que la configuración del ambiente determina qué RDEE particular ocurrirá. Por ejemplo, el ‘vuelo’ puede predominar cuando está disponible una ruta clara de escape. Esta teoría afirma que las reacciones de defensa específicas de la especie predominan durante los estadios iniciales del entrenamiento de evitación. Si la RDEE más probable tiene éxito en prevenir las descargas, esta conducta persistiría tanto tiempo como el procedimiento de evitación esté en funcionamiento. Si la primera RDEE no es efectiva, irá seguida de una descarga, lo que suprimirá la conducta a través del castigo. El animal puede entonces realizar la siguiente RDEE más probable. Si la descarga persiste, esta segunda RDEE también será suprimida por castigo, y el organismo realizará la tercera RDEE más probable. Se asume que el proceso de selección de respuesta termina cuando se encuentra una respuesta efectiva para evitar las descargas, por lo que la conducta no será suprimida por cargo. Por tanto, de acuerdo con la explicación de las RDEEs, el castigo es responsable de la selección de la respuesta instrumental de evitación de entre las otras actividades del organismo. Se asume que, aprendizaje de evitación. De acuerdo con la teoría, la respuesta de evitación correcta no se fortalece por reforzamiento, sino porque otras RDEEs han sido suprimidas por castigo. • La inminencia depredadora y la distinción entre conducta defensiva y recuperativa. El concepto de inminencia depredadora considera las circunstancias a las que tiene que hacer frente un roedor pequeño: gatos, coyotes, serpientes. Cuando aparece un depredador el nivel de peligro aumenta. A medida que la serpiente se acerca, aumenta más. La progresión en el aumento de los niveles de peligro se denomina continuo de inminencia depredadora. PAGE 84 La hipótesis de la inminencia depredadora difiera de la teoría de las RDEEs en dos aspectos: • Las respuestas típicas de la especie, (salto, agresión...) es más probable que ocurran en anticipación a los daños más que en respuesta al daño en sí mismo. el daño actual estimula respuestas recuperativas. Por tanto, esta hipótesis establece una distinción entre las respuestas defensivas y las recuperativas a la estimulación aversiva. • En segundo lugar, en la hipótesis de la inminencia depredadora, se asume q el determinante fundamental de la respuesta concreta de defensa observada está al nivel de la inminencia depredadora más que al de la configuración del ambiente. Por tanto, la selección entre posibles RDEEs no sucede mediante la supresión de RDEEs ineficaces a través del castigo, como propone la teoría de las RDEEs, sino a causa de los diferentes niveles de daño percibido. A pesar de estas diferencias, tanto la teoría de las RDEEs como la hipótesis de la inminencia depredadora asumen (semejanzas): • Que la conducta defensiva ocurre en principio como una respuesta incondicionada. • Que ninguna de ellas asume que el reforzamiento positivo esté involucrado en el desarrollo de la conducta de evitación. 2. EL CASTIGO Análisis experimental del castigo. Implica la presentación de un estímulo aversivo tras una respuesta específica. Si el procedimiento es efectivo, la respuesta especificada será suprimida. No realizando la respuesta castigada, el organismo evita la estimulación aversiva. Como el castigo implica la supresión de la conducta, sólo puede observarse con respuestas que puedan ocurrir en ausencia de castigo. • Características del estímulo aversivo y su método de introducción. El tiempo fuera es la retirada de la oportunidad de obtener reforzamiento positivo. A menudo se utiliza para castigar a los niños, como cuando se le dice a un niño "Vete a tu habitación " tras hacer algo malo. La sobrecorrección implica que una persona no sólo rectifique lo que realizó mal, sino la sobrecorrección del error. Por ejemplo, si un niño se ha introducido un objeto en la boca, puede pedírsele que se lo quite y también que se lave la boca con una solución antiséptica. PAGE 84 Frente al estudio de la conducta de evitación, las investigaciones del castigo no han estado motivadas fundamentalmente por consideraciones teóricas. La mayor parte de la evidencia del castigo ha sido producto de la curiosidad empírica. El castigo está influido por varias manipulaciones más que en probar formulaciones teóricas específicas. Existen pocas teorías sistemáticas, y la mayoría fueron formuladas hace 50 años. • La teoría del castigo de la respuesta emocional condicionada. Propuesta por Estes (1944), está basada en la observación por Estes y Skinner. De que un estímulo condicionado que ha sido emparejado con una descarga suprimirá la realización de la conducta instrumental reforzada por comida. La supresión condicionada incluye una supresión de la conducta elicitada en curso por un estimulo que ha sido asociado con estimulación aversiva. La supresión conductual ocurre fundamentalmente debido a que un estímulo condicionado de miedo elicita una respuesta de congelación, que interfiere en otras actividades. Estes propuso que el castigo suprime la conducta a través del mismo mecanismo que produce la supresión de respuesta a un estímulo condicionado de miedo. Sin embargo, contrariamente al experimento típico de supresión condicionada, los procedimientos de castigo normalmente no incluyen un EC explícito que señale la administración de un estímulo aversivo. La teoría de la respuesta emocional condicionada puede explicar muchos efectos del castigo. Por ejemplo, el hecho de que descargas más intensas y duraderas produzcan mas supresión de respuesta puede explicarse asumiendo que los estímulos condicionados por estos sucesos aversivos elicitan respuetas emocionales condicionadas más vigorosas. Esta teoría también puede explicar por qué la estimulación aversiva contingente con la respuesta produce más supresión de respuesta que la administración de la descarga independiente de la respuesta. Si la descarga está producida por la respuesta instrumental, es más probable que los estímulos que llegan a condicionarse por la descarga estén estrechamente relacionados con la ejecución de esta conducta. En consecuencia, las respuetas emocionales condicionadas tienen mayores probabilidades de interferir en la respuesta castigada. • La teoría del castigo de la evitación. Una alternativa a la teoría de la respuesta emocional condicionada considera el castigo como una forma de conducta de evitación. Dinsmoor aceptó la idea de que los estímulos que acompañan a la respuesta instrumental adquieren propiedades aversivas cuando la respuesta instrumental es castigada. Llegó a proponer que los organismos aprenden a escapar de los estímulos aversivos condicionados relacionados con la respuesta castigada realizando otra conducta incompatible con la actividad castigada. Dado que esta otra PAGE 84 conducta es incompatible con la respuesta castigada, la ejecución de la actividad alternativa da como resultado la supresión de la conducta castigada. • Por lo tanto, la teoría de la evitación explica el castigo en términos de la adquisición de respuestas de evitación incompatibles. Esta propuesta es ingeniosa. Sugiere que todos los cambios producidos por el CO aversivo, sean aumentos o disminuciones en la probabilidad de una respuesta, pueden explicarse por los mismos mecanismo del aprendizaje de evitación. La supresión de la conducta no se ve como una manifestación del debilitamiento de la respuesta castigada. Más bien, se explica en función del fortalecimiento de respuestas de evitación competidoras. La teoría del castigo de la evitación es controvertida. Sus elementos críticos no están establecidos de una forma que puedan ser fácilmente accesibles a la comprobación experimental. • El castigo y la ley negativa del efecto. Thorndike propuso originalmente que el reforzamiento positivo y el castigo implican procesos simétricamente opuestos. Así como el reforzamiento positivo fortalece la conducta, el castigo la debilita. Abandonó esta por que no encontró evidencia que la apoyase en algunos de sus experimentos. Sin embargo, hay una ley negativa del efecto que es comparable pero opuesta a la ley del efecto. Una aproximación al análisis de la ley negativa del efecto fue iniciada por Premack. Propuso que el reforzamiento positivo se da cuando la oportunidad de realizar una actividad altamente valorada se hace depender de la realización anterior de una actividad de menor valor. En el castigo, una actividad de bajo valor se hace contingente a la realización de una conducta altamente valorada. Exponerse uno mismo a una descarga, por ejemplo, tiene mucha menor probabilidad que presionar una palanca para conseguir comida. Con un procedimiento de reforzamiento, la respuesta instrumental se incrementa y la respuesta reforzante disminuye en relación a una situación de línea de base de respuesta libre. Con un procedimiento de castigo, la respuesta instrumental disminuye y la respuesta reforzante o castigadora aumenta con respecto a la condición de línea de base. Es más, en ambos casos la respuesta que aumenta es la conducta poco valorada y la que disminuye es la altamente valorada. Visto así, los procedimientos de reforzamiento y castigo producen los mismos efectos. Operacionalmente, hay sólo una diferencia: en el castigo, el individuo debe ser forzado para realizar la actividad poco valorada; en el reforzamiento, el individuo es ‘inducido’ a realizar la actividad menos valorada. PAGE 84 La perspectiva de Premack sugiere que el castigo es similar al reforzamiento positivo en que impone una restricción sobre qué conducta tiene que ajustarse. La ley negativa del efecto es una descripción de la forma en que la conducta cambia bajo estas restricciones: una actividad poco valorada produce una disminución en una actividad altamente valorada. Los organismos responden con el fin de maximizar el valor total. El proceso de maximización, tanto con procedimiento de reforzamiento como de castigo, implica un aumento en una actividad poco valorada en compensación con un descenso de una actividad altamente valorada. PAGE 84