unidad temÁtica 4 el condicionamiento operante cómo ... · el condicionamiento operante:...
TRANSCRIPT
Sebastián Colmenero Fernández
Sebastián Colmenero Fernández
UNIDAD TEMÁTICA 4
EL CONDICIONAMIENTO OPERANTE
Cómo aprendemos (II)
CONDUCTISMO OPERANTE (NEOCONDUCTISMO)
La tarea de la psicología consiste en describir lo que se ve y en buscar las relaciones
funcionales entre un comportamiento observado y los fenómenos que ocurren
inmediatamente antes y después del mismo.
ANTECEDENTES>> CONDUCTA>> CONSECUENCIAS
THORNDIKE Y LA LEY DEL EFECTO
“Las consecuencias o efectos que siguen a una conducta determinan la probabilidad de
ocurrencia de la misma en el futuro. La práctica pura no conduce al aprendizaje: sin efectos
satisfactorios no es posible aprender
Las conductas seguidas de consecuencias satisfactorias tenderán a repetirse en situaciones
similares.
EL CONDUCTISMO DE SKI
El Condicionamiento Operante es el proceso por el cual la frecuencia de aparición de una
conducta queda modificada por sus consecuencias.
EL CONDICIONAMIENTO OPERANTE
El aprendizaje se produce por la asociación del comportamiento con sus consecuencia
CONDUCTA + CONSECUENCIA POSITIVA (REFUERZO) = AUMENTA LA CONDUCTA
CONDUCTA + CONSECUENCIA NEGATIVA (CASTIGO) = DISMINUYE LA CONDUCTA
CONDUCTA OPERANTE
Definición de Conducta operante o instrumental:
1. La que opera sobre el medio
2. Respuesta que, a modo de
castigo.
CARACTERÍSTICAS:
–Es voluntaria
–Se adquiere por la experiencia
EL CONDICIONAMIENTO OPERANTE: CONCEPTOS
REFORZAMIENTO: Consecuencia satisfactoria para el sujeto. Debido a ello la conducta se
fortalece en el sentido de que aumenta su ocurrencia en el futuro.
CASTIGO: Su aplicación tiene consecuencias insatisfactorias para el sujeto. En este caso, la
conducta se debilita y disminuirá su ocurrencia futura.
Los reforzadores se pueden clasificar
•Reforzadores primarios o no aprendidos
Ejemplos: comida, bebida, una sonrisa, contacto
•Reforzadores secundarios o aprendidos
asociación con algún reforzador
consumo (perfumes, joyas...)
MATERIALES & SOCIALES
EL CONDICIONAMIENTO OPERANTE
CONDUCTISMO OPERANTE (NEOCONDUCTISMO)
La tarea de la psicología consiste en describir lo que se ve y en buscar las relaciones
un comportamiento observado y los fenómenos que ocurren
inmediatamente antes y después del mismo.
ANTECEDENTES>> CONDUCTA>> CONSECUENCIAS
THORNDIKE Y LA LEY DEL EFECTO
“Las consecuencias o efectos que siguen a una conducta determinan la probabilidad de
ocurrencia de la misma en el futuro. La práctica pura no conduce al aprendizaje: sin efectos
actorios no es posible aprender”
Las conductas seguidas de consecuencias satisfactorias tenderán a repetirse en situaciones
EL CONDUCTISMO DE SKINNER
El Condicionamiento Operante es el proceso por el cual la frecuencia de aparición de una
conducta queda modificada por sus consecuencias.
EL CONDICIONAMIENTO OPERANTE
El aprendizaje se produce por la asociación del comportamiento con sus consecuencia
CONDUCTA + CONSECUENCIA POSITIVA (REFUERZO) = AUMENTA LA CONDUCTA
CONDUCTA + CONSECUENCIA NEGATIVA (CASTIGO) = DISMINUYE LA CONDUCTA
CONDUCTA OPERANTE
de Conducta operante o instrumental:
medio para producir un cierto efecto.
de instrumento, pretende obtener cierta recompensa
experiencia de anterior es consecuencias.
EL CONDICIONAMIENTO OPERANTE: CONCEPTOS BÁSICOS
: Consecuencia satisfactoria para el sujeto. Debido a ello la conducta se
fortalece en el sentido de que aumenta su ocurrencia en el futuro.
: Su aplicación tiene consecuencias insatisfactorias para el sujeto. En este caso, la
onducta se debilita y disminuirá su ocurrencia futura.
clasificar en dos categorías:
Reforzadores primarios o no aprendidos: son aquellos que satisfacen necesidades
Ejemplos: comida, bebida, una sonrisa, contacto sexual…
Reforzadores secundarios o aprendidos: adquieren su poder reforzante
reforzador primario. Ejemplos: dinero, buenas notas,
joyas...) Los reforzadores también se pueden clasificar en
@090sebas
@090sebas
La tarea de la psicología consiste en describir lo que se ve y en buscar las relaciones
un comportamiento observado y los fenómenos que ocurren
“Las consecuencias o efectos que siguen a una conducta determinan la probabilidad de
ocurrencia de la misma en el futuro. La práctica pura no conduce al aprendizaje: sin efectos
Las conductas seguidas de consecuencias satisfactorias tenderán a repetirse en situaciones
El Condicionamiento Operante es el proceso por el cual la frecuencia de aparición de una
El aprendizaje se produce por la asociación del comportamiento con sus consecuencias.
CONDUCTA + CONSECUENCIA POSITIVA (REFUERZO) = AUMENTA LA CONDUCTA
CONDUCTA + CONSECUENCIA NEGATIVA (CASTIGO) = DISMINUYE LA CONDUCTA
recompensa o evitar cierto
: Consecuencia satisfactoria para el sujeto. Debido a ello la conducta se
: Su aplicación tiene consecuencias insatisfactorias para el sujeto. En este caso, la
necesidades básicas.
reforzante gracias a su
notas, productos de
en dos categorías:
Sebastián Colmenero Fernández
Sebastián Colmenero Fernández
Castigo negativo: la conducta impide la aparición de un estímulo positivo o provoca la
supresión de un privilegio.
Refuerzo negativo: La conducta resulta fortalecida por la terminación de un estímulo negativo
o porque impide su aparición.
Refuerzo positivo: la probabilidad del aumento de una conducta se consigue por la
presentación de una consecuencia positiva.
Castigo positivo: la respuesta del sujeto tiene como consecuencia la aparición de un estímulo
negativo.
REFORZAMIENTO POSITIVO
En la caja hay un botón o una palanca que al ser
manipulado por el ratón, le ofrece una
recompensa (comida). Además, se lanza algún
tipo de estímulo sonoro o visual (una luz).
Tras repetir el experimento varias veces, cuando
el experimentador lanza el estímulo asociado a la
recompensa, el ratón, que está condicionado,
acude a pulsar la palanca.
REFORZAMIENTO NEGATIVO (Condicionamiento de escape o evitación)
La conducta del sujeto en lugar de producir
aspirina para eliminar el dolor de cabeza) o la hace desaparecer
suspender)… Esta conducta resulta fortalecida por la terminación de un estímulo negativo o
porque impide completamente su aparición.
Factores que afectan a la adquisición del condicionamiento
•Contingencia: Un reforzador
una determinada respuesta (conducta).
•Magnitud y/o calidad del reforzador:
recompensa.
•Demora del Reforzamiento
efectivo será el proceso.
CASTIGO POSITIVO (Condicionamiento de castigo)
La respuesta del sujeto tiene como consecuen
consecuencias se denominan estímulos negativos o castigos.
CASTIGO NEGATIVO (Condicionamiento de omisión)
La conducta impide la aparición de un estímulo positivo
privilegio.
EL CASTIGO
El castigo funciona a veces de
efecto a largo plazo es mucho
: la conducta impide la aparición de un estímulo positivo o provoca la
: La conducta resulta fortalecida por la terminación de un estímulo negativo
ue impide su aparición.
: la probabilidad del aumento de una conducta se consigue por la
presentación de una consecuencia positiva.
: la respuesta del sujeto tiene como consecuencia la aparición de un estímulo
EFORZAMIENTO POSITIVO Condicionamiento de recompensa
En la caja hay un botón o una palanca que al ser
manipulado por el ratón, le ofrece una
recompensa (comida). Además, se lanza algún
tipo de estímulo sonoro o visual (una luz).
o varias veces, cuando
el experimentador lanza el estímulo asociado a la
recompensa, el ratón, que está condicionado,
REFORZAMIENTO NEGATIVO (Condicionamiento de escape o evitación)
a conducta del sujeto en lugar de producir una acción, la disminuye (Escape (Ej. Tomar una
aspirina para eliminar el dolor de cabeza) o la hace desaparecer (Evitación (Ej. Estudiar para no
Esta conducta resulta fortalecida por la terminación de un estímulo negativo o
etamente su aparición.
Factores que afectan a la adquisición del condicionamiento
reforzador es contingente cuando su obtención sólo es posible
(conducta).
Magnitud y/o calidad del reforzador: Mejor condicionamiento cuanto mayor/mejor
Demora del Reforzamiento: A menor tiempo entre la respuesta y el reforzamiento
CASTIGO POSITIVO (Condicionamiento de castigo)
La respuesta del sujeto tiene como consecuencia la aparición de un estímulo negativo.
consecuencias se denominan estímulos negativos o castigos.
CASTIGO NEGATIVO (Condicionamiento de omisión)
La conducta impide la aparición de un estímulo positivo o provoca la supresión de un
de forma inmediata en una determinada situación.
mucho más cuestionable.
@090sebas
@090sebas
: la conducta impide la aparición de un estímulo positivo o provoca la
: La conducta resulta fortalecida por la terminación de un estímulo negativo
: la probabilidad del aumento de una conducta se consigue por la
: la respuesta del sujeto tiene como consecuencia la aparición de un estímulo
REFORZAMIENTO NEGATIVO (Condicionamiento de escape o evitación)
una acción, la disminuye (Escape (Ej. Tomar una
(Evitación (Ej. Estudiar para no
Esta conducta resulta fortalecida por la terminación de un estímulo negativo o
posible realizando
mayor/mejor es la
reforzamiento más
cia la aparición de un estímulo negativo. Las
o provoca la supresión de un
situación. Sin embargo, su
Sebastián Colmenero Fernández
Sebastián Colmenero Fernández
–Poca eficacia: el comportamiento
–Efectos no deseados: aumentar
FACTORES QUE DETERMINAN LA EFECTIVIDAD DEL CASTIGO
A) Contingencia Temporal:
comportamiento dado y su castigo,
B) Constancia: Cuanto más constante
C) Refuerzo de una respuesta alternativa
alternativa que evitará la aplicación del castigo en una situación dada.
APLICACIONES AL MARKETING Y LA
•REGALOS FIJOS
•REGALOS POR SORTEO
•REGALOS TRAS UN DETERMINADO GASTO (PUNTOS)
•REGALO TRAS DETERMINADO USO DE TARJETA
•DESCUENTOS POR USO DE TARJETA
•OFERTAS 2X1, 3X2, ETC.
comportamiento se suprime pero no se olvida
aumentar la agresividad, crear miedo, enseñar a discriminar…
FACTORES QUE DETERMINAN LA EFECTIVIDAD DEL CASTIGO
Cuanto más pequeño sea el intervalo de tiempo
castigo, más efectivo será éste.
constante sea el castigo más efectivo será.
Refuerzo de una respuesta alternativa: Es muy importante especificar la conducta
alternativa que evitará la aplicación del castigo en una situación dada.
APLICACIONES AL MARKETING Y LA PUBLICIDAD
•REGALOS TRAS UN DETERMINADO GASTO (PUNTOS)
•REGALO TRAS DETERMINADO USO DE TARJETA
•DESCUENTOS POR USO DE TARJETA
@090sebas
@090sebas
discriminar…
tiempo entre un
Es muy importante especificar la conducta
Sebastián Colmenero Fernández
Sebastián Colmenero Fernández
•OFERTAS EN UN DETERMINADO PERIODO DE TIEMPO
•OFERTAS DE CANTIDAD EN ST
•% INGRESO A ONG POR COMPRA
•SI NO COMPRAS AQUÍ “ES QUE ERES TONTO”
PROGRAMAS DE PREVENCIÓN
•BENEFICIO DE HACER LA CONDUCTA
•CONSECUENCIAS NEGATIVAS DE NO EFECTUAR LA
CONDUCTA
MOLDEAMIENTO DE CONDUCTAS
Consecución gradual de una
repertorio de respuestas de un organismo o que se da con una baja probabilidad.
1. Definir qué conducta queremos conseguir (nueva), aumenta
2. Evaluar la frecuencia de la con
3. Establecer los pasos desde el inicio del moldeamiento (1ª Conducta) al final del
moldeamiento (Meta)
4. Definir los reforzadores y cuándo se los vamos a dar, en cada uno de los pasos. La
consecución de un primer nivel dará paso al siguiente.
Mantenimiento de la conducta: Programas de reforzamiento
Programas de reforzamiento: son reglas que determinan las condiciones en que una R irá
seguida de una Consecuencia o reforzador.
–Reforzamiento continuo: la respuesta deseada se refuerza cada vez que se produce (Ej. Dar
comida cada vez que presione la palanca).
–Reforzamiento intermitente o parcial: la respuesta deseada se refuerza solo algunas veces.
(Ej. Dar comida cada 15 R)
TIPOS DE PROGRAMAS DE REFORZAMIENTO
PROGRAMAS DE RAZÓN: El reforzamiento depende de cada cuántas respuestas se administra
el reforzador.
•Programas de razón fija: cada nº fijo de respuestas >> Ej. Estudiante que se permite un
descanso cada vez que ha terminado cinco páginas.
•Programas de razón variable
tragaperras (el número de respuestas exigido para cada reforzamiento no es predecible)
PROGRAMAS DE INTERVALO
administración del anterior reforzador.
•Programas de intervalo fijo
media hora si su hijo está estudiando, y le da una palmadita en la espalda siempre que lo
encuentre estudiando.
•Programas de intervalo variable
mediante elogios a un paciente diabético por seguir correctamente su régimen de tratamiento,
cada cierto tiempo (a veces cada semana, a veces cada dos)
•OFERTAS EN UN DETERMINADO PERIODO DE TIEMPO
•OFERTAS DE CANTIDAD EN STOCK
•% INGRESO A ONG POR COMPRA
•SI NO COMPRAS AQUÍ “ES QUE ERES TONTO”
PROGRAMAS DE PREVENCIÓN
•BENEFICIO DE HACER LA CONDUCTA (O DEL PRODUCTO)
•CONSECUENCIAS NEGATIVAS DE NO EFECTUAR LA
MOLDEAMIENTO DE CONDUCTAS
Consecución gradual de una conducta final (o comportamiento meta), que no existe en el
repertorio de respuestas de un organismo o que se da con una baja probabilidad.
1. Definir qué conducta queremos conseguir (nueva), aumentar, reducir o eliminar.
2. Evaluar la frecuencia de la conducta que queremos modificar (línea base)
3. Establecer los pasos desde el inicio del moldeamiento (1ª Conducta) al final del
4. Definir los reforzadores y cuándo se los vamos a dar, en cada uno de los pasos. La
nivel dará paso al siguiente.
Mantenimiento de la conducta: Programas de reforzamiento
Programas de reforzamiento: son reglas que determinan las condiciones en que una R irá
seguida de una Consecuencia o reforzador. Determina las ocasiones en que se refo
Reforzamiento continuo: la respuesta deseada se refuerza cada vez que se produce (Ej. Dar
comida cada vez que presione la palanca).
Reforzamiento intermitente o parcial: la respuesta deseada se refuerza solo algunas veces.
TIPOS DE PROGRAMAS DE REFORZAMIENTO
: El reforzamiento depende de cada cuántas respuestas se administra
: cada nº fijo de respuestas >> Ej. Estudiante que se permite un
ue ha terminado cinco páginas.
Programas de razón variable: cada nº promedio de respuestas >> Ej. Las máquinas
tragaperras (el número de respuestas exigido para cada reforzamiento no es predecible)
PROGRAMAS DE INTERVALO: El reforzamiento depende del tiempo transcurrido desde la
administración del anterior reforzador.
Programas de intervalo fijo: cada periodo fijo de tiempo >> Ej. Un padre comprueba cada
media hora si su hijo está estudiando, y le da una palmadita en la espalda siempre que lo
Programas de intervalo variable: periodos variables de tiempo >> Ej. El médico refuerza
mediante elogios a un paciente diabético por seguir correctamente su régimen de tratamiento,
cada cierto tiempo (a veces cada semana, a veces cada dos).
@090sebas
@090sebas
conducta final (o comportamiento meta), que no existe en el
repertorio de respuestas de un organismo o que se da con una baja probabilidad.
, reducir o eliminar.
3. Establecer los pasos desde el inicio del moldeamiento (1ª Conducta) al final del
4. Definir los reforzadores y cuándo se los vamos a dar, en cada uno de los pasos. La
Programas de reforzamiento: son reglas que determinan las condiciones en que una R irá
Determina las ocasiones en que se reforzará la R:
Reforzamiento continuo: la respuesta deseada se refuerza cada vez que se produce (Ej. Dar
Reforzamiento intermitente o parcial: la respuesta deseada se refuerza solo algunas veces.
: El reforzamiento depende de cada cuántas respuestas se administra
: cada nº fijo de respuestas >> Ej. Estudiante que se permite un
: cada nº promedio de respuestas >> Ej. Las máquinas
tragaperras (el número de respuestas exigido para cada reforzamiento no es predecible)
tiempo transcurrido desde la
: cada periodo fijo de tiempo >> Ej. Un padre comprueba cada
media hora si su hijo está estudiando, y le da una palmadita en la espalda siempre que lo
: periodos variables de tiempo >> Ej. El médico refuerza
mediante elogios a un paciente diabético por seguir correctamente su régimen de tratamiento,
Sebastián Colmenero Fernández
Sebastián Colmenero Fernández
¿Existen diferencias entre ellos?
• Para la fase de adquisición: mejor el reforzamiento continuo.
• Para el mantenimiento de la R y resistencia a la extinción: mejor el reforzamiento
intermitente.
OTROS PROCESOS ASOCIADOS AL CONDICIONAMIENTO
•GENERALIZACIÓN: Es la probabilidad de que se emita una respuesta en una situación nueva
El efecto del refuerzo se extiende
entre las condiciones de la nueva situación y las de la situación en que se
en el pasado. Por ejemplo, si
probablemente volverá a expresar
•DISCRIMINACIÓN: Puede considerarse un proceso contrario a la generalización.
conducta adquirida en un contexto
distinto, debido a las condiciones
es reforzada, pero no así en la
amigos lo celebran. Cuando hace
consiguiente, el muchacho usa
está con sus padres.
•EXTINCIÓN: Es el proceso que ocurre cuando se suspende el reforzamiento de una respuesta,
de forma que el sujeto no puede obtener recompensa sea cual sea su conducta
Se produce por fases. Por ejemplo,
comida, en un primer momento,
animal oprime la palanca de forma
el sujeto deja de responder.
primeras son cada vez más
largas. Finalmente, la respuesta
¿Existen diferencias entre ellos?
• Para la fase de adquisición: mejor el reforzamiento continuo.
• Para el mantenimiento de la R y resistencia a la extinción: mejor el reforzamiento
OTROS PROCESOS ASOCIADOS AL CONDICIONAMIENTO
: Es la probabilidad de que se emita una respuesta en una situación nueva
extiende a otros estímulos. Dependerá de la semejanza existente
entre las condiciones de la nueva situación y las de la situación en que se aprendió la respuesta
si un alumno fue alabado por el profesor al hablar
expresar sus opiniones en otras clases.
: Puede considerarse un proceso contrario a la generalización.
contexto dado es probable que no ocurra en un
condiciones diferenciales de reforzamiento (en una situación
la otra). Por ejemplo, un chico utiliza un lenguaje
hace lo mismo en casa, sus padres se molestan notablemente.
usa dichas expresiones cuando está con sus amigos
el proceso que ocurre cuando se suspende el reforzamiento de una respuesta,
de forma que el sujeto no puede obtener recompensa sea cual sea su conducta
ejemplo, en la caja de Skinner, al desconectar el
momento, se observa un aumento paradójico en la tasa
forma más rápida y vigorosa que antes. Sucede otra
responder. Las explosiones y las pausas se van alternando,
cortas, mientras que las pausas se van haciendo
respuesta deja de producirse.
@090sebas
@090sebas
• Para el mantenimiento de la R y resistencia a la extinción: mejor el reforzamiento
: Es la probabilidad de que se emita una respuesta en una situación nueva.
Dependerá de la semejanza existente
aprendió la respuesta
hablar en una clase,
: Puede considerarse un proceso contrario a la generalización. Así una
un contexto muy
situación la respuesta
lenguaje malsonante y sus
notablemente. Por
amigos pero no cuando
el proceso que ocurre cuando se suspende el reforzamiento de una respuesta,
de forma que el sujeto no puede obtener recompensa sea cual sea su conducta (Tarpy, 1977).
el dispensador de
tasa de respuesta. El
otra fase en la que
alternando, aunque las
haciendo cada vez más