Download - tesina experimental. enviar1.docx
FACULTAD DE HUMANIDADESESCUELA ACADEMICO PROFESIONAL DE PSICOLOGIA
“EFECTOS DEL MOLDEAMIENTO Y ENCADENAMIENTO SOBRE
LA CONDUCTA COMPLEJA DE PICOTEO DE OPERANTE”
AUTORES:
CASTILLO SILVA, JACLYN
HUACCHA VILLAVICENCIO, GUISELA
OTINIANO CABRERA, MERLY
ASESOR:
Marvin Moreno Medina
LINEA DE INVESTIGACION:
Psicología Experimental
TRUJILLO – PERU
2013
PROBLEMA DE LA INVESTIGACIÓN
CAPÍTULO I:
1.1. Realidad problemática
Actualmente en nuestra sociedad se está percibiendo las diversas conductas
que optan los jóvenes o adolescentes entre hombres y mujeres para su
desarrollo integral; sin embargo, han surgido diferentes problemas que se
originan principalmente en la familia; es decir, desde el hogar como la
carencia de valores, falta de comunicación, malos hábitos, que conforme a
su evolución permite que la persona se desenvuelva de acuerdo a lo
aprendido con los demás.
En base a ello es que optamos por sumergirnos dentro del campo
experimental de la psicología conductual, para lo cual es indispensable y
necesario basarnos en una teoría del comportamiento, de otra forma
cualquier investigación no tendría valor científico y no sería objeto de
estudio.
Siendo el conductismo; el que establece que el aprendizaje es un cambio en
la forma de comportamiento en función a los cambios del entorno. Según
los estudios ya existentes encontramos el uso de la teoría de Skiner, el cual
propuso que para el aprendizaje repetitivo existen diversos reforzadores que
actúan en todos los seres vivos de forma variada para inducir a la
repetividad de un comportamiento deseado.
Por otro lado Pavlov, con su teoría nos ha permitido estudiar cómo
aprenden los organismos acerca de las relaciones entre los estímulos
ambientales. Es por ello que el estudio o el uso del condicionamiento ha
contribuído de forma notable al conocimiento de las bases biológicas del
aprendizaje y la memoria. Es de esta manera se trabajara con sujetos
(palomas) a las cuales se le reforzara una conducta con el propósito de que
dicha conducta aumente o se extinga.
1.2. Formulación del problema:
¿Cuál es el efecto del moldeamiento y encadenamiento en la conducta
compleja de picoteo de operante en una paloma castilla?
1.3. Justificación y viabilidad:
Replicar el experimento de Skinner permitirá explorar el fenómeno del
condicionamiento operante en la adquisición de nuevas conductas.
Con el desarrollo de esta investigación se logrará establecer relación
de gran similitud para la resolución de la problemática de tipo
conductual en personas.
La información compilada favorecerá a la ampliación de los
conocimientos sobre las variables en investigación experimentales
dando énfasis al desarrollo de estas conductas complejas.
Servirá de gran utilidad para los estudiantes y los mismos profesionales
que están interesados en la conducta humana.
1.4. Antecedentes:
1.4.1. INTERNACIONALES
Pavlov, Iván (Rusia-1904) realizó sus investigaciones sobre el
funcionamiento de las glándulas salivales. con su teoría nos ha
permitido estudiar cómo aprenden los organismos acerca de las
relaciones entre los estímulos ambientales.
Para ello trabajó de forma experimental y controlada con perros, a
los que incomunicaba del exterior en el laboratorio. Se interesó por
las secreciones producidas por las glándulas salivales sin la
presencia de la estimulación directa del alimento en la boca. Notó
que durante las sesiones experimentales un perro escuchaba los
pasos de la persona que habitualmente lo alimentaba, salivaba
antes de serle ofrecido el alimento; no obstante, si los pasos
escuchados pertenecían a un desconocido, el perro no salivaba.
Watson, (Greenville-1998) demostró el condicionamiento en un
experimento en el que utilizó un niño de algunos meses de nacido
(Albert) y una rata.
Durante el experimento acercaba la rata al niño Albert para que
éste la tocara. Inicialmente el niño no mostraba temor por el
animal, pero a partir de que Watson asoció la presencia de un
ruido fuerte con la exposición del animal al niño Albert, (al
presentar el ruido cada vez que Albert la tocaba), de modo que al
poco tiempo, surgió en el niño un temor hacia la rata, sin
necesidad de escuchar el ruido fuerte. Miedo que luego se
generalizó para otros animales pequeños.
Thorndike (1898): En su trabajo de investigación. “Efectos de
eventos procedentes y subsiguientes en la conducta”. Los eventos
procedentes era una deprivación leve de alimento y presencia de
comida fuera de la jaula, los eventos subsiguientes eran la
apertura de la jaula y la obtención del alimento. Las variables del
estudio de Thorndike son la deprivación previa de alimento como
motivador y la presencia de comida como recompensa.
Franz & Rodríguez (1911) realizaron un trabajo de investigación
básica sobre las Bases Cerebrales de la Percepción. Unos monos
aprendían diversas discriminaciones y se evaluaba,
posteriormente, el grado en el cual ablaciones menores o mayores
de los lóbulos occipitales producidas perdidas asociativas visuales.
Aunque parece que realizaron el examen conductual de algunos
de los animales, su contribución principal fue la de realizar los
exámenes históricos post mortem. Rodríguez el primer español,
realizo un trabajo en el que utilizaron las técnicas del
condicionamiento en animales.
Benjumea & García (2005) lograron entrar en cuadro respuestas
bien en unas palomas definidas: girar en C mediante un arreglo de
redondo, caminar por discriminación E el piso recorriendo una
condicional en donde D trayectoria en forma de ellas fueron
capaces de E ocho, estirar el cuello y realizar la conducta N
golpear con una pata el esperado (rojo= picar a T piso. La
izquierda, verde = E picar a la derecha).
Serrano, Camacho & Carpio (2006) expusieron a E dos grupos de
pichones a un C procedimiento sucesivo de E igualdad de la
muestra D demorada, en donde se encontró E que los pichones
lograban igualar N la muestra de manea más lenta T cuando se
incrementaba la E del intervalo de demora S.
Universidad Nacional de Educación a Distancia, España, (2007),
se llevó a cabo un experimento en el que diez palomas fueron
entrenadas en una tarea de discriminación condicional de su
propia conducta. Los sujetos aprendían que cuando la muestra
había consistido en responder a la izquierda (derecha) ante dos
teclas blancas, debían elegir la comparación roja (verde) para ser
reforzados. Una vez que los animales habían aprendido esta tarea,
se les pasaba a una fase de prueba. En concreto, cinco palomas
fueron entrenadas en una transferencia positiva, ya que elegir la
comparación izquierda (derecha) para llegar al reforzador. Por el
contrario, las otras cinco palomas recibían un entrenamiento de
transferencia negativa, ya que la tarea consistía en que ante una
muestra roja (vede) debían elegir la comparación derecha
(izquierda) para ser reforzados. Los datos obtenidos indican que la
ejecución de los sujetos del grupo en el que había coherencia
entre las fases fue superior a la de los sujetos del grupo en el que
no había dicha coherencia. Los resultados son interpretados en
relación con la importancia que la discriminación de la propia
conducta tiene en la derivación de relaciones bidireccionales.
Andrés García y Santiago Benjumea Rodríguez (Valencia, 2006):
En el trabajo de Investigación: Discriminación condicional de la
propia conducta en palomas. Este experimento con palomas
muestra un procedimiento de discriminación condicional de la
propia conducta, concretamente su dimensión espacial. En dicho
experimento hubo tres condiciones experimentales en función del
número de respuestas exigido como muestra. Los sujetos del
grupo de 1 respuesta, tenían que elegir rojo (vede) tras haber
realizado la conducta de picotear a la izquierda (derecha) en
presencia de dos teclas blancas. En el grupo de 5 respuestas, la
muestra de conducta a discriminar se incrementó hasta que 5
respuestas consecutivas. En el grupo de 0 respuestas, las
palomas aprendieron una tarea similar, pero de discriminación de
un evento externo, dado que se les impidió dar respuestas
diferenciales ante dicha muestra externa. Los resultados se
discuten en relación con la posible importancia que tiene el número
de respuestas emitidas como muestra en los procedimientos de
discriminación de la propia conducta, así como el papel
competitivo que juegan las claves.
1.4.2. NACIONALES
Castilla y Pellón (2004) realizaron su experimento con palomas
privadas de comida y con 80 % de su peso libre, las cuales fueron
expuestas secuencialmente a programas de tipo fijo con diferentes
frecuencias de reforzamiento (15-30-60 seg.). Luego fueron
privadas al 70% de su peso libre y se observaron cambios en la
distribución de picoteo del operante dentro de los intervalos de los
reforzadores en función del nivel de privación de comida.
Benjumea Y García (Lima, 1998): Entrenaron a unas palomas,
mediante un arreglo de discriminación condicional en donde ellas
fueron capaces de realizar las conductas esperadas (rojo= picar a
la izquierda, verde= picar a la derecha).
Saldaña (Lima 2005): con el desarrollo del experimento; se logró
implantar en el ave cuatro respuestas bien definidas: girar en
redondo, caminar por el piso recorriendo una trayectoria en forma
de ocho, estirar el cuello y golpear con una pata el piso. Es decir
se puede aplicar diferentes conductas.
1.4.3. LOCALES
Oshiyama (2002). En su trabajo de investigación, Efectos del
Reforzamiento sobre la conducta compleja de picoteo del operante
en una paloma castila. En el cual se utilizó como instrumentos una
caja experimental modificada de Skinner, encontrando que si se
logró encadenar la conducta compleja de picoteo operante, a
través de un programa de razón fija.
Ascate, Carranza, Chilón Méndez. (2008). En el experimento
denominado “respuesta producida por el reforzador a la conducta
compleja de picoteo de conmutador en una paloma castilla de 4
meses de edad” se pretende observar el efecto del reforzamiento
sobre la conducta compleja de picoteo de operante en una paloma
castilla de 4 meses de edad sin experiencia previa de
reforzamiento, la cual consiste en que el sujeto experimental
deberá subir un puente de 2 cm. De altura y atravesarlo por una
distancia de 15 cm. Al observar la luz azul prenderse y luego
apoyado en sus patas sobre la base de la caja de Skinner eleve su
cabeza hacia el operante y lo toca con el pico al encenderse la luz
roja.
Para ello se utilizó la caja experimental modificada de Skinner de 40
cm. De alto por 50 cm. De largo, como reforzador se utilizó 10 gr. De
choclo picado y como estímulos las luces de colores azul y rojo de
diferentes intensidades. Probándose que realmente la paloma puede
subir y atravesar el puente ante el estímulo presentado.
Almandoz, Díaz, Moran, Pérez (2008). En el trabajo de
investigación denominado “efectos del reforzamiento sobre la
conducta compleja de picoteo de operante”, en una paloma castilla
de 5 meses, se pretende observar el efecto del reforzamiento
sobre la conducta compleja de picoteo de operante, la cual
consiste en que el sujeto experimental deberá subir a la barita al
encenderse la luz verde, picotear el lazo azul apoyado en sus dos
patas sobre la base de la caja de Skinner extendiendo su cabeza
hacia el conmutador y lo golpea con el pico al encenderse la luz
amarilla de 75 watts.
Para ello se utilizó una caja experimental de Skinner de 40 cm. De
altura y 50 cm. De largo, como reforzador se utilizó 10 gr. De trigo
chancado y como estímulos el sonido de una melodía (auditivo) las
luces de colores rojo y amarillo de diferentes intensidades visuales.
Concluyendo que cuando el reforzamiento funciona el sujeto
experimental es capaz de cambiar la conducta.
Contreras, García, López, Pérez (2008). En el trabajo denominado
“efectos del reforzamiento sobre la conducta compleja de picoteo
al conmutador en una paloma castilla de 5 meses”, se pretende
observar el efecto del reforzamiento sobre la conducta compleja de
picotear el conmutador rojo, la cual consiste en que el sujeto
experimental deberá pasar por el aro al encenderse el foco azul de
25 watts y picotear el conmutador rojo, con sus dos patas sobre la
base de la caja de Skinner al encenderse la luz roja de 25 watts.
Para ello se utilizó una caja experimental modificada de Skinner de
50 cm. De alto por 50. Cm de largo, como reforzador se utilizó 10 gr.
De maíz chancado con arroz crudo y como estímulos las luces de
colores: azul, verde y roja con las mismas intensidades (visuales).
Probándose que el reforzamiento bien aplicado produce aprender
nuevas conductas.
Rojas (2007). “efectos del reforzamiento sobre un arco con un
sonido”. En el cual utilizo como instrumento una caja experimental
modificada de Skinner, con esto se probó que se puede encadenar
la conducta compleja de subir una escalera como la luz roja, pasar
con un sonido y picotear el conmutado con la luz amarilla, en una
paloma castilla de 6 meses, a través de un programa de razón fija.
1.5. Objetivos
1.5.1. Objetivo general:
Determinar los Efectos del moldeamiento y encadenamiento en la
conducta compleja de picoteo de operante en una paloma castilla.
MARCO REFERENCIAL
CAPÍTULO II:
2.1. Marco teórico
2.1.1. Condicionamiento Clásico
Pávlov (1904); decidió estudiar el problema como reflejo psíquico, a fin de
entender el porqué de este problema. Inicio su carrera con la
investigación sobre el sistema circulatorio y posteriormente paso al
estudio de la fisiología de la digestión. El objetivo de Pávlov era
comprender la forma en el que el cuerpo descompone el alimento en
elementos químicos que pueden ser absorbidos en la sangre .Este
proceso se inicia con el reflejo salival el cual, cuándo el alimento está en
la boca produce el flujo de la saliva.
2.1.2. Principios
El científico más conocido de Rusia es Iván P. Pávlov (1849-1936).
Primero ganó mucha fama por su investigación acerca de la fisiología del
sistema digestivo. Su trabajo se caracterizó no solo por una variedad de
procedimientos ingeniosos, sino por la completa dedicación a su trabajo.
Una anécdota cuenta de él que en los tiempos difíciles de la revolución,
se le ofreció un incremento en su ración alimenticia, mismo que rechazo
mientras no fuera igualmente disponible dicho incremento, para sus
perros. Pávlov originalmente descubrió que cuando se coloca comida en
el estómago de un perro, las paredes del mismo secretan diversos jugos
que facilitan el proceso digestivo. Una serie de trabajos han demostrado
que la cantidad secretada y la duración de la secreción, son función del
tipo y cantidad de comida en el estómago del perro. Para simplificar la
observación de lo que ocurría dentro del perro, Pávlov invento una
ingeniosa técnica quirúrgica para ex tematizar una porción del estómago.
Se cortaba un trozo del tejido del estómago, sacándolo y fijándolo en un
orificio practicado a un lado del cuerpo. Las habilidades de Pávlov como
cirujano, quedaban demostradas, ya que era capaz de efectuar esta
operación sin interrumpir el suministro de sangre o las conexiones
nerviosas del estómago. A esta preparación se le denomino "pouch
pavloviano" y en ella se conseguía tener un perro con dos estómagos, el
original en su funcionamiento normal y el exteriorizado que podía
observarse mientras el animal digería su alimento. Se encontró que las
secreciones del estómago artificial, correspondían a las secreciones y
otras actividades del estómago original. Mediante este recurso fue que
Pávlov trabajo los detalles de la digestión, incluyendo los reflejos
neuronales involucrados. Descubrió, por ejemplo, que se secreta más y
de forma más persistente ante la carne, que ante cualquier otro tipo de
alimento.
2.1.2.1. Establecimiento de los reflejos condicionados
La técnica consiste en aplicar una y otra vez el estímulo incondicionado
o natural, con el estímulo condicionado. En los experimentos de Pávlov
se utilizaron estímulos olfativos, auditivos, visuales y táctiles como
estímulos sustitutos y en cada caso se usó la comida como estímulo
incondicionado o adecuado. Mientras el perro hambriento esperaba en
la mesa, se le presentaba un plato de comida y al mismo tiempo,
sonaba una nota o un zumbador. Esto se repetía una y otra vez en días
sucesivos y el número de estimulaciones conjuntas sumaban de 8 a 10
por experimento. Al principio la saliva fluía como reacción a la comida
más el sonido, pero finalmente, después de repetidas estimulaciones
conjuntas, la saliva comenzaba a fluir al percibir el sonido solamente.
2.1.2.2. Condicionamiento clasico primario
Pavlov (1927) demostró existen dos tipos distintos de reflejos:
Un tipo es reflejo innato no aprendido y permanente que varía podo de
individuo a individuo. El segundo es el reflejo psíquico, no está
presente en el momento del nacimiento, debe ser adquirido mediante la
experiencia y es relativamente temporal. Pávlov denomino a estos
reflejos condicionados ya que dependen muchísimo de condiciones.
Además llamo reflejos incondicionados a los reflejos que ya se
encuentran programados desde el nacimiento en el organismo, estos
podrían hacerse llamar adquiridos.
Un reflejo incondicional comprende un estímulo incondicional (EI) y la
respuesta que regularmente provoca la respuesta incondicional (RI).
2.1.2.3. Condicionamiento clásico secundario
Pávlov (1904). Un procedimiento por medio del cual un estímulo neutro
se convierte en un EC (estimulo condicionado) bien establecido se
llama condicionamiento clásico secundario.
Estimulo neutral ECI RC
La RC al EC2 generalmente es mucho más débil y la RC al EC
original, y la respuesta EC3, aún más débil. La respuesta a un EC2 es
mucho menos estable que la respuesta a un EC1 y tiende a
desaparecer completamente sino es fortalecida periódicamente
pareándola con el EC1o el E1.
2.1.2.4. Factores del condicionamiento clásico
2.1.2.4.1. Estimulo
Presenta cualidades inherentes a los estímulos neutrales y
significativos, afectan la tasa de condicionamiento. Un estímulo
potente puede tener cierta ventaja cobre un estímulo débil, por lo
menos hasta cierto punto.
Kenneth Spence (1953) comparo los efectos de dos estimulo sin
condicionales que deferían en fuerza en un experimento sobre
condicionamiento palpebral.
2.1.2.4.2. Características del aprendizaje
Pávlov (1910). La serie de factores que afecta el
condicionamiento clásico podríamos en conjunto tratarla bajo el
título de características de principiante. EL condicionamiento
clásico no se desarrolla en la misma forma en todas las especies
o en todos los miembros de una misma especia. También existen
diferencias en una misma especia. Pávlov observó que algunos
perros son sumamente excitables, en cambio otros son mucho
más tranquilos; estas diferencias de personalidad afectan el
condicionamiento. El grado de condicionamiento de un organismo
varía según su estado fisiológico. Hay cierta evidencia de que un
nivel moderado de ansiedad mejora el condicionamiento, y, para
bien o para mal, las drogas que tranquilizan o excitan al animal o
persona probablemente afecten el condicionamiento. De ninguna
manera se podría decir que el papel que juegan dichas
características individuales en el condicionamiento clásico sea
simple o que este claramente definido.
2.1.2.5. Generalización y discriminación
2.1.2.5.1. Generalización del estimulo
Cuando Pávlov(1904) logro condicionar a un perro para que
salivara ante un estímulo anteri0ormente neutral, vio una cosa
curiosa. EL animal no solo salivaba ante el estímulo específico que
había sido pareado con el EI sino que también lo hacía ante otros
estímulos parecidos.
La generalización del estímulo se refiere al hecho de que cuando
un estímulo se convierte en EC, otros estímulos similares también
pueden producir la RC. Los efectos del condicionamiento se
generalizan o dispersan hacia otros estímulos. La magnitud de la
generalización depende del grado de similitud con el EC.
Carl Hovlans (1937 a) analizo en forma más sistemática la relación
entre la similitud y la generalización. Para ello, adiestro a
estudiantes universitarios a responder a un tono particular. El EI
consistió en una descarga eléctrica moderada y la RI fue la
respuesta galvánica de la piel o RPG. El estímulo condicional fue
un tono de frecuencia particular. Después de 16 apareamientos del
EC y el EI, Hovland les presento cuatro tonos diferentes, entre ellos
el EC. Cada tono se presentó dos veces y se promediaron las RC a
cada uno de ellos. Los resultados se graficaron de manera que
mostraran un gradiente de generalización del estímulo.
Es alentador considerar que la generalización toma esta forma
agradable, ordenada y conocida. Desgraciadamente, esto no es
verdad. Como señalo Howard Rachlin (1976), con frecuencia,
cuando se deriva de los promedios de cierto número de sujetos, el
gradiente de generalización del estímulo se asemeja un tanto a
dicha distribución, pero cuando observamos el gradiente de
generalización de algunos de los sujetos, puede variar desde una
línea horizontal hasta una línea recta vertical. Esto se debe a que la
generalización del estímulo es un fenómeno sumamente
cambiante, particularmente afectado por cierto número de
variables. El grado de aprendizaje es de particular importancia:
mientras más débil sea la RC, mas plano será el gradiente de
generalización; mientras más fuerte sea la RC, mayor será la
pendiente del gradiente.
Otros factores que pueden afectar el gradiente de generalización
son la magnitud de las diferencias entre los estímulos alternativos
la intensidad del EI, y por otros por el estilo. A pesar de que el
gradiente de generalización de un individuo puede no seguir la
forma ideal, se puede decir con seguridad que mientras mayor sea
la similitud de un estímulo con EC, mayor será la probabilidad de
que produzca una respuesta condicional.
La generalización semántica se ha demostrado en varios estudios
más. John Lacey y sus colaboradores (1955) parearon palabras
relacionadas con el cultivo: maíz con descarga eléctrica. LA
palabra maíz se convirtió en EC que aumentaba la aceleración
cardiaca. Cuando los investigadores presentaron palabras
relacionadas semánticamente descubrieron que estas palabras
también producían la RC.
2.1.2.5.2. Discriminación del estimulo
Pávlov (1927) Ya sea que la generalización de una respuesta
condicional se base en el significado o en alguna característica
física, el hecho es que la magnitud de generalización varía según el
grado de similitud con el EC. No obstante, la tendencia a
generalizar a responder a estímulos similares, pero no idénticos al
EC, no necesariamente dura para siempre. Pávlov observo que
aunque el perro salivaba cuando oía el sonido de una campana, al
principio, también, salivaba cuando oía otros sonidos; esta
generalización desaparecía, en general, conforme el
condicionamiento proseguía. El animal continuaba respondiendo al
EC, pero respondía cada vez menos a los estímulos que no habían
sido pareados con el EI. En concreto, el animal terminaba por
responder en forma diferente al EC y a los otros estímulos, los
diferenciaba; por esto Pávlov puso el nombre de diferenciación a
este fenómeno.
La diferenciación o discriminación del estímulo, como suele
llamársele en la actualidad, es la imagen de espejo de la
generalización. A medida que un animal o una persona discriminan
con mayor precisión el EC de otros estímulos, menor es la
generalización. EL proceso para lograr que un organismo
discrimine consiste en parear un EC con un estímulo significativo y
enseguida presentar, solo, otro estimulo similar.
2.1.2.6. Extinción
Pávlov (1927) fue el primero en observar la extinción en el laboratorio.
Describe el caso de un perro que fue sometido a extinción después de
haber aprendido a salivar cuando oía el sonido de un metrónomo. A
cada presentación del EC el número de gotas de saliva disminuía con
uniformidad. Apareció un patrón similar al anterior cuando se tomó
como medida de la RC la velocidad de la respuesta. LA exposición
repetida al EC, sin parearlo con el estímulo incondicional, dio lugar a
que la RC se hiciera cada vez más lenta.
A primera vista, la extinción se parece un tanto al olvido, y suele
suceder que sean confundidos. Sin embargo, de ninguna manera son
iguales. En el olvido el EC es eliminado durante cierto periodo y ,
debido al paso del tiempo, la respuesta condicional se hace más débil.
En la extinción el EC se presenta repetidamente, y esta repetición hace
que la respuesta sea más débil.
Pávlov observo que era más difícil extinguir una respuesta salival fuerte
que una débil. Este no es un hallazgo inesperado: es lógico que una
respuesta que apenas acaba de establecerse desaparezca con mayor
facilidad que otra que ya está completamente arraigada.
El número de veces que aparece solo el EC durante el
condicionamiento afecta también la tasa de extinción. Recordará usted
que un estímulo neutral tardara mayor tiempo en convertirse en EC, si
ocurre solo y con mayor frecuencia. Sin embargo, una vez que un
estímulo se ha convertido en EC, el hecho de que se presente solo y
ocasionalmente, hace, en realidad, que la RC se vuelva más resistente
a la extinción.
La extinción es una forma eficiente y básicamente indolora de debilitar
una respuesta condicional, si se lleva a cabo en forma apropiada. La
extinción requiere que el EC siempre ocurra en ausencia del estímulo
significativo. El requisito de que el EC aparezca siempre solo,
determina, en ocasiones, limitación prácticas en el uso de la extinción.
2.1.2.7. Teorías del condicionamiento clásico
2.1.2.7.1. Teoría E-R
Muchos psicólogos creen que el condicionamiento clásico implica la
formación de cierto tipo de conexión en el sistema nervioso, que
enlaza un estímulo. Aunque Pávlov fue un teórico del E-R, llevo a
cabo muy pocas investigaciones sobre el sistema nervioso;
consideraba que sus estudios de condicionamiento proporcionaban
muy buenos indicios sobre lo que sucede en el cerebro. Tomando
como modelo el reflejo salival, desarrollaba sus ideas más o menos
como sigue: el perro nace con una respuesta salival incondicional a
ciertos estímulos, por ejemplo la comida en la boca. El estímulo
incondicional activa cierta área o zona, del cerebro y la excitación de
esta desencadena la salivación. En realidad, todo lo que Pávlov o
cualquier otro experimentado observan es el estímulo incondicional y
la respuesta que produce. Es de suponer que existe cierto tipo de
conexión neurológica que enlaza el EI con la RI.
Por definición, un estímulo neutral, como el sonido de una campana,
es aquel que no produce la respuesta de salivación. En otras
palabras, en el cerebro no existe conexión entre el sonido de la
campana y la respuesta salival. Luego entonces, lo que el
condicionamiento hace es establecer la conexión.
AL presentar el EC y el EI al mismo tiempo, empieza a formarse una
nueva conexión entre las áreas cerebrales respectivas.
Después de varios pareamientos del EC y el EI, la nueva conexión es
lo suficientemente fuerte como para que la presentación del EC
provoque la salivación.
Puede suponerse que Pávlov consideraba que el condicionamiento
clásico secundario implicaba la formación de una conexión entre la
zona del EC y la zona del EC, la que a su vez desencadenaba la
salivación.
2.1.3. Condicionamiento instrumental (operante)
2.1.3.1. Antecedentes
Aproximadamente por la misma época en que Pávlov intentaba resolver el
enigma del reflejo psíquico, Edward Lee Thorndike, joven estadounidense
que concluía sus estudios de grado, intentaba descubrir la forma de
abordar otro problema: la inteligencia animal. A fines del siglo XXI, la
mayoría de la gente consideraba que los animales aprendían por medio
del razonamiento. Quien tuviera un perro o un gato podía ver que el
animal razonaba los problemas y llegaba a una conclusión lógica.
Abundan los relatos acerca del increíble talento de los animales. La
característica común a estos relatos era que presentaban las capacidades
del animal de tal manera lograban hacer que algunas mascotas
parecieran poco menos que un Alberto Einstein mudo. Thorndike se dio
cuenta de la imposibilidad de estimar las capacidades del animal a partir
de la evidencia anecdótica: ‘’Tales testimonios de ninguna manera están a
la par que los testimonios acerca del tamaño de un pez o la migración de
las aves. En estos casos uno no solo debe tratar con testimonios basados
en la ignorancia o la inexactitud, sino también con los testimonios llenos
de perjuicios. Las personas se muestran deseosas por descubrir
inteligencia en los animales, les gustaría que asiera fuera.
Estas y otras preguntas podrían responderse si se diseñara una serie de
situaciones problema y se colocara en ellas al animal, una y otra vez. En
estas condiciones se podría observar al animal en acción. Mediante este
tipo de experimentos Thorndike acabaría con los mitos de la inteligencia
animal. Observaría el aprendizaje conforme tiene lugar, y no ya que
ocurrió, posteriormente sabría porque razones el gatito se aproxima al
escuchar el llamado habitual.
2.1.3.2. Condicionamiento instrumental primario
Thorndike (1898) registro el tiempo que le tomaba al polluelo llegar a su
destino en cada ensayo sucesivo y posteriormente grafico este tiempo
para obtener una curva de aprendizaje.
Los experimentos más famosos de Thorndike son los que llevo a cabo
con gatos. Colocaba un gato hambriento en una caja; le ponía el alimento
totalmente a la vista, pero fuera de su alcance. La puerta de la caja se
abría mediante una acción tan simple como jalar una argolla o pararse en
una plataforma. Al igual que los polluelos, el gato empezó produciendo
varias respuestas ineficaces. En sus notas, Thorndike señala que el gato
generalmente trataba de deslizarse a través de cualquier abertura,
arañaba o mordía las barras o el alambre; introducía las patas por
cualquier abertura y arañaba lo que estuviera a su alcance; mantenía su
esfuerzo por alcanzar cualquier objeto suelto o movible; podía suceder
que arañara las cosas que estaban dentro de la caja. Por fin el gato jalaba
la argolla o se paraba sobre la plataforma, la puerta se abría y podía ir a
tomar el alimento. Cuando regresaba el gato para el ensayo subsiguiente,
nuevamente mostraba la misma actividad azarosa que producía la
respuesta correcta. Después de varios ensayos sucesivos, el animal
producía cada vez menos movimientos azarosos, hasta que después de
muchos ensayos, una vez que se le colocaba en la caja el gato
inmediatamente arañaba la argolla con precisión.
Si se coloca un animal en una situación particular, un laberinto o una caja,
reacciona emitiendo un conjunto de respuestas. Una respuesta particular
puede tener unos de dos tipos de consecuencias o efectos. A uno de los
tipos de consecuencias Thorndike lo llamo: ‘’estado satisfactorio de
cosas’’, al otro: ‘’estado desagradable de cosas’’. Si, por ejemplo, un
polluelo se dirige al corredor equivocado, esta respuesta es seguida por la
persistencia del hambre y la separación de los otros polluelos, lo que
constituye un estado desagradable de cosas. Cuando el polluelo toma el
corredor correcto, esta respuesta conduce al alimento y a la relación con
otros polluelos, lo que constituye un estado satisfactorio de cosas.
Cuando un gato hambriento intenta deslizarse por entre los barrotes de su
caja, permanece hambriento, en un estado desagradable de cosas;
cuando el gato jala la argolla, la puerta se abre y obtiene alimento, es una
consecuencia satisfactoria. Thorndike descubrió que cuando una
respuesta es seguida por un estado satisfactorio de cosas, tiende a
repetirse; en cambio cuando una respuesta es seguida por un estado
desagradable, tiende a desaparecer. En otras palabras la probabilidad de
una respuesta depende de su efecto sobre el medio ambiente, principio al
que no Thorndike llamo La ley del efecto.
Actualmente los psicólogos ya no hablan de estados satisfactorios de
cosas, sino de consecuencias positivas. Cuando una conducta tiene una
consecuencia positiva, es posible que se repita. La conducta es
fortalecida de manera que las consecuencias positivas son identificadas
como sucesos reforzantes o reforzadores. Se llama reforzamiento al
procedimiento para aumentar la probabilidad de una conducta haciéndola
seguir de laguna consecuencia positiva. Existen dos tipos de
reforzamiento.
Dado que este procedimiento implica la remoción o disminución en la
intensidad de un estímulo, suele llamársele reforzamiento negativo. Los
términos reforzamiento positivo y negativo causan muchos problemas en
los estudiantes (y a los psicólogos). Tal vez usted tenga menos
dificultades para entender su correcto contenido si representa lo positivo y
negativo mediante símbolos aritméticos: positivo significa que algo se
agrega, negativo significa que algo se substrae. En ambos procedimientos
la respuesta es seguida por un evento reforzante.
Los psicólogos ya no utilizan la frase ‘’estado desagradable de cosas’’. En
la actualidad hablan de consecuencias aversivas, es menos probable que
se repita. Como la conducta se debilita o suprime, las consecuencias
aversivas son denominadas eventos aversivos o punitivos. Se llama
castigo al procedimiento que consiste en disminuir la probabilidad de una
conducta, haciéndola seguir de alguna consecuencia aversiva. Existen
dos tipos de castigo.
Un tipo de castigo implica la aparición o aumento de la intensidad de un
estímulo.
Suele llamarse castigo positivo a este procedimiento porque implica
agregar, o aumentar la intensidad de un estímulo. Otro tipo de castigo
implica la remoción o la disminución de la intensidad de un estímulo. Si un
niño de seis años arroja un cuchara sobre la mesa, es posible que le
retiren la comida.
Dado que este procedimiento implica la remoción o disminución de la
intensidad de un estímulo, recibe el nombre de castigo positivo. Con
frecuencia los estudiantes se confunden aún más con los términos castigo
positivo y negativo, que con los términos reforzamiento positivo y
negativo. En todo caso, ¡en qué sentido el castigo puede ser positivo! Otra
vez, estos términos se entienden mejor si se usan signos aritméticos
directores: positivo significa algo que se agrega, negativo significa algo
que se substrae. En ambos casos la conducta es seguida de eventos
aversivos.
Thorndike llamo aprendizaje de ensayo y error, o ensayo y éxito, al
procedimiento por medio del cual una respuesta se hace más o menos
probable, dependiendo de sus consecuencias. Hoy día es más frecuente
que se dé el nombre de condicionamiento instrumental a estos
procedimientos. Las consecuencias que se utilizaron en los ejemplos
precedentes son propiamente reforzantes o punitivas; es decir no
dependen de la experiencia anterior que tenga el organismo particular. A
estas consecuencias se les llama reforzadores y castigos primarios. En el
presente caso, llamaremos condicionamiento instrumental primario al
caso en que la conducta se modifica por medio de reforzadores o castigos
primarios.
Los términos condicionamiento instrumental, reforzamiento positivo,
reforzamiento negativo, son muy diferentes de los que propuso Thorndike.
Sin embargo los procedimientos a que se refieren los términos son muy
diferentes de los que él estudió. Los nuevos términos purifican el
pensamiento de Thorndike, no lo rechazan. Pero toda esta purificación
puede dar la idea de que los cuatro procedimientos de condicionamiento
instrumental pueden diferenciarse fácilmente uno de otro. Por desgracia,
las distinciones son más arbitrarias que reales. A manera de ilustración
tomemos el caso de los gatos de Thorndike. El experimentador introduce
un gato hambriento en una caja y coloca el alimento fuera de alcance del
animal.
Originalmente Thorndike pensaba que el condicionamiento instrumental
tenía poco que ver con el aprendizaje humano, excepto en el caso de
habilidades como jugar al tenis. Sin embargo tanto él como otros
investigadores llevaron a cabo estudios en diversas especies, incluyendo
a los seres humanos y esta investigación demostró que el
condicionamiento instrumental es un fenómeno muy difundido, que ocurre
en todo el reino animal desde los insectos hasta los filósofos. Desde la
primera vez que los famosos gatos de Thorndike luchaban por salir de las
cajas, se han realizado literalmente miles de experimentos sobre
condicionamiento instrumental. Por medio de la aplicación de
reforzadores y castigos, peces, gallinas, cerdos, palomas, ratas, y otras
especies han aprendido a recorrer laberintos, jalar cuerdas, presionar
palanca, picoteos de focos, y decenas de otras conductas.
2.1.3.2.1. Reforzamiento Positivo
Por 1930, B.F Skinner (1938, 1956) diseño un aparato para estudiar el
condicionamiento instrumental que tenía varias ventajas sobre las
cajas de Thorndike y otros artefactos. El aparato comúnmente
llamado caja de Skinner ofrecía una forma fácil de obtener registro del
aprendizaje y en la actualidad se ha convertido en un artículo que de
vez en vez, dejaba caer automáticamente unas cuantas porciones de
alimento en un recipiente. Una vez que la rata se acostumbraba al
ruido producido por el dispensador de alimento y comía rápidamente
el alimento que había en el recipiente, Skinner instalaba una palanca
y observaba la conducta de la rata. Algunas veces a medida que
exploraba el medio ambiente, la rata se paraba sobre sus patas
traseras y presionaba la palanca con el dispensador de alimento, de
tal forma que cuando la rata presionaba aquella, la comida caía en el
recipiente. En otras palabras si la rata presionaba la palanca, esta
respuesta era reforzada. En estas condiciones, la tasa de apretar la
palanca aumentaba en forma impresionante.
2.1.3.2.2. Reforzamiento Negativo
El reforzamiento negativo puede tomar varias formas y se puede
volver realmente complicado. Freud Keller (1941) realizo un estudio
sobre reforzamiento negativo muy simple utilizando una luz intensa
como estímulo aversivo. Keller mantuvo unas ratas en la obscuridad
por un periodo prolongado y posteriormente, encendía una luz intensa
periódicamente. Si usted alguna vez a despertado a alguien, a media
noche, con una luz intensa, sabrá que esto es un evento aversivo. Las
ratas estaban en una caja de Skinner modificada, en la que había una
palanca. Si apretaban esta, la luz se apagaba. La terminación de la
luz reforzaba negativamente la presión de la palanca. En la primera
ocasión que la luz de encendió la rata no emitió de inmediato la
respuesta necesaria sino después de varios ensayos en los cuales la
rata apretó la palanca casi tan pronto como se encendió la luz. A esta
forma particular de reforzamiento negativo se le llama entrenamiento
de escape, porque la conducta del organismo termina (o le permite
escapar) al estímulo aversivo.
2.1.3.2.3. Castigo Positivo
En los estudios de castigo positivo se ha utilizado toda suerte de
consecuencias aversivas para suprimir la conducta: nalgadas,
cosquillas y otros. Skinner (1938) fue uno de los primeros que
estudiaron en forma sistemática los efectos del castigo positivo. Como
primer paso, entreno a unas ratas, para que presionaran una palanca,
reforzando con alimento la presión de palanca. En seguida elimino el
procedimiento de reforzamiento y empezó a golpear a algunas ratas
(por medio de un movimiento hacia arriba, la palanca que golpeaba
las patas delanteras del animal) cada vez que presionaban la palanca.
2.1.3.2.4. Castigo Negativo
El castigo negativo se priva al organismo de algún estimulo positivo,
alimento o calor, por ejemplo que normalmente está disponible.
Charles Ferster (1958) desarrollo un tipo de castigo negativo llamado
tiempo fuera del reforzamiento o en forma abreviada, tiempo fuera. En
el tiempo fuera el organismo es retirado de una situación en la que
están disponibles los reforzadores. Ferster utilizo con éxito el tiempo
fuera en pichones y chimpancés, y desde entonces otros
investigadores lo han utilizado para suprimir diversas conductas en
toda clase de organismos.
2.1.3.2.5. Moldeamiento
La conducta supersticiosa demuestra el poder que pueden tener las
consecuencias sobre la conducta. Pero si el condicionamiento
instrumental depende del reforzamiento o castigo a la conducta que
sigue un organismo en un momento dado, ¿en qué forma puede
llegar a la adquisición de una conducta nueva? La respuesta se basa
en un procedimiento descrito inicialmente por Skinner (1938).
Suponga que hemos entrenado una rata para que presione una
palanca. En lugar de esperar a que la conducta deseada ocurriera
espontáneamente (cosa que podría no ocurrir jamás), Skinner
reforzaba cualquier conducta que se aproximara al acto deseado. El
proceso de reforzar aproximaciones cada vez más cercanas a la
respuesta deseada se llama moldeamiento. Mediante esta técnica es
posible que un organismo adquiera todo tipo de conductas.
Cada respuesta era moldeada por medio de reforzamientos
diferenciales de aproximaciones sucesivas. Desde entonces otros
psicólogos han entrenado animales de laboratorio para que realicen
cadenas de conductas todavía más complicadas. Tal vez parezca un
frivolidad enseñar a animales de laboratorio a realizar trucos
novedosos, pero este tipo de investigación ha posibilitado la mejor
comprensión del aprendizaje instrumental, el cual, a su vez se ha
aplicado benéficamente en las escuelas, hospitales y otros lugares.
2.1.4. Factores del condicionamiento instrumental
2.1.4.1. Intervalo respuesta- consecuencia
Jhonston (1972), y Logan (1960), señalan que el tiempo que pasa entre
un acto y sus consecuencias reforzantes o punitivas afecta la tasa de
condicionamiento instrumental. Generalmente mientras más breve sea el
intervalo, más efectiva será la consecuencia. Suponga por ejemplo que
está aprendiendo a andar en bicicleta. En este caso las consecuencias
que le llevan a usted a aprender son las experiencias que siente cuando
está en equilibrio (reforzadores) y las que siente cuando cae (estímulos
punitivos). Ahora suponga que padece de un desorden en el oído medio
que le impide descubrir pequeñas diferencias en el equilibrio. En teoría
usted aún puede aprender a andar en bicicleta si tiene cerca un apersona
que le grite ¡bien! Siempre que distribuya su cuerpo apropiadamente, y
que le grite ¡mal! Cuando esté en peligro de caer.
La principal diferencia entre las consecuencias naturales y artificiales
radica en que el primer caso las consecuencias suceden inmediatamente
a la conducta; en el último caso las consecuencias tardaran un poco.
Hasta donde sé, aun no se ha realizado un experimento de este tipo, pero
es probable que el aprendizaje proceda muy lentamente bajo tales
consecuencias demoradas.
2.1.4.2. Intervalo Entre Ensayos
El intervalo entre ensayos puede tener una variación muy grande en el
medio ambiente natural en el laboratorio. Por ejemplo, se puede colocar a
un gato en una caja de tipo Thorndike y regresarlo a ella inmediatamente
después de que escape; únicamente se dará el tiempo suficiente para el
reforzamiento. Un procedimiento alternativo sería el de separar los
ensayos proporcionando un intervalo de 10 minutos, digamos entre cada
ensayo.
Los efectos que tienen los intervalos entre ensayos sobre el aprendizaje
instrumental varían de experimento. Es difícil generalizar respecto, solo se
puede decir que los efectos dependen, probablemente o por lo menos
parcialmente del tipo de procedimiento de condicionamiento utilizado, y
quizá de la especie misma. Por ejemplo hay una prueba de que los
intervalos más largos funcionan mejor en el reforzamiento negativo
(Staveley 1966). En este último caso de intervalo entre ensayos
constituye la duración del reforzador de tal forma que este factor esta
combinado con el efecto de la magnitud del reforzador.
2.1.5. Características de la respuesta
Ciertas cualidades de la conducta que se va aprender afectan el curso del
condicionamiento. Resulta muy obvio que es más fácil aprender a caminar
sobre una viga de equilibrio que sobre un cable delgado. Puede estar menos
claro que la conducta que depende de los músculos lisos y las glándulas es
más difícil de modificar por medio del condicionamiento instrumental, que la
conducta que depende de los músculos estriados. No obstante si lo piensa
un poco se dará cuenta de que todos mis ejemplos de condicionamiento
instrumental han incluido la conducta controlada por los músculos estriados,
conducta que ordinariamente consideramos como voluntaria.
Se solía suponer que las así llamadas respuestas involuntarias, aquellas
controladas por el sistema nervioso autónomo, no podían ser modificadas
por medio de procedimientos instrumentales. Por ejemplo parecía un
absurdo creer que las personas podían aprender a regular su frecuencia
cardiaca o su presión sanguínea por medio del condicionamiento
instrumental. En la década de los sesentas, Neal Miller y Alfredo Carmona
(1967) utilizaron el condicionamiento instrumental para entrenar a un perro
para que salivara. No se esperaba que ocurriera esto, pero ocurrió.
Posteriormente, Miller y Leo DiCara (1967) se ocuparon del problema de
enseñar a las ratas a controlar su frecuencia cardiaca. A fin de garantizar
que los cambios en la frecuencia cardiaca no se debieran a que el animal
había aprendido a poner en tensión y a relajar ciertos músculos voluntarios
(en consecuencia, se alteraría indirectamente la frecuencia cardiaca),
aplicaron curare en las ratas (es decir, dieron a las ratas un derivado de la
droga llamada curare, que paraliza los músculos voluntarios). En seguida
Miller y DiCara reforzaron los cambios en la frecuencia cardiaca estimulando
un centro cerebral de placer, de la rata. Al principio los investigadores
reforzaron pequeños cambios en la frecuencia cardiaca que iban en la
dirección deseada; posteriormente exigieron desviaciones de la frecuencia
normal cada vez mayores. Durante un periodo de entrenamiento de 90
minutos, las ratas aprendieron a aumentar o disminuir su tasa cardiaca en un
promedio cercano a 20%.
2.1.6. Características de la consecuencia
La tasa de condicionamiento instrumental también se ve afectada por ciertas
características del estímulo reforzante o del punitivo. Algunas de estas
características son la magnitud, duración o intensidad del estímulo. Por
consiguiente, la efectividad de un reforzador o estimulo punitivo aumenta
conforme lo hace la intensidad de dicho reforzador o estimulo punitivo
(Church 1969 y Logan 1960).
Hobart Mowrer sostiene que las consecuencias fuertes producen efectos
colaterales de carácter emocional que pueden interferir con el aprendizaje.
El reforzamiento positivo con un estímulo reforzante poderos produce
felicidad. El reforzamiento positivo es un procedimiento muy seguro porque
produce efectos colaterales de carácter positivo. Sin embargo es posible que
las emociones positivas interfieran con el curso del aprendizaje. El maestro
que recompensa con felicitaciones a sus alumnos de cuarto año por portarse
bien durante un periodo de estudio, probablemente lograra buenos
resultados. Pero si anuncia que se les permitirá salir al recreo diez minutos
antes, las reacciones de júbilo harán imposible aprender algo durante la
siguiente lección.
El reforzamiento negativo produce alivio. Mientras más fuerte sea el estímulo
aversivo eliminado, mayor será el alivio. No obstante, la investigación de
Hans Selye sobre tensión (1956) indica que soportar estímulos aversivos
poderosos exige un esfuerzo considerable; el uso de estos estímulos puede
producir fatiga y su remoción en el reforzamiento negativo puede verse
acompañada de falta de actividad mientras el organismo se recupera. La
inactividad puede interferir con el aprendizaje subsiguiente. Si por ejemplo
un procedimiento de escape es seguido inmediatamente de un periodo en el
que presionar una palanca es reforzado positivamente, el animal, tal vez
pase el tiempo recuperándose y no aprenda a presionar palanca.
El castigo puede producir efectos colaterales particularmente problemáticos.
El castigo positivo ira o temor. Si se utilizan estímulos aversivos poderosos,
la ira o temor pueden inhibir el aprendizaje. El perro normalmente dócil
puede atacar a su amo si este lo golpea mucho; un niño se puede volver
excesivamente tímido y nervioso si el castigo paterno es demasiado severo.
Mowrer considera que el castigo negativo produce su propia forma especial
de reacción emocional: desengaño o depresión. Un ejemplo es de la
depresión que aparece después de una perdida repentina de ingresos
económicos. Es obvio que esta depresión no conduce al aprendizaje. El
resultado final de todo esto es que las consecuencias que son
extremadamente débiles o las que son extremadamente fuertes pueden
resultar inefectivas en lo que se refiere al condicionamiento instrumental.
Generalmente son mejores las consecuencias moderadas.
2.1.7. Nivel De Privacion
Otro factor de condicionamiento instrumental, especialmente cuando
intervienen los reforzadores primarios, es una cosa llamada privación.
Resulta muy obvio que el alimento actuara como reforzador en el animal
hambriento, pero no en el que apenas consumió su porción. La diferencia es
aquel que ha sido privado del alimento por cierto tiempo, digamos doce
horas. De la misma forma, una rata esta sedienta según el periodo
especifico en que se le haya privado el agua, y estará bien privada sino ha
tenido acceso a su pareja sexual, por cierto periodo. La efectividad de un
reforzador primario como el alimento, el agua o el sexo varia, según el
periodo de privación de ese reforzador. En general mientras mayor sea el
nivel de privación con mayor rapidez procederá el aprendizaje. El animal
excesivamente hambriento puede estar demasiado débil como para emitir
las respuestas necesarias, o puede comportarse de una manera muy
excitada. El aprendizaje procede más rápidamente conforme aumenta el
nivel de privación, pero después de cierto punto, los aumentos en la
privación pueden impedir el aprendizaje.
Es mucho menos claro el papel que juega la privación en la determinación
de la potencia de los reforzadores secundarios. Parece ser que en el estudio
de Baer, que se describió anteriormente, las caricaturas se volvían menos
reforzantes conforme se repetía su presentación. De la misma forma una
calificación de A puede resultar un reforzador más poderoso para el
estudiante que normalmente obtiene una C que para el que normalmente
obtiene una B. sin embargo la potencia de los reforzadores secundarios no
parece variar tanto con la privación como los reforzadores primarios. Si se
utiliza alimento como reforzador, el organismo debe estar privado de él
durante cierto tiempo; si el elogio es el reforzador, la privación puede ser de
ayuda (Gewirtz y Baer 1958) pero de ninguna manera es esencial.
2.1.8. Programa De Reforzamiento O De Castigo
Se llama programa de reforzamiento o programa de castigo al patrón de
consecuencias de la respuesta. La mayor parte de la investigación en esta
área ha acatado con programas de reforzamiento, por lo que me concentre
en ese problema. El aprendizaje instrumental se ve poderosamente afectado
por el programa de reforzamiento. En el medio ambiente natural es común
que los programas de reforzamiento sean extremadamente complicados,
pero en el laboratorio pueden dividirse en dos tipos principales.
Si una respuesta particular es reforzada cada vez que ocurre, se dice que
está bajo reforzamiento continuo o RFC. El reforzamiento continuo conduce
a un incremento muy rápido en la probabilidad de una respuesta. La
adquisición de una conducta nueva, especialmente de cadenas de respuesta
complejas, es mejor cuando se utiliza reforzamiento continuo. Por ejemplo,
podríamos comprobar que resulta más difícil entrenar a una rata para que
recoja una canica sino reforzamos cada aproximación a esa respuesta.
Cuando una conducta particular es reforzada es unas ocasiones, pero no lo
es en otras, se dice que está bajo reforzamiento parcial o en un programa de
reforzamiento intermitente.
2.1.9. Generalización y discriminación del estimulo
Se llama estimulo discriminativo al estímulo que indica si una respuesta será
reforzada o castigada. El signo de ‘’entrada’’ colocado en una puerta es un
estímulo discriminativo que nos dice que el intento de entrar a la tienda por
esa puerta será reforzado; la señal de alto es un estímulo discriminativo que
nos dice que seremos castigados (por un accidente o con una multa) sino
nos detenemos.
Es probable que Skinner (1938) haya sido el primero que reconoció la
importancia de los estímulos discriminativos para el aprendizaje
instrumental: ‘’aunque la respuesta puede manifestarse libremente en un
número muy grande de situaciones de estimulación, solo será efectiva si
produce el reforzador en una pequeña parte de ellas. La situación favorable
generalmente está señalada de alguna manera. (El organismo) termina por
responder siempre que esté presente un estímulo que ya estuvo presente
cuando aconteció un reforzamiento anterior, y a no responder cuando este
no es el caso’’.
2.1.10. Generalización y discriminación de la respuesta
La primera vez que un rata presiona una palanca lo puede hacer de muy
diferentes forma desplazándola hacia abajo con la nariz o con la barbilla;
dejando caer las patas delanteras sobre ella; sentándose o golpeándose con
una pata trasera mientras se rasca el lomo. No importa la forma en que
realice la hazaña, la presión de la palanca será seguida del reforzador.
Después de varios reforzamientos el método de la rata para presionar la
palanca habrá cambiado un poco. Por ejemplo, podría ser que siempre con
las patas delanteras. Pero siempre existirá cierta variabilidad en la
respuesta: una vez puede presionarla vigorosamente con las patas
delanteras, después hacerlo ligeramente con las mismas patas y luego
dejarse caer sobre ella también con las mismas patas. El mismo estimulo (la
palanca) puede determinar una de varias respuestas posibles. A este
fenómeno se le llama generalización de la respuesta.
Quizá porque en los experimentos típicos de laboratorio la generalización de
la respuesta es un fenómeno efímero, los psicólogos no le han puesto
mucha atención. Lo que invariablemente sucede es que la variación de la
respuesta disminuye. Regresemos a nuestra rata: después de varios
reforzamientos adicionales, la rata se vuelve cada vez más eficiente para
presionar la palanca. Finalmente puede suceder que se coloque a un lado
de la palanca (el lado más cercano al recipiente del alimento), la apriete con
una pata delantera y aplique la cantidad mínima de presión necesaria para
operar el mecanismo de alimentación. La amplitud de respuesta se hace
cada vez más pequeña y se dice que se ha dado lugar a la discriminación de
la respuesta o diferenciación de la respuesta.
2.1.11. Modificación de la conducta condicionada instrumentalmente
No siempre es benéfico el aprendizaje que ocurre por medio del
condicionamiento instrumental. El niño que aprende a captar la atención de
los demás llevando a cabo peligrosas cabriolas se puede romper el cuello; el
dueño de un perro que aprende a aullar cuando es atado puede venderlo a
otra persona. Cuando llega a suceder que el condicionamiento instrumental
de lugar a conductas inapropiadas, surge la siguiente pregunta: ¿Cómo se
puede modificar esta conducta?. Tal como fue el caso en el
condicionamiento clásico, se puede olvidar la conducta adquirida por medio
del condicionamiento
2.1.11.1. La Conducta:
Sinónimo de comportamiento, con dicho término nos referimos a las
acciones y reacciones del sujeto ante el medio, la respuesta del
organismo considerado como un todo en este caso: presionar la
palanca, mantener una conducta, resolver un problema, es decir,
respuestas al medio en las que intervienen varias partes del organismo y
que adquieren unidad y sentido por su inclusión en un fin.
2.1.11.2. Tipos de conducta:
Conducta de adaptación: Respuesta encaminada a evitar o reducir la
tensión, escapar de ella o afrontar una fuente determinada de tensión.
Conducta anormal: La conducta se considera anormal cuando se
caracteriza por notorias deficiencias de autocontrol, de
funcionamiento social o cognoscitivo o por angustia incontrolable.
Conducta establecida por el sexo: Pautas conductuales
características de los machos y las hembras.
Conducta estereotipada: Conducta ocasionada por un conflicto, varía
poco, tiene una cualidad ritual y raramente es modificada por sus
consecuencias.
Conducta psicopática (personalidad antisocial): Desorden de la
personalidad caracterizada por pautas conductuales que hacen que
las personas estén en conflicto con la sociedad. Los psicópatas
desdeñan los derechos de otros, se comportan como egoístas, actúan
para obtener su propia satisfacción inmediata y parecen olvidarse de
las consecuencias de su conducta.
Conducta refleja: Conducta provocada automáticamente por
estímulos del ambiente. Una respuesta rápida, congruente y no
aprendida que, en circunstancias ordinarias, no está sujeta al control
voluntario.
Valdemar y Miranda (2008). “Parte o manera con las que las personas
gobiernan su vida y dirigen sus acciones. Es la actividad parcial o
global de una persona especialmente la que puede observarse
automática”.
Narcizo Pizarro (1998). La conducta es la sucesión de estados de un
organismo bilógico individual que se produce en un contexto
delimitado.
Skinner (1984). La conducta se entiende como: “el movimiento de un
organismo o de alguna de sus partes en un marco de referencia
provisto por el mismo organismo o por varios objetos externos o
campos de fuerza”.
2.2. Marco Conceptual
Conducta: Skineer (1984). “el movimiento de un organismo o de alguna de
sus partes en un marco de referencia provisto por el mismo organismo o
por varios objetos externos o campos de fuerza.”
Moldeamiento.- es un procedimiento mediante el cual se desarrollan
nuevas conductas, a través del reforzamiento sistemático de
aproximaciones sucesivas hacia el objetivo conductual.
Encadenamiento.- es la formación de una conducta compuesta a partir
de otras más sencillas que ya figuran en el repertorio del individuo,
mediante el reforzamiento de sus combinaciones.
MARCO METODOLÓGICO
a)
CAPÍTULO III:
3.1. Hipótesis:
Al aplicar la técnica de moldeamiento y encadenamiento entonces se establecerá la conducta compleja de picoteo operante en una paloma castilla.
3.2. Variables:
3.2.1. Definición Conceptual:
Variables de control:
Sexo : macho
Edad : 3 meses
Mortalidad del sujeto : Se trabajará con dos sujetos paralelamente en
caso que uno muera o escape.
Peso : se trabajará con un peso experimental equivalente al 300% del
peso libre, el que será controlado y registrado diariamente.
Alimentación : Se le dará el alimento balanceado consistente en maíz
chancado que será pesado y registrado a diario
Estado de privación : 23 horas antes de la sesión, se le retira al sujeto el
alimento (la mitad de su ración habitual), que será utilizada como
reforzador de las conductas deseadas.
Estado de salud : Se asegurará su óptimo estado de salud llevándole al veterinario,
colocándole sus vacunas y dándole vitaminas de ser necesario
Higiene : Limpieza de su jaula vivienda, su caja de transporte.
Duración de las sesiones : Se trabajarán sesiones de 30 minutos cada
una con una frecuencia de 2 veces por semana, dejando al menos un
día de descanso entre cada sesión.
Estímulos visuales: Los experimentadores utilizarán chaqueta blanca al
manipular al sujeto, evitaran usar joyas o artículos con brillo; el
ambiente experimental mantendrá una iluminación tenue e indirecta
Estímulos auditivos : Se apagarán los celulares, se evitarán ruidos fuertes
que perturben a los sujetos experimentales.
Estímulos olfativos : Los experimentadores dejarán de usar productos con
aroma fuerte, se lavarán las manos con jabón neutro antes de
manipular al sujeto.
3.2.2. Operacionalización De Variables
3.2.3. Independiente
Moldeamiento:
El moldeamiento es una técnica mediante la cual se adquieren conductas ausentes o presentes muy vagamente en el repertorio conductual del sujeto (Méndez y Olivares, 2001).
EncadenamientoLa técnica del encadenamiento supone descomponer una conducta compleja en conductas sencillas, de manera que cada una de ellas suponga un eslabón de la cadena. La adquisición de la conducta se produce mediante el reforzamiento de los “eslabones”, los cuales son estímulos reforzadores para la respuesta anterior y estímulos discriminativos (ED) para la siguiente. El procedimiento para encadenar conductas complejas se denomina aproximaciones sucesivas. Tal como ejemplifica Larroy (2008, p. 299).Consiste en recompensar al sujeto tras la realización de una serie de conductas engarzadas unas con otras, formando una cadena natural de actividades.
3.2.4. Dependiente
Conducta compleja
SKINNER: En muy poco tiempo entreno a una paloma para que picoteara en
un lugar específico de la jaula. La probabilidad de que lo hiciera de forma
espontánea era mínima. Al principio Skinner la reforzaba con alimento
cuando volteaba hacia ese lugar. Después se demoró el reforzamiento hasta
que la paloma efectuara un movimiento hacia ese sitio por ligero que fuera. A
continuación solo reforzó los movimientos que acercaban a la paloma al
lugar. Después solo le proporciono recompensa cuando dirigía la cabeza en
esa dirección y por ultimo solo cuando tocaba el lugar con el pico
3.3. Metodología
3.3.1. Tipo de estudio
La investigación es de tipo experimental3.3.2. Diseño
Se utilizará el diseño Univariable Bicondicional, cuyo esquema es: A – B.
Dónde:A = Línea BaseB = Fase de Modificación de Conductas
3.4. Población ,muestreo y muestra
Se trabajará con un sujeto experimental de la especie castilla de 3 meses de edad. Es de sexo macho y mantiene un peso experimental de 250 gramos.
3.5. Técnicas e instrumentos de recolección de datos: validación y confiablidad:
Técnicas operantes: Moldeamiento:
Procedimiento en el que se refuerzan las aproximaciones sucesivas a una conducta meta.
Para que el reforzamiento tenga lugar, es necesario la ocurrencia de una conducta previa.
Cierta conducta traerá determinado refuerzo que a su vez se dispensará solo ante tal conducta.
La conducta según el moldeamiento es cualquier actuación ostensible ante la cual el ambiente responde fiablemente, así pues la conducta es una operante cuyas consecuencias es el refuerzo.
Encadenamiento: Es la formación de una conducta compuesta a partir de otras más
sencillas que ya figuran en el repertorio del individuo, mediante el reforzamiento de sus combinaciones, buscando su conjunto en orden a un fin determinado.
En las cadenas conductuales cada una de las respuestas produce el estímulo discriminativo de la siguiente en la cadena.
sucede también que cada eslabón en la cadena se establece mediante el uso de reforzadores condicionados que van estableciéndose a lo largo del procedimiento mismo de encadenamiento.
Instrumento: Registro. Registro Anecdótico Registro experimental y de peso libre.
RESULTADOS
CAPÍTULO IV:
4.1. Descripción de resultados
Tabla N° 01: Frecuencia de emisiones de la conducta de picoteo de
operante en la fase A.
Nº de Sesión Frecuencia de P.O01 0202 0503 1804 0105 0506 1007 1708 2909 31
TOTAL 118
En la tabla Nº 1 observamos que en la Fase “A” de Línea Base, se puede apreciar que el sujeto experimental si emitió conducta compleja de picoteo de operante en las sesiones, obteniendo un total 118 PO.
Gráfico:
1 2 3 4 5 6 7 8 90
5
10
15
20
25
30
35
25
18
1
5
10
17
2931
Nº de Sesión Frecuencia de P.O
Tabla Nº 02: “Frecuencia de Emisiones de Husmeo y Ascicalamiento en la Fase A”.
Nº de Sesión F. de Husmeo F. de Ascicalamiento
01 04 03
02 13 05
03 46 10
04 24 19
05 30 07
06 23 23
07 19 16
08 18 0109 37 04
TOTAL 214 88
Interpretación:
En la tabla Nº 2 observamos que en la Fase “A” de Línea Base, durante las primeras sesiones la conducta husmeo fue escasa, pero a medida que se iba avanzando con el entrenamiento del sujeto, la frecuencia también aumento, llegando así a obtener un total de 214 en husmeo. Por otro lado en la conducta de ascicalamiento, en su inicio fue escasa pero a medida que iba avanzando el contacto con la caja experimental se fue desenvolviendo, aumentando así en cada sesión obteniendo un total de 88 ascicalamientos.
Gráfico:
1 2 3 4 5 6 7 8 90
5
10
15
20
25
30
35
40
45
50
4
13
46
24
30
2319 18
37
35
10
19
7
23
16
14
Nº de Sesión F. de Husmeo F. de Ascicalamiento
Tabla Nº 03: “Frecuencia de conductas de Picoteo del Operante la Fase B”
Nº de Sesión Frecuencia de P.O01 1502 8203 5604 7605 10606 6207 8008 1009 91
TOTAL 578
Interpretación:
En la tabla Nº 03 observamos que en la Fase “B” de Moldeamiento y Encadenamiento, se puede concluir que la frecuencia de la conducta compleja de Picoteo del Operante ha ido en aumento, a medida que iba avanzando el entrenamiento del sujeto, llegando así a obtener un total de 578 PO.
Gráfico:
1 2 3 4 5 6 7 8 90
20
40
60
80
100
120
15
82
56
76
106
62
80
10
91
Nº de Sesión Frecuencia de P.O
Tabla Nº 04: “Frecuencia de Emisiones de Husmeo y Ascicalamiento en la Fase B”
Nº de Sesión F. de Husmeo F. de Ascicalamiento
01 22 15
02 11 03
03 09 06
04 02 02
05 04 01
06 08 11
07 11 0
08 29 17
09 15 05
TOTAL 111 60
Interpretación:
En la tabla Nº 04 observamos que en la Fase “B” De Moldeamiento y Encadenamiento obtuvo un total de 111 en la conducta de husmeo. Por otro lado en la conducta de ascicalamiento obtuvo un total de 60.
Gráfico:
1 2 3 4 5 6 7 8 90
5
10
15
20
25
30
35
22
119
24
811
29
1515
36
2 1
11
0
17
5
Nº de Sesión F. de Husmeo F. de Ascicalamiento
Tabla Nº 05: “Comparación de la emisión de la conducta de Picoteo Operante entre la Fase A y la Fase B”
FASE “A” FASE “B”N° Sesiones Frecuencia
conductual % N°
SesionesFrecuencia conductual
%
01 02 2 % 1 15 3 %02 05 4% 2 82 14%03 18 15% 3 56 10%04 01 1% 4 76 13%05 05 4% 5 106 18%06 10 8% 6 62 11%07 17 14% 7 80 14%08 29 25% 8 10 2%09 31 27% 9 91 15%
TOTAL 118 100% TOTAL 578 100%
Interpretación:
En la tabla Nº 05 observamos que en la Fase “A” de Línea Base, durante las sesiones la conducta de PO ha sido regular, llegando así a obtener un total de 118 PO. En la fase “B” la conducta compleja de Picoteo de Operante ha ido aumentando favorablemente de manera muy notoria registrando así un total de 578 PO.
Gráfico:
1 2 3 4 5 6 7 8 9
2 5
18
1 510
17
29 31
0.02 0.04 0.15 0.01 0.04 0.08 0.14 0.25 0.27
15
82
56
76
106
62
80
10
91
0.03 0.14 0.1 0.13 0.18 0.11 0.14 0.02 0.15
“Comparación de la emisión de la conducta de Picoteo Operante entre la Fase A y la Fase B”
FASE “A” Frecuencia conductual FASE “A” %FASE “B” Frecuencia conductual FASE “B” %
Tabla 06: Comparación de la emisión de la conducta de Husmeo y Ascicalamiento entre la Fase A y la Fase B.
FASE “A” FASE “B”N°
SesionesF.
Husmeo% F.
Ascicalamiento% N°
SesionesF. Husmeo
% F. Ascicalamiento
%
01 04 2% 03 3% 01 22 20% 15 25%02 13 6% 05 6% 02 11 10% 03 5%03 46 21% 10 11% 03 09 8% 06 10%04 24 11% 19 22% 04 02 2% 02 3%05 30 14% 07 8% 05 04 3 % 01 2%06 23 11% 23 26% 06 08 7% 11 19%07 19 9% 16 18% 07 11 10% 0 0%08 18 9% 01 1% 08 29 26% 17 28%09 37 17% 04 5% 09 15 14% 05 8%
TOTAL 214 100% 88 100% TOTAL 111 100% 60 100%
Interpretacion:
En la tabla Nº 06 observamos que en la Fase “A” durante las sesiones las conductas de husmeo obtenemos un total de 214 y en ascicalamiento tenemos un total de 88, a comparación de la fase “B” de Moldeamiento y Encadenamiento, donde las conductas de husmeo obtiene un total de 111 y en ascicalamiento un total de 60 lo cual demuestra que ha disminuido notoriamente, particularmente en la conducta de husmeo, esto se debe por el entrenamiento y refuerzo hacia la conducta compleja de Picoteo Operante.
Grafico
4.2.
Contrastación de Hipótesis.
4.2.1.Presentar las Hipótesis Ho (Nula) H1 (Alterna Ha)
Ho: “El moldeamiento y encadenamiento no tienen efectos sobre la
conducta compleja de picoteo del operante en una paloma castilla”.
H1: “El moldeamiento y encadenamiento tienen efectos sobre la conducta
compleja de picoteo del operante en una paloma castilla”.
Con esto podemos concluir que se acepta la hipótesis alternativa, ya que
el moldeamiento y encadenamiento si tiene efecto en la conducta compleja
de picoteo operante en una paloma castilla.
1 2 3 4 5 6 7 8 9
2%
6%
21%
11%14%
11%9% 9%
17%
3%6%
11%
22%
8%
26%
18%
1%
5%
20%
10%8%
2% 3%
7%10%
26%
14%
25%
5%
10%
3% 2%
19%
0%
28%
8%
Comparación de la emisión de la conducta de Husmeo y Ascicalamiento entre la Fase A y la Fase B
FASE “A” F. Husmeo FASE “A” F. AscicalamientoFASE “B” F. Husmeo FASE “B” F. Ascicalamiento
DISCUSIÓN
CAPÍTULO V:
En el presente trabajo de investigación sobre “Efectos del Moldeamiento y
Encadenamiento sobre la conducta compleja de picoteo del operante en una
paloma castilla”, se detectó que cuando se aplica el refuerzo (comida), se
incrementa la conducta compleja picoteo del operante, veamos los resultados en
base a los tablas.
En la tabla Nº 1 observamos que en la Fase “A” de Línea Base, se puede
apreciar que el sujeto experimental si emitió conducta compleja de picoteo de
operante en las sesiones, obteniendo un total 118 PO.
En la tabla Nº 2 observamos que en la Fase “A” de Línea Base, durante las
primeras sesiones la conducta husmeo fue escasa, pero a medida que se iba
avanzando con el entrenamiento del sujeto, la frecuencia también aumento,
llegando así a obtener un puntaje total de 214 en husmeo. Por otro lado en la
conducta de ascicalamiento, en su inicio fue escasa pero a medida que iba
avanzando el contacto con la caja experimental se fue desenvolviendo,
aumentando así en cada sesión obteniendo un total de 88 ascicalamientos.
En la tabla Nº 03 observamos que en la Fase “B” de Moldeamiento y
Encadenamiento, se puede concluir que la frecuencia de la conducta compleja de
Picoteo del Operante ha ido en aumento, a medida que iba avanzando el
entrenamiento del sujeto, llegando así a obtener un total de 578 PO.
En la tabla Nº 04 observamos que en la Fase “B” De Moldeamiento y
Encadenamiento obtuvo un total de 111 en la conducta de husmeo. Por otro lado
en la conducta de ascicalamiento obtuvo un total de 60.
En la tabla Nº 05 observamos que en la Fase “A” de Línea Base, durante las
sesiones la conducta de PO ha sido regular, llegando así a obtener un total de
118 PO. En la fase “B” la conducta compleja de Picoteo de Operante ha ido
aumentando favorablemente de manera muy notoria registrando así un total de
578 PO.
En la tabla Nº 06 observamos que en la Fase “A” de Línea Base. Durante las
sesiones las conductas de husmeo obtenemos un total de 214 y en
ascicalamiento tenemos un total de 88, a comparación de la fase “B” de
Moldeamiento y Encadenamiento, donde las conductas de husmeo obtiene un
total de 111 y en ascicalamiento un total de 60 lo cual demuestra que ha
disminuido notoriamente, particularmente en la conducta de husmeo, esto se
debe por el entrenamiento y refuerzo hacia la conducta compleja de Picoteo
Operante.
Todo este proceso de investigación con la paloma castilla lo podemos dar a
conocer en base a lo dicho por, Benjumea Y García (Lima, 1998), los cuales
entrenaron a unas palomas, mediante un arreglo de discriminación condicional en
donde ellas fueron capaces de realizar las conductas esperadas (rojo= picar a la
izquierda, verde= picar a la derecha). Lo cual se demostró que mediante la
aplicación de refuerzos y la discriminación condicional, se obtuvo la conducta
meta.
Según Morris, (1992) dice que el reforzamiento es la presentación de un estímulo
que aumenta la probabilidad de que la respuesta precedente se repita en el
futuro, y según la investigación que hemos realizado sobre “Efectos del
Moldeamiento y Encadenamiento sobre la conducta compleja de la picoteo del
operante en una “paloma castilla” se ha podido constatar que a más frecuencia de
que un reforzador se le presente al sujeto por una conducta deseada, más
frecuente será la emisión de la conducta compleja por parte de la paloma castilla
(Ver cuadro y gráfico N° 05). Es por ello que analizando el cuadro N° 05 podemos
constatar que el sujeto al realizar las conductas deseadas y presentándole el
reforzador (comida) el proceso para adquirir la conducta compleja fue
aumentando, llegando en la sesión N° 09 de la Fase “B” a realizar las conducta
compleja de Picoteo del operante, que posteriormente se fue incrementando con
la práctica y con el aumento del reforzador (comida) cuando el sujeto realizaba la
conducta deseada.
CONCLUSIONES
CAPÍTULO VI:
El sujeto experimental logro aprender la conducta compleja de picoteo
operante aplicándosele el reforzador primario (maíz molido) en forma
contingente.
La tasa de respuestas fue aumentando de acuerdo al número de sesiones
que realizábamos.
El encadenamiento de conductas se logra gracias a la presencia de
estímulos discriminativos visuales, que tienen la función de ser
reforzadores secundarios.
Los resultados obtenidos corroboran la hipótesis planteada, es decir el
sujeto experimental si puede picotear el conmutador verde, el conmutador
amarillo, y por último el conmutador rojo, lo cual con cada conducta que
realice va recibiendo un reforzador (maíz molido) dentro de la caja
experimental de Skinner.
El moldeamiento de conductas se realiza por aproximaciones sucesivas del
sujeto experimental a la conducta objetivo.
Se logró controlar algunas variables extrañas como el ruido, olores,
colores; lo cual fue apropiado para el proceso y el final de nuestro trabajo
experimental ya que podemos obtener un mejor rendimiento de las
conductas de los sujetos.
RECOMENDACIONES
CAPÍTULO VII:
No se aconseja que si el experimentador tiene alguna
preocupación, problema, depresión cargue al sujeto, ya que es muy
sensible y percibe con facilidad.
Los experimentadores deberán organizar su tiempo, para
determinar el horario adecuado en el que se deban realizar las
sesiones con el sujeto experimental y cumplir con el horario que se
haya predeterminado para cada sesión, ya que de esa manera se
podrán obtener resultados satisfactorios.
Es recomendable que el sujeto experimental tenga la edad de 03
meses exactos, ya que esto permitirá que su aprendizaje sea más
rápido. permitiendo así hacer el experimentar buenos resultados.
El sujeto experimental no debe de tener una experiencia previa.
REFERENCIAS BIBLIOGRÁFICAS
CAPÍTULOVIII:
Anexos