aprendizaje

Download aprendizaje

If you can't read please download the document

Upload: tui-terr

Post on 28-Dec-2015

11 views

Category:

Documents


0 download

TRANSCRIPT

Aprendizaje

CAP2 Condicionamiento clasico

Thorndike asociacion E RPavlov asociacion E E, la RC elicitada por medio del EI por el EC

El condicionamiento normalmente es por asociacion de EC EI, a veces por E-R

Respuesta emocional condicionada (REC)- como el estimulo condicionado altera la actividadEC no predice descarga supresion valor 0,5Si se suprime la conducta durante el EC Valor 0Cuanto mas baja es la razon de supresion mas paralizado esta el animal durante el EC

Seguimiento del signo o automoldeamientoEl EC tiene que tener una localizacion precisa para que se produzca seguimiento, aunque se encuente alejadaEl comedero se activa tras la iluminacion de una tecla, haga lo que haga la palomaLa RC picotear dicha tecla, aunque este hecho no tiene efectoiluminacion de tecla no relacionada con la comida, no tiene efecto

Aversion al saborPuede acquirirse una fuerte aversion incluso con un solo emparejamientoy aunque transcurra horas entre la exposicion al sabor y el malestar

Condicionamiento pavloriano excitatorioSe presenta un EC seguido de un EIEl EI puede ser apetitivo o aversivoSe adquiere mejor cuando el EC ocurre antes que el EIIntervalo entre estimulos Intervalo de tiempo entre el comienzo del EC y el comienzo del EIIntervalo entre ensayos Intervalo entre final de un ensayo y el comienzo del siguienteIntervalo entre estimulos tiene que ser mas corto que el intervalo entre ensayos

Condicionamiento de demora El EC sigue presente al menos hasta la aparicion del EIEl EC puede seguir presente, o terminar cuando aparece el EICondicionamiento palpebral 0,4sg, apenas condicionamiento tras 2 o 3 sgSupresion condicionada intervalo optimo mas amplio 10sgAversion al sabor entre EC y EI 1 o 2 horasCondicionamiento de huella El EI no se presenta hasta cierto tiempo despues de la terminacion del EC Intervalo de huella Tiempo transcurrido entre final del EC y comienzo del EICondicionamiento simultaneo EC y EI se presentan a la vez y tienen la misma duracionLa RC obtenida es escasaCondicionamiento hacia atrs El EI seguido tras el ECEl sujeto trata al EC como seal no EIproduce escasa RCEnsayo de prueba Presentacion de EC sin EIImprescindible para condicionamiento simultaneo y/o hacia atras Suele hacerse al final de la prueba, aunque se puede hacer durante la misma

Magnitud Cantidad de conducta que se esta dandoProbabilidad frecuencia que aparece la RC cuando se presenta el ECLatencia Rapidez con la que aparece la RC cuando se presenta el EC

Pseudocondicionamiento la respuesta se da por procesos distintos al condicionamientoSensibilizacion Proceso de aprendizaje no asociativo por la presentacion repetitivade un estimulo en solitario y este cada vez produce mas respuesta

Si en el proceso de control aleatorio ocurre por casualidad emparejamiento EC EI al comienzo de la sesion, hay que solucionarlo con control pseudoaleatorio

Condicionamiento inhibitorio aprender cuando no va a presentarse un EIpara que se desarrolle inhibicion condicionada, se necesita un contexto excitatorioAprenden a responder ante un EC+ que se presenta solo y no ante un EC+EC-El EC- se ha convertido en seal de ausencia EIEl condicionamiento de huella da lugar a condicionamiento inhibitorio si el intervalo de huella es de gran tamaoMedir inhibicion condicionada solo en sistemas de conducta bidireccionalSi no son bidireccionales - Prueba del estimulo compuesto o sumacion- presentacion conjunta de un estimulo inhibitorio con un estimulo excitatorioSi el EC es inibitorio debera reducir la RCEl estimulo excitatorio se asocia a un estimulo neutroPrueba del retraso en la adquisicion un estilo que se ha convertido en inhibitorio necesitara mas ensayos de emparejamiento con el EI para conseguir el mismo grado que un estimulo neutroNO es un procedimiento de inhibicion condicionadaExtincion Ya no se presenta el EI tras el ECDescenso de una respuesta previamente aprendidaNo supera la prueba de sumacion, ni la del retraso del condicionamientoCuando se empareja de nuevo el EC-EI condicionamiento muy rapidoSi se somete a una prueba de sumacion se puede obtener una mayor RCDurante la extincion no se elimina la asociacion EC-EI, sino que se aprende EC ausencia EIRecuperacion espontanea Si pasa un tiempo sin contacto con el EC y el Ei tras la fase de extincion, y de nuevo presentamos el EC, la RC se recobra espontaneamente Renovacion de RC si el cambio de contexto en la prueba es distinto al de extincionla extincion es relativamente especifica del contexto donde se aprendela excitacion condicionada se generaliza mas facilmente a otros contextosRestablecimiento dew la excitacin condicionada ocurre si se presenta el EI en solitario tras la extincion

Condicionamiento con drogas Freuentemente la RC es opuesta a la de la RIFunciona de manera que contrarresta el efecto de la droga que se va a presentarseLas claves ambientales se convierten en EC que provocan una RC compensantoria, generando tolerancia

Tema 3

El EI suele ser comida, descargas o malestar estomacalQue el EI sea un estimulo biologicamente significativo y el EC un estimulo neutro es condicion necesaria, pero no suficiente para el condicionamiento

Un EC o EI intenso acelera el aprendizaje y mayor expresion de la RCLos EI son intensos y salientes por naturaleza

EI de distinta intensida pueden hacer que la amplitud de respuesta sea distinta o que varie la forma de la respuestaUtilizar dos EI aversivos simultaneos crea un condicionamiento mas fuerte A partir de cierta intensidad o saliencia no hay variacion (tiene su nivel maximo)

Con los estimulos novedosos reacciones mas intensasEfecto de preexposicion = ausencia de novedadUn EC preexpuesto retrasa la adquisicion de la asociacion EC-EI posterior Preexposicion el EI el aprendizaje se vera dificultadoLa inhibicion latente promueve la seleccin de los estimulos necesaria para el aprendizaje rapidoHabituacion =disminucion de respuestasinhibicion latente = retraso en un aprendizaje posterior interferencia asociativa Si el EC o el EI son expuestos previamente, su capacidad asociativa disminuira al emparejarse con estimulos nuevos

El tipo de estimulo (su naturaleza) determina el condicionamiento y la RC que tendra lugarQue la RC se parezca a la RI es mas adaptativo que si no lo fueraLa modalidad sensorial del EC determina la forma de la RCRatas expuestas a un tono= movimiento de cabezaratas expuestas a la luz = ponerse de pieLas palomas procesan mejor los colores que la localizacion espacial del ECanimales expuestos a descagas suprimen mas lamer ante un estimulo audiovisual que ante uno gustativosi son expuestos a un malestar gastrico suprimen lamer ante un estimulo gustativo que ante uno audiovisualLas palomas asocian EI alimenticios con estimulos visuales, y descargas con E auditivosUn EC neutro no tiene carcter biologicoPavlov para que el condicionamiento tenga lugar el EC tiene que tener menos fuerza biologica que el EIInvestigaciones actuales- El condicionamiento se puede dar con estimulos de igual fuerza biologica, e incluso sin fuerza alguna

Condicionamiento de segundo orden dos estimulos con distinta fuerza biologicaUn EC neutro, expuesto a un condicionamiento con un EI, puede hacer las veces de EICondicionamiento de primer orden EC-EIContracondicionamiento Condicionamiento de 2 estimulos con fuerza biologicaUn EC emparejado con un EI puede emparejarse con un EI diferente o incluso opuestoPuede variar la RC que tiene lugar La nueva asociacion aprendida no borra del todo el aprendizaje originalLa RC inicial puede aparecer un tiempo despues o en un contexto distinto

Precondicionamiento sensorial Dos estimulos sin fuerza biologica Problema Ausencia de Una RC medible Para ello en la 2 fase del procedimiento se empareja el EC1 con un EI aversivo o apetitivo para que de una RC. Si el aprendizaje EC1-EC2 ha dado lugar , el EC2 provocara una respuesta similar a la mostrada por el EC1 tras su emparejamiento con el EI

Intervalo EC EI Respuesta mas debil cuando el intervalo EC EI es mayorintervalo corto, conducta orientada al ECIntervalo largo, conducta orientada al EIIntervalo entre ensayos (IEE)- mejor condicionamiento con ensayos distanciados entre si

El emparejamiento de un EC y un EI no siempre da lugar a condicionamientoContingencia positiva mayor que 0contingencia nula 0contingencia negativa menor de 0Si el EI siempre aparece en ausencia del EC y nunca en su presencia - -1

Competicion de claves Ensombrecimiento 2 EC presentes de forma simultanea, ambos compiten para ser el mejor predictor del EIEl EC2 ensombrece al EC1, consecuencia: menor RC frente al EC1 que ese mismo EC en un grupo de control

Modelo Rescola Wagner La fuerza asociativa entre EC y EI aumenta por cada ensayo, hasta que el EC predice completamente el EI y deja de ser sorprendenteSaliencie entre EC y EI valor minimo 0 maximo 1, normalmente EC 0,5 EI 1Magnitud 1, o no tener lugar 0, asociado con maximo superiorr de la curva de aprendizaje, ose al maximo de esperabilidad del EI (asintota)El incremento de la furza asociativa EC-EI de un ensayo determinado es directamente proporcional a la salencia de ambos estimulos , maximo de aprendizaje adquirible y la fuerza de la asociacion hasta el ensayo anterior , valores entre -1 a 1El termino es la sorpresividad del EILa sorpresividad del EI depende de la magnitud o intensidad del mismosalencia del EC modifica la cantidad de aprendizaje, yaque se multiplica por la sorpresividadBloqueo el EC1 adquiere valor V positivo a traves de ensayos hasta alcanzar la asintota del aprendizajeEl EC2 en su inicio valor de V=0, pero el EC1 V=1 (maximo)El incremento de la fuerza asociativa entre EC2 y EI durante el primer ensayo es inexistente a causa de la ausencia de sorpresaExtincion el incremento de la fuerza asociativa en el 1 ensayo es un decremento, ya que este es negativo. El valor de V se va reduciendo, y la asintota se acerca a 0La extincion y la inhibicion son extremos contrariorLa extincion segn este modelo es un desaprendizaje (ERROR)Este modelo no puede explicar el efecto de inhibicion latente, ni el contrabloqueo

Los estimulos propios del contexto son claves que el animal puede aprender junto al ECEC+Contexto+EI EC-EI positivaEI solo en contexto EC-EI negativaEC+Contexto+EI es cantidad de veces similar a Solocontexto+EI Contingencia nula

Hipotesis del comparador - La RC depende tambien del resto de asociaciones presentes que puedan establecerse entre las claves del contexto y el propio EISi el valor excitatoriodel contesto es mayor que el propio EC, dara una RC inhibitoria al ECSi la asociacion EC y EI es comparable en fuerza a la formada entre contexto y EI, contingencia nula y RC frente a EC no tendra lugarEI tras la aparicion de EC representacion directaAsociacion entre contexto y contexto y EC representacion indirectaLa comparacion entre representaciones directas e indirectas es lo que determina la intensidad de la RC y su carcter inhibitorio o excitatorioSegun esta teoria no existen asociaciones inhibitoriasLa comparacion de las asociaciones excitatorias determinan la manifestacion de RC, pero no del aprendizajeExplica los efectos de bloqueo como un fallo en la ejecucion

Teoria de Mackintosh (ATENCION)Efectos como el bloqueo se deben a la falta de atencion a ciertos estimulos

Teoria de Pearce y HallSe presta menos atencion a un EC a medida en qu e se convierte en mejor predictor del EINo malgastamos recursos prestando atencion a estimulos que conocemos bien, si con aquellos que aun no controlamos con seguridad

Modelo SOPRepresenta el condicionamiento utilizando nodos y redes neuronalesCuando EC o EI estan presentes fisicamente A1(altas activacion,alta atencion, poco tiempo)A2 (menor activacion, atencion periferica y menos focalizada, largo tiempo)La asociacion EC y EI solo posible si ambos nodos estan en A1La coincidencia de ambos nodos en A1 ensayotrasensayo hace k la asociacion sea mas fuerte

Tema 4 - Condicionamiento operanteInfluencias de Darwin Thorndike el primero que estudio la conducta operante Condicionamiento operante capacidad que tiene el sujeto para operar sobre su ambiente Instrumental la conducta del sujeto es el instrumento para obtener el reforzadorLey del efecto Situacion acompaadas o inmediatamente seguidas de satisfaccion, se conectaran mas firmemente con la situacion Operante libre (Skinner) La respuesta puede ocurrir en cualquier momento, y de forma repetida mientras permanezca en la caja de condicionamiento, la VD la tasa de respuesta x unidad de tiempo

La conducta operante mas relacionada con lo que sucede despues de que ocurran, que con los estimulos que la provocan, las conductas son emitidas, no elicitadasCondicionamiento operante -la probabilidad de que una respuesta sea modificada por sus consecuencias(por los efectos que tiene el ambiente sobre ella)En presencia de un estimulo especifico, el reforzador se presentara solamente si la respuesta operante sucedeEl condicionamiento operante no provoca la aparicion de la respuesta, sino que seala la ocasin de si la conducta se presenta sea seguida por una consecuenciaCuando no es seguida de una consecuencia reforzante (Estimulo delta), la probabilidad de emitir la operante disminuyeLa operante se define por su funcion, no por su forma o topografia, respuestas que producen los mismos efectos sobre el ambiente son la misma operanteLas respuestas pueden ser fisicamente parecidas, pero no tiene por que ser asiReforzamiento condicionado o secundario un estimolo que no era reforzante y adquiere esta capacidad a causa de la asociacion repetida con otro que era reforzanteEn procesos de extincion, los reforzadores condicionados pueden perder su efectividad en poco tiempo, en la vida diaria estos eventos pueden reforzar gran cantidad de conductas sin extinguirseReforzamiento produce incrementos en la conductareforzadores los eventos que hacen que el reforzamiento produzca esos efectoscastigo disminuye la conducta, los eventos son de naturaleza aversivaEnsayo discreto VD la latencia de respuesta, el experimentador tiene que intervenir para ubicar al animal al final y comienzo de cada ensayo Ejemplo Laberinto en TProcedimiento de operante libre - Los sujetos pueden emitir la respuesta de forma constante, sin que el investigador tenga que manipular al sujeto Ejemplo presion de palancaTopografia o forma de la respuesta las propiedades o caracteristicas fisicas de una respuesta Esta relacionada con las contingencias de reforzamiento (las consecuencias de una respuesta puede modificar su forma)Funcion las relaciones de la respuesta con los estimulos antecedentes y las consecuencias de la mismaDos respuestascon la misma/distinta topografia pueden tener la misma/diferente funcionEl control que ejerce un reforzadorpuede estar limitado por la topografia de la respuesta Instancia de respuesta Unidad minima de conducta, particular y especifica segn su topografia Automoldeamiento para aumentar la frecuencia de una rspuesta de baja ocurrecia y poder aplicar una contingencia instrumental Consiste en un condicionamiento clasico excitatorio apetitivo emparejado con un estimulo neutroDistinguir la RC de la respuesta operante no es tarea sencillaLa interaccion entre condicionamiento clasico y el operante es porque los acontecimientos ambientales actuan sobre los sistemas neurofisiolgicos de forma global

Contingencia Cuando uno de los componentes correlacciona con el otroContingencia positiva Cuando una respuesta es seguida de una consecuenciasContingencia negativa cuando una respuesta elimina o previene la aparicion de una consecuencia Procedimientos para aumentar conductas reforzamiento positivo, escape y evitacion reforzamiento positivo una consecuencia apetitiva se presenta de forma contingente a una respuesta Reforzador de comida El animal tiene que estar motivado para obtenerla, la medida de esa motivacion el % de peso que el animal ha perdico respecto a su peso ad libitum (comiendo libremente). Un 5% del peso pede ser suficienteMoldeamiento o metodo de aproximaciones sucesivas Si se necesita que den una respuesta que no se suele presentar en su medio natural. Se refuerza las respuestas o conductas que se aproximan a la respuesta final. Y se deja de reforzar cuando se consigue una respuesta mas parecida a la respuesta objetivo Escape eliminacion o detencion de un evento aversivo, y a su vez, un aumento en la fuerza de respuestaEvitacion La resuesta impide que se presente un suceso aversivoEn un principio los animales aprenden una respuesta de escape y posteriormente la evitacionProcedimientos para disminuir conductas Castigo, entrenamiento por omisionCastigo o castigo positivo Disminucion en la fuerza de la rspuesta cuando se aplica una consecuencia aversiva contingente a la respuestaSi se emite la respuesta, se presenta la consecuencia aversivaCuando el castigo no tiene efecto en la conducta se considera que este no ha ocurridoConsistiria en la disminucion de una respuesta previamente reforzadaEntrenamiento de omision o castigo negativo- Disminucion de la respuesta cuando se elimina o previene una consecuencia apetitiva de forma contingente a la respuesta si se emite la respuesta, la consecuencia la no presentacion de un evento apetitivoSkinner los procedimientos aversivos no son una manera fiable de hacer disminuir conductasExtincion La conducta no se elimina de forma absoluta, puede aparecer recuperacion expontaneaExtallido de extincion al comienzo de dejar de presentar el reforzador . Consiste en un aumento en la tasa de respuestaAumento de la variabilidad de respuesta Frustracion da lugara respuestas emocionales incondicionadas, aleteo en paloma, morder en ratas agresion en humanosLas respuestas operantes que han sido reforzadas en pocas ocasiones se xtinguen lentamentesi ha sido reforzada en multiples ocasiones muestra menor resistencia a la extincion, sobre todo si en la adquisicion se utilizo un programa de reforzamiento continuoCuando la magnitud de la recompensa es alta y se administra de forma continua, la resistencia a la extincion disminuye, esto no ocurre si las recompensas grandes se administran intermitentementeCuando la demora en la presentacion del reforzador es baja, la resistencia a la extincion es mayor

Conducta supersticiosaConducta interin aquella actividad que tenia lugar a mitad del intervalo, cuando aun faltaba baste tiempo para la aparicion del reforzador (dar vueltas sobre si mismas)conducta terminales ocurrian al final del intervalo, cuando faltaba poco para la aparicion del reforzador, (picotear el comedero)la entrega de comida parecia solo influir en las respuestas terminalesLas personas que tienen una gran necesidad de control sobre los eventos mas probable supersticiosalas supersticiones idiosincraticas estarian motivadas por la experiencia propia anterior con situaciones de reforzamientoExisten EC que se condicionan con mas facilidad con determinados EIPertinencia problemas para entrenar conductas como el rascado y el bostezo, algunas respuestas se relacionan de modo natural con el reforzador como consecuencia de la historia evolutiva del animalDeriva instintiva la ejecucion de la tarea empeora segn el entrenamiento avanzaConstraste conductual la efectividad de un reforzador puede verse modificado por la experiencia previa con el mismo reforzador cuando este es de una magnitud o calidad diferentelos efectos de la recompensa depende de la experiencia previa con otras recompensasla sensibilidad hacia la ganancia o perdida de recompensas dependera del estado emocional en el que se encuentrePara reducir el efecto de indefension aprendida inmunizacion -ubicar al sujeto en una situacion que no sea posible fallarforzar a los perros a cruzar la barrera un buen numero de vecesDemora del reforzamiento puede disminuir, aumentar, o no modificar la conducta tiempo entre la respuesta y la entrega del reforzador Cuando la linea base es estable da lugar a una reduccion de la respuesta, aunque a veces en un primer momento puede ocirrir lo contrarioLos efectos de la demora del reforzamiento debe analizarse como un proceso dinamico de las acciones directas e indirectas de distintas variablesPara evitar los efectos de demora, marcar la respuesta haciendo que se pueda distinguir de otros eventos, la presentacion de un estimulo contingente a la respuesta convierte esa respuesta en un evento significativo (procedimiento de marcado)devaluacion del reforzador asociar al reforzador un estimulo o evento de naturaleza contrariaLa ejecucion de una respuesta instrumental puede llegar a automatizarse si se entrena o practica de forma masivaLa practica prolongada da lugar el establecimiento de una ejecucion mucho mas rigida, menos deliberada y dependera menos de las consecuencias de la misma

TEMA 5 Programas y teorias del reforzamiento

El reforzamiento parcial o intermitente produce un aprendizaje mas duradero y mas dificil de extinguir

Un programa de reforzamiento puede definirse sin referencia a sus efectos sobre la conducta

Programa de razon debe emitir un determinado numero de respuestas antes de que la ultima sea reforzadaprograma de intervalo debe pasar un determinado tiempo desde el anterior reforzador antesd e que la respuesta sea de nuevo reforzadarazon fija (RF) respuestas requeridas siempre las mismas. RF1 seria un reforzamiento continuorazon variable(RV)- respuestas requeridas varia. RV100 promedio de 100 respuestas necesariasIntervalo fijo (IF)- se reforzara la 1 respuesta que ocurra despues de un tiempo siempre igualIntervalo variable (IV)- varia el tiempo entre un reforzador y el siguienteRegistrador acumulativo para registrar las respuestas de manera automatica y continuada.Puede medir el numero de respuestas y de pausas, y el tiempo entre respuestasResultado una curva acumulativa continua Los programas de RV proporcionan tasas de respuesta muy altas y constantesLos programas de IV tasas constantes de respuesta de un valor inferior Los programas Rf . Ejecucion alta y estable cuando la razon es relativamente pequea (RF50)si la razon es mayor aparece post-reforzamientoLa duracion del post-reforzamiento depende del valor de la razon. Si fuese muy elevado puede dejar de responder por completo (tension de la razon)la pausa post-reforzamiento depende mas de la frecuencia del reforzamiento que el numero de respuestas a realizarLos programas IF se caracteriza por una pausa post-reforzamiento, y una progresiva aceleracion , la mayor tasa de respuesta se da cerca del fin del intervalo (festoneado)Los programas de intervalo la pausa postreforzamiento tiende a ajustarse proporcional y rapidamente a los cambios en la frecuencia de reforzamientoreforzador limitado en el tiempo se puede aplicar en IF y IVLa tasa de respuesta suele ser mayor en programas de razon que en los de intervaloLos programas de intervalo tienden a reforzar TER (Tiempo Entre Respuestas) largosLos programas de razon no favorecen los TER largosEn los programas de IV no existe relacion entre tasas de respuesta y tasa de reforzamiento. Por mucho que se incremente la tasa de respuesta, la tasa de reforzamiento sufrira poca variacion Funcion de retroalimentacion la forma en que actua el ambiente en funcion de algun aspecto de la ejecucion conductual. Es mas dificil de calcular en los programas de intervalo.La forma de la funcion es hiperboricaLos cambios a tasas bajas de respuesta afectaran mucho a las tasas de reforzamientoLos cambios a tasas altas de respuesta tendran poco efecto en las tasas de reforzamientoLos programas de intervalo generan una mayor variabilidad en la tasa de respuesta

Reforzamiento Diferencial de Tasas Bajas de respuesta (RDB) reforzar solo los TER mas largos solo se refuerza la respuesta si ha transcurrido un tiempo especificado desde la anterior respuestaSe aade una contingencia de castigo para las respuestas que ocurren antes del tiempo especificado. Cualquir respuesta prematura reinicia el intervalo de tiempoReforzamiento Diferencial de Tasas Altas de respuesta (RDA)- refuerza especificament TER cortosSe obtiene reforzador si se responde antes de un tiempo especifico, las respuestas que ocurren despues reinician el intervaloTER- tiempo que transcurre entre la penultima respuesta emitida en un intervalo de reforzadores y la ultima respuestaLos programas RV y IV tienen una tasa de respuesta constante, sin postreforzamientolos programas RF y IF acusadas pausas postreforzamiento, TER muy cortos

Programas secuenciales:Mixto y multiple alternantesTanden y encadenado - SecuencialesPrograma Mixto 2 o mas programas basicos alternandose al azar, tiempo de duracion establecido con anterioridadPrograma Multiple igual k el mixto Cada componente se seala con una clave discriminativa distinta El sujeto sabe en todo momento en que parte del programa se encuentraPrograma tandem 2 o mas programas simples que se presentan n el mismo ordenCompletar el 1 programa para poder iniciar el siguiente, al completar todos se recibe el reforzador Programa encadenado Igual k el tandemLos 2 programas simples estan sealados de manera diferente, para que el sujeto sepa en que componente del programa se encuentra

Programas compuestos simultaneos: Programas concurrentes- simultaneamente al menos 2 programas basicos de reforzamientose puede pasar de uno a otro, sin necesidad de que se haya finalizadolos sujetos eligen entre distintas alternativas que requieren una respuesta operante identica pero que puede llevar a premios diferentesPrograma alternativo se refuerza una respuesta cada vez que se cumple con el requisito de un programa de razon o intervaloPrograma conjuntivo se refuerza una respuesta si se cumple al mismo tiempo el requisito de razon y el de intervaloprograma entrelazado la respuesta que se refuerza viene determinada por 2 programas pero la disposicion de uno de ellos se altera por el desarrollo del otro

Ley de igualacion la tas relativa de respuesta entre dos alternativas de respuesta concurrentes es igual a la tas relativa de reforzamiento asociada con cada una de las alternativas de respuesta Los animales igualan la tas relativa de respuestas con otros parametros que definen al reforzador como la magnitud del reforzador o su inmediatezTodos los factores de reforzamiento influyen de forma igual (multiplicativa) en la eleccion, cualquiera de esos factores (frecuencia, magnitud o demora) pueden reducir la eleccion de una alternativaMaximizacion Elegir la alternativa de respuesta que tiene una razon mas bajaEn general se prefiere responder a un programa de razonAlternancia cambio intermitente de una respuesta a otra sin que los reforzadores tengan relacion demora por el cambio (DCP)- consiste en introducir 2 o 3sg despues de la primera respuesta los sujetos enfrentados con una situacion de eleccion abandonan su comportamiento de alternancia y realizan la eleccion a base de las contingencias de reforzamiento asociadas a las respuestas sesgos influencias no deseables en los experimentos de eleccion, normalmente de influencia desconocida sobreigualacion cuando la mejor alternativa es valorada por encima de la preferencia de la igualacion perfectainfraigualacion cuando es calorada por debajo de la preferencia de la igualacion perfectaes mas comun la infraigualacion que la sobreigualacionsi entre dos alternativas igual de favorables se elige una mas que otra se debe a sesgos de respuesta la sobreigualacion mas frecuente cuando se utiliza DCP relativamente larga, o cuando resulta muy costoso el cambio de una a otra alternativa de respuesta La ley de igualacion establece relaciones entre al menos 2 medidas de la conductaAproximacion teorica molecular el cambio de una alternativa de respuesta a otra se da en el momento en que la probabilidad momentanea de reforzamiento es mayor en la otra alternativa aproximacion molar los animales distribuyen sus respuestassegun el calculo global de las tasas relativas de reforzamiento entre las alternativas de respuesta, eligiendo aquella que proporcione mayor reforzamientocadenas concurrentes de respuesta mide la eleccion entre diferentes fuentes de premiocuando la eleccion era directa (programa concurrente simple)se prefiere premio pequeo inmediato, aunque no sea la mas ventajosaEn un programa concurrente encadenado con un tiempo constante de espera para que sean reforzadas las respuestas, se prefiere el reforzador mayor pero mas demoradoimpulsividad preferencia de una recompensa pequea inmediatamenteautocontrol preferir una recompensa mayor demoradademorar un poco la entrega del reforzador pequeo hace que su fuerza se debilite y se prefiera esperar a uno de mayor magnitudcualquier situacion implica una eleccion, incluso cuando solo hay una alternativa de respuesta (entre responder o no)el reforzamiento total de la situacion comprende los reforzadores programados y los no explicitamente programadosfuerza de la respuesta los estimulos ambientales elicitan respuestasy su asociacion se ve por la ocurrencia del reforzador

Guthrie la funcion del reforzador en el aprendizaje es facilitar la asociacion entre E-Rtodo comportamiento esta formado por movimientos musculares discretosHull la consecucion del reforzador refuerza la asociacion E-R debido a la reduccion del impulsoIntroduce los terminos impulso e incentivola consecucion del reforzador reduce las necesidades del organismo (impulso) al tiempo que incita a la accion (incentivo)Tolman esquema E-Eel reforzador no es necesario para el aprendizaje, pero es imprescindible para que se ejecute la respuesta aprendida

Principio de premack cualquier evento (E o R) puede convertirse en un reforzador eficazSeria necesario:1 que dicha actividaddebe ser preferida en la linea base2 la probabilidad de ocurrencia de la actividad preferidadebe restringirse y ocurrir contingentementecon la realizacion de una actividad menos preferida. Por lo que la menos preferida se convierte en instrumentalLas actividades con menor probabilidad de ocurrencia en las situaciones de libre acceso, nunca podran reforzar a las actividades con una mayor probabilidad de ocurrenciala actividad de mas baja probabilidad puede castigar a la de mayor probabilidad siempre y cuando se aumente su probabilidad de ocurrencia y suceda contingentemente con la actividad mas preferida, como resultado dicha operacin disminuira su frecuencia de aparicionla probabilidad de la respuesta se deberia de considerar como el tiempo dedicado a una actividad particular sobre el tiempo totalLa medida de respuesta mas apropiada es la probabilidad momentaneaTeoria de la privacion de respuesta la eficacia del reforzador depende de que esten limitadas las probabilidades de ejecutar esa respuesta los programas de reforzamiento incrementaran la frecuencia de ocurrencia de la respuesta operante por encima de su linea base, si y solo si, dichos programas privan realizar la respuesta reforzadorapara que una actividad pueda funcionar como un reforzador eficaz, solo es necesario restringir la realizacion de dicha actividad, en relacion cun su ocurrencia en el punto de bienestarNo es necesario que dicha actividad tenga que ser mas preferida que la que se va a convertir en actividad instrumentalLa tasa de respuesta y la tasa de reforzamiento deben relacionarse en forma de u invertidaCuando las sesiones experimentales sean relativamente cortas, la funcion que relaciona tasa de respuesta/tasa de reforzamiento beria tender a la linealidad

Tema 6 Control de la conducta por estimulo

La causa siempre antecede al efectoLa conducta operante tiene prediccion probabilisticaEl control por el estimulo de la conducta operante no es habitual, es omnipresenteestimulos discriminativos positivos (Ed+ o E+) mediante recompensa o escape/evitacionestimulos discriminativos negativos (Ed- o E-) contingentes con el castigo, entrenamiento de omision, o extincion de conductaLa presencia de un discriminativo no implica la aparicion de un reforzador o estimulo aversivo, sino la alta o baja probabilidad de que tras la emision de la conducta esta sea reforzada (E+) o castigada/extinguida (E-) Si la conducta esta bajo el control de un discriminativo positivo, debe haberse condicionado tambien 1 o mas discriminativos negativos para esa conducta, y a la inversa

Estimulo extereoceptivo- si proviene del medio externointeroceptivo si viene del medio internoestimulos propioceptivos- aquellos generados por la posicion y movimiento del cuerpoestimulos relacionados los que dependen de la conexin que mantenian entre si 2 o + elementosaunque no hayamos tenido experiencia con algun estimulo, dependiendo a lo que se parezca (comparta rasgos) a un EI EC o ED controlara nuesta conductala discriminacion requiere entrenamiento, se denomina condicionamiento discriminativo o reforzamiento diferencialexiste mayor contro por el estimulo cuanto mayor es la discriminacion demostradala generalizacion no es mas , ni menos, adaptativa que la discriminacionel control que un estimulo no entrenado ejerce sobre la conducta es directamente proporcional a su semejanza con el estimulo que adquirio ese control durante el proceso de entrenamientoEsta relacion a traves de: Estimulo unico - estimulos multiples generalizacion mantenidaLa exposicion a estimulos generalizados semejantes a discriminativos +, generan gradientes en forma de U invertida (gradientes excitatorios)La gradiente inhibitoria tendria forma de UCuan mas plana es la gradiente , mas generalizacion se ha producido (menos discriminacion)

Control condicional cuando el control que ejercen ciertos estimulos esta matizado o depende de la presencia de otros eventosla contingencia pavloriana (E-R)necesita un modulador para ser control condicional( pasa de 2 a 3 elementos)El condicionamiento operante(Ed-R- Er), necesita un Estimulo Condicional pasando de 3 a 4 elemControl condicional Pavloriano - Holland, establecedor de la ocasion Rescola facilitador los estimulos que adquieren propiedades moduladoras no elicitan por si mismos respuestas excitatorias o inhibitorias, sino que modifican la funcion de los EC con los que se han asociadoLa presentacion continua en solitario de un modulador no provoca su extincion Discriminacion condicional- aquellas situaciones de control operante en la que los estimulos discriminativos dependen de otro evento, el estimulo condicionalEl criterio de igualacion que denomina el estimulo de 2 orden puede ser de igualdad, semejanza o de diferenciaen una igualacion a la muestra de 2 orden es necesario que el sujeto sea capaz de describir verbalmente la relacion entre los estimulos de 2 orden, en caso contrario su presencia podria interferir:la presentacion visual gana en complejidad al haber mas estimulos presenteslos estimulos de 2 orden pueden ser incluidos como parte del arreglo de comparacion de 1 ordenHacer mas distintivs los eventos de control, requerir respuestas diferenciales o aplicar consecuencias distintas, son metodos que aumentan la velocidad de adquisicion de la discriminacion Los estimulos mas utilizados en discriminacion no humana han sido los visualesReferirnos exclusivamente a las caracteristicas fisicas del estimulo, no nos garantiza una medida fiable de discriminalidadLa discriminalidad eentre dos estimulos es en muchas ocasiones un indice que solo puede averiguarse a posterioriLas respuestas que estan diferenciadas por la localizacion quedan bajo el control de la distinta posicion de los estimulos discriminativosLas respuestas que estan diferenciadas por su naturaleza quedan bajo el control del tipo de estimuloEstablecer como requisito una respuesta de observacion a la muestra facilita el aprendizaje de las discriminaciones condicionalescuando la propia conducta es el elemento de muestra a discriminar, el numero de respuestas puede facilitar la adquisicion del aprendizajeEl aprendizaje de la discriminacion condicional mas rapido cuando se requiere un programa diferente para cada muestrala generalizacion de la discriminacion aprendida a otra discriminacion nueva puede ocurrir entre problemas en los que se altera la misma dimension del estimulo (cambio intradimensional) o cuando se utiliza un nuevo problema de discriminacion que implica una dimension estimular nueva (extradimensional o interdimensional)Los cambios intradimensionales se aprenden mas facilmente que los interdimensionalesEfecto de sobreaprendizaje en la inversion quien recibe entrenamiento extra aprende la discriminacion inversa en menos tiempoEntrenamiento simultaneo- el discriminativo positivo y negativo aparecen juntos en cada ensayogo-no go discriminacion respuesta no respuesta en entrenamiento sucesivo los estimulos en determinados momentos esta presente uno y en otras ocasiones se presenta el otro La adquisicion de discriminaciones simples son mas lentas con procedimiento sucesivo que cuando es simultaneoDiscriminacion condicional simultanea- cuando el estimulo condicional y el/los discriminativos se encuentran presentes a la vezDiscriminacion condicional de demora cero donde los estimulos de comparacion son presentados inmediatamente despues del apagadp del estimulo de muestrael hecho de eliminar la muestra en el momento en que aparecen las comparaciones (demora 0) aumenta el numero de ensayos necesarios para aprender la discriminacion Los estimulos visuales tienen mas probabilidad de adquirir el control sobre la conducta reforzada positivamenteLas claves auditivas es mas probable que adquieran un control de la conducta negativamente reforzada Intervalo de 0sg entre ensayos , ejecucion a niveles de azargrupos con 25-60sg exibian los mejores desempenos en la tareaUna vez que la discriminacion condicional ha sido adquirida, la duracion del intervalo ejerce poco efecto sobre la precision, excepto cuando el intervalo se elimina por completo Si los cambios en el E- son graduales, se puede adquirir la discriminacion simple sin cometer ningun error, es decir sin responder al E-El paso del tiempo aumenta la generalizacion, los estimulos diferentes al E+ ejercen mayor control cuanto mas lejana se encuentra la finalizacion del evento

pag 325 - 334