teoría 2 (parte b) introducción a los agentes inteligentes - universidad nacional de ... · 2019....

Post on 27-Mar-2021

4 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Teoría 2 (Parte B)Introducción a los Agentes Inteligentes

Sistemas Inteligentes1

1Universidad Nacional de San Luis, Argentina

Carrera: Ingeniería en InformáticaCarrera: Ingeniería en Computación (Optativa)

Departamento de InformáticaAño 2019

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Aspectos a abordar

Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidadesRepresentación de estados y transicionesAgentes de Aprendizaje

Bibliografía: Capítulo 2, libro de Russell. Sección 2.4.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Clases generales de programas de agentes

Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidades

Estos tipos de agentes pueden a su vez ser implementadoscomo agentes de aprendizaje.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Clases generales de programas de agentes

Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidades

Estos tipos de agentes pueden a su vez ser implementadoscomo agentes de aprendizaje.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos simples (ARS)

También llamados agentes reactivos puros o agentestropísticos.Seleccionan una acción en base a la percepción actual,ignorando el resto de la historia perceptual (el pasado).No existe internamente ninguna representación deestado.La decisión sobre la acción a tomar se basa en unconjunto de reglas condición-acción (o situación-acción).

Ejemplo:

si auto-adelante-esta-frenando entoncescomenzar-a-frenar

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos simples (ARS)

También llamados agentes reactivos puros o agentestropísticos.Seleccionan una acción en base a la percepción actual,ignorando el resto de la historia perceptual (el pasado).No existe internamente ninguna representación deestado.La decisión sobre la acción a tomar se basa en unconjunto de reglas condición-acción (o situación-acción).

Ejemplo:

si auto-adelante-esta-frenando entoncescomenzar-a-frenar

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Un ejemplo de agente reactivo

Un agente reactivo para el mundo de la aspiradora

función AG-REF-ASPIRA(p)entrada: una percepción p = [ubic,est ].salida: una acción a ∈ {Aspirar ,Derecha, Izquierda,NoOp}.

si est = Sucio entonces retornar Aspirarsino si ubic = A entonces retornar Derechasino si ubic = B entonces retornar Izquierda

fin_función

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Un agente reactivo genérico

función AG-REF-SIMPLE(percep) retorna una acciónestático: reglas: un conjunto de reglas condición-acción.

estado ← INTERPRETAR-ENTRADA(percep)regla← REGLA-MATCH(estado, reglas)

accion← ACCIÓN-REGLA[regla]fin_función

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Un robot reactivo: vehículo de Braitenberg

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Características de los agentes reactivos

Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.

VentajasSimplicidad.Tiempo de respuesta mínimo.Reglas simples pueden producir comportamientoscolectivos complejos.Implementación directa en hardware (bueno pararobótica).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Características de los agentes reactivos

Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.

VentajasSimplicidad.Tiempo de respuesta mínimo.Reglas simples pueden producir comportamientoscolectivos complejos.Implementación directa en hardware (bueno pararobótica).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Características de los agentes reactivos

Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.

LimitacionesSólo trabajan bien si la acción correcta puededeterminarse en base a la percepción actual.Posibilidad de loops infinitos bajo observabilidad parcial.Incapacidad de analizar la consecuencia futura de lasacciones.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.

Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.

Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.

Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Estructura de un ARBM

función AG-REF-BAS-MODELO(percep) retorna una acciónestático: estado: una descripción del estado actual del mundo.

modelo: descripción del efecto de las acciones.reglas: un conjunto de reglas condición-acción.accion: la acción más reciente (inicial/ ninguna).

estado ← ACTUALIZAR-ESTADO(estado,accion,percep,modelo)regla← REGLA-MATCH(estado, reglas)

accion← ACCIÓN-REGLA[regla]fin_función

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Arquitecturas con estado: Recurrent Neural Networks

Traducción de lenguajes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en objetivos (ABO)

En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.

El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO

Agentes de búsqueda.Agentes de planning.

Comparación respecto a los agentes reflejos (ARS’s yARBM’s):

Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en objetivos (ABO)

En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).

Dos grandes grupos de ABOAgentes de búsqueda.Agentes de planning.

Comparación respecto a los agentes reflejos (ARS’s yARBM’s):

Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en objetivos (ABO)

En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO

Agentes de búsqueda.Agentes de planning.

Comparación respecto a los agentes reflejos (ARS’s yARBM’s):

Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en objetivos (ABO)

En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO

Agentes de búsqueda.Agentes de planning.

Comparación respecto a los agentes reflejos (ARS’s yARBM’s):

Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Estructura de un ABO

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en utilidades (ABU)

Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.

Cuentan con una función de utilidad

U : S → R

que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:

Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en utilidades (ABU)

Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad

U : S → R

que captura las preferencias del agente por los estadosdel mundo.

La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:

Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en utilidades (ABU)

Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad

U : S → R

que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.

Un ABU es más adecuado que un ABO cuando:Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en utilidades (ABU)

Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad

U : S → R

que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:

Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y el principio de la UEM

Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.

El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.

En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:

23× 9 +

16× 0 +

16× 0 = 6

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y el principio de la UEM

Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.

En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:

23× 9 +

16× 0 +

16× 0 = 6

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y el principio de la UEM

Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.

En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:

23× 9 +

16× 0 +

16× 0 = 6

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y Juego de dos personas - Minimax (1)

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y Juego de dos personas - Minimax (2)

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Algunos conceptos asociados a los ABU

Teoría de DecisiónTeoría de UtilidadTeoría de la ProbabilidadProcesos de Decición Markov (MDP’s)POMDP’sMétodos de Programación DinámicaAprendizaje por RefuerzosTeoría de JuegosEquilibrio de NashMecanismos económicos (subasta, votación, mercado,etc)

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Representando estados y transiciones entre los mismos

¿Cómo representaré los estados del mundo y los efectos delas acciones (modelo de transición)? Enfoques:

AtómicaFactorizadaEstructurada

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Representando estados y transiciones entre los mismos

Atómica: un estado es una caja negra (indivisible) sinestructura interna.Factorizada: un estado consiste de una colección devalores de atributos (reales, booleanos o de un conjuntofijo).Estructurada: cada estado incluye objetos, cada uno delos cuales puede tener atributos propios y tambiénrelaciones a otros objetos.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes de aprendizaje

Incorporan la capacidad de aprender y mejorar sudesempeño a partir de la experiencia.Componentes conceptuales

Elemento de performance: componente que selecciona lasacciones externas (lo que antes era el agente completo).Elemento de aprendizaje: componente encargada dehacer las mejoras (cambios) en el elemento deperformance.Crítico: informa al alemento de aprendizaje cuán bien elagente se está comportando (de acuerdo a una medida deperformance establecida).Generador de problema: sugiere al elemento deaprendizaje acciones exploratorias que conducen aexperiencias nuevas e informativas.

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Un agente de aprendizaje general

top related