![Page 1: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/1.jpg)
Roberto Díaz Morales
Febrero 3, 2013
Métodos Numéricos
Probabilísticos
DTSC, Universidad Carlos III de Madrid
![Page 2: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/2.jpg)
1/27
Índice
1. Introducción
2. Cuadratura
3. Muestreo
4. Cuadratura Bayesiana
5. Aprendizaje activo de la evidencia usando
cuadratura bayesiana.
6. Conclusiones
Febrero 3, 2013
![Page 3: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/3.jpg)
Una de las tareas del aprendizaje máquina consiste en
la inferencia sobre datos complejos.
Dicha tarea incluye el desarrollo y análisis de métods
numéricos basados en teoría probabilística.
Muchas de estas tareas se pueden ver como problemas
de aprendizaje.
Dos de las tareas más importantes son:
Cuadratura
Muestreo
Febrero 3, 2013 2/27
![Page 4: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/4.jpg)
Muchos modelos complejos requieren integrales computacionalmente intratables, con lo que han de ser aproximadas.
En particular, muchos problemas de inferencia requieren integrar sobre funciones de probabilidad. ◦ p(x) podría ser un “posterior” y f(x) las etiquetas de nuestras muestras. ◦ p(x) podría ser un “prior” y f(x) una verosimilitud. ◦ …
Es complicado cuando se trabaja con grandes conjuntos de datos donde evaluar la verosimilitud sobre todo el conjunto de datos es muy costoso computacionalmente.
Febrero 3, 2013 3/27
![Page 5: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/5.jpg)
Índice
1. Introducción
2. Cuadratura
3. Muestreo
4. Cuadratura Bayesiana
5. Aprendizaje activo de la evidencia usando
cuadratura bayesiana.
6. Conclusiones
Febrero 3, 2013 4/27
![Page 6: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/6.jpg)
Si p(x) es una función de densidad de probabilidad y podemos obtener muestras de ella tenemos la aproximación de Monte Carlo:
Su varianza decae en un orden O(1/R)
La principal objección es que tener muestras que representen bien P(x) no garantiza que representen bien Φ(x)
Febrero 3, 2013 5/27
![Page 7: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/7.jpg)
Índice
1. Introducción
2. Cuadratura
3. Muestreo
4. Cuadratura Bayesiana
5. Aprendizaje activo de la evidencia usando
cuadratura bayesiana.
6. Conclusiones
Febrero 3, 2013 6/27
![Page 8: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/8.jpg)
Existen multitud de métodos de muestreo cuando podemos evaluar p(x):
◦ Rejection Sampling:
Se conoce cQ(x)>P(x)
Se genera xi muestra de cQ(x)
Se genera u~U(0,cQ(xi))
Si u<P(x) guardamos xi
Si u>P(x) descartamos xi
Eficiencia según el parecido de cQ(x) con P(x)
Febrero 3, 2013 7/27
![Page 9: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/9.jpg)
◦ Importance Sampling:
Febrero 3, 2013 8/27
![Page 10: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/10.jpg)
Markov Chain Monte Carlo: ◦ Son técnicas de muestreo en los que la siguiente muestra depende de la muestra
actual (estado) y de unas probabilidades de transición.
• Metropolis-Hasting: – Se utiliza una función Q(x) que
depende de la muestra actual.
– Se evalua a:
– Si a>1 la muestra se acepta.
– Si a<1 se acepta con probabilidad a.
– Si se acepta es el nuevo estado.
– Se debe dejar correr
Febrero 3, 2013 9/27
![Page 11: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/11.jpg)
• Gibbs-Sampling:
• La siguiente muestra se obtiene con la distribución conjunta para cada una de las dimensiones.
Febrero 3, 2013 10/27
![Page 12: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/12.jpg)
• Slice-Sampling:
Febrero 3, 2013 11/27
![Page 13: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/13.jpg)
Índice
1. Introducción
2. Cuadratura
3. Muestreo
4. Cuadratura Bayesiana
5. Aprendizaje activo de la evidencia usando
cuadratura bayesiana.
6. Conclusiones
Febrero 3, 2013 12/27
![Page 14: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/14.jpg)
Rasmussen, C. E., & Ghahramani, Z.
Bayesian monte carlo. Advances in neural information
processing systems, 15, 489-496.
Dado un conjunto de muestras D y realizando
inferencia sobre f con D, la media sobre funciones es
la esperanza de f(x) media.
Febrero 3, 2013 13/27
![Page 15: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/15.jpg)
Se agrupan los términos para un GP:
Febrero 3, 2013 14/27
![Page 16: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/16.jpg)
En el caso general, introducir la formulación de los GP en la
integral lleva a expresiones que son dificiles de evaluar, pero
hay casos especiales:
Si p(x) y la función de covarianza son ambas
gaussianas, se obtienen expresiones analíticas
(utilizando la cuadratura Bayes-Hermite):
Febrero 3, 2013 15/27
![Page 17: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/17.jpg)
Febrero 3, 2013 16/27
![Page 18: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/18.jpg)
Febrero 3, 2013 17/27
![Page 19: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/19.jpg)
Febrero 3, 2013 18/27
![Page 20: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/20.jpg)
Febrero 3, 2013 19/27
![Page 21: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/21.jpg)
20/
47
Índice
1. Introducción
2. Cuadratura
3. Muestreo
4. Cuadratura Bayesiana
5. Aprendizaje activo de la evidencia usando
cuadratura bayesiana.
6. Conclusiones
Febrero 3, 2013
![Page 22: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/22.jpg)
21/27
Osborne, M. A., Duvenaud, D., Garnett, R., Rasmussen, C.
E., Roberts, S. J., & Ghahramani, Z. Active Learning of
Model Evidence Using Bayesian Quadrature. NIPS 2012
Se desea realizar una integral sobre una verosimilitud no
negativa:
Febrero 3, 2013
![Page 23: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/23.jpg)
22/27
Para poder tratar la integral, “lineariza” el problema.
Quedando como problema a resolver:
Febrero 3, 2013
![Page 24: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/24.jpg)
23/27
Como L0 utiliza un GP estándar.
L0=mL|s
Prior con media 0
Covarianza Gaussiana
Utiliza el conjunto de datos XS
Utiliza un GP diferente para modelar Δlog L|s
Utiliza prior con media 0
Covarianza Gaussiana
Para entrenar utiliza XS y datos aleatorios en hyper-
elipses alrededor de los puntos XS
Febrero 3, 2013
![Page 25: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/25.jpg)
24/27
Quedando finalmente la media compuesta por dos términos
analíticos.
Y una varianza que puede emplearse como diagnóstico de
convergencia:
Febrero 3, 2013
![Page 26: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/26.jpg)
25/27
Aprendizaje activo:
Ya no es necesario coger muestras que pertenezcan a p(x).
Cuando se han fijado los hyperparámetros, la varianza depende
de la posición de las muestras escogidas.
Selecciona muestras que minimizan la varianza esperada:
Febrero 3, 2013
![Page 27: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/27.jpg)
26/27
Resultados:
Febrero 3, 2013
![Page 28: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea](https://reader031.vdocumento.com/reader031/viewer/2022020317/5ba9543609d3f24c398c71d1/html5/thumbnails/28.jpg)
27/27
www.probabilistic-numerics.org
MacKay, D. J. (2003). Information theory, inference and
learning algorithms. Cambridge university press.
Rasmussen, C. E., & Ghahramani, Z. Bayesian monte
carlo. Advances in neural information processing
systems, 15, 489-496.
Osborne, M. A., Duvenaud, D., Garnett, R., Rasmussen, C.
E., Roberts, S. J., & Ghahramani, Z. Active Learning of Model
Evidence Using Bayesian Quadrature. NIPS 2012
Febrero 3, 2013