ajuste - regresion
DESCRIPTION
Surgen entonces las siguientes preguntas:¿Cómo definimos que es un buen ajuste?¿Cómo calculamos c1 y c2 a partir de la definición de “buen ajuste”?TRANSCRIPT
UNI-FIMPostgrado FIM Ma200
Ajuste de mínimos cuadrados
Ajuste a una recta de la dataDado m pares de datos: (xi,yi), i =1,…mSe desea encontrar los coeficientes c1 y c2 tales que
F(x) = c1 x+c2
sea un buen ajuste a la dataSurgen entonces las siguientes preguntas:¿Cómo definimos que es un buen ajuste?¿Cómo calculamos c1 y c2 a partir de la definición de “buen ajuste”?
Ajustes posiblesPodemos obtener ajustes admisibles por adecuación de la pendiente (c1) y la intersección (c2). A continuación se muestra la representación gráfica de algunos candidatos a mejor ajuste para un conjunto particular de datos.
La pregunta es entonces ¿cuál de estas líneas provee el mejor ajuste?
ResidualEn cada punto, la diferencia entre la ordenada de la data y la función ajustada es:
ri = yi – F(xi) = yi – (c1 x +c2)ri es llamado el residual para el dato (xi, yi)ri es la distancia vertical entre la data conocida y la función de ajuste.
1
UNI-FIMPostgrado FIM Ma200
Minimizando el residualDos criterios para escoger el “mejor” ajuste
Minimizar o Minimizar
Por razones estadísticas y de cálculo se elige la minimización de
= 221 )( cxcy ii
Ajuste de la distancia ortogonalUna alternativa para minimizar el residual es minimizar la distancia ortogonal a la recta.
La mimimización de es conocida como el problema de regresión de la distancia
ortogonal. Este problema puede ser y es rápidamente resuelto con MATLAB.
Ajuste por mínimos cuadradosEl ajuste por mínimos cuadrados es obtenido escogiendo c1 y c2 tales que
sea un mínimo. Para simplificar la notación haremos = .Para encontrar c1 y c2 se debe minimizar = (c1, c2). El mínimo requiere que
iii xcxcy )(2 21 iiii xcxcxy 22
1
1)(2 21 cxcy ii
m
ii
m
ii
m
iii xcxcxy
02
0
21
0
mcxcym
ii
m
ii 2
01
0
2
UNI-FIMPostgrado FIM Ma200
Si hacemos
(1)
(2)
De (1) y (2) se obtiene
(3)
(4)
(5)
Sistema sobre-determinado para ajuste de una rectaEscribiendo la ecuación c1x + c2 = y para todos los puntos conocidos (xi, yi), i =1,..,m obtenemos un sistema sobre-determinado.
O
Donde
Ecuación normal para el ajusteEl cuadrado de la norma 2 de r - y – Ac es
La minimización de requiere que
3
UNI-FIMPostgrado FIM Ma200
o que
Estadístico R2
R2 es una medida de que tan bien la función de ajuste sigue la tendencia de la data.Se define
es el valor de ajuste de la función en los puntos de la data conocida para el ajuste a una recta
y es el promedio de los valores y
iym
y1
Luego:
Cuando R2 1 la función de ajuste tiende a la dataCuando R2 0 la función de ajuste no es significativamente mejor que la aproximación a la data por este medio.
Ajuste de funciones no lineales transformadas
Algunas de funciones no lineales ajustadas y = F(x) pueden ser transformadas en una ecuación de la forma v =c1 u+c2
El ajuste por mínimos cuadrados a una recta es desarrollado en la transformación de variables.
Los parámetros no lineales de ajuste de la función son obtenidos por transformación inversa de las variables originales.
El ajuste de mínimos cuadrados a la ecuación transformada no produce el mismo ajuste de coeficientes como la solución directa de un problemas de ajuste de mínimos cuadrados no lineal que involucra el original ajuste de la función
Ejemploy = e x ln y = c1x + c2
y = x ln y = c1 ln x + c2
y = x e x ln (y/x) = c1x+c2
Ajuste de la combinación lineal de funciones Definición de la función de ajuste y funciones base Formulación del sistema sobre-determinado Solución vía ecuaciones normales
4
UNI-FIMPostgrado FIM Ma200
Considere la función de ajuste
F(x) = c1 f1(x)+c2 f2(x)+… +cn fk(x)Ó
F(x) =
Las funciones base
son seleccionadas por la persona que hace el ajusteLos coeficientes
son determinados por el método de los mínimos cuadradosF(x) puede ser cualquier combinación de funciones que sean lineales en los coeficientes cj, por esta razón
son todas funciones base válidas. Por otro lado
no son funciones base válidas, desde que los cj son los parámetros del ajuste.La función de ajuste para un polinomio cúbico es
la cual tiene las funciones base
El objetivo es encontrar los cj tal que F(xi) .Desde que F(xi) , el residual para cada punto de la data es
La solución de mínimos cuadrados proporciona los cj que minimizan .Considere la función de ajuste con tres funciones base
Asumiendo que F(x) actúa como una función interpolante. Entonces las ecuacionesson todos satisfechas.
Las ecuaciones anteriores son equivalentes al sistema sobredeterminado
5
UNI-FIMPostgrado FIM Ma200
A c = yDonde
Si F(x) no interpola la data, entonces la ecuación matricial precedente no puede ser resuelta exactamente; b no cae en el espacio columna de A.El método de los mínimos cuadrados provee la solución de compromiso que minimiza
El valor de c que minimiza satisface la ecuación normal
En general, para n funciones básicas
Fuente: Scientific Computation by Michael T. Heathhttp://www.cse.uiuc.edu/heath/scicomp/notes/index.html
6