ajuste - regresion

UNI-FIMPostgrado FIM Ma200

Ajuste de mínimos cuadrados

Ajuste a una recta de la dataDado m pares de datos: (xi,yi), i =1,…mSe desea encontrar los coeficientes c1 y c2 tales que

F(x) = c1 x+c2

sea un buen ajuste a la dataSurgen entonces las siguientes preguntas:¿Cómo definimos que es un buen ajuste?¿Cómo calculamos c1 y c2 a partir de la definición de “buen ajuste”?

Ajustes posiblesPodemos obtener ajustes admisibles por adecuación de la pendiente (c1) y la intersección (c2). A continuación se muestra la representación gráfica de algunos candidatos a mejor ajuste para un conjunto particular de datos.

La pregunta es entonces ¿cuál de estas líneas provee el mejor ajuste?

ResidualEn cada punto, la diferencia entre la ordenada de la data y la función ajustada es:

ri = yi – F(xi) = yi – (c1 x +c2)ri es llamado el residual para el dato (xi, yi)ri es la distancia vertical entre la data conocida y la función de ajuste.

1


Minimizando el residualDos criterios para escoger el “mejor” ajuste

Minimizar o Minimizar

Por razones estadísticas y de cálculo se elige la minimización de

= 221 )( cxcy ii

Ajuste de la distancia ortogonalUna alternativa para minimizar el residual es minimizar la distancia ortogonal a la recta.

La mimimización de es conocida como el problema de regresión de la distancia

ortogonal. Este problema puede ser y es rápidamente resuelto con MATLAB.

Ajuste por mínimos cuadradosEl ajuste por mínimos cuadrados es obtenido escogiendo c1 y c2 tales que

sea un mínimo. Para simplificar la notación haremos = .Para encontrar c1 y c2 se debe minimizar = (c1, c2). El mínimo requiere que

iii xcxcy )(2 21 iiii xcxcxy 22

1

1)(2 21 cxcy ii

m

ii

m

ii

m

iii xcxcxy

02

0

21

0

mcxcym

ii

m

ii 2

01

0

2


Si hacemos

(1)

(2)

De (1) y (2) se obtiene

(3)

(4)

(5)

Sistema sobre-determinado para ajuste de una rectaEscribiendo la ecuación c1x + c2 = y para todos los puntos conocidos (xi, yi), i =1,..,m obtenemos un sistema sobre-determinado.

O

Donde

Ecuación normal para el ajusteEl cuadrado de la norma 2 de r - y – Ac es

La minimización de requiere que

3


o que

Estadístico R2

R2 es una medida de que tan bien la función de ajuste sigue la tendencia de la data.Se define

es el valor de ajuste de la función en los puntos de la data conocida para el ajuste a una recta

y es el promedio de los valores y

iym

y1

Luego:

Cuando R2 1 la función de ajuste tiende a la dataCuando R2 0 la función de ajuste no es significativamente mejor que la aproximación a la data por este medio.

Ajuste de funciones no lineales transformadas

Algunas de funciones no lineales ajustadas y = F(x) pueden ser transformadas en una ecuación de la forma v =c1 u+c2

El ajuste por mínimos cuadrados a una recta es desarrollado en la transformación de variables.

Los parámetros no lineales de ajuste de la función son obtenidos por transformación inversa de las variables originales.

El ajuste de mínimos cuadrados a la ecuación transformada no produce el mismo ajuste de coeficientes como la solución directa de un problemas de ajuste de mínimos cuadrados no lineal que involucra el original ajuste de la función

Ejemploy = e x ln y = c1x + c2

y = x ln y = c1 ln x + c2

y = x e x ln (y/x) = c1x+c2

Ajuste de la combinación lineal de funciones Definición de la función de ajuste y funciones base Formulación del sistema sobre-determinado Solución vía ecuaciones normales

4


Considere la función de ajuste

F(x) = c1 f1(x)+c2 f2(x)+… +cn fk(x)Ó

F(x) =

Las funciones base

son seleccionadas por la persona que hace el ajusteLos coeficientes

son determinados por el método de los mínimos cuadradosF(x) puede ser cualquier combinación de funciones que sean lineales en los coeficientes cj, por esta razón

son todas funciones base válidas. Por otro lado

no son funciones base válidas, desde que los cj son los parámetros del ajuste.La función de ajuste para un polinomio cúbico es

la cual tiene las funciones base

El objetivo es encontrar los cj tal que F(xi) .Desde que F(xi) , el residual para cada punto de la data es

La solución de mínimos cuadrados proporciona los cj que minimizan .Considere la función de ajuste con tres funciones base

Asumiendo que F(x) actúa como una función interpolante. Entonces las ecuacionesson todos satisfechas.

Las ecuaciones anteriores son equivalentes al sistema sobredeterminado

5


A c = yDonde

Si F(x) no interpola la data, entonces la ecuación matricial precedente no puede ser resuelta exactamente; b no cae en el espacio columna de A.El método de los mínimos cuadrados provee la solución de compromiso que minimiza

El valor de c que minimiza satisface la ecuación normal

En general, para n funciones básicas

Fuente: Scientific Computation by Michael T. Heathhttp://www.cse.uiuc.edu/heath/scicomp/notes/index.html

6

http://www.cse.uiuc.edu/heath/scicomp/notes/index.html

ajuste - regresion

Documents