quimio clase linealidad

31

Click here to load reader

Upload: edgard-somarriba

Post on 09-Dec-2015

64 views

Category:

Documents


5 download

DESCRIPTION

Quimio Clase Linealidad

TRANSCRIPT

Page 1: Quimio Clase Linealidad

UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA, UNAN-León

QUIMIOMETRIAMSc. FABIO PALAVICCINI

Page 2: Quimio Clase Linealidad

2

CALIBRACIÓN Y REGRESION

LINEAL

Page 3: Quimio Clase Linealidad

3

ANÁLISIS DE CORRELACIÓNCOVARIANZA DE DOS VARIABLES ALEATORIAS X e Y

La correlación es una mediad de la asociación entre dos variables entre dos variables. Cuando existe correlación los valores a lo largo de las dos están ligadas entre si de algún modo.

Esta relación se estima a través de la covarianza (COVxy) la cual nos indica si la posible correlación entre dos variables es directa o inversa:

• Directa: Si COVxy > 0

• Inversa: Si COVxy < 0

• Incorreladas: Si COVxy = 0

El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relación entre las variables.

Page 4: Quimio Clase Linealidad

4

ANÁLISIS DE CORRELACIÓNCOEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON

El coeficiente de correlación lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales).

Tiene el mismo signo que COVxy. Por tanto de su signo obtenemos el que la posible relación sea directa o inversa.

r es útil para determinar si hay correlación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,...)

Page 5: Quimio Clase Linealidad

ANÁLISIS DE CORRELACIÓNPROPIEDADES DE r

• Es adimensional.

• Sólo toma valores entre

• Las variables son incorreladas cuando r = 0.

• Relación lineal perfecta entre dos variables cuando r = +1 o cuando r = -1.

• Cuanto más cerca esté r de +1 o -1 mejor será el grado de correlación lineal.

-1 +10

5

Relación directa casi perfecta

Relación directa casi perfecta

Variables incorreladas

Page 6: Quimio Clase Linealidad

6

ANÁLISIS DE CORRELACIÓN

CORRELACIONES POSITIVAS

r=0,6

30

40

50

60

70

80

90

100

110

140 150 160 170 180 190 200

r=0,1

30

80

130

180

230

280

330

140 150 160 170 180 190 200

r=0,4

30405060708090

100110120130

140 150 160 170 180 190 200

r=0,8

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Page 7: Quimio Clase Linealidad

7

ANÁLISIS DE CORRELACIÓNCORRELACIONES POSITIVAS

r=1

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

r=0,9

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

r=0,99

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Page 8: Quimio Clase Linealidad

8

ANÁLISIS DE CORRELACIÓNCORRELACIONES NEGATIVAS

r=-0,5

0

10

20

30

40

50

60

70

80

90

140 150 160 170 180 190 200

r=-0,7

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

r=-0,95

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

r=-0,999

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

Page 9: Quimio Clase Linealidad

9

ANÁLISIS DE REGRESIÓN

De lo que se trata es de verificar la función matemática que permita predecir a que valores de una variable “y” corresponden valores dados de una variable “x”. Esto se suele escribir como y = f (x), donde x es la variable independiente y la variable dependiente es y.

Rectas de regresión

y

x

(x1,y1)

(x2,y2)

(x3,y3)(x4,y4)

Y^bbx

Page 10: Quimio Clase Linealidad

10

ANÁLISIS DE REGRESIÓN

Entonces para cada valor medido de x se tendrán dos valores:

•El valor medido en el experimento y

•Y su valor esperado, calculado a partir de la recta de regresión

La diferencia entre ambos (y - ) debe ser lo más pequeña posible, para tener una

buena aproximación, al modelo ,lineal.

El objetivo del Análisis de Regresión es minimizar matemáticamente el cuadrado de

estas diferencias con el denominado método de los mínimos cuadrados.

02

i

i

b

Page 11: Quimio Clase Linealidad

11

MODELO DE REGRESIÓN LINEAL

Consideremos el caso del modelo:

En éste modelo, 0 y 1 son parámetros poblacionales que no se conocen. 0 es conocido como la ordenada en el origen, intercepto o intercepción de eje poblacional y 1 es la pendiente poblacional del modelo.

Donde es la predicción de y, b0 es la estimación de 0 y b1 es la estimación de 1, estos se denominan “coeficientes de regresión”.

Page 12: Quimio Clase Linealidad

12

Para cada xi la diferencia entre el valor real observado y i, y el valor predicho, es denominada residual o residuo, ei, el que se calcula mediante:

En la siguiente figura se muestran algunas características del modelo:

MODELO DE REGRESIÓN LINEAL

Page 13: Quimio Clase Linealidad

13

MODELO DE REGRESIÓN LINEAL

COEFICIENTE DE DETERMINACIÓN

EL INTERCEPTO U ORDENADA EN EL ORIGEN

PENDIENTE

PARAMETROS DE REGRESION

Page 14: Quimio Clase Linealidad

14

MODELO DE REGRESIÓN LINEAL

ANÁLISIS DE GRAFICOS DE LOS RESIDUOS

0

Buena Linealidad

+

-x

0

+

-

No existe buena linealidad

Page 15: Quimio Clase Linealidad

15

Tal y como ya hemos mencionado en algunas ocasiones solemos utilizar el coeficiente de correlación lineal para decir si un modelo es lineal. Por lo general este coeficiente se ubica en el intervalo:

Es importante especificar que, el hecho de que r = 0, no significa que no exista correlación entre los datos, solo que esta no es lineal.

Un test que puede ayudarnos a decidir sobre la linealidad de un recta de calibración es calcular el siguiente estadístico t:

Luego se compara éste con ttab a un nivel de significación deseado (α = 0.05) usando una tabla de 2 colas y n-2 grados de libertad.

LINEALIDAD DE UN MODELO

MODELO DE REGRESIÓN LINEAL

Page 16: Quimio Clase Linealidad

16

Para ello plantemos las siguientes hipótesis:H0: No existe linealidad entre x e yH1: Existe linealidad entre x e y

Si tcal >ttab se rechaza H0 y se concluye que existe correlación lineal entre los datos x e y.

LINEALIDAD DE UN MODELO

MODELO DE REGRESIÓN LINEAL

Page 17: Quimio Clase Linealidad

17

Cuando cada partición se asocia a una porción correspondiente del total de grados de libertad, la técnica es conocida cono ANALISIS DE VARIANCIA (ANOVA), que generalmente se presenta en un cuadro de la siguiente forma:

ANÁLISIS DE VARIANZA PARA LA REGRESIÓN LINEAL SIMPLE

Cuadro de ANOVAFuentes de variación Suma de cuadrados GL Cuadrados medios FcalRegresión SCR 1 CMR=SCR/1

CMR/CMEError o residual SCE n-2 CME=SCE /n-2total SCT n-1

El estadístico de contraste es F. Se evalúa las hipótesis:H0 : No existe una regresión lineal entre X e YH1 : Existe regresión lineal de Y en función de X

Se compara el Fcal con un F(0.05;1;n-2).

Si Fcal > Ftab, se rechaza H0 y existe un alto grado de que la regresión sea lineal, es decir la regresión lineal es altamente significativa.

Page 18: Quimio Clase Linealidad

18

Los términos del ANOVA son:

ANÁLISIS DE VARIANZA PARA LA REGRESIÓN LINEAL SIMPLE

Suma de cuadrados del total (SCT), mide la dispersión o variación total en los valores observados de Y. Este término se utiliza para el cálculo de la variancia de la muestra.

Suma de cuadrados explicada (suma de cuadrados debido a la regresión, scr) mide la variabilidad total en los valores observados de Y en consideración a la relación lineal entre X e Y.

Suma de Cuadrados inexplicada (Suma de Cuadrados del Error o Residual, SCE) mide la dispersión de los valores de Y observados respecto a la recta de regresión de (es la cantidad que se minimiza cuando se obtiene la recta de regresión).

Page 19: Quimio Clase Linealidad

19

MODELO DE REGRESIÓN LINEAL

ERRORES EN LA PENDIENTE Y EL INTERCEPTO

Para calcular los errores aleatorios en la pendiente e intercepto, se debe calcular en primer lugar el error de los residuos Sy/x, que estima los errores aleatorios en el eje y.

Desviación residual

Desvío de la pendiente

Desvío del intercepto

Page 20: Quimio Clase Linealidad

20

MODELO DE REGRESIÓN LINEAL

ERRORES EN LA PENDIENTE Y EL INTERCEPTO

Los valores de Sb0 y Sb1, pueden ser usados para calcular los limites de confianza de los coeficientes de regresión:

Estos intervalos sirven para decidir si la recta se ajusta a determinadas especificaciones predeterminadas de antemano, tales como: β0 = 0 y β1 = 1.

Page 21: Quimio Clase Linealidad

21

APLICACIÓN No I

Page 22: Quimio Clase Linealidad

22

Page 23: Quimio Clase Linealidad

23

MODELO DE REGRESIÓN LINEAL

CALCULO DE UNA CONCENTRACIÓN Y SU ERROR ALEATORIO

La concentración de una muestra a partir de los coeficientes de regresión se realiza mediante:

Sin embargo conviene estimar el error asociado a la concentración calculada, mediante la siguiente ecuación:

Una vez calculado esto se expresa la concentración de la muestra como un intervalo, como sigue:

CAP

Donde y0 es el valor experimental de y a partir del cual se determina la concentración x0, Sxo es la desviación estándar estimada de x0,

n es el número de puntos de la recta de regresión.

Page 24: Quimio Clase Linealidad

24

MODELO DE REGRESIÓN LINEAL

CALCULO DE UNA CONCENTRACIÓN Y SU ERROR ALEATORIO

En algunos casos el investigador o analista, puede realizar varias lectura de y0 para obtener una media de x0, en tal caso se dispone de m lecturas por lo que la ecuación de Sx0 que se usa es:

Donde y0 es el valor experimental de y a partir del cual se determina la concentración x0, Sxo es la desviación estándar estimada de x0, n es el número de puntos de la recta de regresión, m es el número de lecturas realizadas a y0. Una vez calculado esto se expresa la concentración de la muestra como un intervalo, como sigue:

Page 25: Quimio Clase Linealidad

25

INTERVALOS DE CONFIANZA EN REGRESIÓN LINEAL

En muchos casos es de interés conocer, entre que valores se encuentra los términos de un modelo de regresión, esto para darnos una idea del ajuste del modelo.

En estas condiciones hacemos uso de los llamados: Intervalos de confianza (en algunos casos llamados también bandas de confianza), que nos ayudan a discernir gráficamente que tan bien se encuentra ajustado nuestro modelo de regresión.

Estos pueden ser calculados usando las siguientes ecuaciones:

Intervalos de confianza2

2

2 )(

)(11ˆˆ

xx

xx

nsty

i

g

Page 26: Quimio Clase Linealidad

26

APLICACIÓN DE REGRESION

Dado los siguientes valores de estándar de concentración de oxitocina con sus respectivas respuesta. encuentre los parámetros de regresión, evalué la linealidad. Si la lectura de área de una muestra es 458860.3, cual es la concentración de oxitocina en la muestra con su error

Conncetración respuestaUI/mL

1 115344.52 229393.54 469670.08 934958.0

16 1872495.0

a -2163.52083b 117183.1808Sa 1649.320871Sb 199.7160498

R2 0.999991286Sx/y 2436.208382

±

Page 27: Quimio Clase Linealidad

27

REGRESIÓN LINEAL PONDERADA

Si los datos son heterocedásticos o si bien han perdido homocedasticidad al linealizar el modelo, la recta de regresión no es adecuada para el calculo de los limites de confianza.

En estas condiciones hacemos uso de la regresión ponderada. Par esto previamente debemos calcular una función de ponderación que utiliza el inverso de la varianza de y.

La pendiente se calcula mediante:

Donde: y son las coordenadas del centroide ponderado, es decir:

Page 28: Quimio Clase Linealidad

28

REGRESIÓN LINEAL PONDERADA

Puesto que la recta de regresión ponderada pasa por el centroide ponderado, la ordenada en el origen se calcula mediante:

La desviación estándar de los residuos se calcula mediante:

La desviación estándar del intercepto y la pendiente se calcula mediante:

Page 29: Quimio Clase Linealidad

29

REGRESIÓN LINEAL PONDERADALa desviación estándar de la predicción de la concentración viene dada por:

Donde w0 es una ponderación adecuada de y0 La desviación estándar de la predicción de la concentración viene dada por:

En regresión ponderada y debido al término 1/w0 la precisión de las predicciones varía con el peso del punto donde se hace la lectura. En general el término 1/w0 aumenta con el aumento de x, por lo que se obtienen límites de confianza mayores a valores altos de concentración, esto se refleja en el siguiente gráfico.

Page 30: Quimio Clase Linealidad

30

REGRESIÓN LINEAL PONDERADA

Se preparó una curva de calibración estandares de ácido ascórbico en ppm, para cada estándar se realizaron tres replicas. evalúe la linealidad del método, por regresión lineal simple y por regresión ponderada.

C ppm / replicas 1 2 3

1 26.3796 26.3238 25.04365 110.7637 111.0972 112.6089

10 271.7395 272.1218 277.487915 415.6191 416.0305 415.619120 544.4357 537.2949 539.356725 671.5256 674.4119 676.7628

Page 31: Quimio Clase Linealidad

31

REGRESIÓN LINEAL PONDERADA

Dado los siguientes niveles de concentración de alfa-Tocoferol con las respectivas lecturas de áreas en diferentes muestras. Evalúe la linealidad y encuentre la concentración de alfa tocoferol

Nivel Concentración (%)

Área

1 0.0022 211118.52 0.0037 363923.83 0.0059 564046.34 0.0081 761679.15 0.0103 962813.7

Media de las áreas de los picos de -Tocoferol, de las muestras diluidas y saponificadas de los aceites vegetales comerciales estudiados

  Clover Girol Regia SabemasDiluidas 564903.7 489510.3 426789.4 422321.1Saponificadas 653974.5 372543.1 612243.3 635228.3