5. ejec 1 - regresión lineal -dureza vs tsolido

8
Regresión lineal. Regresión lineal simple – MINITAB Problema 2: Asistente => regresión => para un factor => lineal Colocar él Y y X => seleccionar lineal => aceptar i ! i de datos Cantidad m ás). variarm ucho. Para obteneruna estim ación m ás precisa, se deben utilizarm uestras m ás grandes (norm alm ente 40 o fuerza de la relación. Las m ediciones de la fuerza de la relación, com o el R-cuadrado y el R-cuadrado (ajustado), pueden El tam año de su m uestra (n = 11)no es lo suficientem ente grande com o para proveeruna estim ación m uy precisa de la poco com unes D atos resultados. N o hay puntos de datos poco com unes. Los puntos de datos poco com unes pueden teneruna fuerte influencia sobre los Normalidad pequeñas, la exactitud del valorp es sensible a errores residuales no norm ales. D ebido a que usted tiene m enos de 15 puntos de datos, debe tenercuidado al interpretarel valorp. Con m uestras del m odelo Ajuste • La línea se ajusta adecuadam ente en áreas de interés especial. • El m odelo ajusta apropiadam ente cualquiercurvatura en los datos (evite un ajuste excesivo). • La m uestra cubre adecuadam ente el rango de valores de X. para asegurarse de que: U sted debe evaluarel ajuste de los datos y del m odelo de acuerdo con sus m etas. O bserve la gráfica de línea ajustada Verificar Estado D escripción Regresión para D ureza (y)vs. tsolido (x) Tarjeta de inform e 1. Cantidad de datos: 2. Datos poco comunes: no hay datos atípicos, estos datos muestran un buen nivel de residuo residuos atípicos: I residuos estándar I > 2.5 3. Normalidad: 4. Ajuste del modelo: nos indica si el modelo es bueno, ajusta los datos pronosticados (deltas de Y) y el modelo. Que los deltas de Y no estén lejos

Upload: emy

Post on 15-Jan-2016

11 views

Category:

Documents


0 download

DESCRIPTION

Regresion lineal

TRANSCRIPT

Page 1: 5. Ejec 1 - Regresión Lineal -Dureza vs Tsolido

Regresión lineal.

Regresión lineal simple – MINITAB

Problema 2:

Asistente => regresión => para un factor => linealColocar él Y y X => seleccionar lineal => aceptar

i

!

ide datosCantidad

más).variar mucho. Para obtener una estimación más precisa, se deben utilizar muestras más grandes (normalmente 40 ofuerza de la relación. Las mediciones de la fuerza de la relación, como el R-cuadrado y el R-cuadrado (ajustado), puedenEl tamaño de su muestra (n = 11) no es lo suficientemente grande como para proveer una estimación muy precisa de la

poco comunesDatos

resultados.No hay puntos de datos poco comunes. Los puntos de datos poco comunes pueden tener una fuerte influencia sobre los

Normalidadpequeñas, la exactitud del valor p es sensible a errores residuales no normales.Debido a que usted tiene menos de 15 puntos de datos, debe tener cuidado al interpretar el valor p. Con muestras

del modeloAjuste

• La línea se ajusta adecuadamente en áreas de interés especial.• El modelo ajusta apropiadamente cualquier curvatura en los datos (evite un ajuste excesivo).• La muestra cubre adecuadamente el rango de valores de X.para asegurarse de que:Usted debe evaluar el ajuste de los datos y del modelo de acuerdo con sus metas. Observe la gráfica de línea ajustada

Verificar Estado Descripción

Regresión para Dureza (y) vs. t solido (x)Tarjeta de informe

1. Cantidad de datos:2. Datos poco comunes: no hay datos atípicos, estos datos muestran un buen nivel de

residuoresiduos atípicos: I residuos estándar I > 2.5

3. Normalidad: 4. Ajuste del modelo: nos indica si el modelo es bueno, ajusta los datos pronosticados (deltas

de Y) y el modelo.Que los deltas de Y no estén lejos

Page 2: 5. Ejec 1 - Regresión Lineal -Dureza vs Tsolido

13.5 3.4855 (3.2732, 3.6977)14 3.3509 (3.1398, 3.5620)

14.5 3.2164 (3.0059, 3.4268)15 3.0818 (2.8716, 3.2921)

15.5 2.9473 (2.7368, 3.1578)16 2.8127 (2.6016, 3.0239)

16.5 2.6782 (2.4660, 2.8904)17 2.5436 (2.3299, 2.7574)

17.5 2.4091 (2.1934, 2.6248)18 2.2745 (2.0565, 2.4925)

9 4.6964 (4.4566, 4.9361)

18.5 2.14 (1.9193, 2.3607)19 2.0055 (1.7816, 2.2293)

19.5 1.8709 (1.6436, 2.0982)20 1.7364 (1.5052, 1.9675)

20.5 1.6018 (1.3665, 1.8371)21 1.4673 (1.2275, 1.7070)

9.5 4.5618 (4.3265, 4.7971)10 4.4273 (4.1961, 4.6584)

10.5 4.2927 (4.0654, 4.5200)11 4.1582 (3.9343, 4.3820)

11.5 4.0236 (3.8029, 4.2444)12 3.8891 (3.6711, 4.1071)

12.5 3.7545 (3.5389, 3.9702)13 3.62 (3.4063, 3.8337)

X Y pronosticada IP de 95%

22201816141210

5

4

3

2

1

t solido (x)

Dur

eza

(y)

Y: Dureza (y)X: t solido (x)

Gráfica de predicción

intervalo de predicción de 95%.cualquier valor de X. Las líneas discontinuas azules muestran elLa línea ajustada roja muestra el valor pronosticado de Y para

y utilice la herramienta de retículo.Para obtener valores pronosticados adicionales, haga clic con el botón derecho en la gráfica

Regresión para Dureza (y) vs. t solido (x)Informe de predicción

Ecuación para intervalos de predicción y confianza.

Revisar intervalos de confianza y predicción.

Intervalos de predicción: línea roja, valores no observados pero dentro del rango Intervalos de Confianza: líneas azules discontinuas, valores observados Para un 90% de confianza, acepto más error, el intervalo de predicción las líneas azules se

cierra. Para un 99% de confianza, el intervalo de predicción las líneas azules se abren.

Page 3: 5. Ejec 1 - Regresión Lineal -Dureza vs Tsolido

4.54.03.53.02.52.0

0.10

0.05

0.00

-0.05

-0.10

-0.15

Residuos versus valores ajustados

Identifique cualquier residuo grande que pueda tener una fuerte influencia sobre la línea ajustada.el modelo de regresión. Lo ideal es que los puntos se ubiquen aleatoriamente a ambos lados del cero.Busque patrones, tales como una curvatura fuerte o conglomerados, que pueden indicar problemas con

Buscar estos patrones:

Residuos grandes

Curvatura fuerte

Conglomerados

Variación desigual

Regresión para Dureza (y) vs. t solido (x)Informe de diagnóstico

Interpretación: Prueba para varianza constante.Los residuos no presenta patrones como los cuadros amarillos, eso quiere decir que están los datos bien tomados de manera aleatoria.

Page 4: 5. Ejec 1 - Regresión Lineal -Dureza vs Tsolido

R-cuadrado (ajustado) 99.01% 99.13%Valor p, modelo <0.005* <0.005*Valor p, término lineal <0.005* 0.002*Valor p, término cuadrático — 0.181Desviación estándar de los residuos 0.089 0.084

Estadísticas LinealModelo seleccionado

CuadráticoModelo alternativo

201816141210

4.5

4.0

3.5

3.0

2.5

2.0

t solido (x)

Dur

eza

(y)

Y: Dureza (y)X: t solido (x)

Gráfica de línea ajustada para modelo linealY = 7.118 - 0.2691 X

* Estadísticamente significativo (p < 0.05)

Regresión para Dureza (y) vs. t solido (x)Informe de selección de modelo

Interpretación:P value del modelo < 0.005, muy bueno.

El R2 del cuadrático es más alto, significa que existe un mejor modelo (ecuación) para hacer predicciones.Sí usamos el modelo alternativo cuadrático: los residuos (errores) se hacen más pequeños.

Page 5: 5. Ejec 1 - Regresión Lineal -Dureza vs Tsolido

significativa (p < 0.05).La relación entre Dureza (y) y t solido (x) es estadísticamente

Sí No

0 0.05 0.1 > 0.5

P < 0.001

Dureza (y).El modelo de regresión puede explicar 99.11% de la variación en

Bajo Alto

0% 100%

R-cuad. = 99.11%

aumenta, Dureza (y) tiende a disminuir.La correlación negativa (r = -1.00) indica que cuando t solido (x)

-1 0 1Negativo perfecto Sin correlación Positivo perfecto

-1.00

20.017.515.012.510.0

4

3

2

t solido (x)

Dur

eza

(y)

la causa de Y.Una relación estadísticamente significativa no implica que X se Dureza (y).corresponda a un valor o rango de valores deseados paravalor de t solido (x), o hallar la configuración de t solido (x) queecuación se puede utilizar para predecir Dureza (y) para unSi el modelo se ajusta adecuadamente a los datos, esta Y = 7.118 - 0.2691 Xrelación entre Y y X es:La ecuación ajustada para el modelo lineal que describe la

Y: Dureza (y)X: t solido (x)

¿Existe una relación entre Y y X?

Gráfica de línea ajustada para modelo linealY = 7.118 - 0.2691 X

Comentarios

Regresión para Dureza (y) vs. t solido (x)Informe de resumen

% de variación explicado por el modelo

Correlación entre Y y X

COEFICIENTE DE CORRELACION “R” R>85%

Cuando no hay correlación R<0.6R > 0.62 es correlación moderada o débilSí tienen signos de + y – indican la dirección de la pendiente, toman valores desde -1 hasta +1

COEFICIENTE DE DETERMINACIÓN “R2” R2>70%

R2= para una variable - R2 ajustado= para una variableCuando no hay determinación R2<0.36R2 > 0.62 es correlación moderada o débil

ESTADISTICA => REGRESIÓN => REGRESIÓN => AJUSTAR1. Modelo: queda igual2. Opciones.

Ponderaciones: nada Nivel de confianza: 95 Tipo de intervalo: bilateral (para ambos lados) suma de cuadrados. Ajustado tipo

III Box cox: usar cuando los datos no son normales

3. Codificación: porque son datos continuos (numéricos o letras) no aparece opciones, por eso se deja así.

Page 6: 5. Ejec 1 - Regresión Lineal -Dureza vs Tsolido

4. Paso a paso: método: ninguno.NOTA:USAR el Modelo de regresión paso a paso:Ecuación lineal por cada segmento, para simplificar el comportamiento no linealALFA ENTRAR, ALFA RETIRARPara incluir el término para cada modelos o segmento.

5. Graficas:Residuos para graficas: EstandarizadosGraficas residuos: 4 en 1

6. Resultados: hacer check también a Durbin Watson.

7. Almacenamiento:

Ajustes, residuos estandarizados, DFITS, coeficientes.

8. Aceptar

Análisis de Varianza - ANNOVA

Fuente GL SC Ajust. MC Ajust. Valor F Valor pRegresión 1 7.96509 7.96509 1005.80 0.000 t solido (x) 1 7.96509 7.96509 1005.80 0.000Error 9 0.07127 0.00792Total 10 8.03636

Resumen del modelo - ESTADISTICO

R-cuad. R-cuad. S R-cuad. (ajustado) (pred)0.0889898 99.11% 99.01% 98.68%

Coeficientes

EE delTérmino Coef coef. Valor T Valor p VIFConstante 7.118 0.130 54.73 0.000t solido (x) -0.26909 0.00848 -31.71 0.000 1.00

Ecuación de regresión

Dureza (y) = 7.118 - 0.26909 t solido (x)

Estadístico de Durbin-Watson

Estadístico de Durbin-Watson = 2.25904

PRUEBA EL SUPUESTO DE VARIANZA CONSTANTE DE RESIDUOS, SE BUSCA EN TABLAS, QUE ESTAN EN VALORES MINIMOS Y MAXIMOS A LA CANTIDAD DE DATOS.

SE DESEA UN ESTADITICO > 1 cumple el supuesto de varianza constate de de residuos.

Page 7: 5. Ejec 1 - Regresión Lineal -Dureza vs Tsolido

GRAFICA DE LINEA AJUSTADA BINARIA

Seleccionas y, xGraficas: Residuos para las graficas: estandarizados. Graficas de residuos: check a residuos vs. Orden o 4 en 1

Opciones: check a mostrar IC y IP aun 95%

Almacenamiento: no se hace check a nada porque ya anteriormente se realizo el check.

201816141210

5.0

4.5

4.0

3.5

3.0

2.5

2.0

1.5

S 0.0889898R-cuad. 99.1%R-cuad.(ajustado) 99.0%

t solido (x)

Dur

eza

(y)

RegresiónIC de 95%IP de 95%

Dureza vs t solidoDureza (y) = 7.118 - 0.2691 t solido (x)

Queremos que nuestros datos azules estén dentro de la línea verde. INTERVALOS DE CONFIANZA Sí la mayoría están dentro del rango, nuestro modelo sería muy bueno.

Si algunos puntos están fuera de la línea verde queremos que estén dentro de la LINEA MORADA, ya que indica el intervalo de predicción.

Sí están fuera de la línea morada, el modelo es pobre, no es consistentes desde un inicio, eso lo indicaría el annova.

S: error estándar o erros típico