5. ejec 1 - regresión lineal -dureza vs tsolido
DESCRIPTION
Regresion linealTRANSCRIPT
Regresión lineal.
Regresión lineal simple – MINITAB
Problema 2:
Asistente => regresión => para un factor => linealColocar él Y y X => seleccionar lineal => aceptar
i
!
ide datosCantidad
más).variar mucho. Para obtener una estimación más precisa, se deben utilizar muestras más grandes (normalmente 40 ofuerza de la relación. Las mediciones de la fuerza de la relación, como el R-cuadrado y el R-cuadrado (ajustado), puedenEl tamaño de su muestra (n = 11) no es lo suficientemente grande como para proveer una estimación muy precisa de la
poco comunesDatos
resultados.No hay puntos de datos poco comunes. Los puntos de datos poco comunes pueden tener una fuerte influencia sobre los
Normalidadpequeñas, la exactitud del valor p es sensible a errores residuales no normales.Debido a que usted tiene menos de 15 puntos de datos, debe tener cuidado al interpretar el valor p. Con muestras
del modeloAjuste
• La línea se ajusta adecuadamente en áreas de interés especial.• El modelo ajusta apropiadamente cualquier curvatura en los datos (evite un ajuste excesivo).• La muestra cubre adecuadamente el rango de valores de X.para asegurarse de que:Usted debe evaluar el ajuste de los datos y del modelo de acuerdo con sus metas. Observe la gráfica de línea ajustada
Verificar Estado Descripción
Regresión para Dureza (y) vs. t solido (x)Tarjeta de informe
1. Cantidad de datos:2. Datos poco comunes: no hay datos atípicos, estos datos muestran un buen nivel de
residuoresiduos atípicos: I residuos estándar I > 2.5
3. Normalidad: 4. Ajuste del modelo: nos indica si el modelo es bueno, ajusta los datos pronosticados (deltas
de Y) y el modelo.Que los deltas de Y no estén lejos
13.5 3.4855 (3.2732, 3.6977)14 3.3509 (3.1398, 3.5620)
14.5 3.2164 (3.0059, 3.4268)15 3.0818 (2.8716, 3.2921)
15.5 2.9473 (2.7368, 3.1578)16 2.8127 (2.6016, 3.0239)
16.5 2.6782 (2.4660, 2.8904)17 2.5436 (2.3299, 2.7574)
17.5 2.4091 (2.1934, 2.6248)18 2.2745 (2.0565, 2.4925)
9 4.6964 (4.4566, 4.9361)
18.5 2.14 (1.9193, 2.3607)19 2.0055 (1.7816, 2.2293)
19.5 1.8709 (1.6436, 2.0982)20 1.7364 (1.5052, 1.9675)
20.5 1.6018 (1.3665, 1.8371)21 1.4673 (1.2275, 1.7070)
9.5 4.5618 (4.3265, 4.7971)10 4.4273 (4.1961, 4.6584)
10.5 4.2927 (4.0654, 4.5200)11 4.1582 (3.9343, 4.3820)
11.5 4.0236 (3.8029, 4.2444)12 3.8891 (3.6711, 4.1071)
12.5 3.7545 (3.5389, 3.9702)13 3.62 (3.4063, 3.8337)
X Y pronosticada IP de 95%
22201816141210
5
4
3
2
1
t solido (x)
Dur
eza
(y)
Y: Dureza (y)X: t solido (x)
Gráfica de predicción
intervalo de predicción de 95%.cualquier valor de X. Las líneas discontinuas azules muestran elLa línea ajustada roja muestra el valor pronosticado de Y para
y utilice la herramienta de retículo.Para obtener valores pronosticados adicionales, haga clic con el botón derecho en la gráfica
Regresión para Dureza (y) vs. t solido (x)Informe de predicción
Ecuación para intervalos de predicción y confianza.
Revisar intervalos de confianza y predicción.
Intervalos de predicción: línea roja, valores no observados pero dentro del rango Intervalos de Confianza: líneas azules discontinuas, valores observados Para un 90% de confianza, acepto más error, el intervalo de predicción las líneas azules se
cierra. Para un 99% de confianza, el intervalo de predicción las líneas azules se abren.
4.54.03.53.02.52.0
0.10
0.05
0.00
-0.05
-0.10
-0.15
Residuos versus valores ajustados
Identifique cualquier residuo grande que pueda tener una fuerte influencia sobre la línea ajustada.el modelo de regresión. Lo ideal es que los puntos se ubiquen aleatoriamente a ambos lados del cero.Busque patrones, tales como una curvatura fuerte o conglomerados, que pueden indicar problemas con
Buscar estos patrones:
Residuos grandes
Curvatura fuerte
Conglomerados
Variación desigual
Regresión para Dureza (y) vs. t solido (x)Informe de diagnóstico
Interpretación: Prueba para varianza constante.Los residuos no presenta patrones como los cuadros amarillos, eso quiere decir que están los datos bien tomados de manera aleatoria.
R-cuadrado (ajustado) 99.01% 99.13%Valor p, modelo <0.005* <0.005*Valor p, término lineal <0.005* 0.002*Valor p, término cuadrático — 0.181Desviación estándar de los residuos 0.089 0.084
Estadísticas LinealModelo seleccionado
CuadráticoModelo alternativo
201816141210
4.5
4.0
3.5
3.0
2.5
2.0
t solido (x)
Dur
eza
(y)
Y: Dureza (y)X: t solido (x)
Gráfica de línea ajustada para modelo linealY = 7.118 - 0.2691 X
* Estadísticamente significativo (p < 0.05)
Regresión para Dureza (y) vs. t solido (x)Informe de selección de modelo
Interpretación:P value del modelo < 0.005, muy bueno.
El R2 del cuadrático es más alto, significa que existe un mejor modelo (ecuación) para hacer predicciones.Sí usamos el modelo alternativo cuadrático: los residuos (errores) se hacen más pequeños.
significativa (p < 0.05).La relación entre Dureza (y) y t solido (x) es estadísticamente
Sí No
0 0.05 0.1 > 0.5
P < 0.001
Dureza (y).El modelo de regresión puede explicar 99.11% de la variación en
Bajo Alto
0% 100%
R-cuad. = 99.11%
aumenta, Dureza (y) tiende a disminuir.La correlación negativa (r = -1.00) indica que cuando t solido (x)
-1 0 1Negativo perfecto Sin correlación Positivo perfecto
-1.00
20.017.515.012.510.0
4
3
2
t solido (x)
Dur
eza
(y)
la causa de Y.Una relación estadísticamente significativa no implica que X se Dureza (y).corresponda a un valor o rango de valores deseados paravalor de t solido (x), o hallar la configuración de t solido (x) queecuación se puede utilizar para predecir Dureza (y) para unSi el modelo se ajusta adecuadamente a los datos, esta Y = 7.118 - 0.2691 Xrelación entre Y y X es:La ecuación ajustada para el modelo lineal que describe la
Y: Dureza (y)X: t solido (x)
¿Existe una relación entre Y y X?
Gráfica de línea ajustada para modelo linealY = 7.118 - 0.2691 X
Comentarios
Regresión para Dureza (y) vs. t solido (x)Informe de resumen
% de variación explicado por el modelo
Correlación entre Y y X
COEFICIENTE DE CORRELACION “R” R>85%
Cuando no hay correlación R<0.6R > 0.62 es correlación moderada o débilSí tienen signos de + y – indican la dirección de la pendiente, toman valores desde -1 hasta +1
COEFICIENTE DE DETERMINACIÓN “R2” R2>70%
R2= para una variable - R2 ajustado= para una variableCuando no hay determinación R2<0.36R2 > 0.62 es correlación moderada o débil
ESTADISTICA => REGRESIÓN => REGRESIÓN => AJUSTAR1. Modelo: queda igual2. Opciones.
Ponderaciones: nada Nivel de confianza: 95 Tipo de intervalo: bilateral (para ambos lados) suma de cuadrados. Ajustado tipo
III Box cox: usar cuando los datos no son normales
3. Codificación: porque son datos continuos (numéricos o letras) no aparece opciones, por eso se deja así.
4. Paso a paso: método: ninguno.NOTA:USAR el Modelo de regresión paso a paso:Ecuación lineal por cada segmento, para simplificar el comportamiento no linealALFA ENTRAR, ALFA RETIRARPara incluir el término para cada modelos o segmento.
5. Graficas:Residuos para graficas: EstandarizadosGraficas residuos: 4 en 1
6. Resultados: hacer check también a Durbin Watson.
7. Almacenamiento:
Ajustes, residuos estandarizados, DFITS, coeficientes.
8. Aceptar
Análisis de Varianza - ANNOVA
Fuente GL SC Ajust. MC Ajust. Valor F Valor pRegresión 1 7.96509 7.96509 1005.80 0.000 t solido (x) 1 7.96509 7.96509 1005.80 0.000Error 9 0.07127 0.00792Total 10 8.03636
Resumen del modelo - ESTADISTICO
R-cuad. R-cuad. S R-cuad. (ajustado) (pred)0.0889898 99.11% 99.01% 98.68%
Coeficientes
EE delTérmino Coef coef. Valor T Valor p VIFConstante 7.118 0.130 54.73 0.000t solido (x) -0.26909 0.00848 -31.71 0.000 1.00
Ecuación de regresión
Dureza (y) = 7.118 - 0.26909 t solido (x)
Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 2.25904
PRUEBA EL SUPUESTO DE VARIANZA CONSTANTE DE RESIDUOS, SE BUSCA EN TABLAS, QUE ESTAN EN VALORES MINIMOS Y MAXIMOS A LA CANTIDAD DE DATOS.
SE DESEA UN ESTADITICO > 1 cumple el supuesto de varianza constate de de residuos.
GRAFICA DE LINEA AJUSTADA BINARIA
Seleccionas y, xGraficas: Residuos para las graficas: estandarizados. Graficas de residuos: check a residuos vs. Orden o 4 en 1
Opciones: check a mostrar IC y IP aun 95%
Almacenamiento: no se hace check a nada porque ya anteriormente se realizo el check.
201816141210
5.0
4.5
4.0
3.5
3.0
2.5
2.0
1.5
S 0.0889898R-cuad. 99.1%R-cuad.(ajustado) 99.0%
t solido (x)
Dur
eza
(y)
RegresiónIC de 95%IP de 95%
Dureza vs t solidoDureza (y) = 7.118 - 0.2691 t solido (x)
Queremos que nuestros datos azules estén dentro de la línea verde. INTERVALOS DE CONFIANZA Sí la mayoría están dentro del rango, nuestro modelo sería muy bueno.
Si algunos puntos están fuera de la línea verde queremos que estén dentro de la LINEA MORADA, ya que indica el intervalo de predicción.
Sí están fuera de la línea morada, el modelo es pobre, no es consistentes desde un inicio, eso lo indicaría el annova.
S: error estándar o erros típico