regresión de datos de vida - statgraphics.net

22
STATGRAPHICS – Rev. 4/d/yyyy © 2006 por StatPoint, Inc. Regresión de Datos de Vida - 1 Regresión de Datos de Vida Resumen El procedimiento Regresión de Datos de Vida está diseñado para ajustar un modelo estadístico paramétrico relacionado con tiempos de falla a una o más variables predictoras. Los predictores pueden ser cuantitativos o categóricos. Pueden ajustarse modelos de primer o segundo orden, con o sin interacciones. La distribución de los tiempos de falla puede tomar siete formas diferentes, incluyendo Weibull, exponencial, normal, lognormal, logística, loglogística, o la distribución de valores extremos para mínimos. Los tiempos de falla pueden ser censurados o no. Los resultados de este predictor incluyen un estimador de la función de riesgo y de los percentiles del tiempo de falla. Pueden hacerse predicciones a partir del modelo ajustado, también pueden detectarse residuales inusuales. StatFolio muestra: lifedata reg.sgp Datos de muestra: El archivo capacitors.sf3 contiene datos de un experimento realizado para determinar el efecto del Voltaje y de la Temperatura en los tiempos de falla de capacitores de vidrio, reportado por Meeker y Escobar (1998). Un total de n = 32 capacitores fueron probados, cuatro a cada combinación de 4 voltajes y 2 temperaturas. Una porción del archivo se muestra abajo. Voltaje (voltaje) temperatura (Temperatura) horas (Horas) 200 170 439 200 170 904 200 170 1092 200 170 1105 250 170 572 250 170 690 250 170 904 250 170 1090 300 170 315 300 170 315 300 170 439 300 170 628 350 170 258 350 170 258 350 170 347 350 170 588 200 180 959 200 180 1065 Todos los tiempos de falla observados son no censurados.

Upload: others

Post on 16-Jul-2022

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 1�

Regresión de Datos de Vida Resumen El procedimiento Regresión de Datos de Vida está diseñado para ajustar un modelo estadístico paramétrico relacionado con tiempos de falla a una o más variables predictoras. Los predictores pueden ser cuantitativos o categóricos. Pueden ajustarse modelos de primer o segundo orden, con o sin interacciones. La distribución de los tiempos de falla puede tomar siete formas diferentes, incluyendo Weibull, exponencial, normal, lognormal, logística, loglogística, o la distribución de valores extremos para mínimos. Los tiempos de falla pueden ser censurados o no. Los resultados de este predictor incluyen un estimador de la función de riesgo y de los percentiles del tiempo de falla. Pueden hacerse predicciones a partir del modelo ajustado, también pueden detectarse residuales inusuales. StatFolio muestra: lifedata reg.sgp Datos de muestra: El archivo capacitors.sf3 contiene datos de un experimento realizado para determinar el efecto del Voltaje y de la Temperatura en los tiempos de falla de capacitores de vidrio, reportado por Meeker y Escobar (1998). Un total de n = 32 capacitores fueron probados, cuatro a cada combinación de 4 voltajes y 2 temperaturas. Una porción del archivo se muestra abajo.

Voltaje (voltaje)

temperatura (Temperatura)

horas (Horas)

200 170 439 200 170 904 200 170 1092 200 170 1105 250 170 572 250 170 690 250 170 904 250 170 1090 300 170 315 300 170 315 300 170 439 300 170 628 350 170 258 350 170 258 350 170 347 350 170 588 200 180 959 200 180 1065 … … …

Todos los tiempos de falla observados son no censurados.

Page 2: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 2�

Entrada de Datos El cuadro de diálogo de entrada de datos pide información sobre los tiempos de falla y las variables predictoras:

• Variable Dependiente: una variable numérica conteniendo a Y, los tiempos de falla (para

datos no censurados) o tiempos censurados (para datos censurados). • (Censura): una columna opcional que indica si cada valor ha sido censurado o no. Ingrese un

0 si el valor de la variable dependiente representa un tiempo de falla no censurado. Ingrese un 1 si el valor ha sido censurado por la derecha (el verdadero tiempo de falla es mayor que el valor ingresado).

• Factores Cuantitativos: columnas numéricas que contengan valores de cualquier factor

cuantitativo que vaya a incluirse en el modelo. • Factores Categóricos: columnas numéricas o no-numéricas que contienen los niveles de

cualquier factor categórico que vaya a incluirse en el modelo. • Selección: Subconjunto a seleccionar.

Page 3: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 3�

Modelo Estadísticos STATGRAPHICS ajusta dos tipos de modelos paramétricos de regresión para tiempos de vida: modelos de regresión de localización-escala y modelos de regresión de log-localización-escala. Modelos de Localización – Escala Para este tipo de modelo, los percentiles de la distribución del tiempo de vida están relacionados con las variables predictoras a través de una función lineal de la forma:

( ) ( )σβββσμ pXXpYP1

221101 ... −− Φ++++=Φ+= (1)

donde μ es un parámetro de localización que depende de las variables predictoras, σ es un parámetro de escala, y Φ-1(p) es la cdf inversa estandarizada de la distribución del tiempo de vida, i.e.,

⎟⎠⎞

⎜⎝⎛ −

Φ=σ

μYYF )( (2)

Para tal modelo, se puede asumir que los tiempos de vida siguen una distribución ya sea normal, logística, o de valores extremos para mínimos. Modelos de Log – Localización – Escala Para este tipo de modelo, los percentiles de la distribución del tiempo de vida están relacionados con las variables predictoras a través de una función no lineal de la forma

( ) ( )σβββσμ pXXpYP1

221101 ...)log( −− Φ++++=Φ+= (3)

donde

⎟⎠⎞

⎜⎝⎛ −

Φ=σ

μ)log()( YYF (4)

Para tal modelo, se puede asumir que los tiempos de vida siguen una distribución ya sea lognormal, loglogística, Weibull, o exponencial.

Page 4: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 4�

Resumen del Análisis El Resumen del Análisis despliega una tabla mostrando el modelo estimado y pruebas de razón de verosimilitud para la significancia de los coeficientes del modelo. Regresión de Supervivencia - horas Variable dependiente: horas Factores: voltaje temperatura Número de valores no censurados: 32 Número de valores censurados por derecha: 0 Modelo de Regresión Estimado - Weibull

Log verosimilitud = -211.019 Pruebas de Razón de Verosimilitud

La tabla incluye: • Resumen de Datos: Un resumen de los datos de entrada, incluyendo el número de

observaciones n usadas para ajustar el modelo.

• Modelo de Regresión Estimado: Estimador de los coeficientes del modelo de regresión, con errores estándar e intervalos de confianza aproximados.

• Pruebas de Razón de Verosimilitud: corrida de prueba para determinar si los coeficientes

son significativamente diferentes de 0 o no. Se despliegan P-valores bidireccionales. P-valores pequeños (menores a 0.05 si se opera a un nivel de significancia del 5%) corresponden a variables estadísticamente significativas.

La tabla de arriba muestra el resultado de ajustar un modelo de primer orden a los datos del capacitor, asumiendo una distribución Weibull para los tiempos de falla a valores fijos de las variables predictoras. El modelo estimado tiene parámetros: μ = 11.6981 - 0.00660564 voltaje - 0.0200546 temperatura (5) σ = 0.312591 (6) basados en un modelo log-lineal. La ecuación del p-ésimo percentil es horas = exp(11.6981 - 0.00660564 voltaje - 0.0200546 temperatura

+ 0.312591 log(-log(1-p) )) (7) Tanto voltaje como temperatura tienen un efecto negativo en los tiempos de vida de los capacitores. Voltaje es altamente significativo, mientras que temperatura es significativo al nivel de 10% pero no al de 5%.

Error LC Inferior 95.0% LC Superior 95.0% Parámetro Estimado Estándar Límite de Conf. Límite de Conf. CONSTANTE 11.6981 1.96481 7.84716 15.5491 voltaje -0.00660564 0.000883368 -0.00833701 -0.00487426 temperatura -0.0200546 0.0110668 -0.0417451 0.00163591 SIGMA 0.312591 0.0432654 0.238321 0.410007 Factor Ji-Cuadrada Gl Valor-P voltaje 29.3505 1 0.0000 temperatura 3.06457 1 0.0800

Page 5: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 5�

Opciones de Análisis El modelo estadístico a ajustarse se especifica usando Opciones de Análisis.

• Tipo de Modelo: Seleccione Primer Orden para ajustar un modelo que solo involucre

efectos principales de cada factor. Seleccione Segundo Orden para incluir efectos cuadráticos de factores cuantitativos e interacciones 2-factores entre todas las variables.

• Distribución: la distribución asumida para los tiempos de falla a valores fijos de las

variables predictoras. • Nivel de Confianza: porcentaje de confianza para los estimadores de intervalo de los

coeficientes del modelo. • Excluir: Presiones este botón para excluir términos específicos del modelo. Un cuadro de

diálogo se desplegará abajo:

Page 6: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 6�

Dé doble clic en un efecto para moverlo del campo Incluir al campo Excluir o viceversa.

Ejemplo: Ajustar un Modelo con una Interacción Para agregar una interacción al modelo, seleccione Segundo Orden en el cuadro de diálogo Opciones de Análisis. Luego presione el botón Excluir para remover temperatura2 y voltaje2 del modelo, dejando los efectos principales y el producto cruz voltaje*temperatura. Los resultados del ajuste se muestran abajo. Regresión de Supervivencia - horas Variable dependiente: horas Factores: voltaje temperatura Número de valores no censurados: 32 Número de valores censurados por derecha: 0 Modelo de Regresión Estimado - Weibull

Log verosimilitud = -210.974

Error LC Inferior 95.0% LC Superior 95.0% Parámetro Estimado Estándar Límite de Conf. Límite de Conf. CONSTANTE 9.06005 8.98877 -8.55765 26.6778 voltaje 0.00297857 0.0319249 -0.0595933 0.0655504 temperatura -0.00508477 0.0510078 -0.105058 0.0948888 voltaje*temperatura -0.0000543878 0.000181097 -0.000409332 0.000300556 SIGMA 0.311771 0.0432319 0.237577 0.409137

Page 7: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 7�

Pruebas de Razón de Verosimilitud

La prueba de razón de verosimilitud para el término producto cruz tiene un P-Valor grande, indicando que no hay interacción significativa entre voltaje y temperatura.

Factor Chi-Cuadrada Gl Valor-P voltaje 0.00869322 1 0.9257 temperatura 0.00995633 1 0.9205 voltaje*temperatura 0.0900258 1 0.7641

Page 8: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 8�

Gráfica del Modelo Ajustado El panel Gráfica del Modelo Ajustado despliega los percentiles como función de cualquier variable X con todas las otras variables fijas a valores específicos.

temperature=175.0

200 230 260 290 320 350voltage

Gráfica del Modelo AjustadoWeibull percentiles: 5%, 50%, 95%

0

200

400

600

800

1000

1200

hour

s

Por ejemplo, la gráfica de arriba muestra cómo los percentiles 5-to, 50-ésimo, y 95-ésimo varían como función de voltaje, con temperatura fija a 175. El tiempo de falla medio decrece como crece el voltaje, con la variabilidad también decreciendo. Panel de Opciones

Page 9: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 9�

• Factores: seleccione un factor a graficar en el eje horizontal, con límites inferiores y superiores de la gráfica. Para los demás factores, especifique valores a los que estos deben quedar fijos.

• Percentiles: porcentajes de percentiles deseados. • Gráficar Media: incluye una línea al tiempo de falla medio estimado. • Siguiente y Atrás: usado para desplegar otros factores cuando hay más de 16.

Page 10: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 10�

Percentiles El panel Percentiles despliega una tabla de percentiles estimados a una combinación seleccionada de variables predictoras.

Tabla de Predicciones Inversas para horas voltaje=275.0 temperatura=175.0

Se incluyen intervalos de confianza basados en una aproximación normal de muestra grande. Por ejemplo, a un voltaje = 275 y una temperatura = 175, se estima que el 50% de los capacitores habrán fallado luego de aproximadamente 522 horas. El intervalo de confianza del 95% para el 50-ésimo percentil oscila entre 459 horas y 593 horas.

Error LC Inferior 95.0% LC Superior 95.0% Porcentaje Percentil Estándar Límite Conf. Límite Conf. 0.1 67.5506 21.7934 35.8931 127.13 0.5 111.788 28.418 67.9212 183.985 1.0 138.942 31.2525 89.4071 215.922 2.0 172.831 33.8385 117.751 253.675 3.0 196.498 35.1376 138.404 278.978 4.0 215.334 35.921 155.281 298.612 5.0 231.266 36.4308 169.834 314.92 6.0 245.231 36.7737 182.781 329.016 7.0 257.762 37.0057 194.543 341.525 8.0 269.198 37.1599 205.387 352.835 9.0 279.764 37.2571 215.494 363.203 10.0 289.623 37.3114 224.996 372.813 15.0 331.643 37.2028 266.186 413.197 20.0 366.192 36.7907 300.739 445.89 25.0 396.457 36.2715 331.376 474.321 30.0 424.014 35.7291 359.463 500.156 35.0 449.788 35.2101 385.811 524.374 40.0 474.4 34.7469 410.959 547.633 45.0 498.307 34.3677 435.302 570.432 50.0 521.89 34.1008 459.156 593.195 55.0 545.493 33.9785 482.801 616.325 60.0 569.466 34.0404 506.508 640.25 65.0 594.205 34.3382 530.575 665.466 70.0 620.206 34.9425 555.366 692.616 75.0 648.154 35.9563 581.377 722.602 80.0 679.11 37.5429 609.374 756.828 85.0 714.934 39.9931 640.693 797.777 90.0 759.558 43.931 678.156 850.732 91.0 770.256 45.0125 686.898 863.73 92.0 781.841 46.2402 696.267 877.932 93.0 794.534 47.6507 706.42 893.638 94.0 808.653 49.2971 717.581 911.283 95.0 824.682 51.2605 730.092 931.527 96.0 843.412 53.6757 744.506 955.457 97.0 866.285 56.7912 761.83 985.061 98.0 896.428 61.1553 784.233 1024.67 99.0 943.323 68.4714 818.231 1087.54 99.5 985.587 75.5529 848.093 1145.37 99.9 1070.79 91.0336 906.442 1264.94

Page 11: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 11�

Panel de Opciones

• Nivel: valores de las variables predictoras a las que los percentiles van a estimarse. • Nivel de Confianza: porcentaje de confianza para los estimadores de intervalo. • Siguiente y Atrás: usados para desplegar otros factores cuando hay más de 16.

Gráfica de Percentiles La Gráfica de Percentiles grafica los percentiles estimados a una combinación seleccionada de variables predictoras.

Page 12: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 12�

voltage=275.0temperature=175.0

0 200 400 600 800 1000 1200hours

0

0.2

0.4

0.6

0.8

1

prob

. de

falla

Gráfica de Percentilescon intervalos de confianza del 95.0%

Se incluyen intervalos de confianza basados en una aproximación normal de muestra grande. Panel de Opciones

• Nivel: valor de la variable predictora a la que se estimarán los percentiles. • Nivel de Confianza: porcentaje de confianza para los estimadores de intervalo.

Page 13: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 13�

• Gráfica: seleccione F.D. Acumulada para graficar los percentiles o Función de Supervivencia para graficar las probabilidades estimadas de supervivencia.

• Siguiente y Atrás: usados para desplegar otros factores cuando hay más de 16.

Gráfica de Percentiles de Probabilidad Esta gráfica grafica los percentiles estimados en un cuadro escalado de tal forma que la distribución acumulativa es una línea recta.

voltage=275.0temperature=175.0

100 1000 10000hours

0.1

0.51

51020305070909999.9

prob

. de

falla

Gráfica de Percentilescon intervalos de confianza del 95.0%

Panel de Opciones Las opciones son las mismas que en Gráfica de Percentiles.

Predicciones El panel Predicciones crea predicciones usando el modelo ajustado. Por defecto, la tabla incluye una línea para cada fila de la hoja de datos que tiene información completa en las variables X y un valor faltante para la variable Y. Esto le permite agregar columnas en la parte baja de la hoja de datos correspondiente a niveles a los que quiere las predicciones sin afectar el modelo ajustado. Por ejemplo, suponga que se desea una predicción para un capacitor sujeto a un voltaje de 275 y a una temperatura de 175. En la fila #33 de la hoja de datos, estos valores serían añadidos pero la columna horas se dejaría en blanco. La tabla resultante se muestra abajo:

Predicciones para horas

Page 14: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 14�

Se incluyen en la tabla:

• Fila – el número de fila de la hoja de datos.

• Observado – los valores observados, Yi.

• Ajustado – los valores ajustados, dados por iμ para modelos de localización-escala y ( )iμexp para modelos de log-localización – escala.

• Error estándar – los errores estándar correspondientes a iμ .

• Límites de Confianza – límites de confianza aproximados para los valores ajustados.

Panel de Opciones

Observado Ajustado Error LC Inferior 95.0% LC Superior 95.0% Fila Estándar para Media para Media 33 585.242 0.0584386 521.906 656.264

Page 15: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 15�

• Mostrar: Todas las filas pueden ser desplegadas, o Sólo Pronósticos (sólo aquellas filas con valores para la variable dependiente).

• Nivel de Confianza: porcentaje de confianza de los estimadores de intervalos.

Observado vs. Predicho El panel Observado vs. Predicho grafica los tiempos observados de falla Yi contra iμ para modelos de localización – escala y ( )iμexp para modelo de log – localización – escala.

Gráfica de hours

0 200 400 600 800 1000 1200predicho

0

200

400

600

800

1000

1200

obse

rvad

o

Si el modelo ajusta bien, los puntos deben dispersarse aleatoriamente alrededor de la línea diagonal.

Gráfica de Probabilidad Residual En todas las aplicaciones de regresión, es importante calcular y graficar los residuales. El procedimiento Regresión de Datos de Vida crea tres diferentes tipos de residuales:

1. Residuales Ordinarios:

Para modelos de localización – escala: iii yr μ−= (8)

Para modelos de log – localización - escala: ( )iii yr μexp−= (9)

2. Residuales estandarizados

Para modelos de localización – escala: σμ

ˆˆ−

= ii

ye (10)

Para modelos de log – localización – escala ( )

⎟⎠⎞

⎜⎝⎛ −

μˆ

ˆlnexp ii

i

ye (11)

Page 16: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 16�

3. Residuales Cox-Snell – un tipo de residuales Cox-Snell forzados a caer entre 0 y 1,

definidos por:

( )ii YFu ˆˆ = (12)

que es la distribución acumulativa del tiempo de vida estimado evaluada en el tiempo de falla observado.

Los residuales ordinarios cuantifican la diferencia entre los datos observados y los valores ajustados. Los residuales estandarizados se escalan de tal forma que deben seguir una forma estandarizada de la distribución asumida del tiempo de falla. Los residuales Cox-Snell pueden ser de utilidad al identificar puntos lejanos. La Gráfica de Probabilidad Residual despliega residuales estandarizados en una gráfica diseñada para ayudar a determinar si las distribuciones asumidas para los tiempos de vida son razonables para los datos:

Gráfica de probabilidad Weibull

0.001 0.01 0.1 1 10Residuo estandarizado

0.1

0.51

51020305070909999.9

porc

enta

je a

cum

ulad

o

Si la distribución seleccionada es adecuada para los datos, los puntos deben caer sobre la línea diagonal de referencia.

Residuos Átipicos El panel de Residuos Átipicos lista todas las observaciones que tienen residuales inusualmente grandes.

Residuos Atípicos para horas

Page 17: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 17�

La tabla despliega: • Fila – el número de fila en la hoja de datos. • Y – los tiempos de falla observados (posiblemente censurados). • Y Predicha – los valores ajustados, dados por iμ para modelos de localización – escala y

( )iμexp para modelos de log – localización – escala. • Residuo – los residuales ordinarios. • Residuo Estandarizado – los ei estandarizados. • Residuo Cox-Snell – los residuales Cox-Snell forzados iu . Se agrega una fila a la lista correspondiente a la lista correspondiente a todos los residuales Cox – Snell que son menores que 0.025 o mayores que 0.975, i.e., cualquier residuales fuera del 95% de la distribución del tiempo estimado. Se le debe dar particular atención a cualquier residual fuera del intervalo. 99865.ˆ00135.0 ≤≤ iu pues sería equivalente a estar más allá de tres desviaciones estándar si la distribución fue Gaussiana.

Gráficas de Residuos Pueden crearse muchos otros tipos de gráficas de residuales.

Y Residuo Residuo Fila Y Predicha Residuo Estandarizado Cox-Snell

Page 18: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 18�

Gráfico de Dispersión vs. Valor Predicho Esta gráfica es de utilidad para visualizar si la variabilidad es constante o varía de acuerdo a la magnitud de Y o no.

320 520 720 920 1120predicho hours

Gráfica de Residuos

-3.4

-1.4

0.6

2.6

4.6

log

resi

udal

est

anda

rizad

o

Gráfica de Probabilidad Normal Esta gráfica puede ser usada para determinar si las desviaciones alrededor de la línea siguen una distribución normal.

Gráfica de Probabilidad Normal para hours

-3.4 -2.4 -1.4 -0.4 0.6 1.6log resiudal estandarizado

0.1

1

5

20

50

80

95

99

99.9

porc

enta

je

Aunque esta gráfica es creada en todos los procedimientos de regresión la Gráfica Especial de Probabilidad Residual descrita anteriormente es más útil para los residuales de datos de vida. Autocorrelaciones Residuales Esta gráfica calcula la autocorrelación entre residuales como función del número de filas entre ellas en la hoja de datos.

Page 19: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 19�

Autocorrelaciones Residuales para hours

0 2 4 6 8 10 12retraso

-1

-0.6

-0.2

0.2

0.6

1

auto

corr

elac

ión

Esto es relevante sólo si los datos se han recolectado secuencialmente. Cualquier barra más allá de los límites indicaría dependencia significativa entre residuales separados por el retraso indicado.

Page 20: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 20�

Panel de Opciones

• Graficar: el tipo de residuales a graficar. • Tipo: el tipo de grafica a crear. Un Diagrama de Dispersión es usado para curvatura. Una

Gráfica de Probabilidad Normal es usada para determinar si los residuales del modelo vienen de una distribución normal o no. Una Función de Autocorrelación es usada para probar dependencia entre residuales consecutivos.

• Graficar Versus: para un Diagrama de Dispersión, la cantidad a graficar en el eje

horizontal. • Número de Retrasos: para una Función de Autocorrelación el número máximo de retrasos.

Para números pequeños de datos, el número graficado de retrasos puede ser menor que este valor.

• Nivel de Confianza: para una Función de Autocorrelación, el nivel usado para crear los

límites de probabilidad.

Matriz de Correlaciones La Matriz de Correlaciones despliega estimadores de la correlación entre los coeficientes estimados.

Matriz de correlación para los coeficientes estimados

Page 21: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 21�

Esta tabla puede ser de ayuda para determinar qué tan bien se han separado entre sí los efectos de variables independientes diferentes.

Guardar Resultados Los siguientes resultados pueden ser guardados en las hojas de datos.

1. Valores Predichos – los valores ajustados correspondientes a cada una de las n observaciones:

2. Errores Estándar de Medias – los errores estándar de los n valores ajustados. 3. Límites Inferiores para las Medias Pronosticadas – los límites inferiores de confianza

para los valores ajustados. 4. Límites Superiores para las Medias Pronosticadas – los límites inferiores de confianza

para los valores ajustados. 5. Residuos – los n residuales ri. 6. Residuos Estandarizados – los n residuales estandarizados ei. 7. Residuos Cox-Snell - los n residuales Cox-Snell iu . 8. Coeficientes – los coeficientes estimados del modelo. 9. Porcentajes – los porcentajes a los cuales fueron calculados los percentiles. 10. Percentiles – los percentiles estimados. 11. Errores Estándar de Percentiles – los errores estándar de los percentiles estimados. 12. Límites de Conf. Inferiores de Percentiles – límites inferiores de confianza para los

percentiles. 13. Límites de Conf. Superiores de Percentiles – límites superiores de confianza para los

percentiles.

CONSTANTE voltaje temperatura CONSTANTE 1.0000 -0.1737 -0.9920 voltaje -0.1737 1.0000 0.0516 temperatura -0.9920 0.0516 1.0000

Page 22: Regresión de Datos de Vida - statgraphics.net

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Regresión de Datos de Vida - 22�

Cálculos Distribuciones Estandarizados Logística, log logística: [ ])exp(1/)exp()( zzz +=Φ (13)

Normal, lognormal: ( ) ( )∫∞−

−=Φz

zz 2/exp2/1)( 2π (14)

Menor valor extremo, Weibull, exponencial: ( )[ ]zz expexp1)( −−=Φ (15) Funciones de Verosimilitud Sea δi = 1 para un tiempo exacto de falla y 0 para una observación censurada por la derecha.

Modelos de Localización – Escala: ii

iin

i

ii yyL

δδ

σμ

σμ

φσ

σβ−

=⎥⎦

⎤⎢⎣

⎡⎟⎠⎞

⎜⎝⎛ −

Φ−⎥⎦

⎤⎢⎣

⎡⎟⎠⎞

⎜⎝⎛ −

= ∏1

1

11),( (16)

Modelos de Log – Localización – Escala:

ii

iin

i

ii yyL

δδ

σμ

σμ

φσ

σβ−

=⎥⎦

⎤⎢⎣

⎡⎟⎠⎞

⎜⎝⎛ −

Φ−⎥⎦

⎤⎢⎣

⎡⎟⎠⎞

⎜⎝⎛ −

= ∏1

1

)log(1

)log(1),( (17)

Errores Estándar para Coeficientes Determinados a partir de las derivadas parciales evaluados en los EMV’s. Los intervalos de confianza están basados en una aproximación normal de muestra grande. Tiempos Medios de Falla Distribución E(Y) Normal μ Lognormal exp(μ + σ2/2) Logística μ log logística exp(μ)Γ(1+σ)Γ(1−σ) Menor Valor Extremo μ-0.5772σ Weibull exp(μ)Γ(1+σ) Exponencial exp(μ)Γ(2)