regresión y correlación simple

73
Tema 8 8 REGRESIÓN LINEAL SIMPLE Dr Carlos Tapia Sánchez

Upload: drakmistic

Post on 11-Nov-2015

218 views

Category:

Documents


15 download

DESCRIPTION

hola

TRANSCRIPT

  • Tema 8REGRESIN LINEAL SIMPLE

    Dr Carlos Tapia Snchez

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    1 El diagrama de dispersinEs un grfico que permite detectar la existencia de una relacin entre dos variables.Visualmente se puede buscar patrones que indiquen el tipo de relacin que se da entre las variables.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    A) Tipos de VariablesEn una ecuacin como Y = 30 + 3X, el valor de Y depende del valor que toma X, por eso a Y se le llama variable dependiente, y a X se le llama variable independiente. Y = b0 + b1 XVariableDependienteVariableIndependiente

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    E) Forma general:La ecuacin simple de primer grado tiene la siguiente forma generalY = b0 + b1 XDonde:b1: pendiente, o sea, el cambio en Y cuando X = 1.b0: el valor autnomo, es decir, Y = b0 cuando X = 0. En la grfica es la interseccin con el eje YEjemplo: Y = 3 + 1.5X

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    17.3 Regresin lineal simpleEs una tcnica estadstica que permite determinar la mejor ecuacin que represente la relacin entre dos variables relacionadas.

    Para poder establecer la relacin cuantitativa entre X e Y es necesario disponer de pares de observaciones. Cada par ha sido registrado a la misma unidad elemental.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    A) Suposiciones de regresin y correlacina) Normalidad: los valores de Y estarn distribuidos normalmente a cada valor de X.b) Homoscedasticidad: la variacin alrededor de la lnea de regresin sea constante para todos los valores de X. c) Independencia de error: el error (diferenciaresidual entre un valor observado y uno estimado de Y) sea independientemente de cada valor de X.d) Linealidad: la relacin entre las variables es lineal.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    La ecuacin general = b0 + b1X se llama ecuacin de regresin y permite estimar o predecir los valores de Y.Es el procedimiento matemtico utilizado para determinar los valores numricos de los coeficientes de regresin: b0 y b1B) El mtodo de Mnimos Cuadrados

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    El mtodo consiste en determinar una ecuacin que la suma de los errores al cuadrado sea mnima.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    El mtodo utiliza un sistema de ecuacin llamado ecuaciones normales, que tienen la siguiente forma:Para aplicar las frmulas, tenemos que confeccionar un cuadro como el siguiente:

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    AplicacinLos datos siguientes muestran las cantidades consumidas de complemento nutricional (en Kg.) y el aumento de peso de nios con signos de desnutricin.Presente la informacin en un diagrama de dispersin

    PACIENTE12345678910COMPLEMENTO1.01.52.02.53.03.54.04.55.05.5EN Kg: XAUMENTO DE810912141315171414PESO : Y

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    XYX2XY1.08.01.08.01.510.02.315.02.09.04.018.02.512.06.330.03.014.09.042.03.513.012.345.54.015.016.060.04.517.020.376.55.014.025.070.05.514.030.377.032.5126.0126.3442.0

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Sustituyendo los valores , n = 5, y ,en las ecuaciones normales, obtenemos el siguiente sistema de ecuaciones. 126 = 10b0 + 32,5b1442 = 32,5b0 + 126,3b1Resolviendo el sistema tenemos: b0 = 7,479 b1= 1,576 ,por lo tanto,

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    c) Interpretacin

    b0 = 7,478 : Es probable que un paciente desnutrido que no sea considerado dentro del Programa de Alimentacin Complementaria tenga un peso de 7,478 Kg.

    b1 = 1,576:Por cada Kg. del alimento complementario, se espera que probablemente el nio aumento su peso en 1,576 Kg.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    17.4 Error estndar de estimacin (Syx)Mide la disparidad promedio entre los valores observados y estimados de la variable Y. Se calcula por la siguiente relacin 14

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    XY1.08.09.055-1.11.1121811.510.09.8430.20.0248062.09.010.630-1.62.6582042.512.011.4180.60.3383753.014.012.2061.83.2177183.513.012.9940.03.48E-054.015.013.7821.21.4835244.517.014.5702.45.9053865.014.015.358-1.41.8436215.514.046-2.14.60402832.5126.0126.00.021.2

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    El Syx es un indicador del grado de precisin con que la ecuacin de regresin describe la relacin entre las dos variables: cuanto ms pequeo, los valores observado y estimado de Y son razonablemente cercanos y, la ecuacin de regresin es una buena descripcin esa la relacin.Reemplazando en la formula

  • Tema 9 CORRELACIN SIMPLE

    Dr Carlos Tapia Snchez

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    17.5 El anlisis de correlacinEl anlisis de correlacin es la tcnica estadstica que permite describir el grado hasta el cual una variable est linealmente relacionada con otra.Hay dos medidas que se usan para describir la correlacin El coeficiente de determinacin El coeficiente de correlacin

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    El coeficiente de determinacin se puede calcular del modo siguiente:Se elevan al cuadrado, para evitar queobtenindose un nmero positivo.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Y8.012.6-4.621.1610.012.6-2.66.769.012.6-3.612.9612.012.6-0.60.3614.012.61.41.9613.012.60.40.1615.012.62.45.7617.012.64.419.3614.012.61.41.9614.012.61.41.96126.0126.00.072.4

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    9.05512.6-3.54512.56999.84312.6-2.7587.603810.63012.6-1.9703.879311.41812.6-1.1821.396412.20612.6-0.3940.155112.99412.60.3940.155313.78212.61.1821.397114.57012.61.9703.880515.35812.62.7587.605516.14612.63.54612.5720126.0126.00.051.2

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    4to Paso: Se compara la variacin explicada y la variacin total.5to Paso: Interpretacin: 70,7% de las variaciones en el incremento de peso, pueden explicarse por el consumo del complemento nutricional.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Valores posibles de r2Si r2 = 1 : Correlacin perfecta, es decir, toda variacin de Y puede explicarse por XSi r2 = 0 : no existe correlacin entre X e Y. La variacin explicada es 0. La variable X no explica nada de los cambios en YResumenCuanto ms cerca a uno, las variables tendrn mayor correlacin.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    B) El coeficiente de correlacinEs la raz cuadrada del coeficiente de determinacin.

    Sus valores oscilan entre -1 y 1 Cuando r es positivo, indica que X e Y estn directamente relacionados.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Cuando r es negativo, indica que X e Y estn inversamente relacionados. El coeficiente r tiene el mismo signo que el coeficiente b1 en la ecuacin de regresin

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Interpretacin del coeficiente de correlacin de Pearson-100,50,91-0,9-0,5PerfectaNegativaPerfectaPositivaFuerteNegativaDbilNegativaDbilPositivaModeradaPositivaFuertePositivaModeradaNegativaNo existe correlacin

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    r2= 0,707Ejemplo:r = 0,84el signo es positivo ya que X e Y estn relacionados directamente como lo indica el signo del coeficiente b1 en la ecuacin de regresin

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Interpretacin: El incremento de peso (Y) y el consumo del complemento nutricional (X) se encuentran directamente asociados.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    17.6 Diagnstico de la regresin: anlisis residualEl anlisis residual permite evaluar lo adecuado del modelo de regresin que ha sido ajustado a los datos. Tambin sirve para detectar si los supuestos se cumplen.A. Evaluacin de lo adecuado de modelo ajustado Los valores del error residual o estimado (i) se define como la diferencia entre los valores observados (Yi) y los estimados ( ) de la variable dependiente para los valores dados de Xi

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Podemos evaluar lo adecuado del modelo de regresin ajustado mediante el grfico de los residuos (eje vertical) con respecto a los correspondientes valores de Xi de la variable independiente (eje horizontal).Ejemplo: El grfico muestra un adecuado ajuste entre el incremento de peso y el consumo del com- plemento nutricional. No se observa una tendencia.

    Grfico2

    -1.0545454545

    0.1575757576

    -1.6303030303

    0.5818181818

    1.7939393939

    0.0060606061

    1.2181818182

    2.4303030303

    -1.3575757576

    -2.1454545455

    Variable X 1

    Residuos

    Variable X 1 Grfico de los residuales

    Hoja1

    XYXY

    39927

    1515

    27414

    5142570

    4101640

    154555156

    Hoja4

    Resumen

    Estadsticas de la regresin

    Coeficiente de correlacin mltiple0.8410408673

    Coeficiente de determinacin R^20.7073497405

    R^2 ajustado0.6707684581

    Error tpico1.627416618

    Observaciones10

    ANLISIS DE VARIANZA

    GLSCCMeF calp-valor

    Regresin151.212121212151.212121212119.33638443940.0022949773

    Residuos821.18787878792.6484848485

    Total972.4

    CoeficientesError tpicot calculadop-valorInferior 95%Superior 95%Inferior 95.0%Superior 95.0%

    Intercepcin7.47878787881.27326107135.87372695770.00037263394.542640684410.41493507324.542640684410.4149350732

    Variable X 11.57575757580.35834534544.39731559470.00229497730.7494111932.40210395850.7494111932.4021039585

    Anlisis de los residualesResultados de datos de probabilidad

    ObservacinPronstico para YResiduosResiduos estndaresPercentilY

    19.0545454545-1.0545454545-0.687294421558

    29.84242424240.15757575760.1026991664159

    310.6303030303-1.6303030303-1.06254137572510

    411.41818181820.58181818180.37919692223512

    512.20606060611.79393939391.16919051014513

    612.99393939390.00606060610.00394996795514

    713.78181818181.21818181820.79394355596514

    814.56969696972.43030303031.58393714387514

    915.3575757576-1.3575757576-0.88479281858515

    1016.1454545455-2.1454545455-1.39828865069517

    Hoja4

    1

    1.5

    2

    2.5

    3

    3.5

    4

    4.5

    5

    5.5

    Variable X 1

    Residuos

    Variable X 1 Grfico de los residuales

    Hoja2

    PACIENTE12345678910

    ALIMENTO1.01.52.02.53.03.54.04.55.05.5

    EN Kg: X

    AUMENTO DE810912141315171414

    PESO : Y

    18

    1.510

    29

    2.512

    314

    3.513

    415

    4.517

    514

    5.514

    Hoja3

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    El anlisis del grfico nos brinda el criterio para adoptar el modelo lineal o dejarlo de lado. Si fuese as, podramos probar con modelos no lineales como el cuadrtico, logaritmo o exponencial. El anlisis de residuos se complementa con el clculo de los residuos estandarizados (SRi), que resultan de la divisin del residuo dividido por su error estndar.En donde

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Los valores estandarizados nos permiten tomar en cuenta la magnitud de los residuos en unidades que reflejen la variacin estandarizada alrededor de la lnea de regresin.

    Anlisis de los residualesObservacinPronstico para YResiduosResiduos estndares19.138461538-0.138461538-0.10110764123.2769230771.7230769231.25822842336.2076923080.7923076920.578560391415-1-0.730221853512.06923077-2.069230769-1.510997526644.307692310.6923076920.505538206

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    En el grfico siguiente, los residuos estandarizados fueron graficados en funcin de la variable independiente (cantidad del complemento nutricional). Se puede observar de que existe una dispersin amplia en la grfica de residuos, no existe un patrn evidente o una relacin entre los residuos estandarizados y Xi . Los residuos parecen estar equitativamente distribuidos por arriba y por debajo de 0, para diferentes valores de X. Podemos concluir que el modelo ajustado parece ser adecuado.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Grfico3

    -0.1011076411

    1.258228423

    0.5785603909

    -0.7302218526

    -1.5109975258

    0.5055382057

    Residuos estndares

    Hoja5

    Resumen

    Estadsticas de la regresin

    Coeficiente de correlacin mltiple0.9958274748

    Coeficiente de determinacin R^20.9916723596

    R^2 ajustado0.9895904495

    Error tpico1.5310880998

    Observaciones6

    ANLISIS DE VARIANZA

    Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F

    Regresin11116.62307692311116.6230769231476.32813781790.0000260786

    Residuos49.37692307692.3442307692

    Total51126

    CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%

    Intercepcin0.34615384620.91734330420.37734384130.7250850754-2.20080475582.8931124481-2.20080475582.8931124481

    Variable X 12.93076923080.134285309621.82494301980.00002607862.5579326683.30360579362.5579326683.3036057936

    Anlisis de los residuales

    ObservacinPronstico para YResiduosResiduos estndares

    19.1384615385-0.1384615385-0.1011076411

    23.27692307691.72307692311.258228423

    36.20769230770.79230769230.5785603909

    415-1-0.7302218526

    512.0692307692-2.0692307692-1.5109975258

    644.30769230770.69230769230.5055382057

    Hoja5

    -0.1384615385

    1.7230769231

    0.7923076923

    -1

    -2.0692307692

    0.6923076923

    Variable X 1

    Residuos

    Variable X 1 Grfico de los residuales

    Hoja1

    XYXYXResiduos estndares

    399273-0.1011076411

    151511.258228423

    2741420.5785603909

    51425705-0.7302218526

    41016404-1.5109975258

    154555156150.5055382057

    Hoja1

    Residuos estndares

    Hoja4

    Resumen

    Estadsticas de la regresin

    Coeficiente de correlacin mltiple0.8410408673

    Coeficiente de determinacin R^20.7073497405

    R^2 ajustado0.6707684581

    Error tpico1.627416618

    Observaciones10

    ANLISIS DE VARIANZA

    GLSCCMeF calp-valor

    Regresin151.212121212151.212121212119.33638443940.0022949773

    Residuos821.18787878792.6484848485

    Total972.4

    CoeficientesError tpicot calculadop-valorInferior 95%Superior 95%Inferior 95.0%Superior 95.0%

    Intercepcin7.47878787881.27326107135.87372695770.00037263394.542640684410.41493507324.542640684410.4149350732

    Variable X 11.57575757580.35834534544.39731559470.00229497730.7494111932.40210395850.7494111932.4021039585

    Anlisis de los residualesResultados de datos de probabilidad

    ObservacinPronstico para YResiduosResiduos estndaresPercentilY

    19.0545454545-1.0545454545-0.687294421558

    29.84242424240.15757575760.1026991664159

    310.6303030303-1.6303030303-1.06254137572510

    411.41818181820.58181818180.37919692223512

    512.20606060611.79393939391.16919051014513

    612.99393939390.00606060610.00394996795514

    713.78181818181.21818181820.79394355596514

    814.56969696972.43030303031.58393714387514

    915.3575757576-1.3575757576-0.88479281858515

    1016.1454545455-2.1454545455-1.39828865069517

    Hoja4

    1

    1.5

    2

    2.5

    3

    3.5

    4

    4.5

    5

    5.5

    Variable X 1

    Residuos

    Variable X 1 Grfico de los residuales

    Hoja2

    PACIENTE12345678910

    ALIMENTO1.01.52.02.53.03.54.04.55.05.5

    EN Kg: X

    AUMENTO DE810912141315171414

    PESO : Y

    18

    1.510

    29

    2.512

    314

    3.513

    415

    4.517

    514

    5.514

    Hoja3

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    B. Evaluacin de las suposiciones a. Homoscedasticidad

    b. Normalidad

    c. Independencia: Los datos recolectados

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    17.7 Medicin de la autocorrelacin: Durbin-Watson Una de las suposiciones del modelo de regresin bsico es la independencia de los residuos. Esta suposicin es violada con frecuencia cuando los datos son recopilados en periodos secuenciales, debido a que un residuo en cualquier punto del tiempo puede tender a ser parecido a los residuos que se encuentran en puntos de tiempo adyacentes. El estadstico D de Durbin-Watson mide la correlacin de cada residuo y el residuo del periodo inmediato anterior al periodo de inters.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    El estadstico D (Durbin-Watson)

    En la que representa el residuo en el periodo i.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Interpretacin de D:Cuando residuos sucesivos estn correlacionados positivamente, el valor de D se aproximar a cero.Si los resultados no estn correlacionados, el valor D estar cercano a 2. Si se presentase una autocorrelacin negativa, lo cual rara vez sucede, de valor D tomar un valor mayor a 2 e, incluso podra aproximarse a su valor mximo que es 4.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Los resultados de SPSS nos proporciona el valor de D de Durbin-Watson

    Segn este resultado permite afirmar que los residuos no estn correlacionados.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    17.8 Estimacin por intervalosIntervalo de confianza para 1b1 N

    Lo que se va hacer es estimar

    se estima mediante la siguiente formula:

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    B. Intervalo de confianza para 0donde:

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    t0 con (n-2) grados de libertad y

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Y/XC. Intervalo de confianza para

    0Para un nivel dado de confianza, una variacin aumentada alrededor de la lnea de regresin, medida a travs del error estndar de la estimacin, tiene como resultado un intervalo ms amplio.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    donde:Sin embargo, como se esperara, un tamao de muestra aumentado reduce el ancho del intervalo.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    D. Intervalo de confianza para un valor individualAdems de obtener una estimacin de intervalo de confianza para el valor promedio, a menudo es importante tener la capacidad de predecir la respuesta que se obtendra para un valor individual.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    donde:El intervalo de prediccin est estimando un valor individual, no un parmetro.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    SCtotal = SCerror + SCregresin (SCresidual)17.9 Anlisis de varianza de la regresin simpleEl anlisis de varianza es una tcnica que permite localizar las fuentes de variabilidad que ayuden a explicar el comportamiento de la variable dependiente.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    El cuadro de Anlisis de Varianza

    Fuentes de variabilidadSuma de CuadradosGLCuadrado MedioF calculadoE(CMe)Debido a la RegresinError ExperimentalTotal

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    La ecuacin de regresin e interprete los coeficientes de regresin.El intervalo de confianza para 1y para un valor individual si X=3,8.El cuadro de ANOVA para la regresin linealEl valor de cuando X = 5,1La prueba de hiptesis respectiva a partir del ANOVA e interprete el resultado.Estime el aumento de peso que puede darse se consumen 6 Kg. del complemento nutricional mediante un intervalo e interprete el resultado.Asumiendo que existe una regresin lineal, determine:

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    SolucinPrimero se realizan los clculos necesarios:

    Clculo de los coeficientes de regresin:

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    La ecuacin de regresin ser:

    Interpretacin:b0= Se espera que el peso que un nio que no consume este complemento nutricional sea 7,49 Kg. b1= Por cada Kg. de complemento nutricional, el peso del nio se incrementar en 1,57 Kg.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Intervalo de confianza para 1

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Interpretacin: Hay 0,90 de confianza que el intervalo que se ha construido, pertenezca al grupo de intervalos que contienen al verdadero parmetro 1.Intervalo de confianza para un valor individual Si X = 3,8 entonces

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Interpretacin

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Anlisis de VarianzaInterpretacin: Se rechaza la hiptesis planteada. El complemento nutricional si explica significativamente los cambios en el peso de los nios.

    Fuentes de variabilidadSuma de CuadradosGLCuadrado MedioF calculadoE(CMe)Debido a la Regresin50,82150,8218,84Error Experimental21,5882,697Total72,409

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Si X = 5,1 Prueba de Hiptesis acerca de 1 1. Hp: 1= 0Ha: 1 0 2. = 0,10 3.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    SupuestosLa muestra seleccionada al azarLa poblacin se distribuye al azarLos valores de X fijas y de Y variables (o aleatorias)Asunciones de la regresin lineal simple 4. Criterios de decisin0,00415,32Si se rechaza la hiptesis planteada

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    5. Clculos

    6. Conclusiones La variable complemento nutricional es apropiada para explicar el comportamiento del aumento de peso en nios desnutridos. Adems, la ecuacin de regresin puede ser usada con fines de prediccin hasta cierto lmite.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Para X = 6, que promedio de Y vamos a obtener?

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    17.10 Resultados con Excel

    Estadsticas de la regresinCoeficiente de correlacin mltiple0.99582747Coeficiente de determinacin R^20.99167236R^2 ajustado0.98959045Error tpico1.5310881Observaciones6

    ANLISIS DE VARIANZAGLSCCMeF calP-valorRegresin11116.623081116.62308476.3281382.60786E-05Residuos49.376923082.34423077Total51126

    CoeficientesError tpicoEstadstico tP-valorInferior 95%Superior 95%Inferior 95.0%Superior 95.0%Intercepcin0.3461540.91734330.377343840.72508508-2.2008047562.893112448-2.2008047562.893112448Variable X 12.9307690.1342853121.8249432.6079E-052.5579326683.3036057942.5579326683.303605794

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Ejemplo: En la Farmacia Santa Rita, se desea determinar la relacin lineal simple entre la experiencia del vendedor y las ventas durante un mes. Se seleccionan 5 vendedores, los datos registrados se presentan a continuacin:

    Hoja1

    VENDEDORCARLOSPEDROJOSEJUANMANUEL

    EXPERIENCIA (aos):X31254

    VENTAS (unidades) : Y9571410

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Un equipo de profesionales en salud mental de un hospital psiquitrico donde el tiempo de permanencia es largo, quiere medir el nivel de respuesta de pacientes retrados mediante un programa de terapia de remotivacin. Para este propsito se contaba con una prueba estandarizada, que era costosa y su aplicacin tomaba mucho tiempo. Para salvar este obstculo, el equipo cre una prueba ms fcil de aplicar. Caso 1

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Para probar la utilidad de este nuevo instrumento para medir el nivel de respuesta del paciente, el equipo decidi examinar la relacin entre las calificaciones obtenidas con la nueva prueba y las calificaciones obtenidas con la prueba estandarizada.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Caso 2Se llevo a cabo un experimento para estudiar el efecto de cierto medicamento para disminuir la frecuencia cardiaca en adultos. Se reunieron los siguientes datos: dosis en miligramos del medicamento y la diferencia entre la frecuencia cardiaca mas baja despus de la administracin del medicamento y un control antes de administrarlo.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Determine la ecuacin de regresin lineal y explique el valor de los coeficientes de regresin. Calcule e interprete el coeficiente de correlacin y el coeficiente de determinacin.

    Hoja1

    Dosis (mg)0.50.7511.251.51.7522.252.52.7533.253.5

    Reduccion ritmo cardiaco1081212141216181720182021

    Hoja2

    Hoja3

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    Hoja de Comprobacin1. El anlisis de regresin se usa para describir que tan bien una ecuacin de estimacin describe la relacin que est estudiando2. Dado que la ecuacin para una lnea es Y = 26 - 24X, podemos decir que la relacin Y con X es directa y lineal3. Un valor r2 cercano a cero indica una fuerte correlacin entre X y Y

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    4. Los anlisis de regresin y correlacin se usan para determinar relaciones de causa y efecto5. El coeficiente de correlacin de muestra, r, no es nada ms quey no podemos interpretar su significado directamente como un porcentaje del mismo tipo6. El error estndar de la estimacin mide la variabilidad de los valores observados alrededor de la ecuacin de regresin.7. La lnea de regresin se deriva de una muestra y no de toda la poblacin

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    8. Podemos interpretar el coeficiente de determinacin de muestra como la cantidad de la variacin en Y que es explicada por la lnea de regresin9. Las lneas trazadas a cada lado de la lnea de regresin a 1, 2 y 3 veces el valor del error estndar de la estimacin se denominan lneas de confianza10.La ecuacin de estimacin es vlida slo sobre el mismo intervalo que el dado por los datos originales de muestra sobre los cuales se desarroll11.En al ecuacin Y = a + bX para la variable dependiente Y y la variable independiente X, la interseccin Y es b.

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    12.Si una lnea se ajusta a un conjunto de puntos mediante el mtodo de mnimos cuadrados, los errores individuales positivos y negativos desde la lnea suman cero.13. Si Se = 0 para una ecuacin de estimacin, debe estimar perfectamente la variable dependiente en los puntos observados14.Supongamos que la pendiente de una ecuacin de estimacin es positiva. Entonces el valor de r debe ser la raiz cuadrada positiva de r2

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    15.Si r = 0.8, entonces la ecuacin de regresin explica 80% de la variacin total en la variable dependiente16.El coeficiente de correlacin es el porcentaje de la variacin total de la variable dependiente que es explicada por la regresin17.El error estndar de la estimacin es medido perpendicularmente desde la lnea de regresin ms que sobre el eje X18.Al cuadrar los errores individuales, el mtodo de mnimos cuadrados magnidica todas las desviaciones desde la lnea de regresin estimada

    Material de Clases Jorge Crdova Egocheaga. Febrero 2003

    19. Una ecuacin de regresin no puede ser vlida al ampliarse fuera del intervalo de muestra de la variable independiente20. Un valor r2 implica que no existe una relacin de causa-efecto significativa entre X y Y21. Una valor pequeo de r2 implica que no existe una relacin de causa-efecto significativa entre X y Y

    **