analisis de regresion lineal simple

Post on 24-Jun-2015

1.362 Views

Category:

Documents

20 Downloads

Preview:

Click to see full reader

TRANSCRIPT

ANALISIS DE REGRESION LINEAL SIMPLE

ESTADISTICAS II

PRONOSTICOS

PRODUCCION

PROGRAMACIONINVENTARIOS

COMPRAS PERSONAL

GERENTEGERENTE

Contabilidad y Finanzas

PRESTAMOSINVERSIONES

FINANZIAMIENTO

FLUJO DE CAJA

EJEMPLOS DE SITUACIONES

La firma debe pronosticar cuántas

unidades de un artículo se

demandarán la próxima semana

La administración debe pronosticar la rapidez de los efectos de un descubrimiento científico

reciente en la industria en que la firma compite

Los pronósticos pueden diferir en cuanto a su importancia, al marco de referencia y al nivel administrativo.

Regresión lineal

Su objetivo es identificar una relación funcional entre una o más variables independientes (predictoras) y la variable dependiente (pronóstico).

Podemos realizar la

Inversión, en comprar las franquicias PARMALAT

Uyyy!Y

AHORA!!

ANALISIS DE

REGRESIONCUAL VARIABLE

VARIABLE INDEPENDIENTE

PREDICTORA

VARIABLE DEPENDIENTEPRONOSTICO

El patrón general de los puntos dibujados sugiere la relación general entre las dos variables.

Diagrama de Dispersion

Representación gráfica del grado de relación entre dos variables cuantitativas.

Se determina la variable independiente y la variable dependiente

En el eje de las abscisas se colocan los valores de las variables independiente (X) y en el eje …

Se coloca un punto en el plano por cada par de valores

Diagrama de dispersión

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

ProcesoEjemplo

Marcamos los pares de datos

Tipos de Diagrama

Relación lineal negativa fuerte

Relación lineal positiva perfecta

Relación lineal negativa

Relación parabólica perfecta

Relación curvilínea negativaNinguna relación entreLas variables.

Una vez que sabemos que dos variables están relacionadas…

¿Cómo averiguar qué tipo de relación tienen?

Para esto utilizamos los modelos de regresión

MODELOS DE REGRESIÓN

¿QUÉ ES?La regresión como técnica estadística analiza la relación de dos o más variables contínuas

¿PARA QUÉ SIRVE?

La regresión se utiliza para inferir datos a partir de otros y hallar una respuesta a lo que pueda suceder

CONCEPTO DE REGRESIÓN

VARIABLES DE LA REGRESIÓN

Las variables del modelo de regresión deben ser cuantitativas

Dada la robustez de la regresión es frecuente encontrar incluidas como variable independiente variables nominales transformadas

La variable dependiente debe ser siempre cuantitativa

Robustez: un estadístico se dice que es robusto cuando es válido aunque no se cumpla alguno de sus supuestos

TIPOS DE REGRESIÓN

Se pueden encontrar distintos tipos de regresión

Regresión Lineal1

Regresión Múltiple2

Regresión Logística3

REGRESIÓN LINEAL

Consideremos una variable dependiente respuesta Y, relacionada con otra variable independiente X

Supongamos una muestra de n individuos para los que se conocen los valores de ambas variables

Hacemos una representación gráfica:

en el eje X la variable independiente en el Y la dependiente

Y Variable dependiente

XVariable independiente

n Muestra

REGRESIÓN LINEAL

OBJETIVO Encontrar una recta que se ajuste a la nube de puntos

A partir de esa recta podemos usar los valores de X para predecir los de Y

Normalmente se utiliza el “método de los mínimos “método de los mínimos cuadrados”cuadrados” que minimiza la distancia de las observaciones a la recta

XiXY 10/

0

Y

XX1 X2 X3 X4

μy|x = β0 + β1x es el valor medio de la variable dependiente y cuando el valor de la variable independiente es x.

–β0 = ordenada al origen (valor medio de y cuando x = 0)

–β1 = pendiente ( valor medio de y cuando x una unidad)

y = μy|x + = β0 + β1x +

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

10 cm.

10 kg.

SUPOSICIONES DE LA REGRESIÓN LINEAL

• Los valores de la variable independiente X son fijos, medidos sin error.

• La variable Y es aleatoria • Para cada valor de X, existe una distribución

normal de valores de Y (subpoblaciones Y) • Las variancias de las subpoblaciones Y son

todas iguales. • Todas las medias de las subpoblaciones de

Y están sobre la recta. • Los valores de Y están normalmente

distribuidos y son estadísticamente independientes

P4

XX1 X2 X3 X4

P3P2

P1

R1

R2

R3 R4

(residuo)

e1

e2

e3

e4

ii XY 10ˆ Y (ajustado)

Y (valor real)

eYY ˆ

Y

0

Modelo de la Regresión Lineal Simple Muestral

La recta de regresión muestral sería

ii XY 10ˆˆˆ

SI pero ¿Cuál es el modelo?

iii

iii

eXY

eYY

10ˆˆ

ˆ

0

0 0

0

0

01

1

11

00 METODO DE LOS MINIMOS

CUADRADOS

221

ii

iiii

XXn

YXYXn

21

XX

YYXX

i

ii

n

X

n

Yn

ii

n

ii

11

10

ˆˆ

XY 10ˆˆ

MEDIDAS DE LA BONDAD DE AJUSTE

Obtener medidas que nos indiquen la confiabilidad de la recta de regresión

Medidas de la Bondad de Ajuste

Mide la bondad

Con la cual La línea

de regresión Se ajusta

Esquema de las Medidas de la Bondad del Ajuste

eSMedidas de laBondadDel Ajuste

AjusteAbsoluto

AjusteRelativo

Error Estándar de la Estimación

Coeficiente de determinación

2r

(X1,Y1)

(X2,Y2)

(X3,Y3)

Y2 Y

Y2 ˆ Y

Y

DESVIACION TOTAL

DESVIACION NO

EXPLICADA

DESVIACION EXPLICADA

Para obtener las formulas de las medida de la Bondad de Ajuste

2, rSeMedidas

de Variabilidad

ANALISIS DEREGRESION

Obtener medidas que nos indiquen la confiabilidad de la recta de regresión

QUIEN MIDE

LAS VARIACIONES?

Variación total = Variación no explicada + Variación Explicada

22 ˆˆ2 YYYYYY iiii

Suma De

CuadradosTotalSCT

Suma De

CuadradosDel Error

SCE

Suma De

CuadradosDe La Regresión

SCR

SCRSCTYYSCE

XnXYYSCR

YnYYYSCT

ii

ii

ii

2

2221

2

222

ˆ

ˆˆ

El error estándar de la estimación se basa en el valor de SCE

Coeficiente de determinación se basa en la magnitud relativa de SCR

eS

2r

Error Estándar de Estimación eS

CME

n

SCE

n

YYS iie

22

ˆ 2

Mide la variabilidad o dispersión de los valores observadosAlrededor de la línea de regresión

eS Mayor es la dispersión

Coeficiente de Determinación 2r

SCT

SCRr 2

Obtiene la cantidad relativa de la variación de la variable dependiente Y explicada por la variableindependiente X

SCT

SCE

SCT

SCR1

Características

• El coeficiente de determinación es un cociente de dos sumas de cuadrados entonces no puede ser negativa

• SCR es menor o igual a SCT, el cociente de determinación esta dado entre los intervalos 0 y 1

10 2 r

• Si el coeficiente es cero indica que no existe relación lineal entre las variables X y Y, lo cual significa que ninguna parte de la variación de Y, esta explicada por X, el valor de r2 va a ser =0 cuando SCR =0 y SCE=SCT

• Un r2=1 indica una relación lineal perfecta entre las variables X y Y, y todo los puntos observados están sobre la recta de regresión muestral, SCE=0 y SCR=SCT, el ajuste perfecto.

INFERENCIA ESTADISTICA CON RESPECTO A LOS PARAMETROS 10 y

Calculada la recta de regresión muestral es importante conocer si esta recta se puede utilizar para fines predictivos

Nos interesa determinar si el conocimiento de la variable independiente X resulta útil para predecir los valores de la variable dependiente Y.

PRUEBA DE HIPOTESIS PARA

101 X y Y no están

relacionadas linealmente

Una línea horizontal

YYi Los valores de X no sirven Para predecir Y

La hipótesis nula H0: 01

La hipótesis alternativa debemos tener conocimiento previo de 1

Si tenemos conocimiento a priori de 101 Unilateral Derecha

0: 11 H Unilateral Izq.

Pasos para la prueba de Hipotesis

1

Planteamos la Hipótesis, reflejada en los valores a priori de

11ˆ

1

ˆ

1ˆ0ˆ

SS

t

1S

El estadístico a utilizar es la distribución t

2221

XnX

S

XX

SS

i

e

i

e

INTERVALO DE CONFIANZA PARA 1

12/;21 Stn

Si el intervalo de confianza incluye el cero, es equivalente a la aceptación de la hipótesis nula, LAS VARIABLES X e Y NO ESTAN RELACIONADAS LINEALMENTE

Si el intervalo de confianza NO incluye el cero, es equivalente al rechazo de la hipótesis nula, LAS VARIABLES X e Y ESTAN RELACIONADAS LINEALMENTE

ANALISIS DE VARIANZA EN LA

REGRESIÓN LINEAL SIMPLE

Fuente de

Variación

Suma de

Cuadrados

Grados de

Libertad

Cuadrados medios

Regresion SCR 1 SCR/1

Error SCE n-2 SCE/(n-2)

TOTAL SCT n-1

CMR es alto en relacion al CME, indica que parte de la variabilidad de en YEsta siendo explicada por la RECTA DE REGRESION, rechazo de H0

CMR es bajo en relacion al CME, indica que parte de la variabilidad de en YNO esta siendo explicada por la RECTA DE REGRESION, acep de H0

CME

CMRF

PREDICCION

0100ˆˆˆ XY

PREDICCION PARA LA MEDIA POR INTERVALO DE CONFIANZA

0/ XY

02/;20 Yn StY

22

2

010 XnX

XX

nSS

i

eY

1

122

2

00

XnX

XX

nSS

i

eY

PREDICCION INDIVIDUAL POR INTERVALO DE CONFIANZA

top related