teoria de correlación

11
CORRELACION Y REGRECION LINEAL SIMPLE ESTADÍSTICA DESCRIPTIVA CORRELACIÓN Hay correlación entre dos variables cuando éstas cambian de tal modo que los valores que toma una de ellas son, hasta cierto punto, predecibles a partir de los que toma la otra. El análisis de correlación es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables. El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables, estas pueden ser. Variable Dependiente.- es la variable que se predice o calcula. Cuya representación es "Y" Variable Independiente.- es la o las variables que proporcionan las bases para el calculo. Cuya representación es: “X”. Esta o estas variables suelen ocurrir antes en el tiempo que la variable dependiente.

Upload: francisco-duran

Post on 06-Mar-2016

220 views

Category:

Documents


7 download

DESCRIPTION

esta es un poco de la teoria de correlación lineal

TRANSCRIPT

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

CORRELACIÓN Hay correlación entre dos variables cuando éstas cambian de tal modo que los valores que toma una de ellas son, hasta cierto punto, predecibles a partir de los que toma la otra. El análisis de correlación es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables. El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables, estas pueden ser. Variable Dependiente.- es la variable que se predice o calcula. Cuya representación es "Y" Variable Independiente.- es la o las variables que proporcionan las bases para el calculo. Cuya representación es: “X”. Esta o estas variables suelen ocurrir antes en el tiempo que la variable dependiente.

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

COEFICIENTE DE CORRELACIÓN.( Pearson ) Este es un índice estadístico que mide la relación lineal entre dos variables cuantitativas, es una forma de medir la intensidad de la relación lineal entre dos variables. El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, -1 < r < 1, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables. El coeficiente de correlación de cálculo “r” es un estimador muestral del coeficiente poblacional Rho, .

Mientras más cercano a cero sea el coeficiente de correlación, este indicará que más débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables.

-1 1 0 < <

Fuerte Fuerte

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

COEFICIENTE DE CORRELACIÓN.( Pearson ) Formula

Valor de R Nivel de Correlación

≤ 0.20 Insignificante

0.21 a 0.40 Baja

0.41 a 0.70 Moderada

0.71 a 0.90 Alta

0.91 a 1 Muy alta

ESTADÍSTICA DESCRIPTIVA

CORRELACION Y REGRECION LINEAL SIMPLE

No hay correlación

0r

Hay correlación no lineal

0r

Correlación lineal positiva

1r

Correlación lineal negativa

1r

El coeficiente de correlación, r, presenta valores entre –1 y +1. Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy

dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión. Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo

lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente. Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un

modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente.

GRADO DE CORRELACIÓN

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

COEFICIENTE DE DETERMINACIÓN, R2

Para estimar la bondad de un ajuste frecuentemente se prefiere utilizar el Coeficiente de Determinación, R2, que es el Coeficiente de Correlación elevado al cuadrado.

Se determina mediante cualquiera de las dos expresiones siguientes:

Su valor oscila entre 0 y +1. Cuando hay una buena correlación lineal, R2 es muy cercano a +1. Normalmente

se acepta para valores de R2 >= 0’99. Cuando no hay correlación o bien ésta no es lineal, R2 es bajo e incluso cercano a

cero

Grado de dependencia de una variable respecto a la otra

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

Si solamente están involucradas dos variables, se dice que la técnica es una regresión o correlación simple. Cuando están implicadas tres o más variables, se tratará de una regresión o correlación múltiple. Mientras que la correlación mide el grado de vinculación entre variables, la regresión se encarga de calcular, a partir de las observaciones, el valor real de los coeficientes que explican una relación funcional matemática. En Estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variable Independiente X y un término aleatorio

REGRESION LINEAL

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

RECTA DE REGRESION

En el modelo de regresión lineal simple la función elegida para aproximar la relación entre las variables es una recta, es decir y=a+bx, donde a,b son los parámetros. A esta recta la llamaremos RECTA DE REGRESIÓN. Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X). Procedimiento: Seleccionar una muestra de la población y enumerar los datos por pares para cada observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la ecuación de regresión. La ecuación de regresión: Y’= a + bX, donde: Y’ es el valor promedio pronosticado de Y para cualquier valor de X. a es la intercepción en Y, o el valor estimado de Y cuando X = 0 b es la pendiente de la recta, o cambio promedio en Y’ por cada cambio de una unidad en X se usa el principio de mínimos cuadrados para obtener a y b

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

Cuando la línea de regresión que mejor se ajusta a la nube de puntos es la recta, es un problema de regresión lineal y distinguiremos dos casos:

Recta de regresión de Y sobre X: Se obtienen valores aproximados de la variable Y conocidos los valores de la variable X

Recta de regresión de X sobre Y: Se obtienen valores aproximados de la variable X conocidos los valores de la variable Y

El criterio de mínimos al cuadrado implica que la recta elegida para ajustar los puntos del diagrama de dispersión sea tal que la suma de los cuadrados de las distancias verticales entre los puntos y la recta sea lo más pequeño posible. Los valores para los coeficientes de a y b son:

RECTA DE REGRESION (y=a+bx)

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

EJEMPLO COEFICIENTE DE CORRELACIÓN.( Pearson )

Un comerciante a menudo lleva a cabo un estudio para determinar la relación entre los gasto de publicidad semanal y las ventas. Se obtuvieron los siguientes resultados

Costo de publicidad ($)

Ventas ($)

40 385 20 400 25 395 20 365 30 475 50 440 40 490 20 420 50 560 40 525 25 480 50 510

Determinar el coeficiente de correlación de Pearson y determinar cual es su nivel.

Dibuje el diagrama de dispersión. Encuentre la ecuación y grafique la recta de

regresión para pronosticar las ventas semanales resultante del gasto de publicidad.

Estimes las ventas semanales cuando los gastos de publicidad asciende a 35$

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

Costo de Publicidad

($) (X)

Ventas ($)

(Y) X*Y X2 Y2

40 385 15400 1600 148225 20 400 8000 400 160000

25 395 9875 625 156025 20 365 7300 400 133225

30 475 14250 900 225625 50 440 22000 2500 193600

40 490 19600 1600 240100 20 420 8400 400 176400 50 560 28000 2500 313600

40 525 21000 1600 275625 25 480 12000 625 230400

50 510 25500 2500 260100 410 5445 191325 15650 2512925

EJEMPLO COEFICIENTE DE CORRELACIÓN.( Pearson )

Nivel de Correlación Moderada

Las ventas depende del costo de publicidad en 0.401*100= 40.1%

CORRELACION Y REGRECION LINEAL SIMPLE

EJEMPLO COEFICIENTE DE CORRELACIÓN.( Pearson )

Ecuación de la Recta Y = a+bx

CORRELACION Y REGRECION LINEAL SIMPLE

ESTADÍSTICA DESCRIPTIVA

Si X= 35$ (Gastos de Publicidad) Y = ? (Ventas) Y =343.70+3.22*35 = 456.40 $

y = 3,220x + 343,7 R² = 0,403

350

400

450

500

550

600

0 10 20 30 40 50 60

Ven

tas

Costo de Publicidad

Coeficiente de Correlación de Pearson

35

456.4