estadÍstica i clase 6: análisis de correlación lineal simple

35
Carrera de Sociología Autor: Lic. Rubén José Rodríguez 1 UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALES Facultad de Psicología y Ciencias Sociales Carrera Sociología Curso Curso ESTAD ESTAD Í Í STICA I STICA I Clase 6: An Clase 6: An á á lisis de Correlaci lisis de Correlaci ó ó n Lineal Simple n Lineal Simple Prof. Titular: Lic. Rub Prof. Titular: Lic. Rub é é n Jos n Jos é é Rodr Rodr í í guez guez Prof. Adjunta: Lic. Micaela Prof. Adjunta: Lic. Micaela Bazzano Bazzano Segundo Cuatrimestre 2012 Segundo Cuatrimestre 2012

Upload: others

Post on 16-Oct-2021

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

1

UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALES

Facultad de Psicología y Ciencias Sociales

Carrera SociologíaCursoCurso

ESTADESTADÍÍSTICA ISTICA IClase 6: AnClase 6: Anáálisis de Correlacilisis de Correlacióón Lineal Simplen Lineal Simple

Prof. Titular: Lic. RubProf. Titular: Lic. Rubéén Josn Joséé RodrRodrííguezguezProf. Adjunta: Lic. Micaela Prof. Adjunta: Lic. Micaela BazzanoBazzano

Segundo Cuatrimestre 2012Segundo Cuatrimestre 2012

Page 2: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

2

• Comprender las medida de la relación entre varia-bles métricas y variables ordinales

• Diferenciar correlación de causalidad.• Reconocer independencia y dependencia estadística

entre variables.• Interpretar un diagrama de dispersión.• Comprender los conceptos de desvío, varianza y

covarianza.• Calcular el Coeficiente de Correlación ‘r’ de Pearson.• Interpretar el ‘r’ en términos de sus coeficientes

derivados.• Aplicar análisis bivariados con datos 1rios y 2rios.

OBJETIVOS DE APRENDIZAJECorrelación de Correlación Lineal Simple

Page 3: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

3

Varianza: Medida de dispersión paramétrica, igual a la media de los cuadrados de las devíos (X-M) de los datos de una distribución respecto de la media.Se simboliza con para la población y la muestra

Covarianza: Medida estadística paramétrica que expre-sa el grado de variación conjunta de dos variables.Es la medida de la suma de los productos entre las desviaciones respecto de su media, de los valores de X e Y. La Cov se basa en las unidades de medida origina-les de las dos variables. Por eso no varía entre –1 a +1 , ni se puede comparar. Se standariza dividiendo su fórmula por las , lo que da lugar al Coeficiente de Correlación Producto-Momento ‘r’ de Pearson.

VARIANZA Y COVARIANZA

22xy sX

2 2y X Y

Page 4: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

4

KARL PEARSON CREADOR DE LA ESTADÍSTICA APLICADA

Page 5: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

5

COVARIANZA Y FÓRMULA GENERAL DELCOEFICIENTE DE CORRELACIÓN

‘r’ DE PEARSON (a)

x j y1

1(x, y) = ( - ) (Y- )n

n

jj

Cov X

1,

( ) ( )

n

j Jj

x yX y

X X Y Yr

n

Page 6: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

6

COEFICIENTE DE CORRELACIÓN ‘r’ DE PEARSON (b)

1

*

* *

n

jxy

X Y

X X Y Yr

n

Page 7: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

7

COEFICIENTE DE CORRELACIÓN ‘r’ DE PEARSON (c)

1,

2 2

1 1

( ) ( )

( ) ( )

n

j jj

x y n n

i ij j

X X Y Yr

X X Y Yn

n n

1 * *xy x yr z zn

Page 8: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

8

Correlación indica relación recíproca. En Esta-

dística, designa no una relación recíproca, sino

la correspondencia en las pautas de variación

de dos o más variables. La covariación puede

no deberse a una relación de influencia entre

las variables, no implica causalidad.El grado de correlación entre las variables es

medido mediante el cálculo de los coeficientes de correlación.

CORRELACIÓN ENTRE VARIABLES

Page 9: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

9

Coeficiente de Correlación lineal y paramétrico, que sirve para determinar el grado y signo de la covariación entre dos variables de nivel intervalar.

Puede variar de –1 a +1, indicando la fuerza o intensidad de la relación y el sentido o dirección:

Requiere que las variables se distribuyan normalmente.

Los puntos en el diagrama de dispersión deben ajustarse al modelo de la ecuación de la línea recta.

Y = a + b . X La herogeneidad o dispersión a lo largo de la recta, debe ser

aproximadamente la misma (homocedasticidad).

COEFICIENTE ‘r’ de PEARSON

x,y( 1 r +1)

Page 10: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

10

Son independientes dos o más variables

cuando la variación de los valores de una varia-

ble no está relacionada con la variación de los

valores de las otras. El ‘r’ es igual a 0.

Dos sucesos son independientes, cuando la

probabilidad de ocurrencia de uno no depende,

o es la misma tenga o no tenga lugar el otro

suceso.

INDEPENDENCIA ESTADÍSTICA

Page 11: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

11

Variables independientes que en la investigación se

estudian como no dependientes en su variación de

otras variables, sino que, al contrario, mediante ellas

se pretende explicar la variación de las variables de-

pendientes.

Variables dependientes que en su variación, dependen

de otras variables, que determinan el alcance y sentido

de las modificaciones que en ellas se observan. Son las

que se quieren estudiar y explicar en la investigación.

VARIABLES INDEPENDIENTES Y DEPENDIENTES

Page 12: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

12

Comparación de diagramas de dispersión (Razón alumnos-cargo*NBI)

CicloInicial

CicloEGB

CicloMedio

CicloEspecial

CicloForm. Prof

CicloCEC

CicloCENS

CicloEduc. Art.

CicloSuperior

CicloAdultos

CicloEd. Física

Page 13: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

13

Coeficiente r: 0,87

Coeficiente r2: 0,75

Page 14: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

14

Coeficiente r: 0,97

Coeficiente r2: 0,93

Page 15: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

15

Coeficiente r: 0,94

Coeficiente r2: 0,89

Page 16: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

16

Coeficiente r: - 0,66

Coeficiente r2: 0,43

Page 17: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

17

Coeficiente r: 0,15

Coeficiente r2: 0,02

Page 18: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

18

Coeficiente r: 0,70

Coeficiente r2: 0,48

Page 19: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

19

Coeficiente r: 0,42

Coeficiente r2: 0,17

Page 20: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

20

Coeficiente r: 0,42

Coeficiente r2: 0,18

Page 21: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

21

Coeficiente r: 0,78

Coeficiente r2: 0,60

Page 22: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

22

Coeficiente r: 0,72

Coeficiente r2: 0,52

Page 23: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

23

Coeficiente r: 0,19

Coeficiente r2: 0,04

Page 24: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

24

Comparación de Diagramas de Dispersión (Puntajes de Tests Mentales y de Rendimiento

Lector de 36 alumnos de EGB)Nivel intelectual

* Madurez lectoraNivel intelectual* Comprensión

Nivel intelectual* Memoria General

Nivel intelectual* Cálculo

Madurez lectora* Velocidad lectora

Velocidad lectora* Comprensión

Nivel de vocabulario* Comprensión

Page 25: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

25

Coeficiente r: 0,70

Coeficiente

r2: 0,49

4 8

Madurez Lectora

Nivel Intelectual

18 4317 307 1812 2315 196 227 2610 209 194 182 127 1720 299 2210 2013 2511 152 1116 338 283 249 204 132 1419 2714 2215 289 198 1811 2010 2013 2410 214 1810 103 14

Page 26: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

26

Ejercicio SPSS-Regresión SimpleFichero ALTURA

Analizar > Correlaciones > Bivariadas

1 ,962**. ,000

339 339,962** 1,000 .339 339

Correlación de PearsonSig. (bilateral)NCorrelación de PearsonSig. (bilateral)N

Edad del CHICO

Altura del CHICO

Edad delCHICO

Altura delCHICO

La correlación es significativa al nivel 0,01 (bilateral).**.

Coeficiente de Correlación “r” de PearsonMatriz de Correlaciones

Fuente: Etxcheberría, Juan (1999). Regresión Múltiple, Cuadernos de Estadística nº 4, Madrid: Editorial La Muralla-Hespérides.

Page 27: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

27

Ejercicio SPSS-Regresión SimpleFichero ALTURA

Analizar > Regresión > LinealVariables introducidas/eliminadasb

Edad delCHICO

a . Introducir

Modelo1

Variablesintroducidas

Variableseliminadas Método

Todas las variables solicitadas introducidasa.

Variable dependiente: Altura del CHICOb.

Resumen del modelo

,962a ,926 ,925 6,927Modelo1

R R cuadradoR cuadradocorregida

Error típ. de laestimación

Variables predictoras: (Constante), Edad del CHICOa.

Page 28: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

28

Ejercicio SPSS-Regresión SimpleFichero ALTURA

Analizar > Regresión > LinealIdentificación de casos atípicos (outliers)

Diagnósticos por casoa

-3,009 154 174,85 -20,85-4,209 151 180,16 -29,16-3,776 154 180,16 -26,16

Número de caso290324330

Residuo tip.Altura delCHICO

Valorpronosticado Residuo bruto

Variable dependiente: Altura del CHICOa.

Page 29: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

29

Ejercicio SPSS-Regresión SimpleFichero ALTURA

Analizar > Regresión > Lineal

ANOVAb

201226,814 1 201226,814 4193,343 ,000a

16171,687 337 47,987217398,501 338

RegresiónResidualTotal

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

Variables predictoras: (Constante), Edad del CHICOa.

Variable dependiente: Altura del CHICOb.

Coeficientesa

89,900 ,903 99,586 ,0005,309 ,082 ,962 64,756 ,000

(Constante)Edad del CHICO

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

ost Sig.

Variable dependiente: Altura del CHICOa.

Page 30: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

30

Ecuación de regresión: ESTATURA = f (EDAD)Coeficientesa

89,900 ,903 99,586 ,0005,309 ,082 ,962 64,756 ,000

(Constante)Edad del CHICO

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

ost Sig.

Variable dependiente: Altura del CHICOa.

1 1

0 1 1

**

i

i

Y a b XY b b X

Y1 = 89,00+5,309*X1 = 89,00+5,309*EDAD=

ESTATURA=89,00+5,309*12 años= 152,7 08 cm.

Yc = Y´= 152,708 cm.

Page 31: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

31

Ecuación de estimación de ESTATURA verdadera

Yc = 143 cm. ± 1,96 * 6,927 = 143 ± 13,577=

Límite Inferior: ESTATURA (estimada) = 143-13,577 = 129, 423 cm.

Límite Superior: ESTATURA (estimada) = 143+13,577 = 156,577 cm.

Resumen del modelo

,962a ,926 ,925 6,927Modelo1

R R cuadradoR cuadradocorregida

Error típ. de laestimación

Variables predictoras: (Constante), Edad del CHICOa.

1,96 *Xc o YY Y z S

152,708 cm. ESTATURA estimada por la Ecuación de Regresión en función de EDAD

143 cm. Media Aritmética de los n = 339 chicos de 2 a 17 años.

158,60 cm. Media Aritmética de los n = 20 chicos de 12 años.

Page 32: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

32

Gráfico ConvencionalDiagrama de Dispersión Simple

ALTURA del chico según

la EDAD del chico

Edad del CHICO

181614121086420

Altu

ra d

el C

HIC

O200

180

160

140

120

100

80

Etx

eber

ría, R

afaé

l (19

99).

Reg

resi

ón M

últip

le.

Cua

dern

os d

e E

stad

ístic

a n°

4. M

adrid

:E

dito

rial H

espé

rides

-La

Mur

alla

, pp.

6-5

1

Page 33: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

33

Gráfico InteractivoRecta de Regresión Lineal Simple

Regresión lineal

4 8 12 16

Edad del CHICO

100

125

150

175

Altu

ra d

el C

HIC

O

A

AAAA

AAAA

AAAAAA AAA

AAAA

A

AAA

A

AA

AA

AAAAAAAA

A

A

AAA

AAAA

AAAAAAA

AAAA

A

AAA

A

AAA

AAA

A

A

A AA

AAAA

AAA

A

A

AAA

A

AAA

AAA

A

AAA

A

AAA

A

AAAA

A

AA

AAAA

AA

A

A

AA

AA

A

AA

A

AA

A

AA

A

AAA

A

AA

AAAA

AA

A

A

A

AAAAA

A

AAA

A

AAA

A

AAAA

AAA

A

AAA

A

AA

A

A

AAAA

A

AA

A

A

AAA

AAAAAA

A

AA

A

A

A

AAAAA

A

AAAA

AA

A

AAA

AA

AAA

A

A

AAAA

A

AAAA

A

A

AA

AA

AAAAA

AA

A

A

AAAA

AA

A

A

AAA

AA

A

A

AA

AA

AA

AAA

AAAA

A

AA

A

A

AA

A

A

A

AA

A

A

AA

A

A

A

A

AAA

A

A

A

AAA

A

A

A

A

A

A

A

A

A

AA

AA

A

AA

A

A

A

A

AA

AA

A

AA

AA

AA

AAA

290324330

1Altura del CHICO = 89,90 + 5,31 * edadR-cuadrado = 0,93

ALTURA del chico en funcion de la EDAD del chico

Etx

eber

ría, R

afaé

l (19

99).

Reg

resi

ón M

últip

le.

Cua

dern

os d

e E

stad

ístic

a n°

4. M

adrid

:E

dito

rial H

espé

rides

-La

Mur

alla

, pp.

6-5

10 1 1*iY b b X

ESTATURA=89,00+5,309*12 años= 152,708 cm.

Page 34: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

34

Gráfico InteractivoRecta de Regresión Lineal Simple.

Suma de Cuadrado Total2( )oSCT Y Y

Etx

eber

ría, R

afaé

l (19

99).

Reg

resi

ón M

últip

le.

Cua

dern

os d

e E

stad

ístic

a n°

4. M

adrid

:E

dito

rial H

espé

rides

-La

Mur

alla

, pp.

6-5

1 ALTURA del chico en funcion de la EDAD del chicoMedia

4 8 12 16

Edad del CHICO

100

125

150

175

Altu

ra d

el C

HIC

O

A

AAAA

AAAA

AAAAAA AAA

AAAA

A

AAA

A

AA

AA

AAAAAAAA

A

A

AAA

AAAA

AAAAAAA

AAAA

A

AAA

A

AAA

AAA

A

A

A AA

AAAA

AAA

A

A

AAA

A

AAA

AAA

A

AAA

A

AAA

A

AAAA

A

AA

AAAA

AA

A

A

AA

AA

A

AA

A

AA

A

AA

A

AAA

A

AA

AAAA

AA

A

A

A

AAAAA

A

AAA

A

AAA

A

AAAA

AAA

A

AAA

A

AA

A

A

AAAA

A

AA

A

A

AAA

AAAAAA

A

AA

A

A

A

AAAAA

A

AAAA

AA

A

AAA

AA

AAA

A

A

AAAA

A

AAAA

A

A

AA

AA

AAAAA

AA

A

A

AAAA

AA

A

A

AAA

AA

A

A

AA

AA

AA

AAA

AAAA

A

AA

A

A

AA

A

A

A

AA

A

A

AA

A

A

A

A

AAA

A

A

A

AAA

A

A

A

A

A

A

A

A

A

AA

AA

A

AA

A

A

A

A

AA

AA

A

AA

AA

AA

AAA

290324330

Media = 143

Page 35: ESTADÍSTICA I Clase 6: Análisis de Correlación Lineal Simple

Carrera de SociologíaAutor: Lic. Rubén José Rodríguez

35

Gráfico InteractivoRecta de Regresión Lineal Simple.

Intervalo de Confianza de la Ecuación del estimación de YcE

txeb

erría

, Raf

aél (

1999

). R

egre

sión

Múl

tiple

.C

uade

rnos

de

Est

adís

tica

n° 4

. Mad

rid:

Edi

toria

l Hes

périd

es-L

a M

ural

la, p

p. 6

-51

Regresión lineal conIntervalo de predicción individual al 95,00%

4 8 12 16

Edad del CHICO

100

125

150

175

Altu

ra d

el C

HIC

O

A

AAAA

AAAA

AAAAAA AAA

AAAA

A

AAA

A

AA

AA

AAAAAAAAA

A

AAA

AAAA

AAAAAAA

AAAA

A

AAA

A

AAA

AAA

A

A

A AA

AAAA

AAA

A

A

AAA

A

AAA

AAA

A

AAA

A

AAA

A

AAAA

A

AA

AAAA

AA

A

A

AA

AA

A

AA

A

AA

A

AA

A

AAA

A

AA

AAAA

AA

A

A

A

AAAAA

A

AAA

A

AAA

A

AAAA

AAA

A

AAA

A

AA

A

A

AAAA

A

AA

A

A

AAA

AAAAAA

A

AA

A

A

A

AAAAA

A

AAAA

AA

A

AAA

AA

AAA

A

A

AAAA

A

AAAA

A

A

AA

AA

AAAAA

AA

A

A

AAAA

AA

A

A

AAA

AA

A

A

AA

AA

AA

AAA

AAAA

A

AA

A

A

AA

A

A

A

AA

A

A

AA

A

A

A

A

AAA

A

A

AAAA

A

A

A

A

A

A

A

A

A

AA

AA

A

AA

A

A

A

A

AA

AA

A

AA

AA

AA

AAA

290324330

1Altura del CHICO = 89,90 + 5,31 * edadR-cuadrado = 0,93

ALTURA del chico en funcion de la EDAD del chico

Y∞ = 152,708 cm. ± 1,96 * 6,927 = 152,708 ± 13,577=139,131

166,357

1,96 *xc yY Y z S