elementos de estadÍstica bivariante
DESCRIPTION
ELEMENTOS DE ESTADÍSTICA BIVARIANTE. Dpto. de Cs. Matemáticas y Física Área Estadística. Prof. Juan Moncada Herrera. Estadística Bivariante. Objetivos. Estudiar, explorar y/o valorar la relación o asociación existente entre DOS variables. Estadística Bivariante. Escenarios posibles. - PowerPoint PPT PresentationTRANSCRIPT
ELEMENTOS DEESTADÍSTICA BIVARIANTE
Dpto. de Cs. Matemáticas y FísicaÁrea Estadística
Prof. Juan Moncada Herrera
Estudiar, explorar y/o valorar la relación o asociación existente entre DOS variables
Objetivos
Estadística Bivariante
Escenarios posibles
Estadística Bivariante
Ambas Variables
Cualitativas Cuantitativas
Esquema de análisis
Estadística Bivariante
ESTUDIO DE LA ASOCIACIÓN
EXPLORACIONES BÁSICAS
MEDIDA DE ASOCIACIÓN
SIGNIFICANCIA ASOCIACIÓN
AMBAS VARIABLES CUANTITATIVAS
Estadística Bivariante
Descriptiva > Gráfica
Diagrama de Dispersión
Cuantitativa
Estadística Bivariante
Diagrama de Dispersión
Estadística Bivariante
Cuantitativa
Descriptiva > Gráfica
Diagrama de Dispersión
Estadística Bivariante
Cuantitativa
Descriptiva > Gráfica
YX
n
iii
SSn
YXnYXr
)1(1
Coeficiente de correlación
lineal de Pearson
Estadística Bivariante
Cuantitativa
Descriptiva > Numérica
El porcentaje de variabilidad de Y explicado por la variabilidad en X lo
mide el coeficiente de determinación, que corresponde a r2.
Estadística Bivariante
Cuantitativa
Descriptiva > Numérica
X 16 14 22 10 14 17 10 13 19 12 18 11
Y 77 70 85 50 62 70 52 63 80 57 81 54
X: Puntaje en un sistema de aprendizaje Y: Costo asociado al logro del puntaje
Estadística Bivariante
Cuantitativa
Descriptiva > Numérica
H0: Las variables son independientes
(Variables no relacionadas)
Estadística Bivariante
Ha: Las variables No son independientes
(Variables relacionadas)
Cuantitativa
Inferencial
Estadístico de Prueba:
Estadística Bivariante
22~
1
2
nobs t
r
nrT
Cuantitativa
Inferencial
Estadística Bivariante
AMBAS VARIABLES CUALITATIVAS
DADAS DOS CARACTERÍSTICAS DE LA POBLACIÓN, Y EN BASE A LAS FRECUENCIAS U OBSERVACIONES
CORRESPONDIENTES: ¿EXISTE ALGUNA RELACIÓN ENTRE TALES CARACTERÍSTICAS, O MÁS BIEN SON ELLAS
INDEPENDIENTES?
Los Objetivos
Estadística Bivariante
Cualitativa
Punto de partida: El cuestionario
Preliminares
Estadística Bivariante
Cualitativa
Preliminares Variables
cualitativas
Individuos X1 X2
1
2
...
n
La Tabla de Datos
Estadística Bivariante
Cualitativa
Ind Carrera Adsc.Rel
1 B C2
2 C C2
3 A C1
4 A C2
5 A C2
6 D C2
7 B C2
8 D C2
9 C C2
10 C C2
11 A C1
12 D C1
13 D C1
14 B C1
15 C C1
Tabla de códigos condensados
Preliminares
Estadística Bivariante
Cualitativa
La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A
B
C
D
TOTALES COLUMNA
Resumen-Descripción
Estadística Bivariante
Cualitativa
Ind Carrera Adsc.Rel
1 B C2
2 C C2
3 A C1
4 A C2
5 A C2
6 D C2
7 B C2
8 D C2
9 C C2
10 C C2
11 A C1
12 D C1
13 D C1
14 B C1
15 C C1
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Construcción
Estadística Bivariante
Cualitativa
Ind Carrera Adsc.Rel
1 B C2
2 C C2
3 A C1
4 A C2
5 A C2
6 D C2
7 B C2
8 D C2
9 C C2
10 C C2
11 A C1
12 D C1
13 D C1
14 B C1
15 C C1
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
0
1
2
3
4
A B C D
Distribución filas
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Representación gráfica
Estadística Bivariante
Cualitativa
Distribución columnas
C1
C2
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
Resumen-Descripción
Estadística Bivariante
Cualitativa
La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Representación gráfica
0
0.5
1
1.5
2
2.5
3
A B C D
Carrera
Religión según Carrera
C1
C2
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Representación gráfica
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
0
0.5
1
1.5
2
2.5
3
C1 C2
Religión
Carrera según Religión
A
B
C
D
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia: Un Primer Resumen: Representación gráfica
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2/15
B
C
D
TOTALES COLUMNA
Frecuencias Absolutas Frecuencias Relativas
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas
Estadística Bivariante
Cualitativa
Resumen-Descripción
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2/15 2/15
B
C
D
TOTALES COLUMNA
Frecuencias Absolutas Frecuencias Relativas
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas
Estadística Bivariante
Cualitativa
Resumen-Descripción
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2/15 2/15 4/15
B 1/15 2/15 3/15
C 1/15 3/15 4/15
D 2/15 2/15 4/15
TOTALES COLUMNA
6/15 9/15 1
Frecuencias Absolutas Frecuencias Relativas
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas
Estadística Bivariante
Cualitativa
Resumen-Descripción
Comparaciones pertinentes: Las Tablas de Perfiles
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2/4 2/4 1
B 1/3 2/3 1
C 1/4 3/4 1
D 2/4 2/4 1
TOTALES COLUMNA
6 9 15
Frecuencias absolutas Perfiles Fila (o Linea)
Estadística Bivariante
Cualitativa
Resumen-Descripción
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2/6 2/9 4
B 1/6 2/9 3
C 1/6 3/9 4
D 2/6 2/9 4
TOTALES COLUMNA
1 1 15
Frecuencias absolutas Perfiles columna
Comparaciones pertinentes: Las Tablas de Perfiles
Estadística Bivariante
Cualitativa
Resumen-Descripción
H0: Las variables son independientes
(Variables no relacionadas)
Estadística Bivariante
Ha: Las variables No son independientes
(Variables relacionadas)
Cualitativa
Las Hipótesis
Inferencia
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A (4*6)/15
B
C (4*9)/15
D
TOTALES COLUMNA
Valores Observados Valores Esperados
ADSC. RELIG.
CARRERA C1 C2 TOTALES FILAS
A 2 2 4
B 1 2 3
C 1 3 4
D 2 2 4
TOTALES COLUMNA
6 9 15
Midiendo la relación entre las variables: La tabla de Valores Esperados
Estadística Bivariante
Cualitativa
Inferencia
Inferencia
Midiendo la relación entre las variables: El estadístico Chi-cuadrado
Estadística Bivariante
22
2 ~
ESP
ESPobsobs f
ff
fobs: Frecuencia absoluta observada
fESP: Frecuencia esperada
2: Distribución Chi-cuadrado con grados de libertad,
=(No filas - 1)(No columnas – 1)
Cualitativa
Análisis Factorial
de Correspondencias
OBJETIVO:
Gráficamente:
Visualizar, mediante proyecciones sobre planos, las proximidades entre perfiles línea, entre perfiles columna y entre perfiles línea y perfiles columna de una tabla de contingencia.
Análisis Factorial de Correspondencias
Jean Paul Benzecri(1932 - )
LA TABLA DE DATOS:
Análisis Factorial de Correspondencias
Variables Cualitativas
Individuos X1 X2
1
n
TRANSFORMACIONES INICIALES:
Frecuencias relativas
… j …
i … fij … fi.
… f.j … 1
Tabla de contingencia
… j …
i … nij … ni.
… n.j … n..
Análisis Factorial de Correspondencias
TRANSFORMACIONES INICIALES:
Frecuencias relativas
… j …
i … fij … fi.
… f.j … 1
Perfiles línea
… j …
i … …. 1
… f.j … 1
.i
ij
ff
Perfiles columna
… j …
i … …. fi.
… 1 … 1
i
ij
ff
.
Análisis Factorial de Correspondencias
TRANSFORMACIONES INICIALES:
Perfiles línea
… j …
i … …. 1
… f.j … 1
.i
ij
ff
Perfiles columna
… j …
i … …. fi.
… 1 … 1
i
ij
ff
.
Espacio de filas Espacio de columnas
Análisis Factorial de Correspondencias
EL REFERENCIAL:
PROCESO DE DIAGONALIZACIÓN
REPRESENTACIÓN DE FILASREPRESENTACIÓN DE FILAS REPRESENTACIÓN DE COLUMNASREPRESENTACIÓN DE COLUMNAS
SE TRATA DE DOS SUBESPACIOS DE MISMA NATURALEZA
REGLAS DE TRANSICIÓN
Análisis Factorial de Correspondencias
EFECTO DE LAS REGLAS DE TRANSICIÓN:
Espacio de filas Espacio de columnas
Análisis Factorial de Correspondencias
REPRESENTACIÓN BIPLOT
EL REFERENCIAL:
IMPORTANTE: A una tabla de contingencia se asocian dos referenciales. Uno se obtiene cuando perfiles fila son entendidos como individuos (y perfiles columna como variables) y la otra cuando perfiles columna son entendidos como individuos (y perfiles fila como variables). No obstante esto, se puede demostrar que ambos procesos de diagonalización producen la misma descomposición de la inercia, y que los espacios resultantes se encuentran fuertemente relacionados entre sí, por medio de las llamadas relaciones pseudobaricéntricas. Estas relaciones permiten, en definitiva, superponer los dos espacios obtenidos. En cada uno de los espacios se representan distancias Ji–cuadrado.
Análisis Factorial de Correspondencias
REGLAS DE LECTURA E INTERPRETACIÓN:
CALIDAD DE REPRESENTACIÓN
CONTRIBUCIONES
DISTANCIA AL ORIGEN Perfiles bien representados se observan siempre alejados del origen del sistema.
Análisis Factorial de Correspondencias
1. Daniel W.: Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-Hill. Mexico, 19997.
2. Canavos G.: Probabilidad y Estadística. Aplicaciones y métodos. Mc Graw Hill. México, 1995.
3. Hernández–Fernández–Baptista: Metodología de la Investigación. Mc Graw Hill. México, 1998.
Sugerencias Bibliográficas