métodos de extracción de factores
TRANSCRIPT
![Page 1: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/1.jpg)
MÉTODOS DE EXTRACCIÓN DE FACTORES
Curso: Estadística Avanzada IÁmbar Oliveras FigueroaManlyn Rivera Laracuente12 de mayo de 2011
![Page 2: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/2.jpg)
ANÁLISIS FACTORIAL
![Page 3: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/3.jpg)
ANÁLISIS FACTORIAL
Análisis Factorial es una técnica estadística de reducción de datos.
Usada para explicar la variabilidad entre variables observadas en términos de un número menor de variables no observadas a las que vamos a llamar factores.
![Page 4: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/4.jpg)
USOS MÁS FRECUENTES
Reducción de información Identificación de estructuras
subyacentes Creación de variables
![Page 5: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/5.jpg)
PASOS PARA EL ANÁLISIS FACTORIAL
Calcular la matriz de correlaciones. Extracción de los factores necesarios
para representar los datos. Análisis de la matriz de cargas (pesos). Rotación de los factores. Calcular las puntuaciones factoriales de
cada individuo.
![Page 6: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/6.jpg)
REQUISITOS
Selección de variables que formen conjuntos correlacionados.
Las variables deben estar en escala métrica.
Mínimo de 100 casos.
![Page 7: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/7.jpg)
EXTRACCIÓN DE FACTORES POR EL MÉTODO CENTROIDE
![Page 8: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/8.jpg)
PRECURSORES
Louis Leon Thurstone (1887-1955). Psicólogo
estadounidense. Responsable por el
modelo de medición de inteligencia que se utiliza hoy en día.
Comenzó a estudiar el análisis factorial en 1947.
![Page 9: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/9.jpg)
PRECURSORES
Benjamin Fruchter (1914-2010) Psicólogo estadounidense. Famoso por su libro “Introducción al
análisis factorial” (1954).
![Page 10: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/10.jpg)
DESCRIPCIÓN
El método de extracción factorial más conocido.
Suplantado por otros métodos más precisos. Método del factor principal.
![Page 11: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/11.jpg)
PUNTO CENTROIDE
Coordenada x: la media de todas las coordenadas x de los vectores de datos.
Coordenada y: la media de todas las coordenadas y de los vectores de datos.
Si se están analizando más de dos coordenadas, se halla la media de la coordenada correspondiente.
![Page 12: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/12.jpg)
PESO CENTROIDE
La fórmula para un peso centroide para la variable j en el factor I:
1
1 1
n
iji
jI n n
ijj i
ra
r
![Page 13: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/13.jpg)
PESO CENTROIDE
La suma de los pesos del segundo factor y los siguientes factores centroides es cero.
Para hallar el peso del primer factor, es necesario usar la fórmula para un peso centroide.
![Page 14: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/14.jpg)
PASOS A SEGUIR
Sumar las entradas de cada columna de la matriz de las correlaciones.
Sumar cada uno de los totales y encontrar la raíz cuadrada de este nuevo total.
Dividir el total de la primera columna entre la raíz cuadrada hallada en el paso anterior.
Dividir el total de la segunda columna entre la misma raíz cuadrada.
Si existen más de dos variables, el proceso continúa con cada columna subsiguiente.
![Page 15: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/15.jpg)
TABLA DE RESIDUOS
Para hallar la tabla de residuos R1 usaremos la fórmula:
Donde: R es la matriz de correlaciones original A1 es el primer factor (una matriz columna) A’1 es la traspuesta de A1
1 1 1'R R A A
![Page 16: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/16.jpg)
MATRIZ DE RESIDUOS
La tabla de residuos se expresa como una matriz de residuos.
La matriz de residuos del primer factor es simétrica.
La suma de cada fila y columna es cero. Antes de realizar los pasos para hallar el
segundo factor centroide, es necesario reflejar ciertos valores para eliminar los signos negativos.
![Page 17: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/17.jpg)
INVERSIÓN DE VALORES
Los residuos se reflejan para hacerlos positivos.
Un factor con signos positivos es extraído. Este factor se elimina de los residuos después de que estos han sido reflejados.
Es necesario identificar las columnas y filas que hemos reflejado.
Los pesos de estas columnas tendrán también su signo invertido.
![Page 18: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/18.jpg)
EJEMPLO
![Page 19: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/19.jpg)
EJEMPLO:
Considere la siguiente matriz de correlaciones:Variables x y z w
x 0.65 0.5 0.16 0.17y 0.5 0.4 0.22 0.24z 0.16 0.22 0.65 0.73w 0.17 0.24 0.73 0.82
![Page 20: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/20.jpg)
Debemos hallar los totales (t) de cada columna. Luego hallamos la sumatoria (T), y buscamos la raíz cuadrada.
Variables x y z wx 0.65 0.5 0.16 0.17y 0.5 0.4 0.22 0.24z 0.16 0.22 0.65 0.73w 0.17 0.24 0.73 0.82 T SQRT(T)t 1.48 1.36 1.76 1.96 6.56 2.56125a(1) 0.577843 0.530991 0.687165 0.765251
![Page 21: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/21.jpg)
Con los valores de a(1) crearemos la matriz columna A, luego encontramos la transpuesta At.
![Page 22: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/22.jpg)
Hallamos la matriz R1 usando la fórmula:
R1= R – A At
![Page 23: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/23.jpg)
El proceso continúa: podemos notar que la suma de las columnas x, y tienen valores negativos. Es necesario comenzar el proceso de reflexión. R1
Variables x y z wx 0.315916 0.193082 -0.23709 -0.27217y 0.193082 0.118039 -0.1448 -0.16622z -0.23709 -0.1448 0.178031 0.204445w -0.27217 -0.16622 0.204445 0.234775t -0.00026 0.000109 0.000593 0.000835∑0 -0.31617 -0.11793 -0.17744 -0.23394
![Page 24: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/24.jpg)
INVERSIÓN DE VALORESReflejar la variable xVariables x y z wx 0.315916 -0.19308 0.237086 0.27217y -0.19308 0.118039 -0.1448 -0.16622z 0.237086 -0.1448 0.178031 0.204445w 0.27217 -0.16622 0.204445 0.234775t 0.63209 -0.38606 0.474765 0.545175∑0 0.316174 -0.50409 0.296734 0.3104
![Page 25: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/25.jpg)
La próxima variable a reflejar es la variable y, ya que su suma es negativa.
Reflejar la variable yVariables x y z wx 0.315916 0.193082 0.237086 0.27217y 0.193082 0.118039 0.144797 0.166215z 0.237086 0.144797 0.178031 0.204445w 0.27217 0.166215 0.204445 0.234775t 1.018254 0.622133 0.764359 0.877605
![Page 26: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/26.jpg)
CÁLCULOS DEL SEGUNDO FACTOR
Variables x y z wx 0.315916 0.193082 0.237086 0.27217y 0.193082 0.118039 0.144797 0.166215z 0.237086 0.144797 0.178031 0.204445w 0.27217 0.166215 0.204445 0.234775 T SQRT(T)t 1.018254 0.622133 0.764359 0.877605 3.282351 1.811726a(2) 0.562035 0.343392 0.421895 0.484403
![Page 27: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/27.jpg)
MATRIZ DE FACTORES
Matriz de factoresa(1) a(2)
x 0.578 0.562y 0.531 0.344z 0.687 0.422w 0.765 0.484
![Page 28: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/28.jpg)
CÁLCULO DE LAS COMUNALIDADES
Factores Factores al cuadradoa(1) a(2) a(1)^2 a(2)^2 h2
x 0.578 0.562 0.334 0.316 0.650y 0.531 0.344 0.282 0.118 0.400z 0.687 0.422 0.472 0.178 0.650w 0.765 0.484 0.585 0.234 0.819
![Page 29: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/29.jpg)
Otros métodos
MÉTODO DE FACTOR PRINCIPAL
![Page 30: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/30.jpg)
MÉTODO DE FACTOR PRINCIPAL Este método supone que existe un factor
común subyacente a las variables y requiere mayor cálculo que el explicado anteriormente pero extrae la máxima varianza con cada factor sucesivo.
Este es el más usado recientemente ya que requiere el uso de software especializado.
Para este método es necesario estimar las comunalidades. La solución depende de la correcta estimación de las mismas.
![Page 31: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/31.jpg)
MÉTODO DE FACTOR PRINCIPAL
La idea de este método es buscar factores que expliquen la mayor parte de la varianza común.
La varianza común es la parte de la variación de la variable que es compartida con las otras variables.
La especificidad es la parte de la variación que es propia de la variable.
![Page 32: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/32.jpg)
TEOREMA
Matriz simétrica puede ser diagonalizada de la siguiente manera. B x R x B’ = D R: matriz simétrica B: matriz ortogonal B’: transpuesta de B D: matriz diagonal
![Page 33: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/33.jpg)
TEOREMA (CONT)
Por lo tanto B x B’ = B’ x B = I (haciendo que B’ sea la inversa de B por definición)
Usando este dato expuesto y luego de unas operaciones se puede llegar a la siguiente conclusión:
R = B’ x D x B
![Page 34: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/34.jpg)
Si es una matriz diagonal, cuyos elementos diagonales son las raíces cuadradas de los elementos correspondientes en las diagonales de la matriz diagonal D, entonces:
Por lo tanto se llega a:
El primer paréntesis es una matriz factorial A y el segundo es la transpuesta de A
D D D
'
( ' )( ) '
R B D D B
B D D B A A
D
![Page 35: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/35.jpg)
PASOS PARA PRODUCIR EL FACTOR PRINCIPAL
Construir la matriz de correlaciones n x n, con los valores apropiados seleccionados para las casillas diagonales como estimaciones de las comunidades. Esta matriz la vamos a llamar R.
Buscar la matriz ortogonal B (n x n) de manera que cuando R es premultiplicada por B y post multiplicada por B’, el resultado es la matriz diagonal D con elementos diagonales
1 2, ,..., n
![Page 36: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/36.jpg)
Multiplicar cada elemento de la columna 1 de B’ por , cada elemento de la columna 2 de B’ por y así sucesivamente.
La matriz que se obtiene en el paso 3 es una matriz factorial A. La suma de los cuadrados de la columna 1 de A es igual a
y los de la segunda a
y así sucesivamente.
12
1
2
![Page 37: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/37.jpg)
VARIANZA POR EL FACTOR I
La varianza extraída por el factor i es
La suma de los valores será la varianza total extraída.
1
in
ii
i
![Page 38: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/38.jpg)
EL MÉTODO DE JACOBI
![Page 39: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/39.jpg)
CARL GUSTAV JAKOB JACOBI ( 10 de diciembre de 1804 -18 de
febrero de 1851) Matemático alemán. Autor muy prolífico, contribuyó
en varios campos de la matemática, principalmente en el área de las funciones elípticas, el álgebra, la teoría de números y las ecuaciones diferenciales.
Destacó en su labor pedagógica, por la que se le ha considerado el profesor más estimulante de su tiempo.
![Page 40: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/40.jpg)
EL MÉTODO DE JACOBI El comienzo de este método lo es obtener
una matriz B1 de manera que: B1 R B1’ = D1
B1: matriz ortogonal con números distintos de 0 en bii, bij, bji y bjj y también en otras casillas diagonales. Con excepción de bii y bjj las casillas diagonales tienen valor de 1. La matriz D1 tendrá 0 en bij y bji. El valor rij es el mayor elemento no diagonal de la matriz.
![Page 41: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/41.jpg)
EL MÉTODO DE JACOBI
Poner el valor de 1 en todas la casillas de la diagonal de Bi excepto en bii y bjj
Calcular
Determinar los siguientes elementos de Bi:
Los otros elementos no diagonales de Bi son iguales a 0.
2 2
2tan(2 ) ij
i j
r
h h
cos ; sin ; sinij ij ij ij ijb b
![Page 42: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/42.jpg)
OTROS MÉTODOS
![Page 43: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/43.jpg)
OTROS MÉTODOS
Mínimos cuadrados no ponderados Mínimos cuadrados generalizados Factorización por imágenes Método Alfa
![Page 44: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/44.jpg)
COMPARACIÓN ENTRE LOS MÉTODOS Cuando las comunalidades son altas (mayores
que 0.6) todos los procedimientos tienen la misma solución.
Cuando las comunalidades son bajas para algunas variables, el método de componentes principales tiende a dar diferente al resto de los otros, con cargas factoriales mayores.
Si el número de variables es muy alto (mayor de 30) las estimaciones de la comunalidad tienen menos influencia en la solución obtenida.
Si el número de variables es bajo todo depende del método que se utilice para estimar las comunalidades.
![Page 45: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/45.jpg)
SPSS COMO HERRAMIENTA
Una de las herramientas utilizadas hoy día para hacer este tipo de cálculos lo es el programa de IBM (SPSS).
Hacer una extracción factorial y otros cálculos antes mencionados en clase resultan ser muy fáciles si se conoce como trabajar con el programa.
![Page 46: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/46.jpg)
EJEMPLO SPSS
Considerar la siguiente matriz de correlaciones:
Ver corrida en el programa…
![Page 47: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/47.jpg)
EJEMPLO SPSS
![Page 48: Métodos de extracción de factores](https://reader034.vdocumento.com/reader034/viewer/2022052307/5580127ad8b42a190e8b491e/html5/thumbnails/48.jpg)
REFERENCIAS
Comrey, Andrew. Manual de Análisis Factorial. Capítulos 3 y 4. 1985
Black, Ken. Business Statistics. Southwestern College Printing. 2001. Ohio
Newmark, Joseph. Statistics and Probability in Modern Life. (6th Edition) Hardcore. New York 1997.