análisis factorial por componentes principales (algunos

18
ESTADlST1CA ESPAÑOLA Val, 30, Núm. 1 18, 1988, págs. 215 a 232 Análisis factorial por componentes principales (Algunos aspectos interesantes) por FERNANDO GOMEZ BEZARES Facultad de Ciencias Económicas y Empresariales Universidad de Deusto-Bilbao Apartado 20044 - 48080 Bilbao RESUMEN Este trabajo se refiere a la utifización de! análisis de compo- nentes principales como un sistema de análisis factorial. En este contexto estudio algunos problemas relacionados con 1a rotacián y la tipificacián de los factores; por otro lada propongo un siste- ma para mantener la posición de los puntos tras la rotación y para interpretar los correspondientes factores, con un concepto que yo denomino "variable pura". Pa/abras c/ave: análisis de componentes principales; análisis fac- torial; rotación; variable pura. Clasificación A MS 19 8 5 6 2 H 2 5. 1. INTRODUCCION Supongamos s variables ltipificadas) con mediciones para n individuos, tal como vienen representadas en la matriz X. X1t ............................................. x1n X = • ^ X .............................................. xsn sl

Upload: others

Post on 30-Jul-2022

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis factorial por componentes principales (Algunos

ESTADlST1CA ESPAÑOLAVal, 30, Núm. 1 18, 1988, págs. 215 a 232

Análisis factorial por componentesprincipales (Algunos aspectos interesantes)

porFERNANDO GOMEZ BEZARES

Facultad de Ciencias Económicas y EmpresarialesUniversidad de Deusto-Bilbao

Apartado 20044 - 48080 Bilbao

RESUMEN

Este trabajo se refiere a la utifización de! análisis de compo-nentes principales como un sistema de análisis factorial. En estecontexto estudio algunos problemas relacionados con 1a rotaciány la tipificacián de los factores; por otro lada propongo un siste-ma para mantener la posición de los puntos tras la rotación ypara interpretar los correspondientes factores, con un conceptoque yo denomino "variable pura".

Pa/abras c/ave: análisis de componentes principales; análisis fac-torial; rotación; variable pura.

Clasificación A MS 19 8 5 6 2 H 2 5.

1. INTRODUCCION

Supongamos s variables ltipificadas) con mediciones para n individuos,tal como vienen representadas en la matriz X.

X1t ............................................. x1n

X = • ^X .............................................. xsnsl

Page 2: Análisis factorial por componentes principales (Algunos

E^T ^t^i^r^^ ^, E^F^^^^^^i_-^ ►

Es bien cflnocido que el método de componentes principales consiste enrotar los ejes, pasando a una nueva base ortonormal, de tal manera que en1a nueva base el primer componente (primer eje) tenga la méxima varianzaposibfe, el segundo en segundo lugar, etc. Obtenemos asi los factores F.Para Ilegar a ese resultado diagonalizamas !a matriz RXx de coeficientes decorrelación, donde Rx,,^XDpX' y Dp es una matriz diagonal de términos 1/n(véase p. ej. J^ireskog y otros, 1976, pégs. 41 y ss. y desde otra perspecti-va, Gómez Bezares, 1981, págs. 249-2 53i, Obteniendo la matriz diagona!d, donde aparecen los valores propios ^., (que son !a varianza de los facto-res), y la matriz U con los vectores propios tipificados.

Los factores resuitantes serán F=U'X y a! ser U ortogonal (1) X=UF. En !arnatriz U cada término u,^ es la proyección del componente j sobre lavariabfe i.

U„ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . U ^^„. '• 1

us, ............................................ usm

Puede suceder que m^ s aunque expliquemos el 100°1° de la varianza,pero para mayor claridad, pensemos que m=s. La matriz F, con el valor quetoma cada individuo en cada factor, será de^ tipo:

F

f„ .............................................. f^^

f^, ..............................................fmn

INTERPRETACION Y MEDICIC)N DE LOS FACTORES AiVTES DELA ROTACION

Recordemos que estos factores son ortogonafes y de varianza ^.,:

F Dp ^F' = U' X DoX' U= U' RxxU = b

Para interpretar los factores se suelen tipificar:

F* = ^1-"2 F

X= U 1^' ^^ ^-' ^2 F

Ilamando A = Ut^"2

X = AF*

Page 3: Análisis factorial por componentes principales (Algunos

•^ti.^I ISIS f^^(^T^ORIAI PC)R ( C)MPC)tiF-^ T^f^^ F'ftl`^C 1f' ^l f^ ^ ^!

Es fécil demostrar que al estar X y F* tipificados, A son coeficíentes decorrelación:

RXF. = XDpF'0-^^2 = XDpX' UA-^^2 _ RxXUO^a^z i RXxAO-^

pero A'A = 0'^2 U"Ud12 = 0

AA'=U0'^2L1"2U'=U^iU'=Rxx

AL1-' _ (AA")-' AA'AO-' _ ( Rxx)-' A

luego RXf. = A

Puedo medir F*, tendré:

F* = 0-^^a U'X = 0-' A'X = A' { Rxx)-' X

Ha sido bastante usual interpretar y medir F*, normalmente sin agatartodos los componentes sino sólo los más importantes {los primeros); es elmétodo de análisis factorial por componentes principales (véase p. ej. Nar-vaiza, 1981). Nosotros vamos a supaner que utilizamos los m componen-tes, estudiando ^o que pasa con las mediciones.

En muchas ocasiones se ha razonado en análisis factorial sobre el espa-cio de los individuos, donde variables y factores son vectores de longítud^igual a su desviación típica por y n. Los éngulos que forman dichos vecto-res, indican s^^s coeficientes de correlación (concretamente sus cosenos).De ahí la costumbre de denominar ortogonales a los factores, cuando sucorrelación es cero. Sin embargo, en dicho espacio, las mediciones de losindividuos se ven con menor claridad. Por esta razón, es conveniente ennuestro caso, razonar sobre el espacia de las variables. En dicho espaciotenemos la nube origina! de puntos, que tal como aparece en la matriz X,representamos en la figura 1(con la limitación de sólo usar dos variables).

Figura 1

Page 4: Análisis factorial por componentes principales (Algunos

E.ST.^[)I^T ICA E^F' ^^iC)LA

La nube de la figura, alargada en sentido diagonal, indica una correlaciánentlr-e las variabCes. Haciendo el cambio que antes comentábamos, losvalores de X en la nueva base serán: U'X=F, y tipificando los factores, lasmediciones son: 0^"^U'X=F*, cuyos valores en la base de partida serán;

Y=UF'=Ut^^'^2U'X

En la figura 2 aparece la nube X y la Y {que es la más redondeada).

Figura 2

La nube Y, es una nube de variables tipificadas y con correlación cero:

Y DpY' = U t1-' ^2 U' X DP X' U 0^ "2 U' = I

De todo esto podemos sacar algunas consecuencias: Dado que los facto-res se interpretan en base a la matriz A(de coeficientes de correlaciónentre X y F*), parece que ia medicián correcta es F*, que no es sino eiresultado de cambiar de base la nube deformada Y. Sin embargo estesistema tiene como inconveniente que no mantiene la distancia (geométri-ca) entre los individuos, al haberse deforrnado la nube de puntos, apare-ciendo entre eilos la distancia de Mahalanobis (2). La utilización de estasmediciones o puntuaciones, tiene las ventajas e inconvenientes de la antescornentado, en función de ia distancia que se considere más convenienteutilizar.

Afortunadamente, también podemos usar como medicián la matriz F. Enefecto, la diferencia entre F y F* es sálo un cambio de escala (una paracada factor) y así tenemos que:

RXF = XDPX' ULi-"2 = RXXALI-' = A

Page 5: Análisis factorial por componentes principales (Algunos

.AtiALISIS E=A(`TORIAL POR COMPC)tiEtiTE^S PRI^+( IF'ALE.S ? ^ 9

Luego interpretando con A podemos medir F.

En consecuencia, y con la misma interpretación (dada por A}, se puedeescoger entre las dos formas de medición aquella que más convenga,según las características del problema. En mi opinión la medición con Fresulta más clara para la utilización posterior de las puntuaciones, pero éstano es una afirmación absoluta.

3. INTERPRETACION Y MEDICION TRAS LA ROTACION

Podemos hacer una rotación ortogonal (p. ej. varimaxf en realidad unasegunda rotación, pues la primera ha consistido en pasar de los ejesoriginales (variables} a los componentes (U} . Esto representa un nuevocambio de base. Sea T la matriz de proyecciones de los nuevos ejes, sobrelos preexistentes (U). Las proyecciones sobre los originales serán: UT.

Utilizando el cambio de base propiciado por la matriz T podemos medirla nube original (X} o la deformada (Y}; Ilamando L al primer sistema demediciones y M* al segundo:

L=T'U'X

M*= T" U" Y= T" U" U o-' ^2 U" X= T' a-^ A" X= T' A' ( Rxx)-' X

Llamando B=A.T, M*=B'(Rxx)-' X, forma tradicional de medir los factorestras la rotación. Estos factores tienen correlación cero y varianza igual auno.

M* DpM*' = B'(Rxx}-' XDp X' (Rxx}-^ B= T'A'(Rxx}-^ ÁT = I

La matriz B nos da los coeficientes de correlación variables-factores:

RxM. = X DP X' ( Rxx1-f g= B

También podemos ver que:

BB'=ATT'A'=AA'=R xx

además como M*=B'(Rxx}-' X, premultiplicando por B y por (BB'}-' --^X=B M*. Pero también sucede que X=A F*=ATM *. Vemos en consecuenciaque la matriz B mantiene, tras la rotación, muchas de las propiedades de lamatriz A. Nos sirve para interpretar los factores M*, que al ser el resultadode cambiar de base la nube deformada (Y), tienen los inconvenientesasociados a ésta.

Page 6: Análisis factorial por componentes principales (Algunos

^ ^O E ^ 1^ ^^t)i^ [ Et -^ E ^;F'-^^lll ^^

Pero quiz^ sea conveniente e! detenernos un poco en la utilidad de larotación, antes de seguir adelante. EI método de componentes principalespretende encontrar unos factores que, en orden decreciente, vayan expli-cando el maximo de variabilidad posible del problema. Aquí hemos supues-to que utilizamos todos los componentes y que éstos son tantos como lasvariables (y así seguiremos actuando de momento para mayor claridad deldesarrollo^, pero en la pr^ctica lo normal es quedarse con los primeroscomponentes (los que más varianza explican^ y despreciar los menos im-portantes. De esta manera reducimos el número de dimensiones del pro-blema, perdiendo el minimo posible de explicación. Los componentes rete-nídos definen un espacio, pero en muchas ocasiones su interpretación noes fácil, por lo que se pracede a una rotación, que sin variar la explicacióntotal, facilite la conceptualización de los factores.

Sin embargo, la rotación hace que se pierdan algunas de las propiedadesde los componentes originales, y así, la relación existente entre F y F* antesde la rotación, no se da entre L y M*. En efecto:

RFF_ !^"^^^ U-XDp X'(Rxxl-^ A= L^► "^^2 U^A = I

pero la matriz de varianzas y covarianzas de L es:

L Dp L` = T' U' X DpX' U T= T' U' RXX U T= T' dT

que ni es diagonal, ni tiene unos en la diagonal principal. Si Ilamamos G aia diagonal principal de T'^T, tendremos (3 ► :

R^M. = G-^^z -1-• U-XppX• (Rxx}-^ A-T ` G-^^2 -T^ ^^^2 -T-

Se nos plantea, en consecuencia, el problema de interpretar los factoresL, resultado de medir sobre los ejes factoriales rotados ia nube original.Entre las distintas posíbilidades se puede plantear la siguiente ( 4): calcule-mos la matriz de covarianzas entre L e Y.

YDPb' = Ud""2U'XDpX'UT = U^1 "^U'R,^xUT = UL1^"2L1T = AT = B

Nos podemos preguntar si es posible interpretar con B. En primer lugar, elque se trate de una matríz de covarianzas, en vez de una de coeficientes decorrelación, no es problema, pues la de coeficientes de correlación seríaB G""^, lo que implica dividir !as covarianzas correspondientes a cada factorpor su propia varianza; en definitiva, un cambio de escafa que no afecta a laimportancia relativa de las variables en los factores.

Page 7: Análisis factorial por componentes principales (Algunos

AtiAI_ISIS F^^^(°T^C)RIAL. POR (^O!^1P0;'^E^.ti^T^E^ PRIti(^I^'•1l,E^S

Con todo, es imprescindible aclarar el significado de Y para poder haceruna interpretación correcta. En la figura 2 podemos ver que Y es una nubedeformada por la tipificación de los componentes F, al convertirlos en F*.Vamos a raionar intuitivamente este proceso: los individuos cercanos al ejedel factor uno ^como I, en la figura 3j, se trasladarán a lo largo del eje,variando su medición en una cantidad parecida en ambas variables. Estosindividuos los podemos denominar normales, pues tienen valores similaresen ambas variables, que est^n correlacionadas.

Figu ra 3 V1

EI individuo 12, por el contrario, es un individuo "anormal", pues tiene unalto vafor en V2 que no se corresponde con su bajo valor en V,; su trasiadolo Ileva a mantener un valar relativamente alto en V2, pero negativo en V,.Esto lo podemos interpretar como que hemos "depurado" los efectos delas variables, y el individuo 12 se ha quedado con valores negativos en V,, alquitarle el efecta de V2. En cansecuencia, las variables de la nube Ypodemos denominarlas variables puras. La matriz B da, en consecuencia,las relaciones entre los factores L y las variables puras, lo que justificautilizarla para la interpretación.

Podemos tratar de Ilegar a la matriz Y por otro camino. Partiendo de quetenemos una matriz X, si deseamos eliminar las influencias lineales queunas variables tienen sobre otras, habremos de buscar una matriz cuadradaZ que dé lugar a una transformación iineal tal que Y=ZX, y que consigaque:

Y DPY' = Z X DpX' Z' = Z R XXZ' = I

Page 8: Análisis factorial por componentes principales (Algunos

r i i E=S T^f)I5T I( 1 E SP4`tiOL.A

Construyamos Q=ZU^l12 -^-^ Z=Q11^12U'; sustituyendo arriba llegamosa Q! Q'=1 --^ que Q es ortogonal, luego es una matriz de cambio entrebases ortonormales. Cuaiquier matriz ts.sl ortogonal Q, convertida en Z,permite transformar X en Y, de manera que las nuevas variables no tengancarrelación. Esto es lógico, pues tal como lo hemos expuesto parece indife-rente la posición de Y, sin embargo esto no es cierto si deseamos que Y semida sobre las ejes sobre los que antes mediamos X. En 1a composicián deZ tenemos una parte (1^^'^2U'} que rota y tipifica, luego para que Q consigaque se vuelva a medir sobre los ejes iniciales haremos Q=U, luegoZ=Ut^^"?U`.

Puede ser interesante observar que la relación entre los factores medidosantes de rotar y las variables puras da:

RYf = U^S-ri^U`XDpX'U1^-"2 _ U

y la matriz de covarianzas es A. Utilizar U para la interpretación na afecta ala importancia relativa de las variables en el factor, pero dará mayor clari-dad relativa a los factores menos importantes, al ser sus coeficientescomparativamente mayores.

4. BREVE VISION EN EL ESPACIO DE LOS INDIVIDUOS

Hasta ahora hemos razonado en el espacio de las variables, donde losindividuos se su^len representar como una nube de puntos. Pero todo estose puede hacer en el denominado espacio de los individuos. En efecto, ental espacio podemos representar las variables como vectores, cuyo cosenoindica su coeficiente de correlación (véase p. ej. Gámez Bezares, 1981,pág. 255i y su longitud es ^n por su desviacián típica (en nuestro caso ^ ñal estar tipificadasj. ^a práctica habitual vista en este espacio es la siguien-te: los componentes principales son vectores ortogonales que maximizanlas proyecciones de las variables al cuadrado, es decir, la variabilidad quede ellas explican (véase Gómez Bezares, 1981, pégs. 251-252}, obtenién-dose también en orden decreciente de expiicación y Ilegando en conse-cuencia a los mismos resultados que antes: F^U'X. Igualmente los pode-mos tipificar, iiegando a F*. X=A F* nos permite representar las variables enel espacio de los factores; A contiene los coeficientes de correlación, queson cosenos y, en consecuencia, son las coordenadas de las variables enlos factores ( 5 ).

Si deseamos hacer una rotacián ortogonal, una vez tenemos los factorestipificados, podemos definir sobre ellos una matriz de rotación T con lasproyecciones de los nuevos ejes sobre los anteriores, de manera que las

Page 9: Análisis factorial por componentes principales (Algunos

^NALISIS f^AC'TORIAL POR C'C7MPC1^lENTES PRIti('IP,ALfwS 2?i

coordenadas de las variables en los factores rotados serán AT=B. Losmétodos de rotación tratan de buscar una B que facilite la interpretaciónde los factores. B nos da también los coeficientes de correlación, loscosenos y las coordenadas de las variables en los nuevos factores M*;luego, X=B M*. Podemos hacer: X=AT Atl *, T' (A' A1^' A' X=M * y operando seIlega a M*=B' 1RXX)^' X, lógicamente igual que antes.

La otra variante de rotacián que hemos planteado es mantener la nube.,-original y rotar ortogonalmente los factores en el espacio de las variat^les,es lo que hemos hecho con nuestra medición L^T' U' X, aunque al darfactores correlacionados, la rotación no sea ortogona! en el espacio de losindividuos.

Existen otras posibilidades de rotación, como es el caso de rotar oblicua-mente los factores tipificados F*. De esta rnanera se puede, algunas veces,mejorar bastante la interpretaci©n, pero también tiene su ŝ inconvenientes,en cuyo estudio no entramos ahora.

5. CONCl.USIONES

Esquematicemos las posibilidades aquí estudiadas:

- En la medición podemos utilizar la nube original o la deformada, cadauna con sus características.

- Antes de rotar, la interpretación de los factore^ es igual con ambasmediciones, tanto si utilizamos:

RxF = Rxf• A

que es la forma tradicional, como si Io hacemos con las variables puras:

R ,,F = R ,,F. = U ^

- Después de rotar, podemos medir la nube deformada, tendremos:

M* = T' U'Y

Rx,^,t.=B=AT

si deseamos interpretar respecto a las variables puras:

R,,M. = Y DPY' U T= UT

Page 10: Análisis factorial por componentes principales (Algunos

T^>U!ti l 1(:' ^ E^P> tiC^l 1

- También, después de rotar, se puede medir la nube origindl, así:

L = T^ U' X

para interpretar respecto a las variables originaies, haremos:

RxC = XDp^C' UTG-^^z = RXXuTG-^^^ _ RXXA^-f^^-TG-^^2

= AL^^i^?-^-^i2 _ BT'^ri^-TG-^i^ .

para hacerlo respecta a las variab^es puras:

R,,^ = U L1' ^2^ T^-' ^2 = B G-"^

A^a hora de la práctica, cada problema tendrá un método que resultemás ventajoso, si bien en muchas ocasiones no es fácil optar por uno o porotro. Intentaré, a pesar de la dicho y con el consiguiente riesgo de error,dar algunas pautas que puedan orientar al lector.

Para medir, la nube original suele ser rnés útil que la deformada, por loque personalmente me inclino por usar principalmente la primera.

Respecto a la interpretacián, es importante resaltar que "no estamosante una ciencia exacta" y que el analista influye poderosamente, con suspropias percepciones, en el nombre o contenido que se da a1 factor. Tradi-cionalmente se ha usado la matriz de coeficientes de correlación con X,pero puede ser también interesante, ver lo que sucede en la matriz decorrelaciones can Y.

En defínitíva, la ínterpretación que se haga respecto a las variables puras,puede aclarar y mejorar fa conceptualízación de los factores. Si creo que esimportante observar que con !a nube original, los factores parece correctoque tengan una claridad conceptual similar, después unos tendrán másvariabilidad que otros. Con la nube deformada, todos los factores tienen lamisma variabilidad, luego parece lógico que unos tengan correlaciones más^mportantes que otros.

Antes de la rotación la interpretación es casi igual, pero aplicando loantedicho, yo me inclinaría por usar:

F* con A

F con U = At^-"2

Después de rotar, ya hay más diferencias y dependerá de las preferenciasdel analista por usar variables puras u originales, pero dado que los progra-

Page 11: Análisis factorial por componentes principales (Algunos

,Ati ^t^ISIS f,^(^TC)RIAL. POR C'()ti1P()tiE^TE.S F'RIti( IP ^LE:^i

mas actuales de ordenador dan normalmente la matriz B y por el principioantes comentado de diferencias en la interpretacián según se use nubeoriginal o deformada, yo aconsejaría:

M * con B

L con BG-"2

La lógica de este sistema creo que es importante: antes de rotar, si midoF`, donde todos los factores tienen igual varianza, !a diferente importanciaentre unos y otros vendr^á reflejada por la importancia de sus correlacionesen A; si neutralizamos este efecto usando U, la diferente magnitud se veráen sus varianzas. Después de rotar, además de lo dicho, aparece que siusamos variables puras, habrá correlación entre los factores, en caso con-trario no.

Puede ser interesante destacar que, si utilizamos sólo urios pocos facto-res, la explicación que consigue cada factor de L del modelo de las varia-bles puras queda bastante reducida al multiplicar B por G-"2, esto es lógicoal ser las variables puras ortogonales. Pero la explicación del modelo origi-nal se mantiene (6).

Con todo esto he tratado de dar una visión sobre algunas posibilidadesque yo creo que existen para medir e interpretar los factores, sobre tadotras una rotación.

6. EJEMPLO

Tal vez todo lo anterior pueda verse más claramente si añadimos unejemplo que, sin entrar en un análisis exhaustivo, permita ver las diferen-cias de interpretación que se dan si usamos variables puras y originales.Partimos de unos datos políticos y econámicos de la España de 1979,cuando se celebraron las primeras elecciones tras la constitución de 1978.Tomamos tales datos en 36 provincias ( eliminando aquellas en las quefueron importantes los partidos nacionalistas), Realizando un análisis facto-rial por componentes principales Ilegamos a la matriz A(véase el cuadro deresultados). EI primer factor tiene un valor propio de 6,043 (explica el46,48%), el segundo factor tiene un valor propio de 2,849 ( explica el21,92 %1. Por ser sobradamente conocido no entramos en la interpretaciónde estos factores. Si para rotar decidimos rnantener la nube original ha-ciendo L=T' U' X, podemos interpretar en función de las variables purasImatriz B, ya hemos comentado que se puede suprimir G-'^2) 17 ) ó de lasoriginales (matriz BT'd"2TG-"2), vamos a comentar las diferencias rn^sapreciables a la vista de los datos: En cualquiera de los dos casos el primer

Page 12: Análisis factorial por componentes principales (Algunos

?2b F.ST ^ f^ISTI(.':1, E:SPA'ti()t.,A

factor es agricola y pobre con fuerte rechazo a"otros izquierda" que esb^sicamente la extrema izquierda; pero al analizarlo respecto a las variablespuras se aclaran los elementos políticos, así disminuye el centrisrno yaumenta el rechazo a la derecha (alianza popular y otros, siendo estosúltimos básicaménte extrema derecha), desapareciendo el rechazo a socia-listas y comunistas. Todo esto es lógico pues hay una asociacián 'rzquierda-centros industriales, que e! uso de variables puras permite aislar. P©r elcontrario el mantenimiento del rechazo a la extrema izquierda hace pensarque realmente es un elemento característico dei factor. También pierdenimportancia las variables de población, y se decanta como lo más determi-nante del factor la pobreza, si bien asociada a una población agricola yregresiva, y con un fuerte rechazo a la extrema izquierda.

EI segundo factor es, en ambos casos, un factor político de centro-derecha con connotaciones de población rural y decreciente; pero al usarvariables puras se acentúa el contenido político del mismo, disminuyendola importancia de las variables de población e incluso, cambiando el signode algunas variables poco importantes ( las de riqueza) que antes se veíanarrastradas por su correlacián con las demás.

En conclusión vemos que si optamos por el uso de la nube original trasla rotacián ( Lj, la utilización de B para la interpretación puede resultar másclara y esto sin entrar en las propiedades interesantes que tiene B(algunasya hemos comentadoj y que no tiene BT`d"2TG^"2. Por lo tanto el uso delas variables puras parece interesante.

CUADRO DE RESULTAD^S

V^4RIABLE N.^

% VOTOS CENTRO (UCDÍ 1% VOTOS SOCIALI STAS 2°1o VOTOS CO M U N I STAS 3% VOTOS ALIANZA POPULAR 4% VOTOS OTROS DERECHA 5% VOTOS OTROS IZQUI ER DA 6INCREMENTOS DE POBLACION ( 1968-1978) 7DENSIDAD DE POBLACION 8POBLACION URBANA/POBLACIOIV RURAL 9% POBLACION ACTIVA EN LA AGRlCULTURA 10% POB LACION ACTIVA EN LA I N DUSTR IA 1 1RENTA PER CAPITA 12INGRESOS MUNICIPALES 13

Page 13: Análisis factorial por componentes principales (Algunos

ANALISIS FAC'T()RIAL PC)R C'OMPONEtiTES PRIti( (P4C_ES 2?7

MATRIZ A MATRIZ B MATRIZ 6T' ^"? TG-'^2

0,7512 0,4671 0,2805 0,8389 0,4219 0,8764-0,5399 -0,7186 0,042 6 -0,8978 -0,114 -0,8742-0,5253 -0,7097 0,0482 -0,8816 -0,1(J58 -0,85730,2621 0,5853 -0,1715 0, 617 9 -0,0615 0,5753

-0,2177 0,3 592 -0,3967 0,1378 -0,3667 0, 0 617-0,7434 0,388 -0,8199 -0,1754 -0,$377 -0,3246-0,92 64 -0,0136 -0,7046 -0,6014 -0,7983 -0, 7 218-0,7084 -0,0058 -0,5418 -0,4563 -0, 612 7 -0,549-0,8924 -0,2203 -0,5466 -0,7389 -0,6666 -0,82760,9245 -0,095 0,7 724 0,5166 0,8503 0,651

-0,7238 0,3905 -O,S064 -0,161 -0,8219 -0,308-0,6236 0,6689 -0,9068 0,1 17 3 -0,8724 -0,0531-0,5644 0,5749 -0,8012 0,082 7 -0,7745 -0,0676

NOTAS

(1) Matriz ortogonal, es aquella matriz cuadrada Q tal que Q'Q = I, con sus correspondien-tes propíedades. También se usa ^ el término ortogonal para indicar perpendicularidad geomé-trica; en este sentido dos vectores son ortogonales cuando su producto escalar es cero. Eneste último sentido los factores son ortogonales, pues FF' es una matriz diagonal. Finalmentediremos que una rotacián es ortogonal cuando se hace entre bases ortonormales.

(2) F'=0`^^2U'X; la distancía (al cuadrado) entre dos puntos i y j será: D2 =(f;-fi)' (f;-f^► ,

donde f; es la columna correspondiente al individuo i en 1a matriz F'. Operando: D^=

(X;-X^ ► 'U^^rU'(X;-X^), donde X, es la correspondiente columna de la matriz X. Operando se

puede ver que U^`' U' _(U^U'}^' =(AA')^^ _ {Rxx)`', así DZ =(X;-X^)' (RXX)^1(X;-X^1, que es la

distancia de Mahalanobis con variables tipificadas.

(3) Respecto a lo que significa G, es fácíl ver que T'dT=B'B, en consecuencia tenemos enla diagonal principal !as capacidades explicativas de los factores M', coincidentes con lasvarianzas de L. De la misma manera que las capacidades explicativas de F^, que son A'A=L1,coinciden con las varianzas de F.

(4) Esta solucián, como la propia medición de L, no la he visto tratada por otros autores,por lo que creo que puede resultar novedosa. En consecuencia hay que asumir mayoresposibilidades de error, aunque creo que los razonamientos que siguen pueden resultar bastanteconvincentes.

(5) En realidad habría que multiplicar por v' n, pero esto no afecta a los razonamientos.

. (6) Esto se puede ver claramente en el espacio de las varíables; si despreciamos loscomponentes menos importantes, el problema pierde dimensiones, y no se explica el 100% dela varianza. AI rotar la explicación no varía. También vimos que las varianzas de L(G) coincidencon la diagonal principal de B'B {donde están las capacidades explicativas de M`) cuya trazacoincide con la de A'A -pues AA'=B B'--- en cuya diagonal principal están las capacidadesexplicativas de F", que son varianzas de F. .

(7) AI multiplicar por G-r^2 se equilibran los coeficientes, bajando en los factores másimportantes y viceversa, ya hemos justificado esto. Pero al no afectar a los pesos relativosdentro del factor, se puede suprimir, y basta con mantener ia idea. Además así sus coeficientesson más comparables con los de BT'd^^2 TG^^^2.

Page 14: Análisis factorial por componentes principales (Algunos

F^^► T^^C^IS^^{(^^ F^tiP:^^C)LA

7. APENDICE GRAFICO

Supongamos dos variables (para facilitar su representacián) y vamos apresentar el problema tanto en el espacio de ias variables como en el delos individuos. En la figura 4 hemos obtenido y medido los factores en elespacio de las variables.

Figura 4

En la 5 tenemos lo mismo tipificado, por lo que F pasa a ser F* y lasvariables se convierten en puras ( P1.

Figura 51

Page 15: Análisis factorial por componentes principales (Algunos

A^+,AI..ISIS F.AC^TC)RIAL POR C'OMPO^+EtiTES PRItiC^IPAL..E.S ?29

Estos dos planteamientos pueden verse también en el espacio de losindividuos, donde factores y variables son vectores y sus ángulos indicanlos coeficientes de correlación (figura 6).

Figura 6

Aquí se puede confirmar lo dicho antes; en las figuras ^ y 5 tenemos lasdos posibles mediciones, la 6 nos puede orientar en la interpretación (se-gún los cosenos de los ángulos que forman los vectores). F y F* tienen, eneste sentido, la misma interpretación; y ambos se pueden interpretar bienrespecto a V, bien respecto a P, en realidad es similar. Podemos decir queel primer factor recoge la relacián positiva de V, y V2 (la más importantey yel segundo la negativa ( menos importante) o que el factor uno recoge eseefecto positivo ( P, con P2) y el dos el negativo ( P, contra P2), que sonigualmente claros. Parece bastante aceptable que usemos P, y P2 (concorrelaciones de igual dimensión en ambos factores) para interpretar F(cuyas diferencias se dan en las varianzas de los factores) y al revés.

AI rotar los factores, supongamos que se identifican con las variabies. Enla figura 7 tenemos el resultado de rotar la situación de la figura 5 enambos espacios. En la 8, ef resultado de hacer lo propio con la 4.

Page 16: Análisis factorial por componentes principales (Algunos

?30

Figura 7a

ES7 A[:)ISTICA ESPA!'^iOLA

p^ c n^ ^^

Figura 8a

V^ t L^ )

Figura 7b

Figura 8b

Page 17: Análisis factorial por componentes principales (Algunos

Ati,AI_tSfS F,4C`TUR1.4L Pt)R C^()!^1PO^•E=tiTES PRItiC^IP^^I E^ ^^^

En la figura 7 he rotado sobre la nube deformada, de manera que losnuevos factores (M'), se confunden con las variables puras. En el espaciode los individuos ocurre el mismo proceso. En la figura 8 el asunto es unpaco más complicado; en el espacio de las variables, simplemente hacemosun cambio de base, confundíéndose los factores (L) con las variables (V1,pero al no estar deformada la nube aparece la correlación entre los facto-res, por lo que en el espacio de las individuos se da una rotación noortogonal (no se mantiene el caseno cero entre ambas), confundiéndosetambién los factores con las variables (V).

Para interpretar, parece en principio indiferente el hablar de los efectospuros o de los de las variables originales, con tal de hacerlo bien. Tenga encuenta el lector que, la identificación de variables y factores que se da eneste caso, se debe a su simplicidad, y no es general.

8. EPILOGO

De lo propuesto hasta aqu^, lo que resulta menos convencional es lamedición con L y su correspondiente interpretación, por lo que al lectorpueden quedarle algunas dudas sobre su lógica, por ello añadiré el siguien-te razonamiento intuitivo: Pensernos que con B tradicionalmente se hainterpretado M*, y esto no se discute. M* es el resultado de medir la nubedeformada sobre ios. factores rotados. Si ahora sobre los mismos factoresmido la nube original, no tiene por qué cambiar substancialmente su signifi-cado, luego puedo seguir usando básicamente lo misrno.

En cualquier caso parece que lo que no ofrece dudas es la interpretacióny medición de los factores antes de la rotación. Por ello yo me inclino poractuar así cuando sea posíble. AI rotar se cometen subjetivismos, queaunque defendibles, siempre resultan discutibles y rnuch©s autores esténen contra de esta posibilidad. Con todo, en ocasiones, la mejora en lainterpretabilidad de los factores justifica proceder a rotarlos.

En este artículo no me he parado en algunos aspectos interesantes detipo matemático, tal es el caso de la posibilidad de que RXX sea singular yno se pueda invertir, en tal caso tendremos menos componentes quevariables... y otros temas similares. Pero esto no afecta a los razonamientosy se sale del objetivo de este trabajo. Tampoco he tocado los aspectosinductivos, manteniéndome a un nivel descriptivo, de simple anáiisis dedatos.

Page 18: Análisis factorial por componentes principales (Algunos

r ^r.^r^i5ric -^ r^^.^^r^t.n

REFERENCIAS

GOMEZ BEZARES , F. (1 981 j. Análisis Multivariante. Bo%trn de Estudios Econó-micos, 1 13, 233-2 5 7.

HARMAIV, H. H. (1976^. Modern Factor Ana/ysis. Chicago: University of Chi-cago Press.

JORESKOG, K. G., KLOvAN, .1. E. y REYMENT, R. A . { 1976}. Geo%gica/ FactorAna/ysis. Amsterdam: Elsevier Scientific Publishing COmpany.

NARVAIZA, J. L. (1981 }. EI Análisis Factorial. Exposición Gráfica e Intuitiva.Boletin de Es tudios Econámicos, 1 1 3, 2 5 9-2 8 5.

TATSUOKA, M. M. (1971 ), Multivariate Analysis. New York: Wiley.

PRINCIPAL COMPONENTS ANALYSIS IN FACTORANALYSIS (SOME INTERESTING ASPECTSj

SUMMARY

This paper refers to the utilization of principal componentsanalysís as a system of factor analysis. In this context I studysome problems related with rotation and standardization of fac-tors; on the other hand I propose a system to maintain theposition of points after rotation and to interpret the correspon-ding factors, with a concept that I call "pure variable".

l^ey words.• principal components analysis; factor analysis; rota-tion; pure variable.

AMS 1985 Subject classification 62 H25.