traduccion de estimacion altamente robusto de dispersion de matrices.pdf

21
Estimacin Altamente robusto de dispersin Matrices Yanyuan Ma y Marc G. Genton Instituto de Tecnologa de Massachusetts E-mail:? Yanyuan math.mit.edu, Genton math.mit.edu Recibido 04 de enero 1999; publicado en lnea el 06 de abril 2001 En este trabajo, proponemos un nuevo estimador de componente a componente de una matriz de dispersin, basado en un estimador muy robusto de escala. La idea clave es la eliminacin de un estimador de ubicacin en el procedimiento de estimacin de la dispersin. Las propiedades de robustez se estudian por medio de la funcin de inuencia y el punto de ruptura. AdemÆs TambiØn se analizaron las caractersticas tales como la varianza y la eciencia asinttica. Se muestra en el enfoque de componente a componente, para las distribuciones gaussianas multi- variantes, que la estimacin de matriz de covarianza es mÆs difcil que la estimacin de matriz de correlacin. La razn es que la varianza asinttica del estimador de covarianza aumentos con el aumento de la dependencia, mientras que disminuye con el aumento de la dependencia de estimadores de correlacin. TambiØn demostramos que la varianza asinttica de dispersin estimadores para distribuciones gaussianas multivariantes es proporcional a la asinttica varianza del estimador subyacente escala. El valor de proporcionalidad depende slo en la dependencia subyacente. Por lo tanto, en el medio slido estimador de dispersin es entre la mejor opcin slida en el momento presente en el enfoque de componente a componente, porque es-lugar libre y com- bina pequeæas propiedades de robustez variabilidad y tales como la alta punto de ruptura y funcin de inuencia limitada. Un estudio de simulacin se lleva a cabo a n de evaluar el comportamiento del nuevo estimador. En primer lugar, una composicin comparacin con otro estimador robusto de componente a componente basado en la mediana se realiza absoluta es- timador de escala de desviacin. Las propiedades altamente robustos de la se conrman nuevo estimador. Una segunda comparacin con estimadores globales como El mØtodo de la estimador momento, el elipsoide de volumen mnimo, y el mnimo TambiØn se realiza estimador de covar- ianza determinante, con dos tipos de valores atpicos. En este caso, el estimador de la matriz altamente robusto dispersin resulta ser una interesante Ing compromiso entre la alta eciencia del mØtodo de momento en estimador situaciones no contaminadas y las propiedades altamente robustas del mnimo elipsoide volumen y estimadores mnimos determinantes de covarianza en contaminadas situaciones. 2001 Academic Press AMS clasicaciones temÆticas: 62H12; 62G35. Palabras y frases clave: punto de ruptura; com- ponente a componente; funcin de inuencia; robustez; estimador de escala. 1. INTRODUCCIN Matrices de dispersin, es decir, la covarianza y correlacin matrices, juegan un papel impor- tante en muchos mØtodos de estadstica multivariante. Por ejemplo, que son las piedras angu- lares del anÆlisis de componentes principales, discriminante anÆlisis, anÆlisis factorial, anÆlisis de correlacin cannica, y muchos otros (por ejemplo Mardia et al., 1979). AdemÆs, las matri- ces de dispersin son en s mismos cantidades de interØs, ya que representan una medida de 1

Upload: carlos40083

Post on 15-Jan-2016

223 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

Estimación Altamente robusto de dispersiónMatrices

Yanyuan Ma y Marc G. GentonInstituto de Tecnología de MassachusettsE-mail:? Yanyuan math.mit.edu, Genton

math.mit.eduRecibido 04 de enero 1999; publicado en línea

el 06 de abril 2001En este trabajo, proponemos un nuevo estimador de componente a componente de una matrizde dispersión, basado en un estimador muy robusto de escala. La idea clave es la eliminación deun estimador de ubicación en el procedimiento de estimación de la dispersión. Las propiedadesde robustez se estudian por medio de la función de in�uencia y el punto de ruptura. AdemásTambién se analizaron las características tales como la varianza y la e�ciencia asintótica. Semuestra en el enfoque de componente a componente, para las distribuciones gaussianas multi-variantes, que la estimación de matriz de covarianza es más difícil que la estimación de matrizde correlación.

La razón es que la varianza asintótica del estimador de covarianza aumentos con el aumento dela dependencia, mientras que disminuye con el aumento de la dependencia de estimadores decorrelación. También demostramos que la varianza asintótica de dispersión estimadores paradistribuciones gaussianas multivariantes es proporcional a la asintótica varianza del estimadorsubyacente escala. El valor de proporcionalidad depende sólo en la dependencia subyacente.Por lo tanto, en el medio sólido estimador de dispersión es entre la mejor opción sólida en elmomento presente en el enfoque de componente a componente, porque es-lugar libre y com-bina pequeñas propiedades de robustez variabilidad y tales como la alta punto de ruptura yfunción de in�uencia limitada. Un estudio de simulación se lleva a cabo a �n de evaluar elcomportamiento del nuevo estimador. En primer lugar, una composición comparación con otroestimador robusto de componente a componente basado en la mediana se realiza absoluta es-timador de escala de desviación. Las propiedades altamente robustos de la se con�rman nuevoestimador. Una segunda comparación con estimadores globales como El método de la estimadormomento, el elipsoide de volumen mínimo, y el mínimo También se realiza estimador de covar-ianza determinante, con dos tipos de valores atípicos. En este caso, el estimador de la matrizaltamente robusto dispersión resulta ser una interesante Ing compromiso entre la alta e�cienciadel método de momento en estimador situaciones no contaminadas y las propiedades altamenterobustas del mínimo elipsoide volumen y estimadores mínimos determinantes de covarianza encontaminadas situaciones. 2001 Academic Press

AMS clasi�caciones temáticas: 62H12; 62G35. Palabras y frases clave: punto de ruptura; com-ponente a componente; función de in�uencia; robustez; estimador de escala.

1. INTRODUCCIÓN

Matrices de dispersión, es decir, la covarianza y correlación matrices, juegan un papel impor-tante en muchos métodos de estadística multivariante. Por ejemplo, que son las piedras angu-lares del análisis de componentes principales, discriminante análisis, análisis factorial, análisisde correlación canónica, y muchos otros (por ejemplo Mardia et al., 1979). Además, las matri-ces de dispersión son en sí mismos cantidades de interés, ya que representan una medida de

1

Page 2: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

asociación o internacional dependencia entre varias características. Proporcionan informaciónsobre la forma de la elipsoide de la nube de datos en un multidimensional espacio. Por lo tanto,los estimadores con�ables de matrices de dispersión son de primordial importancia. Desafortu-nadamente, las matrices de dispersión de la muestra clásica se conocen ser muy sensible a losvalores atípicos en los datos, que puede ser típicamente oculto en la alta dimensionalidad delespacio de variables. Como cuencia cuencia, valores y vectores propios de la matriz de dispersiónheredar esta sensibilidad. Un análisis de componentes principales de este modo podría revelaruna arti�cial estructura de los datos, que en realidad no existe, pero es simplemente creado porun algunos valores atípicos.

En las últimas tres décadas, muchos intentos para superar la pobre resistencia propiedades de lamatriz de dispersión de la muestra clásica se han hecho. El propuestas sólidas se pueden clasi�caren dos categorías principales: robusta composición estimación ponentwise y estimación mundialsólido de la dispersión matriz. La primera de ellas se puede abordar a través de la estimaciónde la ubicación, o la escala estimación, como se describe en la Sección 3. Tiene la ventaja deser capaz de hacer frente a los valores perdidos en los datos, pero no está afín invariante y lohace no proporcionar una matriz de�nida positiva directamente. La segunda categoría por logeneral asegura invariancia afín y de�nitud positiva, pero es menos apropiado para tratar condatos que faltan.

En este trabajo, se propone el uso de un estimador muy robusto de escala, denotado porQ n, en el enfoque de componente a componente. De hecho, se muestra que que es uno dela mejor opción robusta disponible en el momento presente en el enfoque de componente acomponente. Por supuesto, otras escalas robustos y e�cientes estimadores podrían utilizarse,por ejemplo, como el propuesto por -básculas {Yohai y Zamar (1988). Sin embargo, el estimadormuy robusto de la escala Q n posee la propiedad-lugar libre y ya ha sido utilizado con éxito en laacción texto de regresión (Ho ssjer, Croux y Rousseeuw, 1994;? Croux, Rousseeuw, y Ho? ssjer,1994), así como para la estimación de variograma (Genton, 1998) en estadística espacial, y laestimación de autocovarianza (Ma y Genton, 2000) en series de tiempo. En la siguiente sección,se comienza por recordar algunos de la dispersión estimadores de la matriz que se puedenencontrar en la literatura. En la tercera sección describe el estimador muy robusto de matricesde dispersión. Robustez propiedades se discuten en la Sección 4 La función de in�uencia decovarianza estimadores de correlación se estudian, así como su punto de ruptura.

La varianza y la e�ciencia asintótica se derivan para el nuevo estimador en el caso de lasdistribuciones gaussianas multivariantes. Al �nal, se compara la método propuesto con otrosmétodos (componente a componente y global) y llevar a cabo algunas simulaciones.

En la secuela del trabajo, utilizamos las siguientes anotaciones. En el caso de dos variablesaleatorias, que suelen utilizar X e Y para que los represente y el uso x = (x1; x2; :::; xn)

T ,y = (y1; y2; :::; yn)

T , para representar la observación vectores. En el caso de p variables aleato-rias, usamos Xi, i = 1; 2; :::; p a denotar las variables aleatorias. Los n observaciones de cadavariable aleatoria Xi se representan por x1i; 2ix; :::; xni y que se reúnen en un vector x(i). Las /nrealizaciones del vector aleatorio (X1; X2; :::; Xp)está representado por xj = (xj1; xj2; :::; xjp),j = 1; 2; :::; n. Por lo tanto, la matriz de datos X puede ser representado en el siguiente formato:

2

Page 3: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

2. ESTIMADORES MATRIZ DE DISPERSIÓN

En esta sección, describimos algunos estimadores de uso común para la matriz de dispersión,así como algunas recientes propuestas robustos. Nos centramos en la estimación de matricesde covarianza, ya que la estimación de matrices de correlación se puede derivar de la mismamanera.

Suponga que la muestra x1; :::; xn, con xi 2 Rp, i = 1; :::; n, es independientemente e idén-ticamente distribuidos según una distribución multivariante con media vector � y matriz decovarianza �. Tenga en cuenta que la estimación de la correlación matriz R siempre se puedederivar de la relación R = D�D, dondeD = diag(1=

p�11; :::; 1=

p�pp). El método de momento

estimador (MME) de la matriz de covarianza es �

donde b� = 1

n

nXi=1

xi

El punto de ruptura es una característica importante de la �abilidad de un estimador. Indica,en líneas generales, la mayor proporción de datos que pueden ser reemplazado por valoresarbitrarios para llevar el estimador de los límites de la espacio de parámetros. Más detalles sepueden encontrar por ejemplo en Donoho y Huber (1982), Huber (1981, 1984), Hampel et al.(1986). El punto del método de momento estimador de ruptura (1) es cero, lo que indica sumuy pobre resistencia.

Equivariante A¢ ne M-estimadores para matrices de dispersión se sugirieron primero por Ham-pel (1973), y estudiado por Maronna (1976) y Huber (1977, 1981). Desafortunadamente, supunto de ruptura es a lo sumo 1=(P + 1). esto es no es satisfactoria, ya que signi�ca que elpunto de ruptura se convierte más pequeño con el aumento de dimensión, donde hay más opor-tunidades para que se produzcan valores atípicos. El rendimiento de algunos M-estimadoresfueron estudiados por media de un estudio de Monte Carlo por Devlin et al. (1975, 1981). Sta-hel (1981) y Donoho (1982) fueron los primeros en proponer de forma independiente robustosestimadores equivariante a�nes de ubicación multivariante y la dispersión tiene un punto deruptura alta (asintóticamente 1=2) de cualquier dimensión.

Se de�nen como la media ponderada y la dispersión ponderada, donde el pesos son funcionesde una medida de �outlyingness �obtiene considerando todas las proyecciones univariado delos datos. Posteriormente, otro desglose alta

Se han introducido punto equivariante estimadores multivariados. El más conocido es probable-mente el elipsoide de volumen mínimo (MVE) estimador, introducción producida por Rousseeuw

3

Page 4: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

(1984, 1985), y se discute en Rousseeuw y Leroy (1987), y van Rousseeuw Zomeren (1990). Elmétodo busca de un elipsoide volumen mínimo, que contiene m = b(n+p+1)=2c puntos, dondeb c denota la parte entera. Más precisamente, consiste en encontrar b�MVE y b� MVE tales queel determinante de � se minimiza sujeta a

donde a2 es una constante �ja, por ejemplo desde �2p en el caso de los datos de Gauss. ElMVE tiene un punto de ruptura de la muestra �nita de m, es decir, 50% asintóticamente.Dos algoritmos (remuestreo y proyección) para calcular un aproximado solución de MVE sepuede encontrar en Rousseeuw y van Zomeren (1990). El estimador MVE se ha generalizado amultivariantes S-estimadores (Davies, 1987; Lopuhaa ?, 1989;? Lopuhaa y Rousseeuw, 1991).Li y Chen

(1985) propusieron un estimador de matriz de dispersión basado en robustifying director com-ponentes a través de técnicas de persecución proyección. Una clase de estimadores de proyecciónpara matrices de dispersión fueron estudiados por Maronna, Stahel y Yohai (1992). Tyler (1994)discute �nito punto desglose muestra de proyección basada

estimadores, en particular, el estimador Stahel-Donoho. Maronna y Yohai (1995) estudiaronlos comportamientos asintóticos y �nito-muestra de la Stahel? Donoho estimadores robustosmultivariados. De un estudio de simulación, concluyeron que se comparan favorablemente conotras propuestas como la M-multivariado o S-estimadores, y MVE de Rousseeuw. Sin embargo,el principal inconveniente sigue siendo la falta de métodos posibles para calcular los estimadoresde mayores dimensiones que p = 2:

Recientemente, Rousseeuw y Van Driessen (1999) propusieron un algoritmo rápido (FAST-MCD) para el estimador mínimo Covarianza Determinante (MCD). Originalmente propuestopor Rousseeuw (1984, 1985), el uso de este estimador fue hasta ahora obstaculizada por elelevado tiempo de cálculo de los algoritmos existentes. El objetivo es encontrar MCD h den observaciones cuya clásica covarianza matriz tiene el determinante más bajo. El estimadorMCD, b� MCD, de la matriz de covarianza es entonces el método de momento estimador de estos hobservaciones. Rousseeuw y Van Driessen (1999) han demostrado que el muestra �nita punto deMCD desglose m se han de�nido anteriormente, cuando h = m, es decir, 50% asintóticamente.Además, Croux y Haesbroeck (1999) mostraron MCD que es más e�ciente que MVE en altasdimensiones, y por lo tanto recomendar el uso de MCD.

3. el estimador muy robusto

3.1. La dispersión entre dos variables aleatorias

Tradicionalmente, la estimación de la covarianza entre dos variables aleatorias X e Y se basaen un enfoque de ubicación, ya que Cov(X;Y ) = E[(X�E(X)) (Y �E(Y ))]; produciendo, porejemplo, el estimador (1) de �. Sin embargo, estimación de covarianza también puede basarseen un enfoque de escala, por medio de la siguiente identidad (Huber, 1981; Gnanadesikan,1997):

Cov(X; Y ) =��

4[V ar (X=� + Y=�)� V ar (X=�� Y=�)] ; 8�; � 2 R� (3)

En general, X e Y se pueden medir en diferentes unidades, y la elección � = �X y � = �Y esrecomendable (Gnanadesikan y Kettenring, 1972), donde �X =

pV ar(X) y �Y =

pV ar(Y ).

La elección de un estimador robusto de la varianza en (3) produce un estimador robusto de lacovarianza entre X y Y.

4

Page 5: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

En el contexto de la estimación de escala, Rousseeuw y Croux (1992, 1993) propone un esti-mador simple, explícito y muy robusto de escala, Qn,

Qn(z) = d fjzi � zjj ; i < j; i; j = 1; 2; :::; ng(k), (4)

donde z = (z1; :::; zn)T es una muestra de una variable aleatoria Z; k = b(( n

2) + 2)=4c + 1

y b�c denota la parte entera. El factor d es la coherencia: para la distribución de Gauss, d =2;2191: Esto signi�ca que ordenamos el conjunto de todos absoluta diferencias jzi � zjj en ordencreciente para i < j; i; j = 1; 2; :::; n; y a continuación, calcular su estadística de orden k-ésimo(aproximadamente el cuantil 1=4 para n grande). Este valor se multiplica por d, produciendode este modo Qn. Tenga en cuenta que este estimador calcula la estadística de orden k-ésimo

de la (n2) Distancias entre puntos.

Es de interés señalar que Qn no se basa en ningún conocimiento de ubicación y por lo tanto sedice que es-lugar libre. Esto está en contraste con la clásica matriz de covarianza de muestra(1), que se puede obtener mediante la inserción del clásico estimador de la varianza de lamuestra en la ecuación. (3). Por lo tanto, el uso de la estimador muy robusto escala (4) en laidentidad (3) producirá un gran robusta estimador de covarianza, que es también-puesto libre.A primera vista, la estimador Qn parece necesitar O(n2) el tiempo de cálculo, lo que sería undesventaja. Sin embargo, puede ser calculada utilizando no más de O(n log n) tiempo y O(n)de almacenamiento, por medio del algoritmo rápido descrito en Croux y Rousseeuw (1992).

El uso de la identidad (3) y la de�nición (4) de la escala estimador Qn; se proponer el siguienteestimador muy robusto para calcular la covarianza

Entre dos variables aleatorias Xe Y . En primer lugar, utilice Qn para estimar la desviacionesestándar �X y �Y de X y Y . A continuación, utilice Qn de nuevo para estimar las desvia-ciones estándar �+ y �� de X=�X + Y=�Y y X=�X � Y=�Y La covarianza entre X e Y es�X�Y

��2+ � �2�

�=4 Por lo tanto, el altamente estimador robusto b Q de la covarianza es

b Q (x; y) = ��

4[Q2n (x=�+ y=�)�Q2n (x=�� y=�)] ; (5)

donde: � = Qn(x), � = Qn(y). Como se muestra en la Sección 4, tiene un avance punto decaída de 50%, que es el mismo que el Qn estimador. Aquí, 50% punto de ruptura signi�ca queentre los pares n de observación fxi; yig ; i = 1; :::; n valores, la mitad de ellos puede contenercontaminados (arbitrarias) y la estimación no será totalmente destruida. Tenga en cuenta queen el medio sólido estimador de covarianza b Q también puede llevarse a cabo conO(n log n)tiempo y O(n) de almacenamiento.

A �n de obtener un estimador muy robusto de la correlación � entre dos variables aleatorias Xe Y , podríamos dividir el estimador b Q(x; y) enEq. (5) por Qn(x) y Qn(y), produciendo

1

4[Q2n (x=�+ y=�)�Q2n (x=�� y=�)] (6)

donde: Qn(x), � = Qn(y). Sin embargo, esto no es una correlación naturales estimador porqueno está limitada y entre �1 y 1. Por lo tanto, nosconsidere lo siguiente estimador muy robusto correlación b�Q de �;b�Q (x; y) = Q2n (x=�+ y=�)�Q2n (x=�� y=�)

Q2n (x=�+ y=�) +Q2n (x=�� y=�)

(7)

5

Page 6: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

donde el denominador es un estimador del valor 4 que asegura jb�Q (x; y) j � 1. Tenga en cuentaque b Q (x; y) depende de la elección de la constante d apareciendo en Eq. (4), mientras queb�Q es independiente de la elección de d. Sin embargo, d puede ser calculado para diversasdistribuciones, aunque el caso es gaussiana generalmente preferido.

3.2. Dispersión entre p variables aleatorias

En el caso de n observaciones de un vector aleatorio p-dimensional, se utiliza el estimadorb Q para estimar cada covarianza entre Xi y Xj(i; j = 1; :::; p; i 6= j) para conseguir la entra-da (i; j) de la matriz de covarianza �. Las entradas diagonales han sido estimados utilizandoQ2n directamente en la Xi0s(i = 1; :::; p). Esto proporciona una gran estimador robusto compo-nente a componente b�Q de la matriz de covarianza �.El uso de b�Q, podemos estimar las entradas de la matriz de correlación R de manera similarcomo en el caso de la matriz de covarianza, produciendo así un componente a componentealtamente robusto estimador de bRQ. Nos pusimos todos los elementos de la diagonal de bRQ a1.

Tenga en cuenta que dado que el método que proponemos se componente a componente enlugar de global, no hay garantía de que tenemos una matriz de�nida positiva en el �nal de laestimación. Rousseeuw yMolenberghs (1993) propusieron tres tipo de métodos para transformarla matriz estimada a una de�nida positiva matriz. Ellos son, respectivamente, el método dereducción, el método de valor propio, y el método de escalado. Cuando el propio covarianza esla cantidad de interés, hay que transformarla en una matriz de�nida positiva usando uno deestos métodos, mientras que si algunas entradas en particular de la matriz son los valores deinterés, entonces los valores estimados debe proporcionar una buena estimación de la valoresreales.

4. PROPIEDADES DEL PERITO

4.1. puntos Desglose

Se sabe que el punto de ruptura Qn es 50% (Rousseeuw y Croux, 1993). Inspeccionar X=� +Y=�(o X=� � Y=�), podemos ver que mientras como xi (o yi) está contaminada, entoncesx=� + y=�(o x=� � y=�) está contaminado. Así que en los pares (x1; y1); :::; (xn; yn), podemostener como máximo la mitad de los pares de concentraciones que contiene datos contaminados.Si nos �jamos en un par como una observación, entonces el estimadores b Q y b�Q son robustosfrente a más de la mitad de la contaminación observaciones. Así, tienen punto de ruptura 50%En la estimación de la matriz de covarianza � y la matriz de correlación R, que forman pares detodo el observaciones de Xi y Xj(i; j = 1; :::; p), y el estimador permite en la mayoría la mitadde las parejas para estar contaminada. Por lo tanto, entre la observación n vectores x1; x2; :::; xn,a lo sumo la mitad de ellos puede contener datos contaminados.

En otras palabras, el punto de la componente a componente altamente robusto desglose esti-madores b�Q y bRQ es 50% Tenga en cuenta que en el contexto de la dispersión la estimación dela matriz, otro tipo interesante de punto de ruptura es cuando valores atípicos causan la matrizestimada para convertirse en singular. Sin embargo, este No es el caso de nuestros estimadoresde dispersión b�Q y bRQ. incluso sin valores atípicos, que han de ser transformado a de�nitudpositiva por medio de uno de los tres métodos mencionados en el apartado 3.2.

4.2. Función In�uencia

La función de in�uencia (Hampel, 1974) es una herramienta para describir la robustez nesspropiedades de un estimador. Su importancia radica en su heurística atractivo interpretación:mide el sesgo asintótico causada por un in�nitesimal contaminación de las observaciones. De-notemos por Q, �Q, y Q la estadística funcional (por ejemplo Huber, 1981;. Hampel et al,

6

Page 7: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

1986) correspondiente a la estimadores Q, �Q y Qn, respectivamente. La función de in�uenciade la dispersión estimadores viene por Genton y Ma (1999). Se basa en la in�uencia funcióndel estimador subyacente escala. En nuestro caso, la in�uencia función de Qn es (Rousseeuw yCroux, 1993):

IF (u;Q;F ) = d

1

4� F (u+ d�1) + F (u� d�1)R

f (x+ d�1) f (x) dx(8)

donde f es la función de densidad de la distribución de F y d es el mismo ciente ciente comoen el Qn estimador. Basado en (5), la función de in�uencia de la estimador de covarianza b Qes:

IF�(u; v) ; Q; F

�=1

2

��+IF

�u

�X+u

�Y;Q;F+

�� ��IF

�u

�X� u

�Y;Q;F�

���X�Y (9)

Aquí, F+ es la función de distribución deu

�X+u

�Y, F� es la función de distribución de

u

�X� u

�Y,

F es la distribución bivariante de X e Y , con marginal

distribuciones FX y FY . Las funciones de in�uencia IF (�;Q;F+) y IF (�;Q;F�) están dadas porla ec. (8).

Más información sobre la justi�cación y las propiedades de la ecuación. (9) puede ser encontradoen Genton y Ma (1999). Una manera de entender intuitivamente es: �X y �Y en la ecuación. (9)puede ser reemplazado por cualquier constante no cero � y �. Luego de la ecuación. (5), al notarla conexión entre la función de in�uencia y la derivada de primer orden, sabemos Eq. (9) da lafunción de in�uencia. En particular, para � = �X y � = �Y , Eq. (9) sigue siendo válida. Unopuede sospechar que desde � = �X y � = �Y ellos mismos tienen que ser estimados en primerlugar, nuestra función de in�uencia debe tomar la perturbación de estos dos estimadores encuenta también, por lo tanto debe tener una forma más complicada que la dada en la ecuación.(9). Afortunadamente, este no es el caso y podemos entenderlo de esta manera: ¿hasta dóndela estimada � = �X y � = �Y son de los verdaderos valores hace no tiene ningún efecto directosobre la estimación, ya que incluso si se toma arbitraria � y �, el estimador es todavía válida.

Los valores de � y �; sólo tienen un efecto en la realización de la estimación deX

�X+Y

�Yy

X

�X� Y

�Y, y esto se toma cuidar de la función de in�uencia de estos dos estimadores.

Puesto que el estimador de correlación b�Q (x; y) se puede escribir como en la ecuación. (7), setiene:

IF�(u; v) ; �Q; F

�=

2

(�2+ + �2�)2

���2+ + �

2����+IF

�u

�X+v

�Y;Q;F+

�� ��IF

�u

�X� v

�Y;Q;F�

�����2+ � �2�

���+IF

�u

�X+v

�Y;Q;F+

�+ ��IF

�u

�X� v

�Y;Q;F�

���(10)

De este modo, se obtiene la siguiente función de in�uencia de la correlación estimador b�Q:IF�(u; v) ; �Q; F

�=�+��4

���IF

�u

�X+v

�Y;Q;F+

�+ ��IF

�u

�X� v

�Y;Q;F�

��(11)

Se puede comprobar que las funciones de in�uencia tanto de la covarianza estimador y elestimador de la correlación satisfacen

RIFdF = 0.

7

Page 8: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

4.3. varianza asintótica

Bajo condiciones de regularidad, tanto b Q y b�Q son estimadores consistentes, desde Qn esconsistente (Rousseeuw y Croux, 1993). Además, son asintóticamente normal con varianzaasintótica (de orden 1=n) dada por:

V� Q; F

�=

ZIF�(u; v) ; Q; F

�2dF (u; v)

V��Q; F

�=

ZIF�(u; v) ; �Q; F

�2dF (u; v)

V (Q;F ) =

ZIF�(u;Q; F ) ; Q; F

�2dF (u) (12)

Posteriormente, se asume una distribución gaussiana bivariante F = � para (X; Y )T , es decir:�XY

�� N

��00

�;

��2X �2Y

��=

��00

�;

��2X ��X�Y

��X�Y �2Y

��;

donde es la covarianza y � es la correlación entre X e Y. Nosotros tenemos:

Proposición 1: La varianza asintótica del estimador de covarianza b Q esV� Q;�

�= 2V (Q;�)

��2X�

2Y +

2�= 1;215

��2X�

2Y +

2�

(13)

y la varianza asintótica del estimador de correlación b�Q esV (�Q;�) = 2V (Q;�)(1� �2)2 = 1; 215(1� �2)2 (14)

donde � representa la función de distribución gaussiana estándar, es decir, con media cero yvarianza uno.

En la Tabla I, se calcula la varianza del estimador de covarianza y de el estimador de correlaciónpara diferentes varianzas y covarianzas subyacentes.

Los resultados se presentan en la cuarta y quinta columnas de la Tabla I. Proposición la 1 esde hecho válido para un estimador de dispersión basado en cualquier estadística funcional deescala. Por ejemplo, podemos reemplazar la Qn estimador en Proposición 1 con el estimador demáxima verosimilitud de MLE escala, y calcular la forma cerrada de la varianza del estimadorde covarianza b MLE y del estimador correlación b�MLE:

CUADRO I

Asintótica Varianza y e�ciencia de la dispersión Estimadores b Q y b�Q, en el caso dedistribuciones de Gauss

�2X �2Y V� Q;�

�V��Q;�

�Effv

� Q;�

�Effv

��Q;�

�1 1 0 1;215 1;215 0;823 0;8231 1 0;2 1;264 1;120 0;701 0;7911 1 0;5 1;519 0;683 0;296 0;6581 1 0;8 1;993 0;157 0;040 0;5011 2 0;5 2;735 0;930 0;498 0;7321 3 0;5 3;950 1;021 0;589 0;7581 10 0;5 12;458 1;155 0;745 0;803

8

Page 9: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

Nota. Los valores numéricos de las varianzas asintóticas se calcularon con la Proposición 1

y los valores numéricos de las e�ciencias asintóticas se calcularon con la Proposición 3.

COROLARIO 1. La varianza asintótica del estimador de covarianza b MLE es

V� MLE

; ��= �2X�

2Y +

2; (15)

y la varianza asintótica del estimador de correlación b�MLE es

V (�MLE;�) = (1� �2)2; (16)

Por lo tanto, la varianza asintótica de los estimadores de covarianza aumenta con aumento de ladependencia, mientras que disminuye con el aumento de la dependencia de estimadores de cor-relación. De hecho, vemos que la varianza asintótica de estimadores de dispersión para distribu-ciones gaussianas multivariantes es proporcional cional a la varianza asintótica del estimadorsubyacente escala. El valor de proporcionalidad depende sólo de la dependencia subyacente.

4.4. Información de Fisher

Para distribuciones de Gauss, una forma cerrada de la información de Fisher tanto covarianzay correlación se pueden obtener:

Proposición información 2. La información de Fisher de la covarianza es

I ( ; �) =�2X�

2Y +

2

(�2X�2Y � 2)

2 (17)

y la información de Fisher de la correlación � es

I (�; �) =1 + �2

(1� �2)2(18)

Tenga en cuenta que a partir de la información de Fisher para la covarianza , es lineal remitira obtener la información de Fisher para la correlación, ya que la correlación � Es simplemente

�X�Y

4.5. E�ciencia

La e�ciencia se de�ne como la inversa del producto de la información Fisher y la varianzaasintótica del estimador. Así, por las distribuciones gausianas, podemos calcular la e�cienciaasintótica de b Q y b�QProposición 3. La e�ciencia asintótica del estimador de covarianza b Q esE¤� Q;�

�=

(�2X�2Y � 2)

2

2V (Q; �) (�2X�2Y +

2)2 = 0;823

(�2X�2Y � 2)

2

(�2X�2Y +

2)2 (19)

y la e�ciencia asintótica del estimador de correlación b�Q esE¤��Q; �

�=

1

2V (Q; �) (1 + �2)= 0;823

1

1 + �2(20)

9

Page 10: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

Se presenta la e�cacia tanto de la covarianza y la correlación estimadores en la sexta y séptimacolumna de la Tabla I, calculado por la Proposición 3. De hecho, la Proposición 3 es válida paraun estimador de dispersión basado en cualquier estadística funcional de escala. Por ejemplo,podemos volver a reemplazar la Qn estimador en la Proposición 3 con el estimador de máxi-ma verosimilitud de escala MLE, y calcular la forma cerrada de la e�ciencia asintótica de laestimador de covarianza b MLE y del estimador de correlación b�MLE:

COROLARIO 2. La e�ciencia asintótica de la máxima verosimilitud estimador de la covarianzab MLE es

E¤( MLE;�) =(�2X�

2Y � 2)

2

(�2X�2Y +

2)2 (21)

y la e�ciencia asintótica del estimador de máxima verosimilitud de la correlación b�MLE es

E¤(�MLE; �) =1

1 + �2(22)

5. COMPARACIONES

En primer lugar, comparamos el estimador que hemos propuesto aquí, b Q, con el máximoprobabilidad uno, b MLE, y otro componente a componente sólido estimador, b MAD, basado enla desviación media absoluta (por ejemplo, Hampel et al., 1986). A continuación Compararb�Q con los estimadores globales b�MME; b�MVE y b�MCD Nos centramos en la estimación decovarianza aquí ya que como vamos a señalar en la sección 5.1, se es más difícil que la estimaciónde correlación.

5.1. Comparación con MLE y MAD

Como hemos señalado, la Proposición 1 es válido para cualquier estimador de dispersión sobrela base de un M-estimador de escala (Genton y Ma, 1999). En la Fig. 1, trazamos la varianzaasintótica del tres estimadores de covarianza b Q, b MLE y b MAD, para una distribución gaussiananormalizada con correlación �. del mismo modo nosotros también representamos la varianzaasintótica de los tres correlación correspondiente estimadores de la Fig. 2. Las tres curvas dela �gura. 1 y en la Fig. 2 se calculan con la fórmula de la Proposición 1 y en el Corolario 1.Podemos ver que

FIG.1. La varianza asintótica de los estimadores de covarianza basada en Qn, MLE, y MAD,para una distribución gaussiana bivariada estandarizada con correlación �. El b MLE estimadortiene la varianza asintótica más pequeño, la varianza asintótica del estimador b Q es un pocomás grande, mientras que b MADE tiene una varianza asintótica mucho más grande que los otros

10

Page 11: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

dos. para los tres estimadores, la varianza asintótica aumenta cuando la covarianza entre losdos variables aleatorias aumenta.

cuando la covarianza (correlación) entre dos variables aleatorias aumenta, la varianza asintóticadel estimador de covarianza aumenta, mientras que el varianza asintótica de los estimadoresde correlación disminuye. Como cuencia cuencia, la estimación de la correlación es más fácilque la estimación de la covarianza, en el sentido de que tiene menor variabilidad. En la deGauss estándar independiente caso de distribución, es decir, � = 0, la varianza asintótica de lacovarianza estimador y el estimador de correlación tienen el mismo valor.

FIG. 2. La varianza asintótica de los estimadores de correlación basado en Qn, MLE, y MAD,para una distribución gaussiana bivariada estandarizada con correlación �. El b�MLE estimadortiene la varianza asintótica más pequeño, la varianza asintótica de la b�Q estimador es ligeramentemás grande, mientras que b�MAD tiene una varianza asintótica mucho más grande que los otrosdos. Para los tres estimadores, la varianza asintótica disminuye cuando la covarianza entre eldos variables aleatorias aumenta.

TABLA II

La media y la varianza de la covarianza Estimadores b Q, b MLE y b MAD

Nota. Los datos siguen una distribución de Gauss estándar independiente, y se calculó la mediay la varianza después de ejecutar 1.000 muestras. Los tres estimadores son todo imparcial, yla varianza de la b MAD es signi�cativamente mayor que los otros dos.

Hemos llevado a cabo algunas simulaciones para probar la media y la varianza de la estimadoresde dispersión basado en el Qn, MLE, y estimadores MAD. la simulación fue de dos variablesaleatorias gaussianas normalizadas con covarianza 0 y 0,5, y en base a 1000 muestras. Los

11

Page 12: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

tamaños de las muestras fueron 20, 100 y 200. Los resultados se presentan en la Tabla II y III.Podemos ver que los estimadores son imparciales y la varianza de los estimadores aumenta amedida que la variación entre las dos variables se incrementa al azar.

5.2. Comparación con MME, MVE, y MCD

Con el �n de comparar la gran robustez estimador componente a componente b�Q con losestimadores globales b�MME; b�MVE y b�MCD, que lleva a cabo algunos

TABLA III

La media y la varianza de la covarianza Estimadores b Q; b MLE y b MAD

Nota. Los datos siguen una distribución gaussiana con media cero y varianza uno, y la covarianza# entre las dos variables aleatorias fue de 0,5. Se calculó la media y la varianza después deejecutar 1.000 muestras. Los tres estimadores son todo imparcial, y la varianza de la b MAD essigni�cativamente mayor que los otros dos.

simulaciones en tres variables, es decir, � es una matriz 3 � 3, a partir de un multivarianteDistribución gaussiana. En la Tabla IV,

� =

0@ 000

1A ; � =

0@ 1;0 0;9 �0;50;9 1;0 0;2�0;5 0;2 3;0

1A ; (23)

y en la tabla V,

� =

0@ 123

1A ; � =

0@ 1;0 0;8 0;50;8 1;0 0;80;5 0;8 1;0

1A ; (24)

Ambas situaciones son algunas correlaciones de gran tamaño (0,9 en (23) y 0,8 en (24)). Gener-amos 1.000 conjuntos de datos, cada uno con un tamaño de muestra de 100 y se utilizó el cuatroestimadores para el cálculo de la matriz de covarianza �. En la estadística software S-Plus, elb�MME, b�MVE, y b�MCD estimadores son, respectivamente, implementado como var, cov.mve, ycov.mcd$cov (tenga en cuenta que la última dos funciones dan un paso estimadores reweightedbasado en MVE y MCD, véase, por ejemplo Rousseeuw y Van Driessen (1999)). Implementa-mos b�Q en S-Plus desde un C-rutina proporcionada por Croux y Rousseeuw (1992). Sobre labase de las matrices de covarianza estimadas 1000, hemos calculado la media y la varianza delas estimaciones. Los resultados se presentan en la Tabla IV y V. En las primeras columnas,los datos no contienen valores atípicos, en el segunda columna, 10% de los datos tienen unamatriz de covarianza 9� (explotar escriba los valores extremos), en la tercera columna, 10% delos datos tienen una covarianza matriz �=9 (implosionar valores extremos tipo). En estos ejem-plos, las matrices b�Q son de�nida positiva. En caso de que no son de�nida positiva, como unatransformación se describe al �nal de la Sección 3.2 se debe aplicar. Por conveniencia, llamar a

12

Page 13: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

la suma de los valores absolutos de todas las entradas de una matriz de la 1-norma de la ma-triz, y denotan por k�k1. El más pequeño de 1-norma en cada columna se destaca por la fuentenegrita. A partir de las tablas, se puede observar que cuando no hay valores atípicos, b�MME secomporta mejor, b�Q es ligeramente peor, mientras b�MVE y b�MCD se comportan peor. Cuandolos valores extremos son de explotar tipo (la observación tiende a ser mucho más grande queel valor verdadero), b�MVE tiene la mejor estimación, seguido por b�MCD y b�Q, mientras queb�MME da la peor resultado. Para los valores extremos que son de tipo implosión (la observacióntiende a ser mucho más pequeño que el valor verdadero), b�MME y b�Q tanto dan relativamentebuenas estimaciones, mientras que b�MVE es peor y b�MCD da el peor resultado. Esto se puedeentender si nos damos cuenta de que los estimadores b�MVE y b�MCD sólo tener en cuenta lamitad de las observaciones que se distribuyen más cercana a un centro estimada. Por lo tantolos valores atípicos explosión no tendrán mucho

13

Page 14: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

14

Page 15: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

efectuar en los estimadores, mientras que la implosión valores atípicos puede traer importantesdesa�ar a los estimadores. En otras palabras, b�MVE y b�MCD son robustos sólo en contra dela explosión de los valores extremos, no implosión valores atípicos. b�MME da muy buenosresultados en el caso de implosión debido a que los valores de implosionar que probamos sonNo caso extremo y sólo pueden llevar 10% de los datos, por lo que en virtud el procedimientopromediado, el efecto de implosión es muy pequeña. b�Q no es la mejor en cualquiera de las tressimulaciones, pero es relativamente bueno en las tres simulaciones. Así, en la práctica, cuandouno no sabe muy bien qué tipo de valores atípicos existen y cuántos porcentaje de los datosestán contaminados, b�Q es una estimador adecuado a utilizar. En particular en lo que no hayvalores atípicos, el sesgo de b�Q es casi tan pequeño como el sesgo de b�MME. Tenga en cuentaque los resultados de la simulación para b�Q son válidos sólo para (23) y (24) porque nuestroestimador no es afín invariante. Sin embargo, los resultados para (23) y (24) son bastantesimilares.

6. CONCLUSIÓN

Un nuevo estimador de componente a componente de una matriz de dispersión, basado enuna altamente estimador robusto de la escala, se ha propuesto en este artículo. su robustezpropiedades fueron estudiados por medio de la función de in�uencia y el desglose punto. Otrascaracterísticas tales como la varianza y la e�ciencia asintótica eran también analizado. Unaventaja importante de la novela estimador es que su comportamiento es cerca de el métodode momento estimador en situaciones no contaminadas, mientras que es muy robusto en loscontaminados. Se demostró en el enfoque de componente a componente, para las distribucionesgaussianas multivariantes, que la estimación de matriz de covarianza es más difícil que la matrizde correlación estimación. La razón es que la varianza asintótica de la covarianza aumenta conel aumento de la dependencia del estimador, mientras que disminuye con creciente dependenciade estimadores de correlación. También hemos podido comprobar que la varianza asintótica delos estimadores de dispersión de Gauss multivariado distribuciones es proporcional a la vari-anza asintótica de la escala subyacente estimador. El valor de proporcionalidad depende sólode la subyacente dependencia. Por lo tanto, la gran robustez estimador de dispersión es lamejor robusto elección en el momento presente en el enfoque de componente a componente, yaque combina pequeñas propiedades de variabilidad y robustez, como punto de ruptura y altaacotada función de in�uencia. Un estudio de simulación se llevó a cabo con el �n de evaluar

15

Page 16: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

el comportamiento de la nueva estimador. En primer lugar, una comparación con otra esti-mador robusto componente a componente basado en la escala de desviación absoluta medianaestimador, se llevó a cabo. Las propiedades altamente robusto del nuevo estimador fueron con-�rmados. Por otra parte, se ha demostrado que el comportamiento de la nueva estimador esmejor que el basado en el MAD, aunque este último es el B-estimador robusto dispersión com-ponente a componente más (Genton y Ma, 1999). Una segunda comparación con estimadoresglobales como el método de estimador momento, el mínimo volumen estimador de elipsoide, yel covarianza mínimo estimador determinante, también se ha realizado, con dos tipos de valoresatípicos. En este caso, la matriz de dispersión muy robusto estimador resulta ser un compromisoentre la alta e�ciencia de la método de momento estimador en situaciones no contaminadas yla muy propiedades robustas del volumen mínimo elipsoidales y covarianza mínimo estimadoresdeterminantes en situaciones contaminados, con la explosión de tipo de valores atípicos.

7. PRUEBAS

7.1. Prueba de la Proposición 1

La varianza asintótica de b Q a las � es

El cambio de variables

rendimientos

y corresponde a las variables aleatoriasX

�+�X+

Y

���Yy

X

�+�X+

Y

���Y, cada uno de los cuales

sigue la distribución normal estándar � y es independiente

el uno del otro. por lo tanto

16

Page 17: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

Tenga en cuenta que usamos la propiedad lineal de la función de in�uencia (Hampel et al.,1986): IF (�x;Q;��X) =: �IF (x;Q;�X); n : 8� 2 R. Por lo tanto:

Del mismo modo, la varianza asintótica de b�Q a las � es

Usando la misma técnica que el anterior, tenemos:

7.2. Prueba de la Proposición 2

Escribimos a cabo la función de densidad de probabilidad de la bivariado Gauss distribución

17

Page 18: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

donde A = bu2 + av2 � 2 uv y B = 2ab � 2 2. Siguiendo la de�nición de la información deFisher, tenemos

dejar

Entonces, tenemos

y la Ec. (25) se convierte

18

Page 19: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

Sea p =qs2=[4

pab(pab+ )] y q =

qt2=[4

pab(pab� )]. entonces la Ec. (26) se convierte

Por la de�nición de la información de Fisher, sabemos

Donde =pab� en este caso. Usando la ecuación. (17), obtenemos

AGRADECIMIENTOS

Los autores agradecen a Xavier de Luna por sus comentarios sobre una versión anterior dela papel. También agradecemos a dos árbitros anónimos por los comentarios que ayudaron amejorar el papel.

Referencias

1. algoritmos en tiempo e�ciente C. Croux y PJ Rousseeuw, para dos estimadores altamenterobustos de escala, Comput. Estatista. 2 (1992), 411- 428.

2. C. Croux, PJ Rousseeuw, y O. Ho? Ssjer, generalizadas S-estimadores, J. Amer. Estatista.Assoc. 89 (1994), 1271- 1281.

3. C. Croux y G. Haesbroeck, la función y la e�ciencia de la covarianza mínimo In�uenciaestimador de la matriz de dispersión determinante, J. multivariado anal. 71 (1999), 161?190.

19

Page 20: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

4. PL Davies, Comportamiento asintótico de S estimaciones de parámetros de localizacióny multivariado matrices de dispersión, Ann. de estatista. 15 (1987), 1269? 1292.

5. SJ Devlin, R. Gnanadesikan, y JR Kettenring, estimación robusta y atípico detección concoe�cientes de correlación, Biometrika 62 (1975), 531- 545.

6. SJ Devlin, R. Gnanadesikan, y JR Kettenring, estimación robusta de la dispersión ma-trices y componentes principales, J. Amer. Estatista. Assoc. 76 (1981), 354- 362.

7. DL Donoho y PJ Huber, La noción de punto de ruptura, en �Un Festschrift para ErichL. Lehmann �(PJ Bickel, KA Doksum, y JL Hodges Jr., Eds.), Pp. 157? 184, 1982.

8. MG Genton, estimación variograma altamente robusto, Matemáticas. Geol. 30 (1998),213- 221.

9. MG Genton y Y. Ma, propiedades de robustez de los estimadores de dispersión, estatista.Probab. Lett. 44 (1999), 343-350., Estimaciones robustas, los residuos, y la detección devalores atípicos

10. R. Gnanadesikan y JR Kettenring con datos multirespuesta, Biometría 28 (1972), 81-124.

11. R. Gnanadesikan, �Métodos de análisis de datos estadísticos de las observaciones multi-variantes, �2a ed., Wiley, Nueva York, 1997.

12. FR Hampel, estimación robusta: Una encuesta parcial condensada, Z. Wahr. Verw. Ge-biete 27 (1973), 87- 104.

13. FR Hampel, La curva de in�uencia y su papel en la estimación robusta, J. Amer. Estatista.Assoc. 69 (1974), 383- 393.

14. FR Hampel, EM Ronchetti, PJ Rousseeuw, y WA Stahel, �Los estadísticos robustos: ElEnfoque Basado en funciones de in�uencia �, Wiley, Nueva York, 1986.

15. O. Ho? Ssjer, C. Croux, y PJ Rousseeuw, asintótica de S-estimadores generalizadas, J.multivariado anal. 51 (1994), 148? 177.

16. PJ Huber, covarianzas robustas, en �Teoría de la Decisión Estadística y Temas Rela-cionados 2 � (SS Gupta y DS Moore, Eds.), Pp. 165- 191, Academic Press, San Diego,1977.

17. PJ Huber, �Los estadísticos robustos, �Wiley, Nueva York, 1981.

18. PJ Huber, Finito punto de m- y p-estimadores, Ann desglose muestra. de estatista. 12(1984), 119-126.

19. G. Li y Z. Chen, el enfoque de proyección-búsqueda a las matrices de dispersión y robustoscomponentes principales: la teoría de primaria y Monte Carlo, J. Amer. Estatista. Assoc.80 (1985), 759- 766.

20. H. Lopuhaa ?, Sobre la relación entre S y M-estimadores estimadores de multivarianteubicación y covarianza, Ann. Estatista. 17 (1989), 1662- 1683.

21. H. Lopuhaa? Y PJ Rousseeuw, punto de estimadores equivariante a�nes de Desgloseubicación y covarianza matrices multivariantes, Ann. de estatista. 19 (1991), 229? 248.

20

Page 21: traduccion de estimacion altamente robusto de dispersion de matrices.pdf

22. Y. Ma y MG Genton, estimación muy robusta de la función de autocovarianza, J. TiempoSerie anal. 21 (2000), 663- 684.

23. CL Malvas, �sobre algunos temas en Robustez, �Bell Labs Tecnología. Memo, MurrayHill, NJ, 1976.

24. KVMardia, JT Kent, y JM Bibby, �Análisis Multivariante, �Academic Press, San Diego,1979.

25. RA Maronna, robustos M-estimadores de localización y dispersión multivariante, Ann. deestatista. 4 (1976), 51- 67.

26. RA Maronna, WA Stahel, y VJ Yohai, estimación robusta de Bias-multivariado de dis-persión basado en proyecciones, J. multivariado anal. 42 (1992), 141- 161.

27. RA Maronna y VJ Yohai, El comportamiento del robusto multivariable? Donoho Stahelestimador, J. Amer. Estatista. Assoc. 90 (1995), 330- 341.

28. PJ Rousseeuw, menos la mediana de cuadrados de regresión, J. Amer. Estatista. Assoc.79 (1984), 871- 880.

29. PJ Rousseeuw, estimación multivariante con alto punto de ruptura, en �MatemáticoEstadística y Aplicaciones �(W. Grossmann, G. P�ug, I. Vincze, y W. Wertz, eds.), pp.283? 297, Reidel, Dordrecht, 1985.

30. PJ Rousseeuw y AM Leroy, �Regresión Robusta y detección de las demás �, Wiley, NuevaYork, 1987.

31. PJ Rousseeuw y G. Molenberghs, Transformación de correlación no positiva semide�nidamatrices, Commun. Estatista. Teoría Meth. 22 (1993), 965- 984.

32. PJ Rousseeuw y BC van Zomeren, valores atípicos multivariantes desenmascarar y apalan-camiento puntos, J. Amer. Estatista. Assoc. 85 (1990), 633- 651.

33. PJ Rousseeuw y C. Croux, estimadores explícitos escala con alto punto de ruptura, en �L1 Los análisis estadísticos y métodos relacionados �(Y. Dodge, Ed.), pp. 77? 92, Elsevier,Amsterdam, 1992.

34. PJ Rousseeuw y C. Croux, Alternativas a la desviación absoluta mediana, J. Amer. Es-tatista. Assoc. 88 (1993), 1273- 1283.

35. PJ Rousseeuw y G. Molenberghs, Transformación de semide�nida no positivo matricesde correlación, Commun. Estatista. Teoría Meth. 22 (1993), 965- 984.

36. PJ Rousseeuw y K. Van Driessen, un algoritmo rápido para la covarianza mínimo esti-mador determinante, Technometrics 41 (1999), 212- 223.

37. WA Stahel, � Distribución de covarianza estimadores, � Informe de Investigación 31,Fachgruppe fu? r Statistik ETH, Zu? rica, 1981.

38. DE Tyler, ubicación multivariado �nitos puntos desglose muestra de proyección basada ydispersar las estadísticas, Ann. de estatista. 22 (1994), 1024- 1044.

39. VJ Yohai y R. Zamar, las estimaciones de alta desglose de punto de regresión por mediode la minimización de una escala e�ciente, J. Amer. Estatista. Assoc. 83 (1988), 406- 413.

21