1 prof. rosario martínez verdú. 2 tema 5: contrastes de hipÓtesis no paramÉtricas 1. contrastes...

19
1 Introducción a la Inferencia Estadística TEM A 5: C ontrastes de H ipótesis N o Param étricas Prof. Rosario Martínez Verdú

Upload: pepita-alcaraz

Post on 29-Jan-2016

219 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

1

Introducción a la Inferencia Estadística

TEMA 5:Contrastes de Hipótesis No Paramétricas

Prof. Rosario Martínez Verdú

Page 2: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

2

TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS

1. Contrastes de Bondad de Ajuste2. Contraste de Independencia 3. Contraste de Homogeneidad de Poblaciones

Bibliografía específica Tema 5:

- NEWBOLD, P. (1997). Estadística para los Negocios y la Economía. Madrid: Prentice Hall. 4ª Edición. Capítulo 11.

- NEWBOLD, P. y otros (2008). Estadística para Administración y Economía. Madrid: Pearson-Prentice Hall. 6ª Edición. Capítulo 16.

- ESTEBAN GARCÍA, J. y otros: Curso Básico de Inferencia Estadística. Reproexpres Ediciones, Valencia, 2008. Tema 7 apartados 1 a 4.

- LIND D.A y otros. Estadística Aplicada a los Negocios y la Economía. Ed. McGraw Hill, México, (13ª Edición). Capítulo 17.

MURGUI, J.S. y otros (2002). Ejercicios de Estadística. Economía y Ciencias Sociales. Valencia: Tirant lo Blanch. Capítulo 9 apartados 1 a 3.

Page 3: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

3

1.- CONTRASTES DE BONDAD DE AJUSTE

1) Con Datos CategóricosHo simple

2) Con Datos No Categóricosa) Ho simple

b) Ho compuesta

(Multinomial)

(Poisson, Normal, Exponencial)

Page 4: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

4

1.1 Contraste de Bondad de Ajuste para Datos Categóricos

Universo clasificado respecto a k alternativas o categorías: A1,A2,…Ai,…,Ak . La Población representaría la categoría en que estaría clasificada una unidad del universo. Su distribución de probabilidad sería una Multinomial. Es decir:

categorías A1 …. Ai …. Ak

probabili-dades p1 …. pi …. pk

k

ii=1

p =1Estas probabilidades de estar clasificado en cada una de las k categorías son desconocidas y

por tanto, se pueden formular hipótesis acerca de los valores que pueden tomar:

00 i i

01 i i

i 1,2,...k H : p p

H : p p para alguna

Para resolver el contraste de hipótesis:

muestra: m.a.s. de tamaño n clasificada según las k categorías:categorías A1 …. Ai …. Ak

frecuencias observadas n1 …. ni …. nk

k

ii=1

n = n

Page 5: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

5

Test de la Chi-Cuadrado:Si la Ho fuera cierta, las frecuencias que se esperaría que estuvieran en cada una de las k

categorías serían:

categorías A1 …. Ai …. Ak

frec. observ. ni n1 …. ni …. nk nfrec. esper. …. …. n

0inp0

inp 01np 0

knp

Este test se basa en un estadístico que calcula, para cada categoría, las diferencias entre ambos tipos de frecuencias (observadas y esperadas):

20Ki i

0i 1 i

n npQ

np

Interpretación valor del estadístico Q:•Q valor pequeño → diferencias pequeñas → Aceptar Ho•Q valor grande → diferencias grandes → Rechazar Ho

Condición que establece el Test: Rechazar H0 si: Q > c

Para determinar el valor c: Se fija nivel de significación

P (rechazar H0 / Ho cierta) = 0i iP(Q > c / p =p )=

Para resolver esta ecuación es necesario conocer la distribución del estadístico Q cuando Ho es cierta:

Page 6: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

6

Bajo Ho cierta, Pearson demostró que cuando n es grande la distribución de Q se aproxima a una con k-1 grados de libertad. 2

Luego:

Rechazar H0 si:

Aceptar H0 si:

kQ c= 2-1,

kQ c= 2-1,

Para poder aplicar este test se exige:

- Tamaño de la muestra grande

- Todas las frecuencias esperadas

(si alguna no lo cumple hay que agrupar categorías).

0inp 5

Page 7: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

7

EJEMPLO 1

En un municipio hay 3 partidos políticos mayoritarios. De cara a las próximas elecciones, el periódico local ha efectuado una encuesta sobre las preferencias por los 3 partidos políticos: A, B y C entre 80 votantes seleccionados al azar. Los resultados han sido:

partido A B Cvotantes 26 31 23

¿Se puede considerar que las preferencias electorales de los votantes por los 3 partidos políticos son las mismas para un nivel de significación del 5%?

Page 8: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

8

1.2 Contraste de Bondad de Ajuste para Datos No Categóricos

Ahora el universo no está clasificado respecto a k categorías. La Población está representada por una variable aleatoria X que puede ser discreta o continua.

0 0

1 0

H : F(x) F (x)

H : F(x) F (x)

Para resolver el contraste de hipótesis, el procedimiento a seguir consiste en:

El objetivo es contrastar si los datos de la muestra proceden de una distribución particular (Poisson, Normal). Es un contraste para la distribución de probabilidad de la población. Las hipótesis a contrastar son:

0 0

0 0

H simple: F (x) especifica el valor de sus parámetros

H compuesta: F (x) no especifica el valor de sus parámetros

Disponemos de una muestra: (x1, x2, …,xn) m.a.s. de tamaño n grande

1) Se divide el conjunto de todos los posibles valores que puede tomar la v.a. poblacional X en k intervalos numéricos: I1, I2, …,Ik

2) Se calcula el nº de observaciones de la muestra que estarían dentro de cada intervalo → se obtienen las frecuencias observadas ni .

Page 9: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

9

3) Se calculan las probabilidades que la distribución propuesta en la Ho asignaría a la probabilidad de que X pertenezca a cada uno de los k intervalos creados.

0ip

0i ip =P(X I ) para i=1,2,...,k

4) Se calculan las frecuencias esperadas para los k intervalos: 0inp

En el caso de que la Ho fuera compuesta, previamente se estimarían los parámetros desconocidos de la distribución de la Ho.

intervalos I1 …. Ii …. Ik

frec. observ. ni n1 …. ni …. nk nfrec. esper. …. …. n

0inp 0

1np 0inp 0

knp

5) Como tenemos las frecuencias observadas y las frecuencias esperadas, se puede aplicar el test de la Chi-cuadrado y calcular el estadístico Q. El contraste se resolvería como en el caso anterior 1.1.

Rechazar H0 si: k m-Q c= 2- 1,

Aceptar H0 si: k m-Q c= 2- 1,

La única diferencia: grados de libertad se calculan como k-m-1, donde m es el nº de parámetros estimados.

Page 10: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

10

EJEMPLO 2

En una encuesta a una muestra aleatoria de 90 fumadores que manifestaron su intención de dejar de fumar, se les preguntó por el número de veces que hasta el momento lo habían intentado. Los resultados fueron los siguientes:

¿Se puede aceptar un modelo Poisson de media igual a 2 para la variable aleatoria “número de intentos para dejar de fumar”?

nº de intentos fumadores

0 12

1 27

2 21

≥3 30

Page 11: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

11

2. CONTRASTE DE INDEPENDENCIA

Tabla de Contingencia

A B B1 B2 .... BJ ni.

n11 n12 ... n1j n1.

n21 n22 ... n2J n2.

M M n ij M M

n I1 n I2 ... n IJ n I.

n.1 n.2 .... n.J nn.j

A1

A2

M

AI

Sea 1 muestra grande de n individuos clasificados respecto a las categorías de 2 variables categóricas o criterios de clasificación: A y B.

nij frecuencia observada conjunta. Nº de individuos de la muestra que están clasificados simultáneamente en las categorías Ai y Bj.ni. y n.j frecuencias marginales observadas.

ni.: nº total de individuos clasificados en la categoría Ai n.j: nº total de individuos clasificados en la categoría Bj

Page 12: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

12

A B B1 B2 .... BJ pi.

p11 p12 ... p1j p1.

p21 p22 ... p2J p2.

M M pij M MpI1 pI2 ... pIJ pI.

p.1 p.2 .... p.J 1p.j

A1

A2

MAI

pij probabilidad conjunta de estar clasificado simultáneamente en las categorías Ai y Bj de la tabla de contingencia.

Podemos suponer que la muestra proviene de una población con la siguiente distribución conjunta de probabilidad:

pi. y p.j probabilidades marginalespi.: probabilidad de estar clasificado en la categoría Ai p.j: probabilidad de estar clasificado en la categoría Bj

Todas estas probabilidades son desconocidas y se pueden formular hipótesis acerca de los valores que pueden tomar.

Page 13: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

13

Contraste de Independencia (continuación)

0 ij i. .j

1 ij i. .j

H : p p p para todas

H : p p p para alguna

Las hipótesis a contrastar sobre estas probabilidades son:

Independencia (no hay relación)

No independencia (hay relación)

Test de la Chi-Cuadrado:

2frec.observ.-frec.esper.

Qfrec.esper.

2

I Jij i. .j

i 1 j 1 i. .j

n n p p=

n p p

2

i. .jijI J

i. .ji 1 j 1

n nn

nn n

n

Bajo Ho cierta, 2(I-1)(J-1)Q χ Para un nivel de significación fijado:

Rechazar H0 si:

Aceptar H0 si:

(IQ 2-1)(J-1),

(IQ 2-1)(J-1),

Todas las frec. esperadas: i. .jn n5

n

Page 14: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

14

EJEMPLO 3

Una encuesta efectuada a 120 consumidores de un producto, seleccionados al azar, ha permitido clasificarlos respecto a la marca que prefieren y respecto a la región en la que residen, obteniéndose la siguiente tabla:

RegiónMarcaACME 35 20 10P2P 30 15 10

1 2 3

A partir de esta información, ¿se puede admitir, para un nivel de significación del 5%, que la preferencia por una determinada marca está influida por la región de residencia?

RegiónMarca ni.ACME 35 20 10 65P2P 30 15 10 55n.j 65 35 20 120 = n

1 2 3

Page 15: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

15

EJEMPLO 1

Una encuesta efectuada a 120 consumidores de un producto, seleccionados al azar, ha permitido clasificarlos respecto a la marca que prefieren y respecto a la región en la que residen, obteniéndose la siguiente tabla:

RegiónMarcaACME 35 20 10P2P 30 15 10

1 2 3

A partir de esta información, ¿se puede admitir, para un nivel de significación del 5%, que la preferencia por una determinada marca está influida por la región de residencia?

RegiónMarca ni.ACME 35 / 35,2 20 / 18,95 10 / 10,83 65P2P 30 / 29,79 15 / 16,04 10 / 9,16 55n.j 65 35 20 120 = n

1 2 3

Page 16: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

16

3. CONTRASTE DE HOMOGENEIDAD DE POBLACIONES

muestra

A A1 A2 .... AJ ni.

n11 n12 ... n1j n1.

n21 n22 ... n2J n2.

M M n ij M M

n I1 n I2 ... n IJ n I.

n.1 n.2 .... n.J nn.j

1

2

M

I

Sean I muestras grandes independientes de individuos clasificados respecto a las J categorías de 1 variable categórica: A.

nij frecuencia observada. Nº de individuos de la muestra i que están clasificados en la categoría Aj.

ni.: tamaño muestra i

n.j: nº total de individuos del conjunto de todas las muestras clasificados en la categoría Ajn: suma de todos los tamaños muestrales.

Page 17: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

17

Población

A A1 A2 .... AJ

p11 p12 ... p1j 1

p21 p22 ... p2J 1

M M p ij M M

p I1 p I2 ... p IJ 1

1

2

M

I

Podemos suponer que cada muestra proviene de una población con la siguiente distribución de probabilidad:

pij probabilidad en la población i de estar clasificado en la categoría Aj

Todas estas probabilidades son desconocidas y se pueden formular hipótesis acerca de los valores que pueden tomar.

Page 18: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

18

Contraste de Homogeneidad de Poblaciones (continuación)

0 1j 1j Ij j

1 0

H : p p ... p p j 1,2,..,J

H : H no se cumple

La Ho a contrastar es que todas las poblaciones tienen la misma distribución de probabilidad (son homogéneas):

Poblaciones Homogéneas

Poblaciones no Homogéneas

Test de la Chi-Cuadrado:

2frec.observ.-frec.esper.

Qfrec.esper.

2

I Jij i. j

i 1 j 1 i. j

n n p=

n p

2

i. .jijI J

i. .ji 1 j 1

n nn

nn n

n

Bajo Ho cierta, 2(I-1)(J-1)Q χ Para un nivel de significación fijado:

Rechazar H0 si:

Aceptar H0 si:

(IQ 2-1)(J-1),

(IQ 2-1)(J-1),

Todas las frec. esperadas: i. .jn n5

n

Page 19: 1 Prof. Rosario Martínez Verdú. 2 TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste

19

La Comisión Europea está interesada en conocer el grado de apoyo de los ciudadanos a la Constitución Europea. Para ello, ha realizado encuestas en cada uno de los países miembros. En la siguiente tabla se muestran los resultados de las encuestas de España y de Reino Unido:

EJEMPLO 4

Opinión Constitución Europea

A favor En contra No contesta Total encuestados

España 70 10 20 100Reino Unido 60 70 20 150

A partir de la tabla anterior, ¿puede decirse que la opinión de los ciudadanos respecto a la Constitución Europea es homogénea en los dos países o bien cabe hablar de diferencias significativas?

Opinión Constitución Europea

A favor En contra No contesta Total encuestados

ni.España 70 / 52 10 32 20 / 16 100Reino Unido 60 / 78 70 / 48 20 / 24 150

n.j 130 80 40 250 = n

/