estad stica del muestreo - wordpress.com · población de tamaño n = 30, muestras posibles...

55
Ing. Juan Trejo Bedón MUESTREO BÁSICO

Upload: others

Post on 04-Apr-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Ing. Juan Trejo Bedón

MUESTREO BÁSICO

MUESTREO ALEATORIO SIMPLE(M.A.S.)

MUESTREO ALEATORIOSIMPLE (M.A.S.)

• Método de selección de la muestra en un paso• El marco muestral debe ser una lista completa• Cada unidad tiene la misma probabilidad de

selección• Esta probabilidad es p = n/N

– donde n es el tamaño de la muestra– y N es el tamaño de la población

• Cada muestra (de n) tiene la mismaprobabilidad de selección

Muestreo Aleatorio Simple

• Población N = 54 viviendas• Muestra n = 18• Fracción muestral p = n / N = 18 / 54 = 1/3• Cada vivienda tiene probabilidad de selección 1/3• Se seleccionan 18 números aleatorios entre 1 y 54• Se seleccionan las viviendas correspondientes

Muestreo Aleatorio SimpleMuestreo Aleatorio Simple

San José

San Luis

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo domingo

San Pedro

Av 28 de Julio Av. circunvalación

Muestreo Aleatorio SimpleMuestreo Aleatorio Simple

San José

San Luis

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo Domingo

San Pedro

Av. 28 de Julio Av Circunvalación

Muestreo Aleatorio SimpleMuestreo Aleatorio Simple

San José

San Luis

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo Domingo

San Pedro

Av. 28 de Julio Av Circunvalación

Muestreo Aleatorio Simple

Ventajas del MAS• Sencillez conceptual• Necesita como marco muestral sólo una lista de

todos los elementos de la población• Es fácil calcular las estimaciones de valores

poblacionales• Es fácil calcular las estimaciones de precisión

(varianza muestral)

Muestreo Aleatorio SimpleDesventajas del MAS• Tedioso eligir todos los números aleatorios si n

es grande• No utiliza información auxiliar sobre la población• Necesita una lista completa de los elementos de

la población• Puede tener baja precisión comparado con otros

métodos

Muestreo Aleatorio Simple

El MAS se puede realizar:

• Con reposición (MASCR)

• Sin reposición (MASSR)

Muestreo Aleatorio SimpleMASCR• Seleccionar una unidad• “Reemplazarla” en la población• Seleccionar otra, de la población completa• Continuar hasta obtener una muestra de

tamaño n• Se puede seleccionar la misma unidad más

de una véz

Muestreo Aleatorio Simple

MASSR:

• Seleccionar una unidad• “Sacarla” de la población• Seleccionar otra unidad de las que quedan y sacarla• Continuar hasta obtener n unidades distintas• Cada unidad puede estar incluida una sola vez• Es más eficiente que el MASCR• Se usa en la práctica

Ejemplo del MAS

Encuesta de las empresas sobreGastos en insumos•Población de seis empresas (N = 6)

•Propósito: estimar gastos para comprasde insumos•Presupuesto permite sólo una muestrade dos empresas (n = 2)

Ejemplo del MASPoblación completa

Empresa Gastos1 $ 26,0002 470,0003 63,8004 145,0005 230,0006 12,500Total 947,300

Muestras Gastos Estimaciónposibles observados del total(1,2) 496,000 1,488,000(1,3) 89,800 269,400(1,4) 171,000 513,000(1,5) 256,000 768,000(1,6) 38,500 115,500(2,3) 533,800 1,601,400(2,4) 613,000 1,845,000(2,5) 700,000 2,100,000(2,6) 482,500 1,447,500(3,4) 208,800 626,400(3,5) 293,800 881,400(3,6) 76,300 228,900(4,5) 375,000 1,125,000(4,6) 157,500 472,500(5,6) 252,500 727,50015 muestras posibles promedio 947,300/6 : insesgado

ESTIMACION DEL TAMAÑO DE MUESTRA - “MAS”VARIABLES CUANTITATIVAS

Elementos para calcular un tamaño de muestra1. Información anterior de promedios y varianzas de variables

relacionadas con la investigación (Censos, encuestas, pilotos).

2. Elegir un nivel de confianza( 90%, 95%, 99%) . Generalmente paraestudios macroregionales, regionales,locales se elige 95%.Es decir: Z = K = 1.96 (abscisa de ladistribución Normal)

( e = d . Donde : d = Error Relativo Aceptado).

3. Decidir sobre el margen de error (e ) que estamos dispuestos atolerar (Error máximo permisible = Error Absoluto aceptado).

4. Tamaño de la Población ( N )

Fórmula para estimar eltamaño de la muestra (M.A.S.)

1

o

o

nn

n

N

2 2

2, : o

Z Sdonde n e

e = Margen de error. Es el error absoluto delPromedio Poblacional ( e = d . )

d = Es el error relativo aceptado (precisión)

MUESTREO ALEATORIO PARA PROPORCIONESVARIABLES CUALITATIVAS O DE ATRIBUTOS

ˆn

ii

x

n

Xp

n Proporción muestral:

N XPOBLACIÓN(N)

= Número de elementos en la población, que tienen algunacaracterística o atributo, o que caen dentro de alguna clase.

XP Proporción poblacional

N

ESTIMADOR DELA PROPORCIONPOBLACIONAL

ˆ ˆX N p

Estimador del Total deClase Poblacional

X

n

donde: es la tasa muestral o fracción de muestreo

VARIANZA DE LA PROPORCION Y DEL TOTAL DE CLASEMUESTRALES - “MAS”

En el muestreo aleatorio sin reposición las varianzas de laProporción muestral y del Estimador del Total de Claseestán dadas respectivamente por:

nf

N

ˆ( )1

PQ N nV p

n N

2

ˆ1

N PQ N nV X

n N

VARIANZA DELESTIMADOR DELTOTAL DE CLASE

VARIANZA DE LAPROPORCION

MUESTRAL

2 ˆ ˆˆ ˆ1

p q N nV X N

n N

ˆ ˆˆ ˆ1

p q N nV p

n N

ESTIMACION DEL TAMAÑO DE MUESTRA - “MAS”

(VARIABLES CUALITATIVAS O DE ATRIBUTOS)

Tenemos que: ˆ 11

PQ N nP p P Z

n N

Tal que, el error de estimación no debe ser mayor que un valordado “e” ( ERROR MAXIMO PERMISIBLE O ERROR ABSOLUTO ACEPTADO):

2 2 2 2 2ˆ ˆ

1p p

PQ N nZ Z Z

n Ne e e

11

o

o

nn

n

N

2

2, : o

Z PQdonde n e e = d.P

d = error relativoaceptado (precisión)

MODELO DEMATRIZ PARAESTIMAR ELTAMAÑO DEMUESTRA

PRECISIONError Máximo

Permisible (%)d

NIVEL DE CONFIANZA: ( )Z = 1.645

90%Z = 1.96

95%Z = 2.38

98%10% 747% 1525% 2961% 890

COEFICIENTEDE VARIACIÓN

1

ERROR RELATIVO ACEPTADO

MODELO DEMATRIZ PARAESTIMAR ELTAMAÑO DEMUESTRA

PRECISIONError Máximo

Permisible (%)d

NIVEL DE CONFIANZA: ( )Z = 1.645

90%Z = 1.96

95%Z = 2.38

98%

10% 53 74 1057% 107 152 2145% 210 296 4182% 325 890 1370

COEFICIENTEDE VARIACIÓN

1

ERROR RELATIVO ACEPTADO

MUESTREO SISTEMATICO

¿QUÉ ES UN MUESTREOSISTEMATICO?

• Es otro muestreo que también le asignaigual probabilidad de inclusión uniformepara todos, como el simple al azar.

• Nuevamente esta probabilidad es n/N.• Es conveniente por su simplicidad ya que

se necesita sólo un número aleatorio.• Fácil de seleccionar en campo o durante el

operativo• Se logra en general una muestra más

“representativa” de la población.

¿QUÉ ES UN MUESTREOSISTEMATICO? (cont.)

• No es necesario conocer el tamaño de lapoblación N si se conoce la fracción demuestreo.

• Origina muestras bien dispersas desdeel punto de vista geográfico.

• Se emplea generalmente en las últimasetapas en diseños en varias etapas omás complejos.

¿Cómo se selecciona una muestrasistemática?

• Paso 1: Fijar el tamaño de la muestra, n.• Paso 2: Determinar un paso o intervalo,I=N/n.• Seleccionar un número al azar entre 1 y I; sea ese

número igual a k.• Seleccionar las unidades k, k+I, k+2I, k+3I, k+4I,......

Hasta llegar a completar las n necesarias.

1 2 3 N

¿Cómo se selecciona una muestrasistemática?(cont.)

Muestreo Sistemático Circular, útilcuando n no es múltiplo de N.

12

3

45

678

9

10

11

Arranquealeatorio

MUESTREO SISTEMATICO: Ejem. 1

Población de tamaño N = 30, muestrasposibles sistemáticas de tamaño n = 6.Intervalo selección k = N / n = 30/6 = 5

1ra muestra: 1 6 11 16 21 262da muestra: 2 7 12 17 22 273ra muestra: 3 8 13 18 23 284ta muestra: 4 9 14 19 24 295ta muestra: 5 10 15 20 25 30

Muestras posibles de tamaño n = 6 :

Ejem. 2: Seleccionar muestra de n = 20empresas de lista de N = 500 empresas

• Esto significa que 1 de cada 25 empresas de lapoblación se seleccionará

• Utilizando # al azar seleccionamos un número entre 1y 25.

• Suponga que el # seleccionado es 7.

• Entonces la 1ra empresa. selecc. es el # 7.

• Las otras 19 empresas de la muestra se obtienen

sumando al 7 el intervalo de selección 25.

• Es decir: 07, 32, 57 , ..........

Ejem.2 : La muestra de n = 20 empresasseleccionadas de N = 500 empresas es:

Una ventaja del método sistemático es que lamuestra se distribuye por igual en los diversasempresas. Una M.A.S. tomada de la población no posee esta

propiedad.

07 32 57 82 107132 157 182 207 232257 282 307 332 357382 407 432 457 482

Muestreo EstratificadoAleatorio (M.E.A.)

Muestreo estratificado

• Proceso de división de la población en gruposhomogeneos llamados estratos, para luegoseleccionar muestras independientes en cadaestrato

• Variables de estratificación pueden sergeográficas o no-geográficas

• Estratificación se limita a los elementos deinformación disponibles en el marco muestral

1. Protegernos contra la posibilidad de obteneruna mala muestra.

RAZONES PARA LA ESTRATIFICACION

2. La estratificación se utiliza para disminuir lasvarianzas de los estimadores ( disminuir lavarianza para obtener estimaciones más precisas)

3. Se pueden formar estratos para aplicar diferentesmétodos y procedimientos de muestreo dentro decada estrato. (Selección de la muestra yprocedimientos de recojo de información).

4. Los estratos pueden establecerse para darresultados a nivel de “DOMINIOS DE ESTUDIO”(Nivel de inferencia)

N2

ESTRATO 2(Empresasmedianas)

ESTRATO 3(Empresaspequeñas)

ESTRATO 1(Empresasgrandes)

MUESTREO ALEATORIO ESTRATIFICADO ( MAE )

POBLACION ESTRATOS

N1

N3

n1

n2

n3

1 2 31

1 2 31

,L

hh

L

hh

Tal que N N N N N N

n n n n n n

No se puede mostrar la imagen en este momento.

Muestreo estratificado

Ejemplo 1 de M.E.A.Estratificacion de

usuarios de la empresaEDELNOR (parte de Lima)

ESTRATIFICACION DE LA POBLACIONDE 267,694 CLIENTES (EDELNOR)

Nºde

estrato

ESTRATOS

(Sub-estacionestransformación)

Nº de clientes

(Tamaño delestrato)

% de clientes

(Poderación delestrato)

h =1 Canto Grande N1 = 57,241 W1 = 21.4

h =2 Jicamarca N2 = 37,932 W2 = 14.2

h=3 Mirones N3 = 41,157 W3 = 15.4

h=4 Santa Rosa N4 = 66,440 W4 = 24.8

h=5 Tacna N5 = 64,924 W5 = 24. 2

TOTAL N = 267,694 100.0

MUESTRA DE 500 CLIENTES DE LA POBLACION DE267,694 CLIENTES (EDELNOR)

Nºde

estrato

ESTRATOS

(Sub-estacionestransformación)

% de clientes

(Poderación delestrato)

Nº de clientes

(Tamaño delestrato)

h =1 Canto Grande W1 = 21.4 n1 = 107

h =2 Jicamarca W2 = 14.2 n2 = 71

h=3 Mirones W3 = 15.4 n3 = 77

h=4 Santa Rosa W4 = 24.8 n4 = 123

h=5 Tacna W5 = 24.2 n5 = 122

TOTAL 100.0 n = 500

RESULTADOS MUESTRALES DE 500 CLIENTES:promedio muestral mensual y desviación estándar de consumo por

estratos

N° ESTRATOS Clientes

nh

Media Desviaciónestándar

sh

1 Canto Grande 107 1,200 10,000

2 Jicamarca 71 800 6000

3 Mirones 77 3,000 30,000

4 Santa Rosa 123 2,350 25000

5 Tacna 122 2,100 20,000

TOTAL 500 2,000 22,000

hx

AFIJACION DE LA MUESTRASe da el nombre de afijación al reparto,asignación o distribución de la muestra (n)entre los diferentes estratos. Tal que:

1 2 3 ..... Ln n n n n

1. AFIJACION PROPORCIONAL

hh h

Nn n nW

N

h h hh

h

n N n no o f f

n N N N

2. AFIJACION DE NEYMAN ( O DE MINIMA VARIANZA)

La afijación de Neyman o afijación de mínimavarianza, consiste en determinar los valores de nhde forma que para un tamaño de muestra (n) fijo,la varianza sea mínima.

1

h hh L

h hh

N Sn n

N S

2: :hdonde cuasivarianza poblacional del estS ratoh

( )stV X

3. AFIJACION DE OPTIMA

La afijación de óptima, consiste en minimizar la varianzapara un coste fijo. Es decir, minimizar con lacondición de que:

1

h h

h

h h

h

N SC

h LN S

Ch

n n

2

:

:

:

( )

:

h

h

donde

costo total

costo por unidad en el

estrato h costo unitario

cuasivarianza poblacional

del estr

C

C

S

ato h

1

L

h hh

C n C

( )stV X

NOTA: Cuando Ch = constante h, la Afijación Optimacoincide con la Afijación de Neyman

Muestreo por conglomerados

Muestreo porconglomerados

• Es un proceso de muestreo en dospasos– Agrupar la población en

conglomerados que se puedenidentificar en mapas y en el terreno

– Seleccionar una muestra deconglomerados y entrevistar todos loselementos de aquellos

Muestreo porconglomerados

• Conglomerados pueden seragrupaciones naturales oartificiales

• Posiblemente disponibles defuentes como el Censo (manzanas,etc.)

• Los que diseñan la encuesta tal veztengan que conformarlos

Muestreo porconglomerados

• Se entiende la población comojerarquía de unidades–personas viven en viviendas–viviendas constituyen manzanas–muchas manzanas hacen una

ciudad

Encuesta de estudiantesEncuesta de estudiantes

= Escuelas = Estudiantes

Muestra por conglomeradosMuestra por conglomerados

=Escuelas

= Estudiantes = Seleccionados

Muestreo porconglomerados

• Ventajas– Se pueden utilizar aun cuando no haya lista de

unidades de la población– Para entrevistas personales, el tiempo y costo

de viajes se reduce muchísimo, sobre todo parapoblaciones rurales

– Se necesita sólo una lista de conglomerados– O la posibilidad de construirla

Muestreo porconglomerados

• Desventajas– Tendencia de unidades vecinas de ser semejantes

reduce la precisión– Dado n fijo, sería menos eficiente– Pero si se consideran los costos en el terreno, la

posibilidad de aumentar n implica menor pérdidade precisión en la práctica

MUESTREO PORCONGLOMERADOS

• En el muestreo por conglomerados, los elementosindividuales de la población sólo pueden participar enmuestra si pertenecen a un conglomerado (UPM)incluido en la muestra.

• La UPM no es igual a la unidad de observación (USM),y hay que tomar en cuenta los dos tamaños deunidades experimentales al calcular los erroresmuestrales de las muestras por conglomerados.

¿ PORQUE USAR MUESTREOPOR CONGLOMERADOS ?

• La construcción de una lista de unidades deobservación para el marco de muestreo puede serdifícil, cara e imposible.

• La población podría estar muy dispersageográficamente o aparecer en cúmulos naturales,como las escuelas, hospitales, manzanas, familias.

• El muestreo por conglomerados se utiliza en lapráctica debido a que es más barato y convenienteobtener muestras por conglomerados que al azarentre la población.

MUESTREO PORCONGLOMERADOS

• La población está particionada en N conjuntos quellamaremos “Conglomerados”

• No se cuenta con una lista de unidades de la población, perose tiene una lista de los conglomerados.

• La forma de obtener una muestra consiste en escoger nconglomerados, y en cada uno de ellos se observan todas lasunidades de población que estaban en cada conglomeradoselecionado.

• Este procedimiento de obtener la muestra se denominamuestreo por conglomerados.

MUESTREO PORCONGLOMERADOS : Ejemplo

Número de niños por manzanaLas 3510 manzanas de una ciudad selocalizan en 90 poblados (urbanizaciones,AAHH y conjuntos habitacionales).El número de manzanas en las diferentesurbanizaciones, AA.HH., C.H. no es elmismo .Se selecciona una muestra aleatoria simple de15 poblados y se determina el # de niños pormanzana.

MUESTREO PORCONGLOMERADOS : Ejemplo3

• Promedio de Niños por manzana = 12.24• La estimación de la varianza del promedio de

niños es de = 0.5854• El Error Muestral absoluto de la estimación de

la varianza del promedio de niños por manzana es laRaíz cuadrada de = 0.5854. Es decir :Error muestral = 0.7651 niños por manzanaError muestral relativo = .7651/12.24 =6.25 %