población y muestra

56
Recopilación y análisis de datos

Upload: claudia-huerta-r

Post on 01-Jul-2015

3.471 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Población y muestra

Recopilación y análisis de datos

Page 2: Población y muestra

El alumno identificará la importancia del análisisde datos en el proceso para la verificación de hipótesis

Objetivos particulares:Definirá los tipos de muestra y sus procedimientos de selección aplicados a diferentes estudios.

Enunciar los conceptos de muestra, población y procedimiento de selecciónde la muestra.

Obtener muestras representativas de la población estudiada.

Aplicará el muestreo como técnica estadística.

Objetivo

Page 3: Población y muestra

En cualquier actividad que tiene una parte intelectual y se apoya en elementos teóricos, se requiere de un acopiode datos y antecedentes (metodologías , técnicas,experiencias de otras personas, etc) para tener una correcta guía para la ejecución de nuestra actividad.

Page 4: Población y muestra

Estos datos deberán confrontarse con nuestras propias experienciaspara dar a luz nuevos juicios y nuevos conocimientos.

Page 5: Población y muestra

Para emprender cualquier clase de investigación…

Es indispensable recabar antecedentes, datos y, en general, referencias que nos den una dirección precisa,la cual oriente nuestro trabajo, de modo tal que tengaun soporte teórico, sólido y fundamentando.

Page 6: Población y muestra

Revisión de la información

La información proviene de una fuente de datos,los cuales deben ser:

Confiables

entendibles

Para quien va recibirlos

Page 7: Población y muestra

La diferencia básica entre datos e información

los datos no son útiles o significativoscomo tales, sino hasta que son procesados y convertidosen una forma más útil y completa llamada información.

Page 8: Población y muestra

ProcesoDATOSINFORMACIÓN

Page 9: Población y muestra

¿Cómo obtenemos información?

Mediante la recopilación del mayor número de datosposibles a fin de tener una imagen del problemay proponer su posible solución.

Para lograr esto, se aplican las siguientes técnicas:

Page 10: Población y muestra

Observación:

No sólo de hechos, sino también de tipo documental,cuando se refiere al análisis de registros, informes,estadísticas, etc, de laboratorio.

Page 11: Población y muestra

Encuestas

Se recopilan datos a través de la aplicación de cuestionarios y entrevistas

Page 12: Población y muestra

Muestreo

Aplicación de técnicas estadísticas a una parte deuna población, para determinar resultados representativos o comunes a ésta.

Page 13: Población y muestra

Experimentación

Se reproduce un hecho o un fenómeno con el finde observar sus características y modificarlas a voluntad

Page 14: Población y muestra

Población y muestra

Page 15: Población y muestra

Una vez definido:

El problemade investigación

Formulados los objetivos

Y delimitadas las variables

Se hace necesari

o

Determinar los elementos o individuos con quienes se va a llevar a cabo el estudio o investigación

Esto nos conduce a delimitar el ámbito dela investigación definiendo a una población yseleccionando un muestra

Page 16: Población y muestra

Cualquier característica medible de la población se denomina:

Parámetro

Los parámetros calculados sobre muestras se conocen como estadísticos,utilizan letras latinas (σ, μ,.., media, varianza ) y describen las citadasmuestras

Page 17: Población y muestra

PoblaciónConjunto de todos los individuos (objetos,

personas, eventos) en los que se desea

estudiar el fenómeno

Hoy se prefiere hablar de “unidad de observación” o

“elemento” para referirse al objeto sobre

el cual se realiza una medición

Page 18: Población y muestra

Población y Universo

Page 19: Población y muestra

Población:

“Conjunto de los individuos o cosas sometidos a una evaluaciónEstadística mediante muestreo”

En cualquier investigación el primer problema que aparece, relacionadocon este punto es la frecuente imposibilidad de recoger datos de todoslos sujetos o elementos que interesen a la misma

Page 20: Población y muestra

Universo Todos los posibles sujetos o medidas de un cierto tipo.la parte del universo a la que el investigador tieneacceso se denomina población

Es un conjunto definido, limitado y accesible del universoque forma el referente para la elección de la muestra.

Es el grupo al que se intentageneralizar los resultados

Page 21: Población y muestra

Investiga….

¿Cómo se delimita una población, desde el tipo de enfoque cuantitativoY cualitativo?

¿qué es un parámetro muestral?

Menciona un ejemplo

¿Cómo seleccionar una nuestra bajo un enfoque cuantitativo?

¿Qué condiciones debe de cumplir una muestra?

Page 22: Población y muestra

Martín Ibáñez, señala las diferencias entre “población” o “universoGeneral” y “universo de trabajo”

• Toda la población a la que queremos extender las conclusiones de la muestra

Población

• Son los casos que de alguna manera tenemos consignados y de los que podemos extraer la muestra

• Base de la muestraUniverso trabajo

Page 23: Población y muestra

• Población de la que se extrae la muestra

Población muestreada

• Entendida como la colección completa de observaciones que deseamos estudiar

Población objetivo

Page 24: Población y muestra

La definición de la población es una parte importante, y con frecuencia difícil, del estudio.

Por ejemplo, en una encuesta política ¿la población objetivo deberíanSer todos los adultos que pueden votar?¿Todos los votantes registrados?¿Todas las personas que votaron en la última elección?

En cualquier caso, la elección de esta población objetivo afectaráprofundamente al resultado de la investigación

Page 25: Población y muestra

Muestreo

Se conoce con el nombre de muestreo al proceso de extracción de unamuestra a partir de una población. El proceso esencial del muestreo consiste en identificar la población que estará representada en el estudio

Entre las ventajas que proporciona el muestreo suele señalarse:

El ahorro de tiempo en la realización de la investigaciónLa reducción de costos yLa posibilidad de mayor profundidad y exactitud en los resultados

Page 26: Población y muestra

Inconvenientes:Dificultad de utilización de la técnica de muestreoUna muestra mal seleccionada o sesgada distorsiona los resultadosLas limitaciones propias del tipo de muestreoTener que extraer una muestra de poblaciones que poseen pocos individuoscon la característica que hay que estudiar

Importancia: No es necesario trabajar con los “N” elementos de una población para comprender con un nivel “razonable” de exactitud la naturaleza delfenómeno estudiado

Page 27: Población y muestra

Muestra

El Diccionario de la Lengua Española (RAE,2001) define la muestra,en su segunda aceptación, como: “parte o porción extraída de un conjunto por métodos que permiten considerarla como representativa de él”

Las muestras tienen un fundamento matemático estadístico.Este consiste en que obtenidos unos determinados resultados de una muestra, hacer la inferencia o generalización fundada matemáticamente de que dichos resultados son válidos para la población de la que se ha extraído la muestra, dentro de unos límites de error y probabilidad, que se pueden determinar estadísticamente en cada caso.

Page 28: Población y muestra

La selección correcta de la muestra implica crear una que represente a la población con la mayor fidelidad posible. Esto conlleva utilizar unastécnicas de selección de la muestra, así como la necesidad de determinarsu tamaño óptimo.

Page 29: Población y muestra

Proceso de selección

Elemento muestral

Es un objeto en el cual se toman las

mediciones, la unidad más pequeña en que

podemos descomponer la muestra

Unidad de muestreo

Unidad donde realizamos la nuestra, está constituida por

grupos excluyentes de elementos de la población que

completan la misma *

Marco de muestreo

La lista de “unidades de muestreo” (familias,

centros educativos, empresas…)

Page 30: Población y muestra

*Por ejemplo, podríamos desear estudiar a un grupo de personas (unaciudad, una barriada, un grupo de estudiantes de un determinado niveleducativo, los trabajadores de un sector de producción, etc.) pero notenemos la lista de todos los individuos que pertenecen a la población.En su lugar las familias, los centros educativos, las empresas…podríanservir como unidades de muestreo.Las unidades de observación o elementos muestrales serían los individuos que viven en una familia o que trabajan en una determinada empresa…La lista de “unidades de muestreo” (familias, centroseducativos, empresas…) constituyen el “marco de muestreo”

Page 31: Población y muestra

Etapas del proceso de muestreo

1) Definición o selección del universo o especificación de los posibles sujetos o elementos de un determinado tipo

2)Determinación de la población o parte de ella a la que el investigador tiene acceso

3)Selección de la muestra invitada o conjunto de elementos de la población

4)A los que se pide que participen en la investigación

5)Muestra aceptante o parte de la muestra invitada que acepta participar

6)Muestra productora de datos; la parte que aceptó y que realmente produce datos

Page 32: Población y muestra

Condiciones que ha de cumplir la muestra

1)Que comprenda parte del universo y no la totalidad de éste2)Que su amplitud sea estadísticamente proporcionada a la magnitud delUniverso.3)La ausencia de distorsión en la elección de los elementos de la muestra.Si esta elección presenta alguna anomalía, la muestra resultará por este mismo hecho viciada.4)Que sea representativa o reflejo fiel del universo, de tal modo que reproduzca sus características básicas en orden a la investigación. Estoquiere decir que si hay sectores diferenciados en la población que se supone ofrecen características especiales, a efectos de los objetivos de lainvestigación, la muestra también deberá comprenderlos y precisamenteen la misma proporción, es decir, deberá estar estratificada como eluniverso

Page 33: Población y muestra

Para cumplir estas condiciones es necesario aplicar unas determinadas técnicas de selección de la muestra que garanticen su representatividad,determinar el tamaño óptimo de la muestra y tener en cuenta el “error muestral”

Page 34: Población y muestra

Tipos o técnicas de muestreo

Probabilístico

Utiliza el azar como instrumento de selección. Mayor rigor científico ya

que todos los elementos de la población tienen la misma

probabilidad de salir elegidos en una muestra

*Muestreo Aleatorio simple*Muestreo aleatorio

sistemático*Estratificado

*Conglomerados o grupos

No probabilístic

o

La muestra se obtiene atendiendo al criterio del

investigador. No utilizan el criterio de equiprobabilidad,

siguen otros criterios, procurando que la muestra

obtenida sea lo más representativa posible

*Muestreo accidental o casual

*Intencional u opinativo*Muestreo por cuotas

Page 35: Población y muestra

Dinámica:

Se numerarán del 1 al 5 y de acuerdo a su número se pondrán en equipos.

Investigarán el tipo de muestreo con los ejemplos correspondientes, en unTérmino de 15 minutos

Regresarán con su equipo original y harán un cuadro comparativoen donde pongan los tipos de muestreos.

Page 36: Población y muestra

Investiga: definición y ejemplos

Muestreo probabilístico

Muestreo aleatorio simple ……………….1

Muestreo aleatorio sistemático………….2

Muestreo por zonas……………………………3

Muestreo aleatorio estratificado………….4

Muestreo por conglomerados………………5

Page 37: Población y muestra

Muestreo no probabilístico

Muestreo por cuotas

Muestreo de opinión o intencional

Muestreo causal o incidental

Muestreo de bola de nueve

Muestreo discrecional

Page 38: Población y muestra

Muestreo probabilístico

Page 39: Población y muestra

Aleatorio

simple

•Todos los elementos tienen la misma probabilidad de ser seleccionados

•Se extraen al azar un número determinado de elementos “n”del conjunto mayor “N”

•La muestra quedará formada por los “n” elementos obtenidos mediante sorteo de la población

Muestreo Aleatorio Sistemátic

o

•Es una variante del anterior tipo. Primero se calcula “I” (frecuencia de los casos) mediante la fórmula I=N/n. Después se elige un número menor o igual que I.

•a, a+I, a+2I, a+3I

Muestreo

estratificad

o

•El elementos en cada estrato (clase) deben ser más semejantes entre si que respecto a la población. Ello conduce a un tamaño más pequeño de la muestra total, o ante igual tamaño, a una mayor precisión que si se selecciona a partir del total de la población.

•Para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que contenga también esos mismos porcentajes de hombres y mujeres.

Muestreo por

conglomerados

•Cuando en lugar de unidades últimas se eligen grupos, bloques o conjuntos de esas unidades, se dice que el muestreo es por conglomerados. Si en lugar de seleccionar de forma aleatoria personas para medir su capacidad adquisitiva o de consumo se seleccionan, por ejemplo, familias, se dice que el muestreo es por conglomerados

Page 40: Población y muestra

Muestreo no probabilístico

Page 41: Población y muestra

Muestreo accidental o

casual•Se utilizan las muestras que se tienen al alcance.•El criterio de selección de los individuos depende de la posibilidad de acceder a ellos•Ejemplo: entrevistar a la salida del metro, o a las personas que pasan por una calle•Se debe cuidar el análisis y la interpretación de datos

Muestreo intencional u

opinático•Se selecciona de modo directo los elementos de la muestra que desea participar en el estudio. Se eligen los individuos o elementos que se estima son representativos o típicos de la población•Se justifica cuando se quieren estudiar elementos excepcionales de cierta población•Ej. Si queremos datos sobre la población delincuente será interesante recurrir a los servicios policiales, a los centros penitenciarios

Muestreo por cuotas

•Cada cuota consiste en un número de elementos que reúnen unas determinadas condiciones. La selección de las “cuotas” suele hacerse mediante “rutas” o “itinerarios”•Por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Zona Esmeralda. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.•La categorización usada puede ser unidimensional (por ejemplo, por edades) bidimensional (por ejemplo, por edad, sexo y escolaridad) o de más dimensiones.

Page 42: Población y muestra

Tamaño de la muestra

•El tamaño de la muestra, un tema que siempre preocupa, no tiene fácil solución y va estrechamente unido a la representatividad. En principio hay que rechazar la idea, demasiado extendida, de que la muestra debe ser proporcional a la población.

•No existe un tamaño ideal de la muestra. A efectos descriptivos, se considera una muestra grande cuando n > 30. •Una muestra debe ser lo suficientemente grande como para ser representativa, pero el número de elementos necesarios paralograr la representatividad varía de una investigación a otra. Cuanto más homogénea es una población en la/s característica/sobjeto de estudio, más fácil resulta obtener muestras representativas sin necesidad de que sean grandes.

Page 43: Población y muestra

•El nivel de confianza que queramos que alcancen nuestros resultados también influye en el tamaño que debamos dar a la muestra. •Entre +2 y -2 sigmas de la curva de distribución normal de Gauss[1], a partir de la media, está incluido el 95.5% de la población. Esto quiere decir que tenemos una probabilidad de que 955/1000 coincidan con los de la población total. •Si queremos alcanzar una mayor certidumbre hemos de abarcar entre +3 y -3 sigmas, en cuyo caso el riesgo de que exista diferencia entre los estadísticos de la muestra y los parámetros de la población sean distintos será de 997/100, pero naturalmente tendremos que elevar el numero de elementos de la muestra.

Page 44: Población y muestra

Determinación estadística del tamaño de la muestra

Conociendo el nivel de confianza que queremos que alcancen los datos se puede aplicar una ecuación matemática para estimar el tamaño de la muestra. Según se trate de poblaciones infinitas o finitas, la determinación variará, según las siguientes ecuaciones:

Page 45: Población y muestra

Si deseamos estimar una proporción, debemos saber:•El nivel de confianza o seguridad (1-a ). El nivel de confianza prefijado da lugar a un coeficiente (Za ):• Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58. •La precisión que deseamos para nuestro estudio. •Una idea del valor aproximado del parámetro que queremos medir (en este caso una proporción). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha información utilizaremos el valor p* = 0.5 (50%).

*Probabilidad de la población que presenta las características. Dicho de una forma más comprensible, es la probabilidad que tiene la muestra en poseer las mismas cualidades de la población (homogeneidad) y está determinada por:

Page 46: Población y muestra

Ejemplo: ¿A cuantas personas tendríamos que estudiar para conocer la prevalencia de diabetes?Seguridad = 95%; Precisión = 3%: Proporción esperada = si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral:

Page 47: Población y muestra

•Za 2 = 1.962 (ya que la seguridad es del 95%)

•p = proporción esperada (en este caso 5% = 0.05) •q = probabilidad de la población que no presenta las características:1 – p (en este caso 1 – 0.05 = 0.95) •d = precisión (en este caso deseamos un 3%)

Page 48: Población y muestra
Page 49: Población y muestra

Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántos del total tendremos que estudiar la respuesta seria:

donde:•N = Total de la población •Za

2 = 1.962 (si la seguridad es del 95%) •p = proporción esperada (en este caso 5% = 0.05) •q = 1 – p (en este caso 1-0.05 = 0.95) •d = precisión (en este caso deseamos un 3%).

Page 50: Población y muestra

¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?

Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral.

Page 51: Población y muestra

Según diferentes seguridades el coeficiente de Za varía, así:•Si la seguridad Za fuese del 90% el coeficiente sería 1.645 •Si la seguridad Za fuese del 95% el coeficiente sería 1.96 •Si la seguridad Za fuese del 97.5% el coeficiente sería 2.24 •Si la seguridad Za fuese del 99% el coeficiente sería 2.576

Page 52: Población y muestra

A) Determinación del tamaño de la muestra para poblaciones infinitas.[ En este caso pueden presentarse dos situaciones:

•A.1) Que conozcamos la proporción de elementos que posee la característica a través de estudios previos. En este caso se aplica la fórmula:

Z" 2 * p * q n = número de elementos que debe poseer la muestra

n = --------------------- " = riesgo o nivel de significación. e2 z" = puntuación correspondiente al riesgo " que se haya

elegido. Por ejemplo, para un riesgo del 5%;

" = 0.05 (Z" = 1.96)

p = % estimado q = 100-p e = error permitido.

Page 53: Población y muestra

A.2. Si desconocemos la proporción de individuos que poseen la característica, se toma p = 50% y q = 50%.

De este modo, el número de elementos óptimo de una muestra, estimando qué proporción de sujetos poseen una característica al nivel de confianza del 99.7% (3 F) y un error de estimación admitido del 2%, será:

32*50*50N = ------------------- = 5625 elementos.

22

Page 54: Población y muestra

•En el caso de que la investigación requiera estimar una media se utiliza la siguiente fórmula:

Z2" * s

2 s2 = Varianza.

n = --------------------- e2

•Determinación del tamaño de la muestra para poblaciones finitas. En este caso se emplea la siguiente fórmula:

Z"2 * p * q * N

n = ----------------------------- e2 (N-1) + Z"

2 p * q

De este modo, el número óptimo para un estudio de 60.000 personas inscritas en cursos de formación, estableciendo un nivel de confianza de 2F (95.5%), y el margen de error en el 3%, sería. Suponemos que la opción por inscribirse en cursos de formación, o no, es del 50%.

4 * 50 * 50 * 60.000

Page 55: Población y muestra

•N = ---------------------------------- = 1091 individuos 9 (60.000-1) + 4 * 50 * 50•

4 * 50 * 50 * 60.000

Page 56: Población y muestra

Referencias

Población y Muestra. Recuperado desde: http://www.google.com.mx/search?hl=es&q=Etapas+del+proceso+investigador.Poblaci%C3%B3n+y+Muestra&meta=&aq=f&aqi=&aql=&oq=&gs_rfai=. El 02 de abril del 2010