capítulo 2 fundamentos de estadística y biometría.pdf

15
46 Epidemiología, Biometría Y Estadística | www.cvudes.edu.co La estadística se constituye como la herramienta necesaria para el análisis de los datos producto de los estudios de eventos en poblaciones de interés. Los resultados de los estudios epidemiológicos realizados en muestras poblacionales, permiten inferir los resultados a la población blanco. Las variables se clasifican de acuerdo a su naturaleza (cualitativa y cuantitativa), escala de medición (nominal, ordinal, intervalo y razón) y su interrelación (dependiente e independiente). Las tablas de distribución de frecuencia incluyen la frecuencia absoluta, frecuencia relativa, frecuencia acumulada y frecuencia relativa acumulada. Los gráficos se utilizan para describir las variables cualitativas y cuantitativas. Entre ellos se encuentran los gráficos de sectores, diagramas de barras, histogramas, entre otros. Las medidas de resumen permiten analizar descriptivamente los datos. Se encuentran las medidas de tendencia central, de dispersión, de forma y de posición. F UNDAMENTOS DE E STADÍSTICA

Upload: pabloagamezhernandez

Post on 15-Jul-2016

25 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

46Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

La estadística se constituye como la herramienta necesaria

para el análisis de los datos producto de los estudios de eventos en

poblaciones de interés.

Los resultados de los estudios epidemiológicos realizados

en muestras poblacionales, permiten inferir los resultados a la

población blanco.

Las variables se clasifican de acuerdo a su naturaleza (cualitativa

y cuantitativa), escala de medición (nominal, ordinal, intervalo y

razón) y su interrelación (dependiente e independiente).

Las tablas de distribución de frecuencia incluyen la frecuencia

absoluta, frecuencia relativa, frecuencia acumulada y frecuencia

relativa acumulada.

Los gráficos se utilizan para describir las variables cualitativas

y cuantitativas. Entre ellos se encuentran los gráficos de sectores,

diagramas de barras, histogramas, entre otros.

Las medidas de resumen permiten analizar descriptivamente los

datos. Se encuentran las medidas de tendencia central, de dispersión,

de forma y de posición.

FUNDAMENTOSDE ESTADÍSTICA

Page 2: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

47Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Page 3: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

48Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

2. FUNDAMENTOS DE ESTADÍSTICA

Se presentan conceptos referentes a la estadística descriptiva e

inferencial, así como a las poblaciones y muestras de estudio. Se rea-

liza una descripción de los datos continuos y discretos, además de las

tablas de distribución de frecuencia. Posteriormente se presentan los

tipos de gráficos más utilizados para la descripción de los resultados

en investigación, al igual que las recomendaciones para el tipo de va-

riable para las que estos son de utilidad. Por último se presentan las

principales medidas de resumen que permiten presentar unos datos

de una manera adecuada.

2.1. Generalidades

Teniendo en cuenta que desde el enfoque cuantitativo, el

estudio de los eventos en salud incluyen el estudio de la magnitud

de la observación y la variabilidad de esta; la estadística ofrece una

herramienta necesaria para la toma de decisiones. Martínez-Gonzáles,

Sánchez-Villegas, & Faullín-Fajardo, (2006). De esta forma, los estudios

se realizan en muestras de la población, con el objetivo de realizar

inferencia o extrapolación de los resultados a la población en general.

Page 4: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

49Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

2.2. Poblaciones y Muestras

MuestreoInferenciaEstadistica

Población: conjunto de todos los individuos o elementos que

cumplen ciertas características. Ej: Estudiantes de pregrado de la

Universidad de Santander.

Muestra: Subconjunto de la población extraído mediante una

técnica de muestreo. Ej: 358 estudiantes mayores de 18 años escogidos

aleatoriamente.

Figura 7. Modelo de Indiferencia Estadística

Nota Fuente: Hernández, L. (2015). Estadística inferencial. Universo fórmulas. Recu-perado de: http://www.universoformulas.com/estadistica/inferencia/

Población

Muestra

Page 5: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

50Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Nominal-ordinal-de intervalo (o intervalo igual)-de razón.

En el capítulo 2 se describieron los tipos de variables y las escalas

de medición. La escala de medición de las variables categóricas o

cualitativas puede ser nominal y ordinal, sin embargo, las categorías

dentro de cada una pueden ser dicotómicas y politómicas.

Dicotómicas: si/no, hombre/mujer

Politómicas: Se incluye más de dos posibles categorías. Ej: Grupo

sanguíneo (A, B, AB, O).

2.3. Estadística Descriptiva e Inferencial

Descriptiva: Incluye la recolección, clasificación, representación

y resumen de la información contenida en unos datos. Utiliza

el cálculo de índices estadísticos y representaciones gráficas.

Martínez-Gonzáles, Sánchez-Villegas, & Faullín-Fajardo, (2006).

Inferencial o Analítica: Pretende demostrar asociaciones o

relaciones entre las características observadas. Contempla la

comprobación de hipótesis y la estimación de intervalos de

confianza.Martínez-Gonzáles, Sánchez-Villegas, & Faullín-

Fajardo, (2006).

2.4. Escala de Medición

Page 6: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

51Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

2.5. Datos Continuos y Discretos

Las variables cuantitativas o numéricas se agrupan de acuerdo a

su escala de medición en razón e intervalo, sin embargo, se pueden

encontrar de dos tipos:

Discretas: Valores numéricos finitos y enteros. Ej: número de hijos.

Continuas: Valores numéricos que incluyen o pueden incluir

decimales de acuerdo a la precisión de la medición. Ej: Peso

Page 7: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

52Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

2.6. Distribuciones de Frecuencia

Hace referencia al número absoluto de datos cualitativos o

cuantitativos de cada categoría.

Ej: número de casos de malaria, número de casos de dengue, etc.

A continuación se presentan las principales medidas de distribución de

frecuencia.

Es el número de observaciones de un evento expresado en forma de

proporción respecto al total.

Ej: Proporción de casos de malaria respecto al total de la población.

Es el total de sujetos o frecuencia para la categoría sumado a las

frecuencias de las categorías anteriores.

Corresponde al porcentaje de frecuencia relativa de cada categoría

más el de las categorías anteriores.

2.6.1. Frecuencia absoluta

2.6.2. Frecuencia relativa.

2.6.3. Frecuencia acumulada.

2.6.4. Frecuencias realtiva acumulativa.

Tabla 2. Tabla de Frecuencia de la Variable Edad Nota Fuente: Elaboración Propia del Autor

Page 8: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

53Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Se conoce también como gráfico de pastel, en el cual se representa

mediante una circunferencia en donde los 360° corresponden al 100% de

los datos y cada una de las categorías de las variables corresponderá a

una porción o a un sector del pastel.

Es de gran utilidad para describir datos cualitativos y no se

recomienda para variables con más de cinco categorías.

A continuación se presentan las principales gráficas para descripción de

datos cualitativos y cuantitativos.

FútbolTenisBaloncestoAtletismoNatación

Representa gráficamente la distribución de frecuencia de un

conjunto de datos y permite comparar dos o más valores. Se recomienda

para variables cualitativas nominales y ordinales. En este tipo de gráficos

el eje horizontal corresponde a cada una de las categorías de la variable y

en el eje vertical se grafican los valores de frecuencia de cada categoría.

Martínez-Gonzáles, Sánchez-Villegas, & Faullín-Fajardo, (2006).

2.7.1. Gráfico de sectores.

2.7.2. Diagrama de barras.

2.7. Gráficas

DEPORTES PRACTICADOS

EDAD AGRUPADA POR SEXO

Figura 9. Gráfico de Sectores para Representar la Frecuen-cia de Práctica de Deportes

Nota Fuente: Elaboración Propia del Autor

Figura 10. Diagrama de Barras

Nota Fuente: Elaboración Propia del Autor

Page 9: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

54Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Tipo de gráfico parecido al diagrama de barras, que presenta las

barras de manera consecutiva. Es útil para variables cuantitativas de

intervalo o razón. En el eje vertical se debe iniciar siempre en cero y en

el eje horizontal se grafican los valores correspondientes a las categorías

de la variable a describir.

Tipo de gráfico en el que la representación se realiza mediante una

línea que une los puntos medios de las barras del histograma. Es útil

para variables numéricas.

2.7.3. Histogramas.

2.7.4. Polígonos de frecuencia.

Figura 11.Histograma

Nota Fuente: Romero, E. (2009). Un histograma con ta-bla dinámica en Excel. Recuperado de: http://excelforo.blogspot.com.co/2009/11/un-histograma-con-tabla-di-namica-en.html

Figura 12. Polígono de Frecuencia

Nota Fuente: Elaboración Propia del Autor

Page 10: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

55Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Consiste en un tipo de gráfico que también brinda información de

la distribución de frecuencia de la variable. Se construye separando los

dígitos de cada número y colocando el primero como tallo y el último

dígito como hoja. Ej: para los datos 8, 10, 15, 15, 15, 15, 20, 20, 20, 20, 25,

30, 35, 40, 40 y 45.

2.7.5. Diagrama de Tallo y Hojas.

Figura 13. Diagrama de Tallo y Hojas

Nota Fuente: Martínez-Gonzáles, Sánchez-Villegas, &

Faullín-Fajardo, (2006).

Page 11: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

56Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

2.8. Medidas de Resumen

Las medidas de tendencia central son útiles para la descripción

de datos numéricos y estiman el valor típico o representativo de la

muestra. Martínez-González, (2006).

Media: Se considera la principal medida de tendencia central y

refleja el promedio de los datos. Se obtiene sumando todos los datos y

dividiendo por el número total de datos u observaciones.

Mediana: Para obtener la mediana, se deben ordenar por orden

ascendente los datos a describir. Posteriormente se ubica el dato que se

encuentra en la posición central, es decir, el dato que permite separar la

mitad de los datos por debajo y por encima.

Moda: El dato que se encuentra con mayor frecuencia dentro de un

grupo de datos. En caso de que sean dos valores los que se repiten el

mismo número de veces, se considera que la distribución es bimodal.

Ejemplo:

De las siguientes edades correspondientes a 17 trabajadores,

calcular la moda, la media y la mediana.

Para calcular la mediana se ordenan los valores de menor a mayor

y se busca la posición que divide el 50% de la población. En este caso el

17 corresponde a un número impar y por tanto la posición 9 divide los

valores dejando 8 datos por debajo y 8 datos por encima.

Moda = 57 y 58 años

Es bimodal pues las edades de 57 y 58 años son las que se repiten con

mayor frecuencia.

A continuación se presentan las principales medidas de resumen:

Para calcular la media o promedio

se debe sumar cada uno de los valores

y dividir por el número total de datos:

50+51+51+52+52+54+55+55+56+56+5

7+57+57+58+58+58+59 = 936 / 17 = 55,06.

Promedio= 55,06 años

Mediana = 56 años.

Edad Frecuencia

50 151 252 254 155 256 257 358 3

59 1

2.8.1. Medidas de tendencia central.

Page 12: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

57Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Desviación Estándar: Corresponde a la raíz cuadrada de la varianza

y permite evidenciar que tan dispersos están los valores respecto a la

media. Se calcula como la raíz cuadrada de la varianza.

Varianza: Corresponde al cuadrado de la desviación estándar y se

calcula como el promedio de las desviaciones de cada valor respecto a

la media, elevado al cuadrado. Martínez-González, (2006).

Son útiles para describir la posición de un valor respecto al total de

los datos. “Este puesto o posición se expresa como la proporción de los

datos que queda por debajo del valor que nos interesa. A esta cantidad se

le llama percentil” Martínez-González, (2006).

El conjunto de datos ordenados ascendentemente también se puede

dividir en cuatro grupos iguales y a cada grupo de datos se denomina

“Cuartil”. De esta forma, el primer cuartil comprende hasta el percentil

25 y el segundo cuartil hasta el percentil 50. Si el conjunto de datos se

divide en cinco grupos con el mismo número de observaciones, al

primer grupo se llamará “Primer Quintil” y corresponde al percentil 20.

2.8.2. Mediciones de dispersión. 2.8.3. Medidas de posición relativa.

A continuación se presentan las principales medidas de dispersión:

Page 13: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

58Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Simetría: Se considera que la distribución de los datos es simétrica,

cuando se distribuyen de manera uniforme hacia la derecha y la izquierda

de la media; es decir, cuando la distribución de los datos se ajusta a

la distribución normal. Si los datos se distribuyen hacia la derecha o

izquierda, se considera que presenta asimetría hacia la derecha o hacia

la izquierda, según corresponda.

Curtosis o apuntamiento: Corresponde al achatamiento de la

curva de distribución de los datos, por tanto, se espera que la curtosis

no sea tan grande.

De esta forma, se encuentran las siguientes clases:

2.8.4. Medidas de la forma de una distribución.

Figura 14.Medida de Forma- Simetría

Nota Fuente: Elaboración Propia del Autor

Figura 15.Medidas de la Forma de una Distribución

Nota Fuente: Medidas de Distribución- Asimetría y Curtosis. Recuperado de: http://www.spssfree.com/curso-de-spss/analisis-descriptivo/medidas-de-dis-tribucion-curtosis-asimetria.html

A continuación se presentan las principales medidas de forma:

Page 14: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

59Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Enfoque Cuantitativo

Datos

Discretos

Continuos

Frecuencia

Medidas Resumen

Medidas de Tendencia Central

FUNDAMENTOSDE ESTADÍSTICA

Page 15: Capítulo 2 Fundamentos de Estadística y Biometría.pdf

60Epidemiología, Biometría Y Estadística | www.cvudes.edu.co

Gordis, L. (2005). Epidemiología 3. Madrid, España: Elservier.

Martínez-Gonzáles, M. A., Sánchez-Villegas, A., & Faullín-Fa-

jardo, J. (2006). Bioestadística amigable. Madrid, España: Diaz de

Santos.FUNDAMENTOSDE ESTADÍSTICA