seminario 6 tics

16
Seminario 6 TICS Análisis exploratorio de datos Tablas de frecuencias, resúmenes numéricos y gráficos.

Upload: anpeca

Post on 13-Apr-2017

68 views

Category:

Health & Medicine


0 download

TRANSCRIPT

Page 1: Seminario 6 tics

Seminario 6 TICS

Análisis exploratorio de datos Tablas de frecuencias,

resúmenes numéricos y gráficos.

Page 2: Seminario 6 tics

Ejercicio número 1 :• Selecciona dos variables cualitativas-factor

del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas.

Page 3: Seminario 6 tics

Ejercicio número 1 :• Las dos variables cualitativas o factores que

utilizaremos para resolver el ejercicio son : a) Uso de preservativo b) empleo de la “marcha atrás”

Page 4: Seminario 6 tics

Ejercicio número 1 :Procedemos a realizar una interpretación de ambas distribuciones:

a) Uso de preservativo:

• Un 61’57% de la muestra SIEMPRE utiliza preservativo en sus relaciones sexuales.

• Tan solo un 4’71% de la muestra afirma no haber utilizado nunca este método anticonceptivo.

• Más de la mitad de la muestra ha usado el preservativo como método anticonceptivo en sus relaciones sexuales (92.94%)

Page 5: Seminario 6 tics

Ejercicio número 1 :b) empleo de la “marcha atrás”:

• Más de la mitad de la muestra (50’96%) nunca ha realizado esta conducta de riesgo.

• Un 41’83% de la muestra ha practicado el coito interrumpido alguna vez

• Tan solo un 4’43% de la muestra utiliza en el 100% de sus relaciones sexuales esta práctica como “método anticonceptivo”.

Page 6: Seminario 6 tics

Ejercicio número 2:• Selecciona dos variables numéricas

del fichero “activossalud.RData”, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas.

Page 7: Seminario 6 tics

Ejercicio número 2:• Realizamos los resúmenes numéricos de dos de

las variables cuantitativas de nuestra base de datos, en este caso hemos escogido las variables : a) Altura y B) peso.

• Peso: vector numérico, unidades kg• Altura: vector numérico, unidades metros

Page 8: Seminario 6 tics

Ejercicio número 2:Estudiaremos medidas de resumen o medidas descriptivas numéricas que son de tres tipos:

• Las que ayudan a encontrar el centro de la distribución, llamadas medidas de tendencia central.

• Las que miden la dispersión, llamadas medidas de dispersión.

• Las que describen la posición relativa de una observación dentro del conjunto de datos, llamadas medidas de posición relativa.

Page 9: Seminario 6 tics

Ejercicio número 2:• 1. Medidas de Tendencia Central :Son valores numéricos que quieren mostrar el centro de un conjunto de datos, nos interesan especialmente: la media (o promedio) y la mediana.

En cuanto a la variable “altura” : Encontramos que la media de la altura de nuestras muestra es de 1’667 metros, que difiere un poco de la mediana , cuyo valor central se encuentra en 1’655 metros. Solo una persona no ha contestado.

Por otro lado, en cuanto a la variable “peso”, observamos que el peso medio de los alumnos de la muestra se encuentra en 62’755 kg y el valor central o mediana se halla en 60’00 kg. 16 personas no contestaron sobre su peso.

Page 10: Seminario 6 tics

Ejercicio número 2:• 2) Medidas de Dispersión:. Rango: Es la medida de variabilidad o dispersión más simple. Se calcula tomando la diferencia entre el valor máximo y el mínimo observado. Rango = Máximo – Mínimo

3) Medidas de posición:.Cuartiles: Cuando se dividen un conjunto ordenado de datos en cuatro partes iguales, los puntos de división se conocen como cuartiles y los representamos por Q1, Q2 y Q3.

En relación a esto, podemos comentar que:

Page 11: Seminario 6 tics

Ejercicio número 2: En cuanto a la desviación, en la altura es de 0’08, mientras que en

el peso es de 12’66. Esto nos dice que los valores en el peso están mucho más dispersos que con respecto a al altura.

El máximo del peso se sitúa en 130 kg, la altura máxima se corresponde con 2m.

El peso mínimo es 38kg, mientras que la mínima altura es de 1’46m.

La muestra por tanto es más homogénea con respecto a la altura que con respecto al peso.

Observamos también los datos de los cuartiles Q1,Q2 y Q3 en nuestra tabla, que coinciden con los valores el 25, 50 y 75% respectivamente y de los cuales el Q2 es la mediana o valor medio, que en cuanto al peso es 60kg y en cuanto a la altura es 1’65m.

Page 12: Seminario 6 tics

Ejercicio número 3:• Debes realizar al menos un gráfico de cada

tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos

Page 13: Seminario 6 tics

Ejercicio número 3:• Variables cualitativas-factor: Gráficos de sectores- Variable utilizada: botellónEn nuestro gráfico observamosQue aproximadamente un 35% de losencuestados solo realizan botellón losFines de semana, mientras que un 20% nunca han realizado esta práctica. Porotro lado, observamos que el porcentajede usuarios que lo realizan durante lasemana o a diario no supera un 5%

Page 14: Seminario 6 tics

Ejercicio número 3:• Variables cualitativas-factor: Gráficos de barras -Variable utilizada: cervezaEn nuestro gráfico de barras se observaQue la mayoría de nuestros encuestadosNunca beben cerveza, y que solo una minoría la consume a diário.Solo unos 18 encuestados la toman algunavez y aquellos que la beben de 2 a 3Veces en semana varían desde 9 a 20 Personas aproximadamente.

Page 15: Seminario 6 tics

Ejercicio número 3:• Variables numéricas : Histograma de frecuencias - Variable utilizada: horas de prácticas deportivas

En nuestro histograma apreciamos que la mayoría de los encuestados no superanlas 5 horas de prácticas deportivas semanales, siendo más frecuente unapráctica de 2h semanales (más de 150personas), y lo menos frecuente, superar las 10-15 horas de ejercicio físico a la semana, lo cual solo lo realiza una minoría casi inapreciable.

Page 16: Seminario 6 tics

Ejercicio número 3:• Variables numéricas :Diagrama de cajas o bigote- Variable utilizada: alturaSacamos tres sujetos fuera denuestra gráfica ya que se salen de nuestros valores y alterarían la grafica.- El valor maximo es 1’46 aprox. MientrasQue el mínimo es 2m aprox.-El 25% de los individuos presentan una altura de 1’6m y la mediana se corresponde Con 1’65m-El 71% de los alumnos tienen una alturaDe 1’75m.Los valores están distribuidos proporcionalmente yNo muy dispersos entre 1’6 y 1’7m.