actividad_p2p

4
Actividad P2P PARTE 1: Genere un breve informe estadístico descriptivo, a partir de la salida de ordenador que se adjunta (tómese el espacio que necesite pero sea breve), en el que señale: 1) el tamaño muestral, 2) cuál es la variable con mayor variabilidad, 3) cuál de las medias es más representativa de los datos y 4) cuál de las medias es más estable. Se trata de un estudio que contiene mediciones del contenido de monóxido de carbono, peso, alquitrán, la nicotina y clase de las muestras de 25 tipos de cigarrillos. Los valores con mayor variabilidad los encontramos en el alquitrán ya que está influenciada por valores extremos, por ello tiene un mayor coeficiente de variabilidad -49,73%- respecto a la nicotina -40,73%- y el peso -9,04%-. Asimismo la desviación típica muestra un claro grado de dispersión de esta variable 5,87634. El peso sería la variable más representativa con valores reducidos en su desviación típica, mientras que la nicotina a partir de la media y su error típico concluimos que sería la variable más estable con -0,946- respecto al alquitran-12,99- o el peso -0,98-.

Upload: abel-henarejos-almagro

Post on 16-Jan-2016

3 views

Category:

Documents


0 download

DESCRIPTION

j

TRANSCRIPT

Page 1: actividad_p2p

Actividad P2P

PARTE 1: Genere un breve informe estadístico descriptivo, a partir de la salida de ordenador que se adjunta (tómese el espacio que necesite pero sea breve), en el que señale:

1) el tamaño muestral,

2) cuál es la variable con mayor variabilidad,

3) cuál de las medias es más representativa de los datos y

4) cuál de las medias es más estable.

Se trata de un estudio que contiene mediciones del contenido de monóxido de carbono, peso, alquitrán, la nicotina y clase de las muestras de 25 tipos de cigarrillos.

Los valores con mayor variabilidad los encontramos en el alquitrán ya que está influenciada por valores extremos, por ello tiene un mayor coeficiente de variabilidad -49,73%- respecto a la nicotina -40,73%- y el peso -9,04%-. Asimismo la desviación típica muestra un claro grado de dispersión de esta variable 5,87634.

El peso sería la variable más representativa con valores reducidos en su desviación típica, mientras que la nicotina a partir de la media y su error típico concluimos que sería la variable más estable con -0,946- respecto al alquitran-12,99- o el peso -0,98-.

Parte 2. Analice los percentiles a partir de la tabla correspondiente que aparece debajo. Escriba un breve informe con los resultados más relevantes entre los que al menos debe estar la Mediana y el Recorrido intercuartílico (debe calcularlo a partir de la tabla) para todas y cada una de las variables. En el informe compare, además, los resultados obtenidos con la Media y su dispersión y la Mediana y su dispersión.

Page 2: actividad_p2p

La mediana corresponde al valor situado en el centro. Es el valor que deja por debajo a la mitad de las observaciones y por encima a la otra mitad. Por lo tanto el valor de la mediana de cada variable recae sobre su propio percentil 50.

Junto a la mediana incorporamos e R.I que prescinde de valores situados en ambos extremos concentrando la información en los valores centrales.

Recorrido intercuartilicoMonóxido de carbono 5,9

Alquitran 7,25Nicotina 0,62

Peso 0,09

Ya que la muestra de pacientes es pequeña y existen valores extremos en el caso del alquitrán, sería interesante considerar el uso de la mediana junto con el recorrido intercuartilico como medida de tendencia central, aunque ello dependerá del objetivo del estudio.

Con estos resultados obtenidos sobre la variable del alquitrán deducimos unos valores más estables con esta medida que con respecto a la media y desviación típica.

Con ambas medidas de tendencia central conseguimos resultados similares en el peso y nicotina y una ligera diferencia en el monóxido de carbono, indicando una mejor estabilidad con la mediana y recorrido intercuartilico por la presencia de resultados aberrantes en esta variable.

Page 3: actividad_p2p

Parte 3. Analice los Box plot (diagramas de caja) que se adjuntan y saque las conclusiones más relevantes. Debe escribir, al menos, sobre la posible asimetría y la existencia, o no, de outliers

1. A simple vista todas las variables son asimétricas, con sus distintos grados de dispersión, outliers y los sesgos que esto pueda generar en el análisis.

2. La variable Alquitrán muestra una asimetría en cuanto a su distribución, con mayor número de valores inferiores al percentil 25, y una mediana que representa en mayor parte a los valores superiores de esta muestra.

3. La Nicotina tiene una menor dispersión que acompaña aproximadamente el valor de la mediana, según su recorrido intercuartilico.

4. El alquitrán tiene un outlier por encima de los bigotes de la caja5. la nicotina tiene un outlier muy por encima de los bigotes de la caja y otro por debajo

de los bigotes de la caja 6. el peso tiene outliers menos distantes por encima y debajo de los bigotes de la caja.