actividad p2p-carlos
DESCRIPTION
EstadisticaTRANSCRIPT
Actividad P2PNombre: Carlos Ivn Diaz LinaresTarea.Hacer un estudio descriptivo de las variables que intervienen en el estudio. La realizacin de esta tarea ir en un documento a parte que tendrs que subir en el apartado "Fichero opcional" que se encuentra al final de la actividad p2p. Este documento tendr 3 partes:
PARTE 1:
Genere un breve informe estadstico descriptivo, a partir de la salida de ordenador que se adjunta (tmese el espacio que necesite pero sea breve), en el que seale: 1) el tamao muestral, 2) cul es la variable con mayor variabilidad, 3) cul de las medias es ms representativa de los datos y 4) cul de las medias es ms estable.
Respuesta:
PreguntaRespuesta
Tamao muestral25
Variable con mayor variabilidadAlquitrn
Media ms representativa de los datosPeso
Media ms establePeso
Parte 2. Analice los percentiles a partir de la tabla correspondiente que aparece debajo. Escriba un breve informe con los resultados ms relevantes entre los que al menos debe estar la Mediana y el Recorrido intercuartlico (debe calcularlo a partir de la tabla) para todas y cada una de las variables. En el informe compare, adems, los resultados obtenidos con la Media y su dispersin y la Mediana y su dispersin.
VariableMedianaQ3-Q1Recorrido Inter cuartilico
Monox. Carb1316.65-9.755.9
Alquitrn12.415.15-7.97.25
Nicotina0.901.03-0.680.35
Peso0.95731.016-0.9200.096
MediaDesvi tpicaMedianaDispersion
Alquitrn11.81605.8712.47.25
Nicotina0.876000.350.900.35
Peso0.9702840.870.95730.096
Monox. carb12.52804.73135.9
Para la variable monxido de carbono, tanto la media como la mediana seran buenos indicadores de tendencia central.Para las otras 3 variables, presentan una distribucin asimtrica, por lo que la media tendera a sesgar los resultados. En estos casos, la mediana se ajusta mejor. La presencia de dos puntos extremos en las variables nicotina y peso del cigarro, as como el punto extremo que aparece en la variable alquitrn cuando todos los valores tienden a estar representados por debajo del 25% hace que la media falsee el resultado.
Parte 3. Analice los Box plot(diagramas de caja) que se adjuntan y saque las conclusiones ms relevantes. Debe escribir, al menos, sobre la posible asimetra y la existencia, o no, de outliers
VariableAsimetraDispersinValores discordante
MonxidoSimtricoElevado valor de dispersin16 sera el valor discordante
AlquitrnAsimtrico Elevado valor de dispersinValor discordante 3
NicotinaAsimtricoBajo valor de dispersinPuntos extremos 3
Peso CigarrilloAsimtricoElevado valor de dispersinPuntos extremos 3 y 16
Como vemos los valores en 3 y 16 se repiten en todos, por lo que quiz no estn recogidos mal los datos y sean unos datos que puedan deberse en algunos casos el aumento de nicotina para crear adiccin en el consumidor. Es algo que queda pendiente de estudio.