seminario v estadística

33
ESTADÍSTICA Seminario V 15/04/2015

Upload: cristina-reguera

Post on 21-Aug-2015

110 views

Category:

Art & Photos


2 download

TRANSCRIPT

ESTADÍSTICASeminario V

15/04/2015

PUNTO 1 Abrimos el fichero y vamos a la vista

variable. cambiamos las escalas de los datos que

nos dan.

PUNTO 2 Consiste en calcular una nueva

variable. Esta nueva variable será el IMC.

IMC: peso/talla al cuadrado.

Para ello clicamos:o 1º transformaro 2º crear una variable

Añadimos los datos del IMC y al darle a aceptar ya tenemos la variable en la pantalla.

Es importante añadirle una etiqueta, y cambiarle la escala si fuera necesario

Lo conveniente sería categorizar la variable numérica, para ello recodificamos una variable distinta. Una vez abierta la pestaña, arrastramos

la variable que queremos categorizar, en este caso IMC.

Para categorizar, clicamos en “valores antiguos y nuevos” A continuación picamos en rango, y le voy

a decir que rango quiero, añadiéndole un valor. Y así con todos.

Ej: 10-15.99 – delgadez severa valor 1

VARIABLES EMPLEADAS

10-15.99 – delgadez severa valor 1 16-16.99 – delgadez moderada valor 2 17 – 18.49 – delgadez aceptable valor 3 18.5 – 24.99 – normopeso valor 4 25 – 29.99 – sobrepeso valor 5 30 – 34.99 – obesidad GRADO I valor 6 35-39.99 – Obesidad GRADO II valor 7 40 – 70 – obesidad GRADO III valor 8

Así quedaría en vista de datos:

Vamos a vista variable de nuevo y: Quitamos los decimales ya que no tiene

sentido pues la hemos categorizado, ya no trabajamos con números.

Cambiamos la escala, poniéndola en ordinal.

Añadimos los valores utilizados.

PUNTO 3

Una vez terminado esto nos vamos a dedicar a la pestaña analizar.

Vamos a crear una tabla a través de estadísticos descriptivos, haciendo tablas cruzadas.

Se trata de una tabla 2x2 nominal/nominal (nos mezcla dos o mas variables de tipo nominal). Esta compuesta por dos columnas o dos filas entrecruzadas.

Ponemos la variable sexo en filas, y la variable hábito tabáquico en columnas:

Como queremos que a nuestra tabla la acompañe un gráfico le damos a mostrar gráficos de barras agrupadas:

Este es el resultado:

La primera tabla es par que sepamos los datos con los que hemos trabajado.

La segunda tabla es la nuestra, la que hemos creado.

Y al final vemos el gráfico de barras apiladas de nuestra tabla y lo ha categorizado por las filas.

Después, comprobamos que una tabla 2x2 no funciona con variables de tipo cuantitativo. Nos dan datos erróneos ya que sirven para dar datos de las cosas, no valores. Se usan para variables CUALITATIVAS.

A continuación hicimos una tabla con una variable nominal y otra ordinal.

Este es el resultado:

Tenemos un perdido. Habría que averiguar si esa persona no contestó o si se nos pasó de introducir los datos.

Parece que las mujeres tienen mas tendencia al sobrepeso que los hombres.

El IMC predominante como podemos ver es: mujeres: normopeso. hombre se maneja con sobrepeso, normopeso y en menor

medida obesidad grado I, los demás valores quedan lejos.

Si le damos la vuelta a las variables, obtenemos una tabla mejor, pero sin embargo un gráfico que resume peor que el otro.

Tabla de datos tipo cuantitativo. O tablas de contribución.

Elegimos tres variables cuantitativas. A continuación picamos en estadísticos

para obtener: media, cuartiles, desviación estándar.

A continuación pinchamos en gráfico: y el gráfico que mejor le va es el histograma:

La primera tabla nos da los datos con los que trabajamos:

Como podemos ver la media es de 42.65, si la desviación típica es de 16.032, podemos decir que la edad media es de 42.65+- 16

La segunda nos da nuestra tabla, la que hemos creado.

La segunda tabla:

Y después tenemos los gráficos, donde la mayoría de los datos están dentro de la campana:

ANÁLISIS DESCRIPTIVO

A continuación realizamos un análisis descriptivo.

Y obtenemos la tabla que se muestra a continuación.

EXPLORAR

Ahora le damos a explorar para obtener datos ordenados de dos variables distintas, en este caso edad e IMC.

Le damos para obtener descriptivos y percentiles

Resultados:

PODEMOS VER QUE A MAYOR EDAD, MAYOR PESO.

También hemos obtenido los percentiles y el gráfico. Este gráfico se denomina “de cajas y

bigotes”

Vamos a hacer los mismo pero con menos categorías:

El intervalo de confianza, son dos valores en los que hay una probabilidad del 95% de que el peso que yo busco para el hombre esté entre esos dos valores.

GRÁFICOS RESULTANTES

Podemos ver que en los valores mínimos no se diferencian mucho los hombres y mujeres. Se diferencian mas en los valores altos.

Podemos ver que en el paciente 198, 131 y 98, poseen valores altísimos, que no se corresponden con la media de la población. Son datos fuera de la norma.

PUNTO 5. GRÁFICOS.

En esta última parte del seminario, hemos realizado varios tipos de gráficos distintos.

Una vez que hemos elegido el tipo de gráfico, elegimos las variables que queremos que aparezcan.

LE DAMOS PARA QUE NOS LO EXPRESE EN PORCENTAJES

RESULTADO

GRÁFICO DE BARRAS.

Ahora realizamos un gráfico de barras, para ver mejor los resultados.

BARRAS AGRUPADAS

OBTENEMOS

Hasta aquí el fin del V seminario.

Espero que todo os haya quedado claro.

¡UN SALUDO!