contenido 1 estadística 1 análisis de datos con · pdf fileanálisis de...

11
1 Análisis de datos con SPSS ESTADÍSTICA 1 Máster en Salud Respiratoria 2007-2008 Introducción al SPSS Organización del SPSS l Ventanas l Barra de herramientas l Cuadros diálogo Lectura de ficheros en SPSS l ¿Qué es un fichero/matriz de datos? l Creación de un fichero de datos l Lectura de un fichero de datos CONTENIDO 1 INTRODUCCIÓN AL SPSS SPSS: S tatistical P ackage for the S ocial S ciences Programa (software) estadístico : l Gestionar bases de datos l Describir y resumir los datos l Medidas de tendencia central, dispersión, localización,... l Representaciones gráficas l Análisis estadístico Existen otros: l SAS, S-Plus, Stata, Epi-info, Minitab,... INTRODUCCIÓN AL SPSS l Dispone de: l Tutorial l Página web : www.spss.com l Manual de sintaxis ..... INTRODUCCIÓN AL SPSS l TUTORIAL ORGANIZACIÓN DEL SPSS Ventanas l Ventana de datos (variables y casos) (*.sav) l Ventana de resultados (*.spo) l Ventana de sintaxis (programación) (*.sps) Barra de herramientas Cuadros de diálogo

Upload: lamthien

Post on 18-Feb-2018

231 views

Category:

Documents


1 download

TRANSCRIPT

1

Análisis de datos con SPSS

ESTADÍSTICA 1

Máster en Salud Respiratoria 2007-2008

Introducción al SPSS

Organización del SPSSl Ventanasl Barra de herramientasl Cuadros diálogo

Lectura de ficheros en SPSSl ¿Qué es un fichero/matriz de datos?l Creación de un fichero de datosl Lectura de un fichero de datos

CONTENIDO 1

INTRODUCCIÓN AL SPSS

SPSS: Statistical Package for the Social Sciences

Programa (software) estadístico :l Gestionar bases de datosl Describir y resumir los datos

l Medidas de tendencia central, dispersión, localización,...

l Representaciones gráficas

l Análisis estadístico

Existen otros:l SAS, S-Plus, Stata, Epi-info, Minitab,...

INTRODUCCIÓN AL SPSS

l Dispone de:l Tutoriall Página web : www.spss.coml Manual de sintaxis.....

INTRODUCCIÓN AL SPSS

l TUTORIAL

ORGANIZACIÓN DEL SPSS

Ventanasl Ventana de datos (variables y casos) (*.sav)l Ventana de resultados (*.spo)l Ventana de sintaxis (programación) (*.sps)

Barra de herramientas

Cuadros de diálogo

2

VENTANA DE DATOS: nombre.SAV

Nombre fichero

Variables

Casos

Datos

VENTANA DE DATOS: nombre.SAV

Informaciónsobre lasvariables

Nombre Valores

Etiqueta Identificadoresde valores

missing

VENTANA DE RESULTADOS: nombre.SPO

Navegador

Objetos

Se edita fácilmente

con muchas

opciones:

• gráficas

• estilo

• impresión

• etc...

Memoriza los últimos análisis

realizados

VENTANA DE RESULTADOS: nombre.SPO

• Es aconsejable, una vez se ha comprobado que el análisis es correcto, crear la

sintaxis de los análisis realizados,

• Permite más análisis no disponibles entre las ventanas de Windows visibles

• Permite realizar fácilmente análisis parecidos, o modificar rápidamente una

sintaxis ya programada anteriormente

EJECUTAR !!!!!EJECUTAR !!!!!

VENTANA DE COMANDOS: nombre.SPS

Añadir comentarios con *

Programar anàlisis:

las sentencias se finalizan con .

BARRA DE HERRAMIENTAS

Existe una barra en cada ventanaDatos

Resultados

Sintaxis

3

BARRA DE HERRAMIENTAS

Ventana de datos

Abrir, salvar,

imprimir datos,

resultados y gráficos

ModifIcar, cortar, copiar,

pegar, encontrar texto

y datos

Menus y botones de

estado, tamaño, fuentes, vista

general

Análisis estadístico: descriptivos, modelos…

Creargráficos

Información sobre la base

de datos

Administrador de ventanas

Ayuda (F1),

tutorialDefinir, ordenar,

seleccionar datos. juntar

archivos

Archivo Edición Ver Datos Transformar Analizar Graficos Util. Ventanas ?

Transformar, calcular,

crear variables y

valores usando

expresiones y funciones

CUADROS DIÁLOGO

l Para la selección de variables y especificaciones opcionales

Contiene la información recogida para todos los casos

l Filas: unidad de análisis (casos) l encuesta de satisfacción de un hospital: pacientesl encuesta de gasto hospitalario: hospital

l Columnas: características que quiero medir (variables)l sexo, edad, tiempo de espera, calidad de la comidal número de camas, número de médicos, gasto de luz

¿QUÉ ES UN FICHERO DE DATOS?

El sujeto 1007 tenía 16 años en el momento de la entrevista

¿QUÉ ES UN FICHERO DE DATOS?

NUMID SEXO EDAD CLASE REGION SALUD FUMAR1001 1 67 3 6 2 11002 1 53 3 2 1 11003 1 28 2 1 3 11004 2 74 2 1 4 11005 1 24 3 1 4 11006 2 78 2 1 4 11007 1 16 3 1 3 11008 1 16 2 1 3 11009 1 82 2 1 4 11010 1 44 3 1 1 1

¿QUÉ ES UN FICHERO DE DATOS? Fichero de datos en SPSS: tabaco.sav

Nombrefichero

Datos

Variables

Casos(sujetos)

CREACIÓN DE UN FICHERO DE DATOS Creación de un fichero de datos en SPSS: entrada manual de datos

Teclear directamenteel valor en la casilla

Entrada de datos

Definición de las variables

Click 2 veces e insertar el nombre de la variable

4

CREACIÓN DE UN FICHERO DE DATOS Definición de variables

Informaciónsobre lasvariables

Nombre Valores

Medida dela variable

Etiqueta identificadoresde valores‘missing’

Tipo

CREACIÓN DE UN FICHERO DE DATOS

SPSS no ha sido creado con este

propósito y no tiene ni las ventajas ni la flexibilidad de un programa específico para

la creación y manejo de bases de datos

Ficheros de datos ya creados:

l SPSS (*.sav)l ASCII (*.dat, *.txt)l Excel (*. xls)l Lotus (*.wk*)l dBase (*.dbf)

LECTURA DE UN FICHERO DE DATOS

Ficheros de datos ya creados

LECTURA DE UN FICHERO DE DATOS

Ficheros de datos ya creados

LECTURA DE UN FICHERO DE DATOS

Seleccionartipo de fichero

Excel

Si en la 1ª fila del fichero Excelse encuentra el nombre de lasvariables marcar la opción

LECTURA DE UN FICHERO DE DATOS

5

Lectura de datos texto (ASCII)

LECTURA DE UN FICHERO DE DATOS

Lectura de datos texto (ASCII) Lectura de datos de texto (ASCII)

Marcar sólo siexiste un formato

Visualización previade los datos

LECTURA DE UN FICHERO DE DATOS

Datos de texto

Si en la 1ª fila del ficherose encuentra el nombre de lasvariables marcar la opción

Organizaciónde las variables

LECTURA DE UN FICHERO DE DATOS

Datos de texto

Número de casosque se desea leer

Qué representacada línea

En qué línea sesitúa el 1r caso

LECTURA DE UN FICHERO DE DATOS

Datos de texto

Separador de variables en el fichero de texto original

LECTURA DE UN FICHERO DE DATOS

Datos de texto

Especificacionesde variables

LECTURA DE UN FICHERO DE DATOS

6

Datos de texto

Copiar sintaxis en fichero *.sps

Marcar finalizar

LECTURA DE UN FICHERO DE DATOS

Datos de texto (opción alternativa)

LECTURA DE UN FICHERO DE DATOS

Abrir el fichero ‘tabaco.xls’ y guardarlo como ‘smoke_xls.sav’

Abrir el fichero ‘tabaco.dat’ y guardarlo como ‘smoke_dat.sav’

Abrir el fichero ‘smoke.sav’

EJERCICIO

Definición de variables en SPSSl Etiquetas de variables y valoresl Tipo de variablesl Datos faltantes (missing)

Creación y Transformación de variables en SPSS

CONTENIDO 2

DEFINICIÓN DE VARIABLES EN SPSS

Informaci ónsobre lasvariables

NombreEtiquetas paralos valores

Medida dela variable

Etiqueta de la variable

Identificadoresde valores

missing

Scale: cuantitativaNominal: cual. nominalOrdinal: cual. ordinal

DEFINICIÓN DE VARIABLES EN SPSSEs buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador.Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos.l Sexo (Cualit: Códigos arbitrarios)

l 1 = Hombrel 2 = Mujer

l Raza (Cualit: Códigos arbitrarios)l 1 = Blancal 2 = Negra,...

l Felicidad Ordinal: Respetar un orden al codificar.l 1 = Muy felizl 2 = Bastante felizl 3 = No demasiado feliz

Se pueden asignar códigos a respuestas especiales como

l 0 = No sabel 99 = No contesta...

Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)

7

Identificar qué variables tienen valores missing y listarlos.

Definir el valor 9 de la variable ‘sexo’ como missing

Cambiar el nombre de la variable ‘numid’por ‘identificador’, ¿qué ocurre y porqué?

Sustituir la etiqueta del valor 1 de la variable ‘región’ por ‘Lerida’

EJERCICIOS con fichero tabaco.sav

Utilizando el manual de codificación:

Definir las etiquetas de los valores de las variables ‘sexo’ y ‘fumfin’.

Definir la etiqueta de la variable ‘sexo’

EJERCICIOS con fichero tabaco.sav

Calcular una nueva variable:imc=peso(kg)/altura2 (m)

Recodificar los valores de una variable l Recodificar en la misma variable

Cambiar los valores existentes por otrosSexo: 1=hombre, 2=mujer ⇒ Sexo: 1= mujer, 2= hombrePeso: continua ⇒ Peso: 1= ‘<60kg’, 2=’60-70kg’, 3=‘>70kg’

l Recodificar en una nueva variableCrear una variable nueva usando los valores de otraSexo: 1=hombre, 2=mujer ⇒ Sexo2: 1= mujer, 2= hombrePeso:continua ⇒ Weight: 1=‘<60kg’, 2=’60-70kg’, 3=‘>70kg’

TRANSFORMACIÓN /CREACIÓN DE VARIABLES

Categorizar una variable continua segúnnúmero de categorías:

l Crear una variable nueva con un número específico de categorías.

l Las categorías tienen un porcentage de casos igual o similar (percentiles)

Contar las apariciones del mismo valor, o valores, en una lista de variables

TRANSFORMACIÓN /CREACIÓN DE VARIABLES

TRANSFORMACIÓN /CREACIÓN DE VARIABLES CALCULAR VARIABLES

Transformar → Calcular

IMC PESO/(ALTURA**2)

8

RECODIFICAR VARIABLES

• Es aconsejable recodificar en nuevas variables para no perder los valores

originales de las variables

• Todos los valores de la variable original deben ir a parar a una categoría de la

nueva variable, es importante conocer la distribución de los valores variable

original

Transformar → Recodificar

RECODIFICAR VARIABLES

Recodificar en la misma variable

Transformar → Recodificar

RECODIFICAR VARIABLES

Recodificar en una nueva variable

Transformar → Recodificar

CATEGORIZAR VARIABLES

Categorización de una variable contínua

Indicar el número de categoriasestas se construyen según percentiles

ej: 4 categorias → <Q1, Q1-Q2, Q2-Q3 y > Q3

Transformar → Categorizar

CATEGORIZAR VARIABLES

Nueva variable que representa el orden de una variable continua

Asigna el orden de la variable continua

Variableoriginal

Variablenueva

CATEGORIZAR VARIABLES

Categorización automática

Convierte los valores de una variable númericao alfanumérica en números enteros consecutivos

9

CONTAR APARICIONES

Transformar → Contar

EJERCICIO

1) Recodificación de la variable edad en las siguientes categorías:

l (30 , 50] añosl (50 , 60] añosl (60 , 70] añosl (70 , 75] añosl Más de 75 años

2) Definir la variable creada

EJERCICIO

3) Cálculo de nuevas variables:

l Exposición a tabaco (tiempo que hace que fuma en años):fumafin – fumaini

l Definir la variable ‘exposición a tabaco en años’

l Transformación el tiempo en años a días: (fumafin – fumaini) * 365,25

Tratamiento de DATOSl Ordenar casos

l Selección de casos

l Ponderar casosl Segmentar/estratificar archivo

Manipulación de ARCHIVOSl Fusión de archivos

l por variables

l por casos

l Reestructuración de datos

CONTENIDO 3

ORDENAR ARCHIVO

Datos → Ordenar casos

SELECCIÓN DE CASOS

Datos → Seleccionar casos

Selecci ón temporal

Selecci ónpermanente

10

FUSIÓN DE FICHEROS

Existen dos tipos de fusiones:

l Añadir variables

l Añadir casos

Var 1 ..Var 10 Var 11 ..Var 20

+

+

Ind 1...Ind 5

Ind 6...Ind 10

FUSIÓN DE FICHEROS - VARIABLES

Se quiere evaluar el estado de salud según

el sexo.

l Las variables estan en ficheros distintos

l Tabaco_demo.sav: datos demográficos

l Tabaco_salud.sav: datos de salud

Fusión añadiendo variables

FUSIÓN DE FICHEROS - VARIABLES

Es necesario que ambos ficheros contengan

la misma variable identificadora del caso

l La variable identificadora debe reconocer

inequivocamente un caso, no pueden existir

repeticiones

Previamente ambos ficheros se deben

ordenar de forma ascendente según la variable identificadora

FUSIÓN DE FICHEROS - VARIABLESDatos → Ordenar casos → Ordenar por variable

identificadora

Salvar el fichero!!

FUSIÓN DE FICHEROS - VARIABLESDatos → Fusionar → Añadir variables →

Seleccionar fichero 2

FUSIÓN DE FICHEROS - VARIABLES

Opción:-los dos ficheros pueden aportar casos-sólo usará los casos del fichero 1-sólo usará los casos del fichero 2

Variables que contendráel fichero resultante

Variables excluidasla var id siempre está

Variable identificadora

11

FUSIÓN DE FICHEROS - CASOS

Se quiere evaluar el estado de salud de

toda la muestra.

l La región sanitaria ‘Lleida’ está en un fichero

aparte del resto

l Tabaco_lleida.sav: datos de Lleida

l Tabaco_region7.sav: datos del resto de 8 regiones sanitarias

Fusión añadiendo casos

FUSIÓN DE FICHEROS - CASOS

Si ambos ficheros contienen las mismas

variables → OK

Si aportan alguna/s variable/s distintas,

estas seran missing para los casos que

provienen del fichero donde no estan las variables

FUSIÓN DE FICHEROS - CASOS Datos → Fusionar → Añadir casos → Seleccionar

fichero 2

FUSIÓN DE FICHEROS - CASOS

Variables que contendráel fichero resultante

Variables desapareadas

Variable que identificael fichero origen. Opcional

1) Crear un fichero de datos global (tabaco_hombres.sav + tabaco_mujeres.sav)

2) Crear un fichero de datos global(tabaco_sexo.sav + tabaco_nosexo.sav)

EJERCICIO REESTRUCCTURACION DE DATOS

REGISTROS A VARIABLES

13031

15512

12021

14011

sbptimeid

VARIABLES A REGISTROS

120

sbp2

155

140

sbp1

2

1301

sbp3id