caso 3. explorando presiones arteriales en pacientes -...

11
Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS: ANÁLISIS EXHAUSTIVO DE UNA MATRIZ ) CASO PRÁCTICO Se ha medido la presión arterial sistólica y diastólica en una muestra de 50 pacientes de una población antes y despues de someterles a un tratamiento durante seis meses. Los datos obtenidos figuran en la siguiente tabla y se hayan recogidos en el archivo Excel caso3.xls. El objetivo de este ejercicio sería hacer una exploración minuciosa de la matriz de datos, bien por columnas aisladas, bien tomadas de dos en dos, tomadas todas a la vez, etc, así como obtener las respectivas representaciones gráficas. TEORÍA En general, la exploración de datos en el caso de una matriz aborda los siguientes aspectos: Un análisis de estadística descriptiva de los datos: media, mediana, varianza y desviación estándar, límites de confianza para la media, cuartiles, recorrido intercuartílico, asimetría y curtosis...etc. Este análisis se puede hacer por filas o columnas, si bien en muchos casos sólo tiene interés hacerlo por columnas. Un análisis gráfico para tener una referencia visual del comportamiento de los datos: histogramas por columnas, diagramas de caja (Box and Whisker), diagrama de barras en 3D, diagramas de dispersión de dos columnas entre sí. Otros aspectos: Tests de normalidad de Kolmogorov-Smirnov y Shapiro-Wilks, test de igualdad de varianzas entre dos columnas. Estudio de correlación entre variables (columnas). Caso 3 : Explorando presiones arteriales en pacientes 13

Upload: others

Post on 05-Oct-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

Caso 3. Explorando presiones arteriales en pacientes(EXPLORACIÓN DE DATOS: ANÁLISIS EXHAUSTIVO DE UNA MATRIZ )

CASO PRÁCTICO

Se ha medido la presión arterial sistólica y diastólica en una muestra de 50 pacientes deuna población antes y despues de someterles a un tratamiento durante seis meses. Los datosobtenidos figuran en la siguiente tabla y se hayan recogidos en el archivo Excel caso3.xls .

El objetivo de este ejercicio sería hacer una exploración minuciosa de la matriz de datos,bien por columnas aisladas, bien tomadas de dos en dos, tomadas todas a la vez, etc, así comoobtener las respectivas representaciones gráficas.

TEORÍA

En general, la exploración de datos en el caso de una matriz aborda los siguientes aspectos:� Un análisis de estadística descriptiva de los datos: media, mediana, varianza y desviación

estándar, límites de confianza para la media, cuartiles, recorrido intercuartílico, asimetría ycurtosis...etc. Este análisis se puede hacer por filas o columnas, si bien en muchos casossólo tiene interés hacerlo por columnas.

� Un análisis gráfico para tener una referencia visual del comportamiento de los datos:histogramas por columnas, diagramas de caja (Box and Whisker), diagrama de barras en3D, diagramas de dispersión de dos columnas entre sí.

� Otros aspectos: Tests de normalidad de Kolmogorov-Smirnov y Shapiro-Wilks, test deigualdad de varianzas entre dos columnas.

� Estudio de correlación entre variables (columnas).

Caso 3 : Explorando presiones arteriales en pacientes 13

Page 2: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

PROCEDIMIENTO PASO A PASO

1.- Crear un archivo con la matriz de datos

� Se podrían teclear los datos de la tabla anterior para crear un archivo de datos tipo“matriz” , para ello bastaría seleccionar en el menú principal las opciones File > Make avector/matrix file > Normal user > Matrix ...etc . Pero, en este caso, teclear 200 datossería un poco tedioso, por lo que ya se ha preparado dicho archivo en Excel con el nombrecaso3.xls . Puede abrirlo ahora, seleccionar la matriz con los datos (se pueden incluir lasetiquetas, es decir la fila superior y la columna de la izquierda que acompañan a lascolumnas con los datos) y copiarlos al portapapeles (Ctrl+C ), luego, en su momento,bastará con “pegarlos” en Simfit a través del botón Paste de Simfit.

2.- Exploración de datos: Análisis exhaustivo de la m atriz de tensiones

� Seleccione en el menú de Simfit la opción Statistics , y en el submenú que se despliega acontinuación picar en la opción Data exploration - simstat (option 1) , luego seleccionarExhaustive-analysis: arbitrary matrix .

� En la pantalla siguiente, seleccionamos New data > File/Clipboard > Paste (para pegarlos datos que tenemos en el portapapeles > OK > Open . Ahora ya tenemos cargadosnuestros datos y podemos operar con ellos.

� Seleccionamos Analyse the current data set y obtenemos el siguiente listado deopciones:

14 Caso 3 : Explorando presiones arteriales en pacientes

Page 3: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

� El hacer un análisis resumen por filas no tiene aquí mucho sentido (sería mezclar todas lasvariables para cada paciente), por eso escogeremos directamente el hacer un “Summary(all columns)” . Aparecerán los siguientes resultados:

� En primer lugar debieramos hacer un análisis exhaustivo de cada columna. A modo deejemplo analicemos la primera columna 1 (presión sistólica antes). Para ello debemosseleccionar la opción Analyse/tests one column . El programa pregunta el número decolumna deseado, contestar “1”. A continuación aparecerá el siguiente menú:

Caso 3 : Explorando presiones arteriales en pacientes 15

Page 4: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

� Elija la opción Exhaustive analysis of your data . El programa pregunta luego si incluye eltest de normalidad de Shapiro-Wilks, contestaremos Yes. A continuación aparecerá lapantalla con los resultados:

� Obervemos los resultados. Por ejemplo la media sería de 14.00 con unos límites deconfianza al 95% de 13.55 y 14.45 (es decir ). Estos límites de confianza se14.00 ! 0.45han obtenido como:

� c x ! t(�,�)s

n

siendo el valor de la “ t ” de Student con un riesgo del 5 % (95% de confianza) y unt(�,�) �nº de grados de libertad , y donde “s” es la desviación estándar de la muestra,� = n − 1“n” el número de datos, es la media de la muestra y la estima de la media de lax �población.

� También vemos que los coeficientes de asimetría y curtosis son muy pequeños, lo queapunta hacia una distribución normal de los datos. Supuesto éste que es confirmado por eltest de Shapiro-Wilks con una p = 0.9742 (p >> 0.05).

� Al pulsar OK se vuelve al menú principal. Seleccione ahora la opción Plot histograms ,siga luego pulsando OK en las opciones por defecto. Finalmente aparecerá en pantalla elsiguiente histograma:

14 Caso 3 : Explorando presiones arteriales en pacientes

Page 5: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

� Visto el histograma anterior pulsar cancel y, al regresar al menú principal, podríamosechar una ojeada a otras opciones. Para abandonar la última gráfica y volver al menúgeneral de exploración basta con seguir la secuencia: Cancel > Cancel .

� Aquí un aspecto muy interesante sería explorar si los datos de esta columna siguen unadistribución normal mediante algún test de normalidad como el test deKolmogorov-Smirnov y el test de Shapiro-Wilks (se hará más adelante en el apartado 4).

� Ahora nos interesa más el seguir adelante y escoger la opción Analyse /paired-test twocolumns , apareciendo el siguiente menú:

� Lo interesante ahora sería comparar unas columnas con otras, por ejemplo la “presiónsistólica antes” (columna 1) con la “presión diastólica antes” (columna 2), aquí todavía espronto para hacer comparaciones de medias por el test “t” de Student. Para ello dejaremosmarcados sólamente las casillas con las opciones 3 ( Simple X,Y plot ) y 4 (Regresion /Correlation ) (deseleccionar el resto ). Saldrá primero la gráfica con los datos de las doscolumnas, y una vez vista pulsaremos Cancel . Aparecerá a continuación toda lainformación para las dos rectas de regresión: la recta de regresión de “y” sobre “x” y la de“x” sobre “y”:

Caso 3 : Explorando presiones arteriales en pacientes 17

Page 6: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

� Seguidamente aparece un menú para representar estas rectas de diferentes formas:

� aquí escogeremos la opción Both unweighted least squares lines :

14 Caso 3 : Explorando presiones arteriales en pacientes

Page 7: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

� Pulsando Cancel > Cancel > OK se vuelve al menú principal. Seleccione ahora la opciónPlot 2D boxes and whiskers . Aparecerá en pantalla el siguiente diagrama :

� Pulsando Quit > Yes se vuelve al menú principal. Seleccione ahora la opción Plot 2D barsand error bars , luego siga la siguiente secuencia de opciones: 95% conf. Limits of meany > Accept these error bars > Plot as a bar chart . Aparecerá en pantalla el siguientediagrama :

para abandonar esta gráfica se sigue la secuencia: Quit > Yes > Cancel .

� Habremos vuelto al menú principal, podríamos echar una ojeada a otras opciones como:Plot 3D barchart/cylinder plot . Escogida esta opción sigamos la siguiente secuencia:Plot data [3D skyscrapers] > Display/Save facet mod el. Aparecerá la siguiente gráfica:

Caso 3 : Explorando presiones arteriales en pacientes 19

Page 8: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

� Finalmente, abandonemos esta sección de exploración en la forma habitual hasta volver ala pantalla principal de SIMFIT.

3.- Exploración: Correlación de todas las variables e ntre si � En la pantalla principal de de SIMFIT elegir la pestaña Statistics , seleccionar luego la

opción: Multivariate statistics - simstat (option 5) > Correlation: Pearson ProductMoment .

� Al seleccionar New data para cargar nuestros datos, el programa recuerda que tiene enmemoria nuestra matriz de datos y nos muestra como opción por defecto un archivotemporal ...\clipboard_1.tmp , que abriremos como normalmente. Para comenzarpulsamos Analyse the current data set > Analyse current data . Inmediatamenteaparece una pantalla con los valores de los coeficientes de correlación (r) y sussignificancias (p):

como se observa hay correlación (p < 0.05) entre las columnas 1 y 2, 1 y 3, 2 y 4 y 3 y 4.

� A continuación sale una pantalla en la que se prueba la hipótesis nula de que hay ausenciade correlación entre todas las columnas consideradas globalmente. En este caso elveredicto es el de rechazo de la hipóteis nula, porque si hay correlación al menos entrealgunas de ellas (como se ha visto más arriba).

� A la pregunta Further analysis/plot for any two columns as (X/Y)? , podríamos contestarYes y hacer un análisis por parejas de las columnas 1 y 2, la 1 y 3, la 2 y 4 y 3 y 4, que sonlas parejas correlacionadas. Para la pareja 1 y 2 el resultado sería el mismo que hemos

14 Caso 3 : Explorando presiones arteriales en pacientes

Page 9: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

obtenido ya más arriba y todo sería análogo con las restantes parejas, obteniéndose enconjunto las cuatro gráficas siguientes:

4.- Exploración: Tests estadísticos acerca de la norma lidad de los datos

� En el pantalla principal de SIMFIT desplegar la pestaña Statistics y luego seleccionar laopción Standard statistical tests , luego elegir 1 sample normal distribution test . Acontinuación aparece una pantalla en la que elegiremos New data , con el fin de importar lacolumna 1 de nuestro archivo caso3.xls. Lo haremos de la forma ya conocida: abriremosprimero el archivo Excel, luego copiaremos los números de la columna 1 al portapapeles ylos pegaremos en SIMFIT a través del botón Paste .

� Seguidamente pulsaremos en Analyse the current data . Inmediatamente aparece unapantalla acerca de si deseamos estimar los parámetros de la muestra o los fijamosnosotros, seleccionaremos la primera opción. Seguidamente aparece una pantalla con losresultados del test de Kolmogorov-Smirnov y del test de Shapiro-Wilks:

Caso 3 : Explorando presiones arteriales en pacientes 21

Page 10: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

� Como puede verse al contrastar Ho frente a H1 por el test de Kolmogorov-Smirnoff seobtine una p = 0.2561 (p >>0.05), luego no se rechaza la hipótesis nula y por tanto losdatos reales y los teóricos de una distribución normal no son significativamente diferentes.A la misma conclusión se llega con el test de Shapiro-Wilks: p= 0.3405 (p >>0.05).Nuestros datos pues siguen una distribución normal.

� A continuación aparece el siguiente menú de opciones:

si vamos representando cada una de estas opciones obtendremos el siguiente resultado:

14 Caso 3 : Explorando presiones arteriales en pacientes

Page 11: Caso 3. Explorando presiones arteriales en pacientes - USALsimfit.usal.es/casos/curso2009/caso3.pdf · Caso 3. Explorando presiones arteriales en pacientes (EXPLORACIÓN DE DATOS:

Estas dos representaciones analizan si los datos siguen o no una distribución normal, laprimera bajo la forma de una distribución acumulativa en base a la superposición de losdatos reales frente a los esperados de una distribución normal que tuviera la misma mediay desviación estandar que la que tienen los datos reales. La segunda adopta la forma dehistograma al que se ha superpuesto la curva normal teórica correspondiente a esa mediay esa desviación estándar.

5.- Exploración: Tests estadísticos acerca de igual dad de varianzas

� En el pantalla principal de SIMFIT desplegar la pestaña Statistics y luego seleccionar laopción Standard statistical tests , luego elegir Variance Homogenity tests y proceder demanera análoga a lo visto en apartados anteriores.

Caso 3 : Explorando presiones arteriales en pacientes 23