estadística aplicada a ciencias de la salud (e-l).pdf

56
RAFAEL ÁLVAREZ CÁCERES ESTADÍSTICA APLICADA A LAS CIENCIAS DE LA SALUD

Upload: jose-antonio-dzib

Post on 11-Oct-2015

637 views

Category:

Documents


32 download

TRANSCRIPT

  • RAFAEL LVAREZ CCERES

    ESTADSTICA APLICADA A LAS CIENCIAS

    DE LA SALUD

  • Rafael lvarez Cceres, 2007Reservados todos los derechos.

    No est permitida la reproduccin total o parcial de este libro,ni su tratamiento informtico, ni la transmisin de ningunaforma o por cualquier medio, ya sea electrnico, mecnico,por fotocopia, por registro u otros mtodos, sin el permisoprevio y por escrito de los titulares del Copyright.

    Ediciones Daz de SantosE-mail: [email protected]://http:www.diazdesantos.es

    ISBN: 978-84-7978-823-0Depsito legal: M. 21.952-2007

    Diseo de cubierta: ngel Calvete y Rafael lvarezFotocomposicin e impresin: Fernndez CiudadEncuadernacin: Rstica - Hilo

    Impreso en Espaa

  • La elaboracin de un libro tan complejo y extenso como este ha necesitadomucho tiempo, sin la comprensin y el estmulo de mi mujer y de mis hijos no hu-biera podido realizarlo.

    A mis alumnos que me han enseado y me siguen enseando muchas cosas;en cada curso aprendo algo nuevo.

    Al doctor Patricio Alonso Sacristn por haber ledo parte del original y por susinteresantes sugerencias.

    AGRADECIMIENTOS

  • PRLOGO .................................................................................................

    PREFACIO .................................................................................................

    GUA DE LECTURA ................................................................................

    1. INTRODUCCIN A LA ESTADSTICA ..........................................1.1. Estadstica ....................................................................................1.2. Historia ........................................................................................1.3. Poblacin y muestra ....................................................................1.4. Estadstica aplicada .....................................................................1.5. Aplicaciones estadsticas a las ciencias de la salud .....................1.6. Variables estadsticas: escalas de medida ...................................1.7. Variables en estadstica aplicada .................................................1.8. Bibliografa ..................................................................................

    2. ESTADSTICA DESCRIPTIVA ........................................................2.1. Estadstica descriptiva ...............................................................2.2. Variables aleatorias ...................................................................2.3. Descripcin de variables cualitativas ........................................2.4. Descripcin de variables cuantitativas ......................................2.5. Medidas de tendencia central ....................................................2.6. Medidas de dispersin ...............................................................2.7. Medidas de posicin: n-tiles ......................................................2.8. Valores atpicos (outliers) .........................................................2.9. Momentos respecto al origen ....................................................2.10. Momentos respecto a la media ..................................................

    XI

    NDICE

    XXIII

    XXV

    XXIX

    11347

    10101113

    1515161721284251575959

  • 2.11. Medidas de forma ......................................................................2.12. Estadstica descriptiva con SPSS ..............................................2.13. Ejercicios ...................................................................................2.14. Bibliografa ................................................................................

    3. FUNDAMENTOS MATEMTICOS DE LA PROBABILIDAD .....3.1. Sucesos ......................................................................................3.2. Probabilidad ...............................................................................3.3. Cuantificacin de la probabilidad ..............................................3.4. Tcnicas de contar .....................................................................3.5. Espacio muestral ........................................................................3.6. lgebra de sucesos ....................................................................3.7. Espacio de probabilidad ............................................................3.8. Axiomas de la probabilidad .......................................................3.9. Regla general de la adicin .......................................................3.10. Ejercicios ...................................................................................3.11. Bibliografa ................................................................................

    4. PROBABILIDAD CONDICIONADA. TEOREMA DE BAYES .....4.1. Probabilidad condicionada ..........................................................4.2. Teorema de la multiplicacin ......................................................4.3. Independencia de sucesos ............................................................4.4. Teorema de Bayes .......................................................................4.5. Ejercicios .....................................................................................4.6. Bibliografa ..................................................................................

    5. APLICACIONES DEL CLCULO DE PROBABILIDADES A LASCIENCIAS DE LA SALUD ................................................................5.1. El riesgo. Factores de riesgo y de proteccin ............................5.2. Medidas de riesgo ......................................................................5.3. Diferencia de riesgos .................................................................5.4. Riesgo relativo (RR) ..................................................................5.5. Reduccin relativa del riesgo, RRR ..........................................5.6. Predominio. Razn de predominio (OR) ...................................5.7. Diagnstico ................................................................................5.8. Normalidad, anormalidad y patologa de los datos clnicos ......5.9. Caractersticas probabilsticas de las pruebas diagnsticas .......5.10. Sensibilidad y proporcin de falsos negativos ..........................5.11. Especificidad y falsos positivos ................................................5.12. Valor predictivo positivo ...........................................................5.13. Valor predictivo negativo ..........................................................5.14. Determinacin de los valores de la sensibilidad y de la especi-

    ficidad ........................................................................................

    60637476

    777778788088888990929394

    95959898

    101105106

    107107108108109113113115116117118118119120

    121

    XII NDICE

  • 5.15. Determinacin de los valores predictivos: teorema de Bayes ...5.16. Deduccin de las expresiones para el clculo de los valores

    predictivos mediante el teorema de Bayes ................................5.17. Ejercicios ...................................................................................5.18. Bibliografa ................................................................................

    6. VARIABLE ALEATORIA .................................................................6.1. Variable aleatoria ......................................................................6.2. Propiedades ...............................................................................6.3. Variable aleatoria discreta .........................................................6.4. Funcin probabilidad de una variable aleatoria discreta ...........6.5. Funcin de distribucin acumulativa de una variable aleatoria

    discreta .......................................................................................6.6. Funcin probabilidad en variables aleatorias continuas ............6.7. Propiedades de la funcin probabilidad en variables aleatorias

    continuas ....................................................................................6.8. Funcin de distribucin acumulativa en variable aleatoria con-

    tinua ...........................................................................................6.9. Valor esperado de una variable aleatoria ..................................6.10. Propiedades del valor esperado .................................................6.11. Varianza de una variable aleatoria ............................................6.12. Covarianza de dos variables aleatorias ......................................6.13. Propiedades de la varianza ........................................................6.14. Teorema de Tchebychev ...........................................................6.15. Ejercicios ...................................................................................6.16. Bibliografa ................................................................................

    7. DISTRIBUCIN DE VARIABLES ALEATORIAS DISCRETAS:BINOMIAL, POISSON, HIPERGEOMTRICA, GEOMTRICA,MULTINOMIAL. BINOMIAL INVERSA ........................................7.1. Distribuciones tericas ..............................................................7.2. Ensayos o pruebas de Bernouilli ...............................................7.3. Distribucin binomial ................................................................7.4. Distribucin multinomial ..........................................................7.5. Distribucin geomtrica ............................................................7.6. Distribucin binomial negativa .................................................7.7. Distribucin de Poisson .............................................................7.8. Distribucin hipergeomtrica ....................................................7.9. Ejercicios ...................................................................................7.10. Bibliografa ................................................................................

    122

    127131132

    133133134136136

    140142

    145

    146146148150151152153154155

    157157158161174176177178181184185

    NDICE XIII

  • 8. DISTRIBUCIONES DE VARIABLES ALEATORIAS CONTI-NUAS: NORMAL, T DE STUDENT, CHI-CUADRADO, F DESNEDECOR ........................................................................................8.1. Distribucin normal ...................................................................8.2. Propiedades de la curva normal .................................................8.3. Tipificacin de la variable .........................................................8.4. Funcin de distribucin acumulativa de una variable aleatoria

    normal ........................................................................................8.5. Clculo de probabilidades mediante tablas ...............................8.6. Teorema central del lmite .........................................................8.7. Aproximacin de una distribucin binomial a una normal .......8.8. Aproximacin de la distribucin de Poisson a la normal ..........8.9. Distribucin gamma ..................................................................8.10. La distribucin Chi cuadrado (2) .............................................8.11. Distribucin T de Student ..........................................................8.12. Distribucin F de Snedecor .......................................................8.13. Ejercicios ...................................................................................8.14. Bibliografa ................................................................................

    9. INFERENCIA ESTADSTICA: TCNICAS DE MUESTREO ........9.1. Poblaciones estadsticas ............................................................9.2. Inferencia estadstica .................................................................9.3. Muestras estadsticas .................................................................9.4. Representatividad de la muestra ................................................9.5. Fraccin muestral ......................................................................9.6. Tcnicas de muestreo no probabilstico ....................................9.7. Muestreos probabilsticos ..........................................................9.8. Muestreo aleatorio simple .........................................................9.9. Muestreo sistemtico aleatorio ..................................................9.10. Muestreo estratificado aleatorio .................................................9.11. Muestreo por conglomerados ....................................................9.12. Ejercicios ...................................................................................9.13. Bibliografa ................................................................................

    10. INFERENCIA ESTADSTICA: ESTIMACIN DE PARMETROS .10.1. Estimaciones ............................................................................10.2. Variable aleatoria estimada X: fraccin muestral ....................10.3. Estimadores .............................................................................10.4. Estimacin de la media aritmtica poblacional .......................10.5. Predeterminacin del tamao de la muestra en la estimacin de

    medias ......................................................................................10.6. Estimacin de proporciones ....................................................10.7. Predeterminacin del tamao de la muestra para estimar pro-

    porciones .................................................................................

    187187189194

    196198205205207208208211214217218

    219219221222223224225227227229232238240241

    243243246247250

    268275

    282

    XIV NDICE

  • 10.8. Estimacin del parmetro de Poisson ......................................10.8.1. Predeterminacin del tamao de la muestra ...............

    10.9. Estimacin por el mtodo de mxima verosimilitud ...............10.9.1. El mtodo de mxima verosimilitud ..........................

    10.10. Estimacin de parmetros con SPSS .......................................10.11. Ejercicios .................................................................................10.12. Bibliografa ..............................................................................

    11. INFERENCIA ESTADSTICA: CONTRASTES DE HIPTESIS ...11.1. Introduccin .............................................................................11.2. Extrapolacin de los resultados de un contraste de hiptesis es-

    tadsticas ..................................................................................11.3. Estructura de un contraste de hiptesis ...................................11.4. Errores aleatorios en un contraste de hiptesis .......................11.5. Relacin entre alfa y beta ........................................................11.6. Predeterminacin del tamao de la muestra ............................11.7. Qu significa estadsticamente significativo? ........................11.8. Interpretacin errnea de contrastes de hiptesis ....................11.9. Contrastes de hiptesis versus intervalos de confianza ...........11.10. Ejercicios .................................................................................11.11. Bibliografa ..............................................................................

    12. RELACIONES ENTRE VARIABLES ...............................................12.1. Relaciones entre variables .........................................................12.2. Asociacin entre variables .........................................................12.3. Tipos de asociacin ...................................................................12.4. Estudio simultneo entre dos o ms variables: estadstica biva-

    riante y multivariante .................................................................12.5. Sesgo de confusin ....................................................................12.6. Interaccin .................................................................................12.7. Bibliografa ................................................................................

    13. COMPARACIN DE DOS PROPORCIONES: PRUEBAS PA-RAMTRICAS ...................................................................................13.1. Introduccin ...............................................................................13.2. Contraste de hiptesis sobre proporciones: contraste respecto a

    un valor de referencia ................................................................13.3. Predeterminacin del tamao de la muestra ..............................13.4. Comparacin de dos proporciones: datos dependientes ............13.5. Comparacin de dos proporciones: datos independientes .........13.6. Ejercicios ...................................................................................13.7. Bibliografa ................................................................................

    288290292292295296297

    299299

    300302310325327333338346348348

    349349350351

    353354355356

    357357

    359362365367372373

    NDICE XV

  • 14. PRUEBAS BASADAS EN LA DISTRIBUCIN CHI-CUADRA-DO: BONDAD DEL AJUSTE, TABLAS DE CONTINGENCIA.PRUEBA DE FISHER, PRUEBA DE MCNEMAR ..........................14.1. Pruebas basadas en la distribucin Chi-cuadrado: bondad del

    ajuste de datos experimentales a distribuciones tericas .........14.2. Pruebas de independencia y homogeneidad: asociacin entre

    variables cualitativas ...............................................................14.3. Tablas de contingencia ............................................................14.4. Estadstica analtica mediante tablas de contingencia 2 2:

    contrastes de hiptesis e intervalos de confianza: pruebas ba-sadas en la distribucin chi-cuadrado ......................................

    14.5. Anlisis de tablas de contingencia K R ...............................14.6. Significacin estadstica y fuerza de la asociacin .................14.7. Anlisis del riesgo mediante tablas de contingencia ...............14.8. Anlisis estratificado ...............................................................14.9. Anlisis del sesgo de confusin, e interaccin entre variables

    cualitativas ...............................................................................14.10. Bondad del ajuste y anlisis de tablas de contingencia con

    SPSS ........................................................................................14.11. Ejercicios .................................................................................14.12. Bibliografa ..............................................................................

    15. COMPARACIN DE DOS MEDIAS, PRUEBAS PARAMTRI-CAS .....................................................................................................15.1. Comparacin de dos varianzas ..................................................15.2. Comparacin de dos medias ......................................................15.3. Comparacin de dos medias, datos dependientes o pareados ...15.4. Comparacin de dos medias con datos independientes .............15.5. Comparacin de dos medias con SPSS .....................................15.6. Ejercicios ...................................................................................15.7. Bibliografa ................................................................................

    16. ANLISIS DE LA VARIANZA ........................................................16.1. Anlisis de la varianza unifactorial .........................................16.2. Tipos de anlisis de la varianza ...............................................16.3. Fundamentos del anlisis de la varianza .................................16.4. Aplicaciones experimentales del anlisis de la varianza .........16.5. Modelo matemtico .................................................................16.6. Hiptesis de ANOVA ..............................................................16.7. Asunciones del anlisis de la varianza ....................................16.8. Comparacin de K varianzas ...................................................16.9. Modelos de anlisis de la varianza de una va .........................16.10. Comparaciones mltiples ........................................................16.11. Predeterminacin del tamao de la muestra ............................

    375

    382385

    389405414416418

    418

    432442444

    445445450451458469474475

    477477479479484488493498500502507517

    XVI NDICE

  • 16.12. Anlisis de la varianza unifactorial con SPSS .........................16.13. Ejercicios .................................................................................16.14. Bibliografa ..............................................................................

    17. ANLISIS DE LA VARIANZA: BLOQUES, MEDIDAS REPETI-DAS .....................................................................................................17.1. Anlisis de la varianza con bloques aleatorizados. Modelos

    con efectos fijos y aleatorios ...................................................17.2. Modelo matemtico .................................................................17.3. Variabilidad cuadrtica: suma de cuadrados ...........................17.4. Cuadrados medios ...................................................................17.5. Hiptesis de ANOVA bloques ................................................17.6. Comparaciones mltiples ........................................................17.7. Estudio de la interaccin: prueba de no aditividad de Tukey ..17.8. Medidas repetidas ....................................................................17.9. ANOVA medidas repetidas con SPSS ....................................17.10. Ejercicios .................................................................................17.11. Bibliografa ..............................................................................

    18. CORRELACIN .................................................................................18.1. Introduccin ...............................................................................18.2. Clculo del coeficiente de correlacin lineal de Pearson ..........18.3. Contraste de hiptesis sobre ...................................................18.4. Intervalos de confianza ..............................................................18.5. Coeficiente de correlacin de Spearman ...................................18.6. Correlacin con SPSS ...............................................................18.7. Ejercicios ...................................................................................18.8. Bibliografa ................................................................................

    19. REGRESIN LINEAL SIMPLE ........................................................19.1. Introduccin .............................................................................19.2. Tipos de anlisis de regresin .................................................19.3. Regresin lineal simple ...........................................................19.4. Coeficientes de regresin estandarizados ................................19.5. Variabilidad cuadrtica. Relacin entre el coeficiente de re-

    gresin y el de correlacin .......................................................19.6. Valores observados, valores esperados y residuos ..................19.7. Modelo matemtico .................................................................19.8. Consistencia de la asociacin lineal ........................................19.9. Hiptesis en regresin lineal simple ........................................19.10. Regresin y anlisis de la varianza ..........................................19.11. Intervalos de confianza de los coeficientes de la recta de re-

    gresin .....................................................................................19.12. Estimaciones en regresin lineal simple: predicciones ...........

    519525526

    527

    527530532533534538539541552558559

    561561562566574575579586588

    589589591592595

    595597599602604607

    609611

    NDICE XVII

  • 19.13. Asunciones del anlisis de regresin .......................................19.14. Anlisis de residuos .................................................................19.15. Comparacin de dos coeficientes de regresin .......................19.16. Anlisis de un modelo de regresin simple: errores ms fre-

    cuentes .....................................................................................19.17. Ejercicios .................................................................................19.18. Bibliografa ..............................................................................

    20. REGRESIN LINEAL MLTIPLE ..................................................20.1. Regresin lineal mltiple: clculo de los coeficientes de re-

    gresin .....................................................................................20.2. Coeficientes de regresin estandarizados ................................20.3. Variabilidad cuadrtica ............................................................20.4. Coeficientes de correlacin binarios .......................................20.5. Valores observados, valores esperados y residuos ..................20.6. Modelo matemtico .................................................................20.7. Consistencia de la asociacin lineal: coeficiente de correla-

    cin mltiple, coeficiente de determinacin ............................20.8. Hiptesis general en regresin lineal mltiple. Tabla de

    ANOVA ...................................................................................20.9. Intervalos de confianza de los coeficientes de regresin ........20.10. Estimaciones en regresin lineal mltiple: predicciones ........20.11. Asunciones del anlisis de regresin mltiple ........................20.12. Interaccin ...............................................................................20.13. Colinealidad .............................................................................20.14. Correlacin parcial y semiparcial ............................................20.15. Confusin en regresin mltiple .............................................20.16. Modelos de regresin con variables cualitativas: variables fic-

    ticias o Dummy .......................................................................20.17. Anlisis de residuos en regresin mltiple ..............................20.18. Construccin de un modelo de regresin mltiple ..................20.19. Anlisis de un modelo de regresin mltiple: errores ms fre-

    cuentes .....................................................................................20.20. Anlisis de regresin lineal con SPSS .....................................20.21. Ejercicios .................................................................................20.22. Bibliografa ..............................................................................

    21. REGRESIN LOGSTICA .................................................................21.1. Introduccin .............................................................................21.2. Estimacin de los coeficientes de regresin logstica .............21.3. Contraste de hiptesis de los coeficientes de regresin logs-

    tica ...........................................................................................21.4. Intervalos de confianza de los coeficientes .............................21.5. Interaccin ...............................................................................

    614614616

    619621622

    623

    623630631633634635

    640

    642647648650650654657659

    661670673

    674676697698

    699699702

    705712713

    XVIII NDICE

  • 21.6. Confusin ................................................................................21.7. Variables ficticias o dummy ....................................................21.8. Clculo de probabilidades: riesgo ...........................................21.9. Predominio y razn de predominio (Odds y Odds ratio); pro-

    babilidad relativa y riesgo relativo, RR ...................................21.10. Residuos en regresin logstica ...............................................21.11. Validez de los modelos de regresin logstica ........................21.12. Bondad del ajuste: prueba de Hosmer-Lemeshow ..................21.13. Regresin logstica con SPSS ..................................................21.14. Ejercicios .................................................................................21.15. Bibliografa ..............................................................................

    22. ESTADSTICA NO PARAMTRICA ...............................................22.1. Estadstica paramtrica y no paramtrica ..................................22.2. Pruebas para una sola muestra ...................................................

    22.2.1. Prueba binomial ...........................................................22.2.2. Bondad del ajuste: prueba 2 ........................................22.2.3. Pruebas de Kolmogorov-Smirnov, Kolmogorov-Smir-

    nov-Lilliefors y Shapiro Wilks .....................................22.2.4. Pruebas de aleatoriedad: prueba de las rachas .............

    22.3. Pruebas no paramtricas con dos variables relacionadas ..........22.3.1. Prueba de los signos para dos variables relacionadas ..22.3.2. La prueba de Wilcoxon ................................................

    22.4. Pruebas no paramtricas para dos muestras independientes .....22.4.1. Prueba de la mediana para dos muestras independientes .22.4.2. La prueba de Mann-Whitney ........................................22.4.3. La prueba de Kolmogorov-Smirnov para dos variables

    independientes ..............................................................22.4.4. La prueba de las rachas de Wald-Wolfowitz para dos

    variables independientes ..............................................22.4.5. La prueba de los valores extremos de Moses ...............

    22.5. Pruebas para k variables relacionadas .......................................22.5.1. Prueba de Friedman ......................................................22.5.2. Coeficiente de concordancia de Kendall ......................22.5.3. La prueba de la Q de Cochran ......................................

    22.6. Pruebas no paramtricas para k variables independientes .........22.6.1. La prueba de Kruskal Wallis ........................................22.6.2. La prueba de la mediana para k variables ....................

    22.7. Ejercicios ...................................................................................22.8. Bibliografa ................................................................................

    23. FUNCIN DE LA ESTADSTICA EN EL PROCESO DE INVES-TIGACIN ..........................................................................................23.1. Investigacin cientfica ............................................................

    716716722

    725734735739741760761

    763763764764770

    771778782783786790791794

    798

    801804808809815819822823829831832

    833833

    NDICE XIX

  • 23.2. Caractersticas principales de una investigacin cientfica .....23.3. Objetivos e hiptesis ...............................................................23.4. Tipo de estudios .......................................................................23.5. Poblaciones de referencia ........................................................23.6. Seleccin de la muestra ...........................................................23.7. Variables: mediciones .............................................................23.8. Plan estadstico ........................................................................23.9. Validez interna ........................................................................23.10. Validez externa ........................................................................23.11. Bibliografa ..............................................................................

    24. CARACTERSTICAS ESTADSTICAS DE LOS ESTUDIOS OBSERVACIONALES: SERIES DE CASOS, TRANSVERSALES,COHORTES, CASOS Y CONTROLES .............................................24.1. Comunicaciones de un caso ......................................................24.2. Series de casos ...........................................................................24.3. Estudios transversales ................................................................24.4. Estudios de cohortes ..................................................................24.5. Estudios de casos y controles ....................................................24.6. Bibliografa ................................................................................

    25. CARACTERSTICAS ESTADSTICAS DE LOS ESTUDIOS EX-PERIMENTALES Y CUASIEXPERIMENTALES: ENSAYOSCLNICOS ...........................................................................................25.1. Estudios experimentales ..........................................................25.2. Estudios cuasiexperimentales: ensayos clnicos ......................25.3. Fases de los ensayos clnicos ...................................................25.4. Factores que influyen en la evolucin de las enfermedades ...25.5. Control de los factores que pueden influir en la evolucin de

    las enfermedades .....................................................................25.6. Poblaciones en un ensayo clnico. Seleccin de los partici-

    pantes en el ensayo ..................................................................25.7. Estudios controlados con asignacin aleatoria ........................25.8. Anlisis de los resultados ........................................................25.9. Anlisis estadsticos ms utilizados en los ensayos clnicos ...25.10. Validez de los ensayos clnicos ...............................................25.11. Bibliografa ..............................................................................

    26. ERRORES MS FRECUENTES EN LA APLICACIN DE LA ES-TADSTICA A LAS CIENCIAS DE LA SALUD .............................26.1. Confundir la poblacin diana o poblaciones de inters en in-

    vestigacin con la poblacin estadstica del estudio .................26.2. Realizar conclusiones inferenciales en muestras no aleatorias .26.3. El extrao caso de las muestras representativas ........................

    835835837837839839842845847850

    851851851853857864868

    869869871871875

    876

    883885890891898902

    903

    903904905

    XX NDICE

  • 26.4. Confundir los errores tipo I y tipo II de los contrastes de hip-tesis con sus probabilidades ......................................................

    26.5. Considerar demostrada la hiptesis nula cuando no se ha recha-zado en un contraste de hiptesis ..............................................

    26.6. Considerar que la significacin estadstica es el parmetro fun-damental para evaluar las conclusiones de un estudio ..............

    26.7. Otro extrao caso: la media seguida de la desviacin tpica oel error estndar de la media ......................................................

    26.8. Uso de modelos matemticos como ecuaciones determinsticas .26.9. El extrao caso de las constantes vitales ...................................

    A1. LGEBRA DE BOOLE ......................................................................A1.1. Conjuntos ..................................................................................A1.2. Subconjuntos ............................................................................A1.3. Conjunto de las partes de un conjunto ......................................A1.4. Operaciones con conjuntos .......................................................A1.5. Relaciones entre conjuntos-aplicaciones ..................................

    A2. SOLUCIONES A LOS EJERCICIOS .................................................A2.1. Captulo 2 ...............................................................................A2.2. Captulo 3 ...............................................................................A2.3. Captulo 4 ...............................................................................A2.4. Captulo 5 ...............................................................................A2.5. Captulo 6 ...............................................................................A2.6. Captulo 7 ...............................................................................A2.7. Captulo 8 ...............................................................................A2.8. Captulo 9 ...............................................................................A2.9. Captulo 10 .............................................................................A2.10. Captulo 11 .............................................................................A2.11. Captulo 13 .............................................................................A2.12. Captulo 14 .............................................................................A2.13. Captulo 15 .............................................................................A2.14. Captulo 16 .............................................................................A2.15. Captulo 17 .............................................................................A2.16. Captulo 18 .............................................................................A2.17. Captulo 19 .............................................................................A2.18. Captulo 20 .............................................................................A2.19. Captulo 21 .............................................................................A2.20. Captulo 22 .............................................................................

    A3. TABLAS ESTADSTICAS .................................................................

    NDICE ANALTICO ................................................................................

    905

    906

    906

    907908909

    911911912913913917

    921921923926928930931933936937941943945948950952956958960961964

    967

    989

    NDICE XXI

  • Siempre he admirado a los buenos docentes no slo por su pasin por latransmisin del saber, sino por su curiosidad intelectual y rigor. Conoc a Rafaellvarez Cceres durante mi etapa en la Escuela Nacional de Sanidad (Madrid),donde trabaj primero como responsable del Departamento de Epidemiologa y Es-tadstica (1991-1995), del que Rafael lvarez era profesor, y despus como di-rector (1995-2000). Desde el primer momento fui testigo de su capacidad, poliva-lencia y atencin a las necesidades reales de los estudiantes, adems de su cuidadatcnica pedaggica. As, siempre se destac por transmitir de forma rigurosa y almismo tiempo amena, las ideas fundamentales del anlisis estadstico.

    Materia en la que pocos profesores son capaces de triunfar, la estadsticaconstituye sin duda uno de los pilares de la ciencia y su aplicacin al campo de lasalud ha progresado exponencialmente en los ltimos aos. En la actualidad, esdifcil comprender la medicina moderna, la epidemiologa y salud pblica, lametodologa de la investigacin e incluso la gestin sanitaria sin slidos conoci-mientos de estadstica. Esto ltimo tuve ocasin de comprobarlo durante mi ex-periencia como Director General de Salud Pblica del Ministerio de Sanidad yConsumo (2002-2004). En esa etapa profesional pude comprender hasta qupunto la estadstica me ayud al anlisis del riesgo asociado a la exposicin a losresiduos del Prestige, cmo caracterizar y predecir la tendencia de la neumonaasitica (SARS)... o cmo tras una leve temporada de gripe (con baja mortalidadinvernal), la ola de calor haba hecho que durante el verano hubiese aumentado lamortalidad de forma significativa... El anlisis estadstico tiene consecuenciasprcticas evidentes si queremos proceder con bsica inteligencia sanitaria parala consiguiente accin. Dicho anlisis, tan importante para caracterizar factores deriesgo o de proteccin, est basado en el clculo de probabilidades; las caracte-rsticas de las pruebas diagnsticas (sensibilidad, especificidad y valores predic-tivos) son probabilidades; la significacin estadstica de la que tanto se habla ytanto se desconoce es simplemente una probabilidad; la diferencia estadstica-mente significativa entre dos tratamientos es una decisin basada en la probabi-

    XXIII

    PRLOGO

  • lidad; el control de calidad se fundamenta en clculos probabilsticos. Sera in-terminable la lista de circunstancias fundamentales en las ciencias de la salud queseran muy difciles de entender sin conocimientos slidos de estadstica.

    Aunque la lista de textos de estadstica aplicada a las ciencias de la salud esextensa, el que ahora tengo el privilegio de prologar no es simplemente unoms. En primer lugar llama la atencin la cantidad de informacin que contiene;con cientos de ejemplos que permiten aclarar los conceptos estadsticos que a ve-ces son muy complejos. Es destacable el tratamiento de la inferencia distin-guiendo muy bien entre significacin tcnica y estadstica, que es lo que realmentediferencia la estadstica inferencial matemtica y la aplicada. Adems, se abordantemas que no se tratan frecuentemente en los libros de estadstica aplicada a lasciencias de la salud, como el anlisis de la varianza de medidas repetidas, la re-gresin logstica y la regresin mltiple, y todo ello con rigor y profundidad.

    Dado lo convencido que estoy de la importancia de la materia y de la capaci-dad del autor para explicarlo, creo que estamos ante un texto singular con valoraadido con respecto a lo que ya existe en la bibliografa. Deseo que las personasque tienen en sus manos esta obra disfruten con su estudio y tengan el mayor xi-to en sus trabajos.

    JOS MARA MARTN MORENOCatedrtico de Medicina Preventiva y Salud Pblica de la Facultad de Medicina

    y Hospital Clnico Universitario de Valencia & Member, European AdvisoryCommittee on Health Research, World Health Organization

    XXIV ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

  • La aplicacin de la estadstica a las ciencias de la salud y a las ciencias so-ciales est aumentando rpidamente en los ltimos aos. Pocos artculos se pu-blican sin que incluyan estudios estadsticos, al menos descriptivos. La estadsti-ca es una herramienta muy til y poderosa para describir y analizar datos, tambincomo apoyo a la toma de decisiones. Debido a su rpido desarrollo, no ha sido to-dava debidamente implementada a las tcnicas de investigacin propias de cadadisciplina.

    La estadstica aplicada tiene grandes diferencias conceptuales respecto a la es-tadstica matemtica, aunque sus fundamentos son los mismos. En estadstica ma-temtica se trabaja con nmeros que no tienen errores de medida, mientras que enestadstica aplicada las poblaciones de nmeros que son los valores de las varia-bles se obtienen despus de haber realizado observaciones y medidas; debido aello, si las mediciones no pueden ser exactas, lo que ocurre en la mayora de lascircunstancias, habr que tener en cuenta, en los clculos estadsticos, los erroresde medida; sin embargo esto es raro que se haga, y una vez obtenidos los resul-tados de investigacin se tratan como si procedieran de poblaciones de nmeros.Las primeras ciencias a las que se empezaron a aplicar tcnicas estadsticas fuerona la fsica, la qumica, y a sus aplicaciones tecnolgicas: la ingeniera. En general,las mediciones que se realizan en estas disciplinas tienen pocos errores y, adems,la mayora de las variables tienen variabilidades pequeas, por eso el xito en laaplicacin de la estadstica ha sido enorme. En la actualidad, no se podra enten-der la fsica moderna sin el uso de la estadstica; teoras como la mecnica esta-dstica y la mecnica cuntica no slo estn basadas en la estadstica, son teorasestadsticas con muy buenos resultados en la aplicacin prctica. Mediante la es-timacin de parmetros, los contrastes de hiptesis y el control de calidad apli-cados a estas disciplinas se suelen obtener magnficos resultados debido a la pe-quea varianza de la mayora de las variables a las que se aplican.

    La aplicacin de la estadstica a las ciencias de la salud y sociales, se ha rea-lizado y se realiza sin tener e cuenta, en muchos casos, que las mediciones no se

    PREFACIO

  • pueden hacer con mucha exactitud y que las variables en muchos casos tienen va-rianzas relativamente grandes. Por eso cuando las mediciones pueden hacerse concierta exactitud y las varianzas son pequeas se obtienen grandes xitos, comoocurre, en general, en bioqumica, gentica y fisiologa; sin embargo en medicinaclnica, administracin sanitaria y ciencias sociales se cometen importantes errores.

    Los errores en la estadstica aplicada estn muy generalizados, y no slo de-bido a la aplicacin de mtodos complejos, es muy frecuente aplicar intervalos deconfianza y realizar contrastes estadsticos con muestras no probabilsticas, lo cualno tiene ningn fundamento y las tomas de decisiones realizadas de esta manerano tienen la precisin ni el rigor que parecen tener. Un ejemplo muy conocido esel de los estudios de casos y controles, muy tiles en algunas ocasiones; sin em-bargo, en la mayora de los casos los datos no se obtienen mediante muestreosprobabilsticos, pero se estudian como tales.

    La toma de decisiones basadas en la significacin estadstica parece muycmoda y adems no hay que pensar mucho. Se coloca un nivel de decisin, fre-cuentemente 0,05, y si la probabilidad obtenida en el contraste de hiptesis es me-nor se rechaza la hiptesis nula, en caso contrario no se rechaza. El problema esque en estadstica aplicada la significacin estadstica es un parmetro secundarioen la toma de decisiones. El parmetro principal es la significacin tcnica, es de-cir, la importancia clnica, psicolgica, sociolgica o fisiolgica del valor calcu-lado de los parmetros, y slo si estos son relevantes tiene sentido preguntarse laprobabilidad de haber obtenido los resultados por azar, que es lo nico que con-testa la significacin estadstica, y esto si el estudio se basa en un muestreo pro-babilstico. Sin embargo, es muy frecuente que la discusin de los resultados deun experimento se hagan tomando como parmetro principal la significacin es-tadstica, muchas veces sin mencionar el valor de los parmetros clnicos o so-ciolgicos calculados y, en muchos casos, a partir de muestras no probabilsticas.Si las muestras son grandes la significacin estadstica est casi garantizada.

    El poder poltico y econmico necesita apoyo a sus decisiones. En la anti-gedad se consultaban los orculos, que se consideraban la voz de la verdadporque provenan de los dioses o de fuerzas superiores que rara vez se equivoca-ban. Si el consultante era poderoso, las predicciones casi siempre apoyaban susdeseos; si fallaban se achacaba a errores de interpretacin o a ofensas a las divi-nidades realizadas despus de las profecas. Aunque muchos usuarios poderososy sacerdotes saban que los orculos eran una patraa, les interesaba mantenerla:los poderosos porque reciban un respaldo divino a sus decisiones, y los sacerdo-tes de todos los rangos porque vivan muy bien de este trabajo.

    En la actualidad el poder poltico, en lugar de orculos consulta encuestas, yen el caso de las ciencias de la salud, el poder econmico consulta estudios de in-vestigacin; curiosamente los resultados apoyan casi siempre a los poderosos,como ocurra en la antigedad. Parece que este sistema es cmodo para casi todoslos implicados en l, y a pocos preocupa los graves errores que hay en su aplica-cin. La gran diferencia entre los orculos y el mtodo cientfico es que este lti-mo permite obtener informacin acertada cuando se utiliza correctamente.

    XXVI ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

  • Si los estudios se realizan con el rigor cientfico y la precisin que los exper-tos dicen tener: cmo es posible que se cometan tantos errores y que con tantafrecuencia los resultados, apoyados por los mejores expertos, muchas veces secompruebe que eran errneos?

    Mencin especial merecen los ensayos clnicos. Los tratamientos mdicos sebasan en ellos, y la tcnica de estos estudios no ha variado sustancialmente en losltimos treinta aos. Sin embargo, muchos estudios realizados hace quince oveinte aos, sobre tratamientos que parecan estupendos, la prctica ha demos-trado que no eran acertados o que sus riesgos eran mucho mayores de lo que pa-reca, y que el error aleatorio no es suficiente para explicar tantos desatinos. Sintener en cuenta el fraude, que puede explicar una parte de los errores, el problemaprincipal es la aplicacin incorrecta de tcnicas estadsticas y la interpretacin ina-decuada de los resultados basndose en la significacin estadstica en lugar de lasignificacin clnica. Las consecuencias pueden ser dramticas: tratamientos ina-decuados, fallecimientos y secuelas por efectos secundarios no previstos, etc.

    Es necesario revisar la aplicacin de la estadstica a las ciencias de la salud, ysu implementacin con los mtodos de investigacin, a fin de optimizar los re-sultados de las investigaciones, lo que sin duda ser beneficioso para la mayorade los ciudadanos.

    En Villa Libertad, Benalmdena a 11 de marzo de 2007.

    RAFAEL C. LVAREZ [email protected]

    PREFACIO XXVII

  • Este libro puede ser til como libro de aprendizaje; es decir, como libro detexto y como libro de consulta. Se incluyen casi todos los casos que pueden ne-cesitarse en estadstica aplicada, huyendo del simplismo generalizado de aproxi-mar a la normal casi todos los ejemplos, cometiendo importantes errores en mu-chas ocasiones.

    En la actualidad, los clculos estadsticos se realizan mediante programasestadsticos. Uno de los ms utilizados en ciencias de la salud y en ciencias so-ciales es SPSS 1; por eso en este libro se explican las salidas de resultados ms uti-lizadas de este programa, aunque como los resultados correspondientes a la ma-yora de las aplicaciones (estadstica descriptiva, comparacin de dos medias,tablas de contingencia, correlacin, regresin, regresin logstica, etc.) son muy si-milares a la mayora de los programas estadsticos, los comentarios acerca de lastablas de resultados obtenidas mediante SPSS pueden ser tiles para los usuariosde otros muchos programas como G-STAT, SAS y STAT GRAPHICS, entreotros. Existe la creencia muy extendida de que los programas estadsticos lo hacentodo respecto a los clculos estadsticos, y que no es necesario tener grandes co-nocimientos estadsticos para obtener buenos resultados. Esto es inexacto. Obte-ner resultados mediante programas estadsticos es relativamente sencillo, pero in-terpretar los parmetros obtenidos y elegir los adecuados no es tarea fcil y exigeamplios conocimientos de estadstica para no cometer errores importantes. Ade-ms, en el caso de clculos estadsticos de cierto nivel es necesario saber los pa-rmetros necesarios para realizar los clculos que muchas veces no se obtiene demanera inmediata; por ejemplo, el clculo del riesgo relativo mediante un mode-lo de regresin logstica no se obtiene de manera explcita; tampoco es posiblecomparar de manera inmediata dos coeficientes de regresin o de correlacin.Cierto es que la mayora de los grandes paquetes estadsticos como SPSS, adems

    GUA DE LECTURA

    1 SPSS es marca registrada de SPSS INC Chicago USA.

  • de los mens permiten obtener resultados mediante programacin, pero ello exi-ge importantes conocimientos informticos y estadsticos. Cada vez es ms ne-cesario tener conocimientos amplios de estadstica para utilizar eficientemente losprogramas. Este libro expone con detalle las principales tcnicas utilizadas en es-tadstica aplicada en general, y en particular las de uso cotidiano en las ciencias dela salud.

    El libro se puede dividir en dos partes: los primeros once captulos incluyen lamateria fundamental, los conocimientos generales e imprescindibles; la segundaparte incluye tcnicas estadsticas concretas.

    El Captulo 1 expone los principios fundamentales estadsticos y cientficos.Se recomienda leerlo atentamente porque muchos errores se cometen por inter-pretaciones inadecuadas de los conceptos de poblacin y muestra, y de un prin-cipio elemental en estadstica aplicada: la validez de los valores de las variables.Todo estudio estadstico se basa en procesar la informacin disponible acerca deun conjunto de variables, si los valores de stas son inexactos, tambin lo son losclculos estadsticos.

    El Captulo 2 se refiere a la estadstica descriptiva; es decir, tabulacin, gr-ficos y parmetros fundamentales correspondientes a los tipos de variables utili-zadas en estadstica aplicada.

    El Captulo 3 hace una introduccin a los principios elementales de la proba-bilidad: espacio muestral, axiomas y principales teoremas de la probabilidad sonalgunos de los temas comentados. Se utiliza como herramienta matemtica el l-gebra de Boole. Si algn lector necesita recordar los fundamentos de esta tcnicamatemtica, en el apndice uno se recuerdan sus fundamentos.

    El Captulo 4 aborda los conceptos de sucesos mutuamente excluyentes e in-dependientes; adems se estudia la probabilidad condicionada y el teorema de Va-yes, fundamental para el clculo de probabilidades en la aplicacin a las cienciasde la salud, como en el caso de ayudas al diagnstico.

    El Captulo 5 trata de la aplicacin del clculo de probabilidades al clculo deparmetros muy utilizados en ciencias de la salud, como riesgo, riesgo relativo, ra-zn de predominio, sensibilidad, especificidad y valores predictivos.

    El Captulo 6 es ms tcnico desde el punto de vista estadstico, pero es muyinteresante como base para abordar las principales distribuciones de probabilidaden los captulos siguientes. Se recomienda estudiarlo detenidamente.

    El Captulo 7 estudia las principales distribuciones de probabilidad aplicablesa variables aleatorias discretas. La ms importante es la binomial, pero tambin seutilizan con frecuencia las distribuciones de Poisson, multinomial, hipergeom-trica, geomtrica y binomial negativa.

    En el Captulo 8 se estudian las distribuciones de probabilidad ms impor-tantes aplicables a variables aleatorias continuas. La ms utilizada es la distribu-cin normal o de Gauss, pero tambin son de uso frecuente las distribuciones dela t de Student, la Chi-cuadrado y la F de Snedecor. En este captulo se dan lasinstrucciones necesarias para el manejo de las tablas que permiten el clculo deprobabilidades mediante las distribuciones antedichas.

    XXX ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

  • El Captulo 9 introduce los principios de la estadstica analtica. Es funda-mental distinguir entre inferencia estadstica e inferencia tcnica; tambin se es-tudian las principales tcnicas de muestreo, con especial atencin al muestreo pro-babilstico.

    El Captulo 10 estudia uno de los temas que aborda la estadstica analtica, laestimacin de parmetros puntual y por intervalo. Se analiza el clculo de inter-valos de confianza para la estimacin de medias y de proporciones teniendo encuenta muchas circunstancias distintas; tambin se predetermina el tamao demuestra necesario para estimar parmetros con una precisin determinada.

    El Captulo 11 estudia con detalle el otro tema que aborda la estadstica ana-ltica, el contraste de hiptesis. Los contrastes de hiptesis estadsticos siemprehan estado rodeados de controversia, incluso hay quien aboga por su eliminacin.Es cierto que su interpretacin es compleja, pero son imprescindibles en la tomade decisiones en estadstica analtica. Como todas las herramientas complejas, sino se saben utilizar se pueden cometer importantes errores. Se analizan con detallemuchos ejemplos y se estudian los errores que se cometen habitualmente en elcontraste de hiptesis estadsticas.

    El Captulo 12 analiza algunos principios bsicos a tener en cuenta en esta-dstica aplicada, como causalidad, interaccin entre variables y fenmenos de con-fusin.

    El Captulo 13 estudia la comparacin de dos proporciones, tanto en el casode datos pareados como independientes. Se realizan clculos de intervalos de con-fianza y contraste de hiptesis en los casos ms utilizados en estadstica aplicada.

    El Captulo 14 estudia la estadstica descriptiva y analtica mediante el uso detablas de contingencia, que se utilizan muy frecuentemente en estadstica aplica-da a las ciencias de la salud y a las ciencias sociales. El clculo de la Chi-cua-drado de Pearson, la correccin de Yates, la prueba de Fisher y la prueba de Mc-Nemar, son algunas de las pruebas estadsticas analizadas. Se realiza el clculo delos parmetros ms utilizados en el anlisis del riesgo mediante tablas de contin-gencia.

    El Captulo 15 trata sobre la comparacin de dos medias, tanto en el caso dedatos apareados como datos independientes. El clculo de intervalos de confian-za, contraste de hiptesis y predeterminacin del tamao muestral particularizadoscuando se analizan simultneamente dos medias, son los temas fundamentales es-tudiados en este captulo.

    En el Captulo 16 se estudia el anlisis de la varianza unifactorial. Esta inte-resante tcnica estadstica permite comparar k medias de manera simultneasiendo k 2. Adems, el contraste de hiptesis mediante el cociente de dos va-rianzas y el anlisis de la tabla de ANOVA se utilizan en muchas tcnicas de es-tadstica avanzada, como el anlisis de regresin. Las tcnicas de comparacinmltiple se utilizan tambin en otras tcnicas estadsticas, como las pruebas deFriedman y de Kruskall Wallis. Se recomienda al lector interesado en las tcnicasestadsticas avanzadas estudiar este captulo, puesto que los principios que en l seexponen son aplicables a otras muchas tcnicas.

    GUA DE LECTURA XXXI

  • El Captulo 17 estudia el anlisis de la varianza bloques y el anlisis de la va-rianza de medidas repetidas, que permite comparar k medias, siendo k 2, en elcaso de datos pareados. Tambin se estudian las pruebas de comparacin mltipleaplicables en el caso de rechazar la hiptesis nula de igualdad de medias.

    En el Captulo 18 se estudia la asociacin entre variables cuantitativas, fun-damentalmente las medidas de correlacin de Pearson y de Spearman. Tambin seanaliza la comparacin de dos coeficientes de correlacin.

    El Captulo 19 analiza la regresin lineal simple. Con objeto de fijar concep-tos, se recomienda al lector estudiar primero la regresin simple, y despus lamltiple, ya que muchos conceptos son similares y aplicables de manera inme-diata a esta ltima.

    El Captulo 20 analiza la regresin lineal mltiple. Se han evitado los com-plejos anlisis matemticos, aunque se comenta que el modelo matricial no es im-prescindible para el seguimiento del captulo, aunque s deseable. Entre otros te-mas, se analiza con detalle la inclusin en los modelos de variables ficticias(Dummy).

    En el Captulo 21 se estudia la regresin logstica simple y mltiple; esta esuna de las tcnicas ms utilizadas en ciencias de la salud en los artculos publi-cados en las revistas ms prestigiosas del mundo. En primer lugar se analiza la re-gresin simple para fijar conceptos, y despus la mltiple. Al igual que en el casode la regresin lineal mltiple, se hace un estudio amplio sobre las variables fic-ticias (Dummy). Despus se estudia el anlisis del riesgo mediante modelos de re-gresin logstica.

    En el Captulo 22 se analizan las tcnicas estadsticas no paramtricas ms uti-lizadas en estadstica aplicada.

    El Captulo 23 tercero trata los aspectos estadsticos generales de la metodo-loga de la investigacin aplicada a las ciencias de la salud.

    El Captulo 24 estudia los aspectos estadsticos ms importantes de los estu-dios observacionales.

    El Captulo 25 analiza las caractersticas ms importantes de los ensayos cl-nicos y sus peculiaridades estadsticas.

    Y como punto final, en el Captulo 26 se comentan los errores ms frecuentesque se suelen cometer en estadstica aplicada.

    XXXII ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

  • familiarizarse con ciertas expresiones matemticas. Los clculos necesarios se realizan consultando tablas, la tabla de la curva normal tipificada que se utiliza ha-bitualmente en este texto est basada en la funcin de distribucin acumulativa.Cuando se determina el valor de un rea mediante la tabla se realiza de una ma-nera sencilla un clculo que de otra manera habra que realizar resolviendo com-plejas expresiones integrales.

    CLCULO DE PROBABILIDADES MEDIANTE TABLASComo se ha indicado en apartados anteriores, el clculo de probabilidades de

    variables aleatorias normalmente distribuidas puede realizarse resolviendo com-plicadas expresiones integrales o mediante el uso de tablas, lo cual es mucho mssencillo.

    Las tablas pueden ser distintas, no todas estn basadas en la funcin de dis-tribucin acumulativa; saber manejar un tipo de tabla no presupone que se sepanmanejar todas; se recomienda al lector que si necesita manejar una tabla distintade la que emplea habitualmente, para evitar errores, antes de utilizarla estudie de-tenidamente sus fundamentos.

    Las tablas que se utilizan en este libro, para el clculo de probabilidades co-rrespondientes a variables aleatorias normales y, tambin para el clculo de pro-babilidades de variables aleatorias que se distribuyen de manera distinta a lanormal, estn basadas en la funcin de distribucin acumulativa.

    Los problemas a resolver son fundamentalmente de dos tipos:

    a) Conocida la abscisa de la variable aleatoria X, o de la variable aleatoria ti-pificada z, calcular la probabilidad de que la variable tenga un valor dentrode un determinado intervalo.

    b) Calcular la abscisa o abscisas que delimiten una proporcin de rea deter-minada.

    Mediante el siguiente ejemplo se comenta detalladamente el uso de la tabla.Se recomienda al lector seguirlo con especial atencin, puesto que las cuestionesa resolver han sido especialmente diseadas para comprender el manejo de la tabla.

    8.5.

    198 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

  • DISTRIBUCIONES DE VARIABLES ALEATORIAS CONTINUAS 199

    EJEMPLO 8.2La glucemia basal de los diabticos atendidos en un centro sanitario puede

    considerarse como una variable normalmente distribuida, con media 106 mg por 100ml, y desviacin tpica 8 mg por 100 ml N(106; 8).

    Calcular:

    a) La proporcin de diabticos con una glucemia basal inferior a 120 mg por100 ml, P(X 120) (recuerde que en variable continua es lo mismo menorque menor o igual).

    b) La proporcin de diabticos con una glucemia basal comprendida entre 106y 120 mg por 100 ml.

    c) La proporcin de diabticos con una glucemia basal mayor de 120 mg por100 ml.

    d) El nivel de glucemia basal tal que por debajo de l estn el 25% de los dia-bticos, es decir, el primer cuartil.

    a) El clculo anterior no puede realizarse directamente, puesto que no se dis-pone de tablas para los parmetros correspondientes a la variable X, pero tipifican-do 120 se obtiene:

    Z (120

    8106) 1,75

    El valor tipificado tiene la siguiente propiedad:

    P(X 120) P(Z 1,75)

  • 200 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

    x

    120

    Z

    1,75

    FIGURA 8.9. P(X 120).

    FIGURA 8.10. P(Z 1,75).

    0

    106

  • DISTRIBUCIONES DE VARIABLES ALEATORIAS CONTINUAS 201

    En los grficos anteriores el rea sombreada representa la probabilidad pedida.Observe que el rea bajo la curva N(106; 8) para X 120 es igual que el rea bajola curva tipificada N(0; 1) para Z 1,75. Por lo tanto, con la tabla de la curva nor-mal tipificada se calcula el rea necesaria para resolver este punto del ejercicio.

    Busque en la Tabla I en la columna encabezada por z, el valor 1,7, una vez lo-calizado este valor observe que en la parte superior de la tabla hay 10 columnas des-de la 0,00 hasta la 0,09, la confluencia de la fila cuyo comienzo es 1,7 y la columna0,00 corresponde a P(X 1,70) cuyo valor es 0,9554, la segunda columna P(X 1,71)y as sucesivamente hasta llegar a la columna encabezada por 0,05, que correspon-de a 1,75 cuya probabilidad es la que se desea calcular; la probabilidad buscada es 0,9599.

    Observe que el valor de la columna encabezada por Z corresponde al valor en-tero y al primer decimal de la normal tipificada, en la fila correspondiente estn losvalores de las probabilidades, cada columna aade una centsima al valor que en-cabeza la fila, en el primer punto del ejemplo se desea calcular la probabilidad quedeja a su izquierda el valor de Z 1,75, es decir, la funcin de distribucin acumula-tiva, F(Z 1,75) P(Z 1,75), en primer lugar se localiza la fila correspondien-te a 1,7, a este valor cada columna aade una centsima a dicho valor, hasta 0,05,que son las centsimas que hay que aadir 1,7 para obtener 1,75; la interseccin en-tre la fila encabezada por 1,7 y la columna encabezada por 0,05, muestra la proba-bilidad que se quiere calcular.

    P(X 120) P(Z 1,75) 0,9599

    La proporcin de diabticos con una glucemia basal menor de 120 mg por 100ml es 0,9599. Tambin se podra decir que la probabilidad de que un diabtico se-leccionado al azar en esta poblacin tenga una glucemia basal inferior a 120 mg por100 ml es 0,9599.

    b) Se pide la probabilidad de que el valor de la variable aleatoria est com-prendida entre 106 y 110, P ( 106 X 110). En la Figura 8.11 se representa laprobabilidad pedida.

    Observe que si al rea bajo la curva para X 110, se le resta el rea bajo la curva para X 106 se obtiene la probabilidad pedida, que se corresponde conel rea sombreada, esto puede expresarse matemticamente de la siguiente ma-nera:

    P(106 X 110) P(X 110) P(X 106)

    El valor tipificado de 110 es 0,5: Z 110 8

    106; el valor tipificado de 106 es

    0: Z 106

    8106

    . Observe que Z es la distancia en desviaciones tpicas de un va-

    lor a la media, puesto que 106 es la media su distancia a 106, o sea, a s misma es 0.

    El rea sombreada en la curva normal tipificada es la probabilidad pedida (Fi-gura 8.12).

  • 202 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

    X

    rea bajo la curva para:(106 X 110)

    Z

    0,50

    rea bajo la curva para:(0 Z 0,5)

    FIGURA 8.11. P(106 X 110).

    FIGURA 8.12. P(0 Z 0,5).

    106 110

  • DISTRIBUCIONES DE VARIABLES ALEATORIAS CONTINUAS 203

    P(106 X 110) P(X 110) P(X 106) P(Z 0,5) P(Z 0)

    P(Z 0,5) consultando en la tabla es igual a 0,6915.P(Z 0) es 0,5 puesto que es la mitad de la curva.

    P(X 110) P(X 106) P(Z 0,5) P(Z 0) 0,6915 0,5 0,1915

    La proporcin de diabticos con una glucemia basal comprendida entre 110 y106 mg por 100 ml es 0,1915.

    c) Se pide la proporcin de diabticos con una glucemia basal mayor de 120 mgpor 100 ml, P(X 120). En variable continua que 120 o 120, es lo mismo,puesto que la nica diferencia sera la probabilidad de que la variable tome, exac-tamente, el valor 120, que es 120 seguido de infinitos ceros, dicha probabilidad escero.

    P(X 120) P(X 120) 1

    Observe que en la expresin anterior estn contempladas todas las posibilidades,por lo tanto la probabilidad es 1.

    En el punto a se ha calculado P(X 120), cuyo valor es 0,9599.

    P(X 120) 1 P(X 120) 1 0,9599 0,0401

    La proporcin de diabticos con una glucemia basal mayor de 120 mg por 100 mles 0,0401.

    d) En este caso se pide el valor de la glucemia basal a, que cumpla la siguientecondicin:

    P(X a) 0,25

    Observe que esta cuestin es distinta a las anteriores, en este caso se conoce laprobabilidad pero no el valor de X.

    En la Figura 8.13 se representa grficamente el problema.El punto a tiene un valor tipificado Za caracterizado por: (Z za) 0,25.Buscando en la tabla en los valores de las probabilidades, no en la columna Z,

    tenga en cuenta que en este caso se conoce la probabilidad, 0,25, y se quiere calcu-lar el valor de Z que le corresponde. El valor 0,25 exacto no est en la tabla, los va-lores mayor y menor que el son 0,2514, al que le corresponde el valor Z 0,67, y0,2483 al que corresponde el valor Z 0,68; el valor buscado est entre los dosvalores de Z anteriores y, aproximadamente, en el punto medio de los dos, por lotanto: P(Z 0,675) 0,25, o sea, que 0,675 es el valor que corresponde al pri-mer cuartil de la variable normal tipificada.

    En la curva de la Figura 8.14 se representa grficamente la situacin en la cur-va normal tipificada.

  • 204 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

    FIGURA 8.13. P(X a) 0.25.

    FIGURA 8.14. P(Z 0,675) 0.25.

    X

    106a

    0,25

    Z

    0,675 0

    0,25

  • TEOREMA CENTRAL DEL LMITESi una variable aleatoria X puede expresarse como suma de n variables alea-

    torias independientes, para n 30, X es aproximadamente normal.El teorema central del lmite tiene un gran nmero de aplicaciones en esta-

    dstica. Hay muchas variables que pueden descomponerse en la suma de n varia-bles aleatorias independientes y cuando n es mayor de 30 se puede considerar quedichas variables son aproximadamente normales. La mayora de los autores acep-tan que con n 30 es suficiente para que la aproximacin a la normal sea ade-cuada, lo cual ha sido comprobado en mltiples experimentos de simulacin conordenador. La aproximacin a la normal mejora segn aumenta n.

    APROXIMACIN DE UNA DISTRIBUCIN BINOMIAL A UNA NORMAL

    En ocasiones y bajo ciertas condiciones se puede aproximar una distribucinbinomial a una normal, lo cual puede facilitar notablemente los clculos. Laaproximacin no siempre es posible, y si no se tienen en cuenta las condicionesque la permiten pueden cometerse importantes errores de clculo.

    Si una variable aleatoria X es binomial con parmetros n y p, B(n, p), puedeaproximarse a una distribucin normal con np y desviacin tpica : npqcuando se cumplen simultneamente las siguientes condiciones:

    a) p 0,05b) q 0,05 (q 1 p)c) n 30

    Una distribucin binomial de parmetros n y p, consiste en n pruebas inde-pendientes, la variable aleatoria binomial X, puede considerarse como la suma de

    8.7.

    8.6.

    DISTRIBUCIONES DE VARIABLES ALEATORIAS CONTINUAS 205

    0,675 es el valor tipificado de a, ahora hay que calcular el valor de la variableX, denotado mediante a, que corresponde a ese valor:

    0,675 a 8106

    Despejando a en la ecuacin anterior:

    a 100,6

    El valor pedido es 100,6, esto significa que el 25% de los diabticos de la po-blacin estudiada tienen una glucemia basal inferior a 100,6 mg por 100 ml.

  • n procesos de Bernouille, cada uno de ellos compuesto por una variable aleatoriadicotmica, por lo tanto una variable aleatoria binomial est compuesta por n va-riables aleatorias independientes.

    Muchos autores consideran que la aproximacin binomial a la normal es po-sible si np 5 y nq 5, pero esta condicin puede ser insuficiente en muchos ca-sos, por ejemplo si p 0,5 y n 11 se cumple la condicin np y nq 5, sin em-bargo el teorema central del lmite exige que n sea al menos igual a 30.

    La variable aleatoria binomial X es discreta, mientras que las variables nor-malmente distribuidas son continuas; cuando una variable binomial cumple los requisitos para realizar la aproximacin a la normal debe tenerse en cuenta queP(X a) 0, si X es continua, para evitar errores debe realizarse la correccinpor continuidad, esto significa que la equivalencia P(X a) cuando X es binomialy por lo tanto discreta, debe considerarse como P(a 0,5 X a 0,5), al realizar la aproximacin a la normal y ser X continua, calculando la probabilidadde que X est contenida en un determinado intervalo.

    206 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

    EJEMPLO 8.3Un tratamiento antibitico es efectivo frente a infecciones pulmonares por le-

    gionella en el 25% de los casos. Los pacientes mejoran permaneciendo con buen es-tado general y afebriles antes de transcurridas 72 horas del comienzo del trata-miento. En una epidemia de infecciones pulmonares por legionella se aplica eltratamiento a 80 pacientes.

    Calcular la probabilidad de que antes de 72 horas de iniciado el tratamiento me-joren entre 25 y 35 pacientes, es decir, sea efectivo el tratamiento.

    Cada paciente tratado es una prueba independiente de las dems. La variablealeatoria X nmero de pacientes que mejoran antes de 72 horas de administrado eltratamiento es discreta y el experimento cumple los requisitos de la distribucin bi-nomial con parmetros n 80 y p 0,25, B(80; 0,25).

    Se cumplen los requisitos de aproximacin a la normal:

    a) p 0,25 p 0,05b) q 0,75 q 0,05c) n 80 n 30

    Podemos pasar de una B(80; 0,25) a una normal con 20 y 3,875, losparmetros de la variable normal son: N(20; 3,87).

    El problema pide calcular: P(25 X 30), aproximando a la normal y te-niendo en cuenta la correccin por continuidad la probabilidad pedida es:

    P(24,5 X 30,5)

    Tenga en cuenta que 25 al pasar de variable discreta a continua es el intervalo24,5 - 25,5 y 30 el intervalo 29,5 - 30,5.

  • DISTRIBUCIONES DE VARIABLES ALEATORIAS CONTINUAS 207

    Resumiendo, se dispone de una variable aleatoria normal con 20 y 3,87N(20; 3,87).

    P(24,5 X 30,5) P(X 30,5) P (X 24,5)

    El valor tipificado de 30,5 es: 2,71, y el de 24,5: 1,16. Por lo tanto:

    P(X 30,5) P (X 24,5) P(Z 2,71) P(Z 1,16)

    Consultando en las tablas de la curva normal tipificada:

    P(Z 2,71) P(Z 1,16) 0,9966 0,8770 0,1196

    Hay una probabilidad de 0,1196 de que de los 80 pacientes tratados, entre 25 y30 mejoren antes de 72 horas de iniciado el tratamiento.

    APROXIMACIN DE LA DISTRIBUCIN DE POISSON A LA NORMAL

    La distribucin de Poisson es aplicable a variables aleatorias discretas. Cuan-do el parmetro es mayor de 10, se puede aproximar a una distribucin normalcon y .

    Teniendo en cuenta que la variable aleatoria X es discreta, al realizar la apro-ximacin a la normal debe hacerse la correccin por continuidad.

    8.8.

    EJEMPLO 8.4.En un hospital el nmero medio de pacientes con dolor abdominal atendidos por

    da es 16. Calcular la probabilidad de que un da determinado haya ms de 25 pacientes

    con dolor abdominal.

    El nmero de pacientes con dolor abdominal puede considerarse un suceso dePoisson con 16, teniendo en cuenta que 10 se puede hacer una aproxima-cin a una normal con 16 y 4.

    La probabilidad pedida es:

    P(X 25) 1 P(X 25)

    Al realizar la aproximacin a la normal hay que hacer la correccin por conti-nuidad, por lo tanto, la probabilidad anterior queda de la siguiente manera:

    P(X 24,5) 1 P(X 24,5); el valor tipificado de 24,5 es: 2,131 P(X 24,5) 1 P(Z 2,13) 1 0,9834 0,0166

  • DISTRIBUCIN GAMMALa distribucin o funcin gamma () de Euler es la base de algunas de las

    ms importantes distribuciones de probabilidad utilizadas en estadstica.La funcin gamma de grado k est definida por la siguiente expresin:

    (k) 0

    Xk1ex dx [8.7]

    La funcin anterior est definida para k 0.Se puede demostrar que (k) (k 1)! En el caso particular k 1:

    (1) 0

    ex dx [8.8]

    (1) es la funcin exponencial negativa para x 0.Resolviendo [8.7]:

    (1) [ex] X entre 0 e

    (1) 1; teniendo en cuenta que (k) (k 1)!, (1) 0! 1. Observeque 0! 1 es una igualdad matemtica y no un convenio. La funcin exponencialnegativa para x 0 es igual a 1 y, por lo tanto, puede definir una distribucin deprobabilidad. Recuerde que una condicin necesaria de una funcin para poderdefinir una distribucin de probabilidad es que el rea entre la curva y el eje deabscisas sea igual a 1.

    LA DISTRIBUCIN CHI-CUADRADO (2)La distribucin 2 es una de las ms utilizadas en ciencias de la salud, muchos

    estimadores de uso corriente en investigacin clnica y epidemiolgica se distri-buyen segn esta curva. En este apartado se estudian las caractersticas funcio-nales de la distribucin y sus propiedades ms importantes, incluyendo la utili-zacin de la tabla.

    Una variable aleatoria continua X, sigue una distribucin chi-cuadrado con grados de libertad 1; 2, si su funcin de probabilidad es la siguiente:

    8.10.

    8.9.

    208 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

    1 Grados de libertad es el nmero de variables que pueden tomar valores libremente. Las res-tricciones son los parmetros que tienen que tomar un valor determinado.

  • SSResidual K

    j1 b

    i1(Xji XGj XBi X)2 [17.10]

    Para facilitar los clculos de la suma de cuadrados es preferible utilizar las si-guientes frmulas:

    SSTotal K

    j1 b

    i1X2ji [17.11]

    SSGrupos K

    j1Tb

    2Gj [17.12]

    En la expresin anterior TGj es la suma de todos los valores del j-simo grupo.

    SSBloques n

    i1TK

    2Bi [17.13]

    En la expresin anterior TBi es la suma de todos los valores del i-simo bloque.

    SSResidual SSTotal SSGrupos SSBloques [17.14]

    CUADRADOS MEDIOS

    Los cuadrados medios, que son la estimacin puntual de las varianzas, se ob-tienen dividiendo la suma de cuadrados por los correspondientes grados de liber-tad. Los grados de libertad, GL, son aditivos, es decir, los grados de libertad to-tales, son iguales a los grados de libertad entre grupos ms los grados de libertadde bloques ms los grados de libertad residuales:

    GLTotal GLGrupos GLBloques GLResidual [17.15]GLTotal Kb 1; GLGrupos K 1; GLBloques b 1

    Despejando en 17.15.

    GLResidual GLTotal GLGrupos GLBloques [17.16]GLResidual (Kb 1) (K 1) (b 1)

    17.4.

    ( Kj1 bi1Xji)2

    Kb

    ( Kj1 bi1Xji)2

    Kb

    ( Kj1 bi1Xji)2

    Kb

    ANLISIS DE LA VARIANZA: BLOQUES, MEDIDAS REPETIDAS 533

  • GLResidual (K 1)(b 1) [17.17]

    MSTotal KSbST

    otal

    1 [17.18]

    MSGrupos SKSG

    rup

    1os

    [17.19]

    MSBloques SbSB

    loq

    1ues

    [17.20]

    MSResidual (K S1S)Re

    si

    (du

    bal

    1) [17.21]

    HIPTESIS DE ANOVA BLOQUESEn el anlisis de la varianza de bloques la hiptesis principal a contrastar es la

    igualdad de las medias de los grupos.

    H0 G1 G2 GKH1 Gi Gj para algn i, j

    En el ejemplo 17.1, la hiptesis principal a contrastar es si existen diferenciasen disminucin del colesterol entre los hipolipemiantes, una vez controlado el po-sible efecto distorsionador de los hipotensores.

    Una hiptesis secundaria a contrastar, aunque muchas veces carece de inters,es la igualdad entre las medias de los bloques.

    H0 B1 B2 BKH1 Bi Bj para algn i, j

    Lo ms frecuente es que haya diferencias entre los bloques, precisamente poreso se controla su efecto para que esta distorsin no afecte al objetivo principal delestudio, que es comparar las medias de los grupos. En cualquier caso, sea o no es-tadsticamente significativo, el efecto bloques no afecta al resultado del contrastede la hiptesis principal. Lo importante es el diseo, bloquear el posible efecto deuna variable extraa a los objetivos del estudio.

    En el ejemplo 17.1, el contraste entre las medias de los bloques comparara lasmedias del colesterol entre los distintos tratamientos hipotensores.

    De manera similar que en el anlisis de la varianza unifactorial, la hiptesisprincipal se contrasta comparando el cuadrado medio entre grupos y el cuadrado

    17.5.

    534 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

  • medio residual mediante la prueba de la F de Snedecor, si la significacin esta-dstica es menor que el valor del contraste de hiptesis se concluye que hay unefecto sobre la variable dependiente debido al grupo, en el ejemplo de los hipoli-pemiantes, indicara que el efecto de los tratamientos es diferente.

    La hiptesis secundaria se contrasta comparando el cuadrado medio bloquescon el cuadrado medio residual, tambin mediante la prueba de la F de Snedecor,si la significacin estadstica es menor que el valor del contraste de hiptesis seconcluye que hay un efecto sobre la variable dependiente debido al bloque.

    Si se sospecha que en las poblaciones de referencia no se cumplen los su-puestos de ANOVA, se puede contrastar la hiptesis principal mediante el cocienteentre MSG y MSR, igual que antes, pero considerando que la F tiene 1 y (b 1)grados de libertad, en lugar de (K 1) y (K 1) (b 1) grados de libertad, deesta manera aumenta la probabilidad de cometer un error tipo II, pero disminuyela probabilidad de cometer error tipo I.

    17.5.1. Tabla de ANOVA bloques

    Los parmetros fundamentales para realizar un anlisis de la varianza bloquesse suelen exponer en una tabla similar a la siguiente:

    ANLISIS DE LA VARIANZA: BLOQUES, MEDIDAS REPETIDAS 535

    Fuentede variacin

    Entre gruposBloquesResidualTotal

    GL

    K - 1b - 1

    (k 1)(b 1)Kb 1

    Suma de cuadrados

    SSGruposSSBloquesSSResidualSSTotal

    CuadradosmediosMSGruposMSBloquesMSResidual

    Fcociente

    MSGrupos/MSResidualMSBloques/MSResidual

    Fprob.

    P

    Anlisis de la varianza bloques

    EJEMPLO 17.2El objetivo de un estudio es evaluar el poder hipocolesterolemiante de tres tra-

    tamientos diferentes A, B y C en pacientes hipertensos; el tipo de tratamiento hipo-tensor puede influir en los resultados; para controlar este posible efecto se realiza undiseo de bloques. Hay tres pacientes por cada uno de los seis tipos principales detratamiento hipotensor: diurticos, betabloqueantes, alfabloqueantes, IECAS, ARAIIy calcioantagonistas; se seleccionan tres pacientes de cada tipo de tratamiento hi-potensor y se asignan al azar a cada uno de los tres tratamientos hipolipemiantes;tres meses despus se analiza el nivel del colesterol total de cada uno de los diecio-cho pacientes que participan en el estudio en mg por 100 ml. Los datos obtenidosson los siguientes:

  • 536 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

    Hay diferencias entre los valores del colesterol obtenidos mediante los trata-mientos de los tres hipolipemiantes? Hay efecto de bloques? Estas son las pre-guntas cuya respuesta se quiere obtener, mediante el anlisis de la varianza bloques.El contraste se resuelve con 0,05.

    A continuacin se calculan las sumas de cuadrados. Aplicando la expresin17.11 se calcula la suma de cuadrados total:

    SSTOTAL 850.521,00 838.512,5; SSTOTAL 12.008,5

    Aplicando la expresin 17.12 se calcula la suma de cuadrados grupos:

    SSGRUPOS 1.36242

    1.46552

    1.16062 838.512,5; SSGRUPOS 10.360,32

    Aplicando la expresin 17.13 se calcula la suma de cuadrados bloques:

    SSBLOQUES 67302

    66322

    65342

    63342

    63362

    62392 838.512,5

    SSBLOQUES 471,82

    Aplicando la expresin 17.14 se calcula la suma de cuadrados residual:

    SSRESIDUAL 12.008,50 10.360,32 471,82; SSRESIDUAL 1.176,36

    A continuacin teniendo en cuenta los correspondientes grados de libertad secalculan los cuadrados medios:

    A

    Diurticos 227

    B

    233

    C

    210 TD 670 xD 223,33 SD 11,93

    Betabloq. 231 241 190 TBQ 662 xBQ 220,67 SBQ 27,02

    Alfabloq. 216 252 186 TAQ 654 xAQ 218 SAQ 33,05

    IECAS 222 237 175 TIE 634 xIE 211,33 SIE 32,35

    ARAII 217 242 177 TAR 636 xAR 212,00 SAR 32,79

    Calcioant. 211 250 168 TCL 629 xCL 209,67 SCL 41,02

    TA 1.324 TB 1.455 TC 1.106

    xA 220,67 xB 242,50 xC 184,3

    SA 7,45 SB 7,34 SC 14,84

    X 215,83 3

    j1

    6

    i1Xji 850.521,00

    TABLA 17.2. Hipolipemiantes

  • ANLISIS DE LA VARIANZA: BLOQUES, MEDIDAS REPETIDAS 537

    MSGRUPOS 10.36

    20,32 MSGRUPOS 5.180,16

    MSBLOQUES 471

    5,82 MSBLOQUES 94,36

    MSRESIDUAL 1.17

    160,36 MSRESIDUAL 117,63

    La hiptesis principal a contrastar es si hay diferencias entre las medias de co-lesterol total correspondientes a los grupos tratados con los tres hipolipemiantes.

    H0 A B CH1 i j para algn i, j 0,05

    La hiptesis anterior se resuelve comparando el cuadrado medio entre gruposcon el cuadrado medio residual mediante la prueba de la F de Snedecor.

    La hiptesis secundaria es comprobar si hay efecto de bloques:

    H0 D BQ AQ IE AR CLH1 i j para algn i, j 0,05

    La hiptesis anterior se resuelve comparando el cuadrado medio entre bloquescon el cuadrado medio residual mediante la prueba de la F de Snedecor.

    Los resultados de los contrastes se exponen en la siguiente tabla:

    La diferencia entre los colesteroles totales correspondientes a los tres grupos definidos por los tratamientos A, B y C son clnicamente significativos; adems, lasdiferencias son estadsticamente muy significativas, y habr que dilucidar entrequ medias hay diferencias; esto se har en los apartados siguientes.

    No hay diferencias estadsticamente significativas entre los bloques, es decir, nose ha podido probar que haya efecto bloques; debe tenerse en cuenta que las mues-tras son pequeas y, adems, haya o no efecto bloques, esto no influye en los re-sultados principales.

    Fuentede variacin

    Entre grupos

    GL

    2

    Suma decuadrados

    10.360,32

    Cuadradosmedios

    5.180,16

    Fcociente

    44,14

    Fprob.

    0,00001

    Bloques 5 471,82 94,36 0,80 NS

    Residual 10 1.176,36 117,63

    Total 17 12.008,50

    Anlisis de la varianza bloques

  • COMPARACIONES MLTIPLESSi al contrastar la hiptesis principal se rechaza la hiptesis nula, hay que di-

    lucidar entre qu medias hay diferencias estadsticamente significativas (eviden-temente esto tiene inters prctico si las diferencias son tcnicamente significati-vas), para ello pueden utilizarse las pruebas de comparacin mltiple estudiadasen el captulo anterior, aunque hay que tener en cuenta algunas diferencias. En elcaso del anlisis de la varianza unifactorial la varianza dentro de grupos es equi-valente a la varianza residual en el anlisis de la varianza bloques. Cuando en alguna prueba hay que utilizar los grados de libertad correspondientes a la varia-bilidad dentro de grupos que son N K, siendo N el nmero total de casos, es de-cir, bk, en el anlisis de la varianza bloques hay que tener en cuenta que los gradosde libertad residual son (K 1) (b 1). En el anlisis de la varianza bloques losgrupos tienen el mismo nmero de casos; una de las pruebas ms utilizadas es lade Tukey 1; en el caso de que las comparaciones se realicen respecto a la media deuno de los grupos se recomienda utilizar la de Dunnet.

    En general, haya o no efecto bloques, no se comparan las medias de los blo-ques, si se quisiera hacerlo habra que considerar a los bloques como grupos.

    17.6.

    538 ESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD

    1 Las caractersticas principales de las pruebas de Tukey y de Dunnnett se estudian en el Cap-tulo 16.

    EJEMPLO 17.3Realizar las pruebas de comparacin mltiple correspondientes al ejercicio

    17.2, con 0,05.En el ejercicio 17.2 se rechaz la hiptesis nula principal, por lo tanto la con-

    clusin es que hay diferencias estadsticamente significativas entre los tratamientoshipolipemiantes; hay que analizar entre qu medias son las diferencias detectadas.Los colesteroles medios correspondientes a los tres grupos son los siguientes:

    xA 220,67 xB 242,50 xC 184,33

    Interesa realizar todas las posibles comparaciones binarias entre las medias.Como todos los grupos tienen el mismo nmero de casos, seis, se puede aplicar laprueba de Tukey.

    Las diferencias entre las medias son:

    xA xB 21,83 xA xC 36,37 xB xC 58,17

    Segn Tukey, la diferencia mnima que tiene que haber entre dos medias paraconsiderar que hay diferencias estadsticamente significativas, DMS, se calculan me-diante la siguiente expresin:

  • ESTUDIO DE LA INTERACCIN: PRUEBA DE NO ADITIVIDAD DE TUKEY

    Uno de los supuestos del modelo es que entre el efecto grupos y el efecto blo-ques, si es que los hay, no hay interaccin, es decir, dichos efectos son aditivos.La interaccin es un efecto especial, ms all de la simple suma, entre alguno delos grupos y alguno de los bloques, lo que puede ocasionar importantes errores enla interpretacin de los resultados.

    Estudiar la interaccin entre grupos y bloques no es una tarea sencilla porque,entre otras razones, slo hay un caso por cada una de las posibles combinacionesde grupos y de bloques. Tukey propuso un mtodo denominado prueba de no adi-tividad de Tukey, el cual se expone en la Tabla 17.3.

    En dicha tabla, adems de los elementos que haba en la tabla 17.1, hay unosparmetros que no estaban en ella, los dGj, los dBi y sus correspond