inferencias asintÓticas sobre una combinaciÓn lineal de …
Post on 16-Oct-2021
5 Views
Preview:
TRANSCRIPT
UNIVERSIDAD DE GRANADA
Departamento de Estadiacutestica e Investigacioacuten Operativa
TESIS DOCTORAL
IINNFFEERREENNCCIIAASS AASSIINNTTOacuteOacuteTTIICCAASS SSOOBBRREE UUNNAA
CCOOMMBBIINNAACCIIOacuteOacuteNN LLIINNEEAALL DDEE KK PPRROOPPOORRCCIIOONNEESS
IINNDDEEPPEENNDDIIEENNTTEESS
Mariacutea Aacutelvarez Hernaacutendez
Granada 2011
Editor Editorial de la Universidad de Granada
Autor Mariacutea Aacutelvarez Hernaacutendez
DL GR 4518-2011
ISBN 978-84-694-5758-0
La presente Tesis Doctoral estaacute avalada (hasta la fecha de su lectura) por los artiacuteculos y comunicaciones a Congresos que se indican a continuacioacuten
Artiacuteculos aceptados
1 Martiacuten Andreacutes A and Aacutelvarez Hernaacutendez M (2008) Comments on lsquoActive-control
trials with binary data a com parison of m ethods for testing superiority or non-
inferiority using the odds ratio Statistics in Medicine 27(27) 5799-5800 DOI
101080 10629360601026386
2 Martiacuten Andreacutes A Aacutelvarez Hernaacutendez M and Herranz Tejedor I (2010)
Inferences about a linear com bination of proportions Statistical Methods in Medical
Research Prepublihed March 11 2010 DOI 1011770962280209347953
3 Martiacuten Andreacutes A Herranz Tejedor I and Aacutelvarez Hernaacutendez M (2010) On the
optimal m ethod to m ake inferences about a linear com bination of proportions To
appear in Journal of Statistical Computation and Simulation
Artiacuteculos sometidos
1 Martiacuten Andreacutes A Aacutelvarez Hernaacutendez M and Herranz Tejedor I (2011)
Asymptotic two-tailed confidence intervals for the difference of proportions
2 Martiacuten Andreacutes A and Aacutelvarez Hernaacute ndez M (2011) Two-tailed approxim ate
confidence intervals for th e ratio of proportions Som etido por segunda vez (a
instancias del editor) a The American Statistician
3 Martiacuten Andreacutes A and Aacutelvarez H ernaacutendez M (2011) Two-tailed asym ptotic
inferences for a proportion
4 Martiacuten Andreacutes A and Aacutelvarez Hernaacutendez M (2011) Optim al method for realizing
two-tailed inferences about a linear combination of two proportions
Congresos
1 Martiacuten Andreacutes A y Aacutelvarez Hernaacutendez M ldquoOn the inferences of a linear function of
several proportionsrdquo XII Conferencia Espantildeola de Biometriacutea Com unicacioacuten oral
Actas paacutegs 141-142 ISBN 978-84-692-532 5-0 Caacutediz (23-25 septiem bre del
2009)
2 Martiacuten Andreacutes A Aacutelvarez Hernaacutendez M y Herranz T ejedor I ldquoI ntervalos de
confianza aproxim ados para la diferencia de dos proporcionesrdquo XXXII Congreso
Nacional de Estadiacutestica e Investigacioacuten Operativa y VI Jornadas de Estadiacutestica
Puacuteblica Comunicacioacuten oral Actas paacutegs 1-7 ISBN 978-84-693-6152-8 A Coruntildea
(14-17 septiembre del 2010)
La realizacioacuten de este trabajo ha s ido posible gracias a la Beca Predoctoral
adscrita a Proyectos de Investigacioacuten de Ex celencia de la Consejeriacutea de Innovacioacuten
Ciencia y Empresa de la J unta de Andaluciacutea (BOJA nuacutem 138 de 18 de julio de 2005)
Proyecto de Excelencia P06-FQM-1459
Esta memoria ha sido realizada en el seno del
Grupo de Investigacioacuten en Bioe stadiacutestica de la Universi dad de Granada del Plan
Andaluz de Investigacioacuten Desarrollo e I nnovacioacuten de la Junta de Andaluciacutea (FQM-
235)
Proyecto de Investigacioacuten ldquoAnaacutelisis de tablas de contingencia desde las perspectivas
del acuerdo el diagnoacutestico la independencia y la equivalenciardquo del Plan Nacional
I+D (MTM2009-08886)
Proyecto de Investigacioacuten ldquoMeacutetodos estadiacutesticos para el acuerdo la independencia y
la equiv alencia Aplicacioacuten a la obtencioacuten de interva los de confianzardquo del Plan
Nacional I+D (MTM2008-01697)
AGRADECIMIENTOS
Quisiera dedicar m i maacutes sincero agradecim iento a m i tutor y director de Tesis
D Antonio Martiacuten Andreacutes y a m i direct ora Dntildea Inm aculada Herranz Tejedor por
haberme dado la posib ilidad de trabajar con ellos perm itieacutendome aprender de sus
conocimientos y de su excepcional profesionalidad G racias por su perm anente
disposicioacuten y dedicacioacuten a este trabajo ha sido todo un privilegio
Igualmente gracias a Francisco R equena Juan de Dios Luna Mariacutea Teresa
Miranda Pedro Fem ia Joseacute Antonio Roldaacuten y Ana Mariacuten m iembros de la Unidad
Docente de Bioestad iacutestica de la Fac ultad de Medicina (Dep artamento de Estad iacutestica e
Investigacioacuten Operativa de la Univer sidad de Granada) por acogerm e con carintildeo en e l
equipo Ellos son m odelo a seguir tanto por su s aptitudes en la investigacioacuten com o por
la calidad de su docencia Mi agradecim iento de modo especial a Marta Loacutepez por su
colaboracioacuten en los aspectos de form ato de esta m emoria y por su disponibilidad y
apoyo personal en todo momento
Quisiera m encionar con igual considerac ioacuten al departam ento de Estadiacutestica e
Investigacioacuten Operativa de la Universidad de Salam anca Mi gratitud a profesores y
compantildeeros con los que em prendiacute esta aven tura y en concreto a su directora Dntildea M
Purificacioacuten Galindo por inculcar me el intereacutes por la esta diacutestica y anim arme a seguir
adquiriendo conocimientos de ella
Agradezco el apoyo incondicional d e mi familia y am igos que han ten ido que
soportar y en m uchas ocasiones aliviar el de sgaste que este tipo de trabajos conlleva
Me comprometo a devolverles el tiempo que no he podido dedi carles en esta etapa En
especial mencionar a m is abuelas Pilar y Ca rmen por su ejem plo de lucha para salir
adelante y por los sabios consejos que ha n sido ayuda en m i crecimiento personal A
mis hermanas Rosalidia y Carm en por esta r conmigo siempre que las he necesitado
Finalmente a mis padres Manuel y Mordf del Carm en por ensentildearme la constancia en e l
trabajo y el arrojo en la vida Ellos son ejemplo diario y mi soporte en cada momento
ldquoLo importante es no dejar de hacerse preguntasrdquo
Albert Einstein
IacuteNDICE
Paacuteg
PROacuteLOGO XIII
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
I1 INTRODUCCIOacuteN 1
I2 NOTACIOacuteN 3
I21 Generalidades y estadiacutestico base 3
I22 Estimadores de las proporciones pi 4
I221 Estimadores no restringidos por H0 4
I222 Estimadores siacute restringidos por H0 5
I23 Procedimientos de inferencia que se obtienen con cada estimador 5
I24 Modificacioacuten de los datos muestrales y meacutetodos de inferencia que se
obtienen 7
I3 RESULTADOS DE LA LITERATURA 8
I31 Resultados teoacutericos 8
I311 Meacutetodo claacutesico de Wald y meacutetodos ldquoadjustedrdquo Wald 8
I312 Meacutetodos de tipo bayesiano 9
I313 Meacutetodo de tipo Newcombe 9
I32 Resultados praacutecticos 10
I321 Generalidades sobre los estudios de simulacioacuten 10
I322 Conclusiones de la literatura 11
I4 APORTACIONES DE TIPO TEOacuteRICO 13
I41 Propiedades a verificar por cualquier estadiacutestico para que la inferencia sea
coherente 13
I42 Meacutetodo de Newcombe-Zou 14
I43 Procedimiento y estimador E (meacutetodo de las marcas) 14
I431 Estimadores de maacutexima verosimilitud 15
I432 Equivalencia del planteamiento anterior y el test chi-cuadrado
(o test de las marcas) 17
I433 Caacutelculos alternativos para el test y el intervalo 18
II INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
I434 Propiedad del estadiacutestico 20
I435 Aproximaciones al meacutetodo de las marcas meacutetodos de tipo
ldquoadjustedrdquo Wald 21
I44 Procedimiento y estimador P (en sus dos versiones Pa y Pb) 24
I441 Obtencioacuten del procedimiento 24
I442 Propiedades del estadiacutestico Pa 25
I45 Meacutetodos con correccioacuten por continuidad 26
I5 APORTACIONES DE TIPO PRAacuteCTICO 28
I51 Objetivo 28
I52 Descripcioacuten del estudio de simulacioacuten y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo 28
I53 Seleccioacuten del meacutetodo oacuteptimo de cada familia en la versioacuten sin cpc 30
I531 Seleccioacuten para los meacutetodos de tipo W (α=5) 30
I532 Seleccioacuten para los meacutetodos de tipo N (α=5) 31
I533 Seleccioacuten para los meacutetodos de tipo E (α=5) 32
I534 Seleccioacuten para los meacutetodos de tipo P (α=5) 33
I54 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los mejores de cada familia
(α=1 5 y 10) caso general y caso particular de un contraste 34
I55 Seleccioacuten del meacutetodo oacuteptimo consin cpc de entre los mejores de cada
familia (α=5) 35
I56 Verificacioacuten de los resultados de la literatura 36
I6 CONCLUSIONES FINALES Y EJEMPLOS 37
I61 Meacutetodo oacuteptimo 37
I62 Foacutermulas aconsejadas para realizar la inferencia 37
I621 Meacutetodo E0 (el mejor salvo que nile10 i) 37
I622 Meacutetodo W3 (el mejor si nile10 i y una buena alternativa al resto
de casos) 38
I623 Meacutetodo Pa0 (meacutetodo muy conservador pero que no falla casi
nunca) 39
I63 Ejemplos praacutectico 39
IacuteNDICE III
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA
II1 INTRODUCCIOacuteN 43
II2 NOTACIOacuteN 44
II21 Generalidades y estadiacutestico base 44
II22 Estimadores de las proporciones pi 45
II221 Estimadores no restringidos por H0 45
II222 Estimadores siacute restringidos por H0 46
II23 Procedimientos de inferencia que se obtienen con cada estimador 47
II24 Datos muestrales a utilizar y meacutetodos que proporcionan 48
II3 RESULTADOS DE LA LITERATURA DE TIPO TEOacuteRICO 49
II31 Meacutetodos basados en el estadiacutestico Z 49
II311 Meacutetodo claacutesico de Wald y meacutetodos ldquoadjustedrdquo Wald 50
II312 Meacutetodo de Newcombe 50
II313 Meacutetodo condicionado 51
II314 Meacutetodo incondicionado exacto 52
II315 Meacutetodo incondicionado Peskun 52
II316 Estadiacutestico Z con correccioacuten por continuidad 53
II317 Propiedades que verifica el estadiacutestico ZE 54
II32 Meacutetodos basados en el estadiacutestico X 54
II33 Meacutetodos basados en el estadiacutestico A 55
II4 RESULTADOS DE LA LITERATURA DE TIPO PRAacuteCTICO 56
II41 Generalidades sobre los estudios a realizar 56
II42 Conclusiones de la literatura 57
II5 APORTACIONES DE TIPO TEOacuteRICO 60
II51 Aproximaciones al procedimiento de las marcar procedimiento L y
meacutetodos de tipo ldquoadjustedrdquo Wald 60
II52 Procedimientos basados en el estimador Pb 62
II53 Test e intervalo de confianza para el procedimiento ZCb 62
II54 Estadiacutestico A con correccioacuten por continuidad 63
II55 Equivalencia entre la evaluacioacuten de un meacutetodo de obtencioacuten de intervalos
de confianza y su meacutetodo de test asociado 64
IV INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
II6 APORTACIONES DE TIPO PRAacuteCTICO 65
II61 Objetivo 65
II62 Descripcioacuten del estudio a realizar y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo 65
II63 Seleccioacuten del meacutetodo oacuteptimo de cada familia (en sus versiones sin cpc) 68
II631 Seleccioacuten entre los meacutetodos de tipo Z (α=5) 68
II632 Seleccioacuten entre los meacutetodos de tipo X (α=5) 73
II633 Seleccioacuten entre los meacutetodos de tipo A (α=5) 74
II634 Seleccioacuten entre los meacutetodos de tipo L (α=5) 74
II64 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los mejores de cada familia
(α=1 5 10) caso general y caso particular con grandes muestras 76
II65 Seleccioacuten del meacutetodo oacuteptimo consin cpc de entre los dos oacuteptimos
(α=5) 77
II66 Verificacioacuten de los resultados de la literatura 77
II67 Seleccioacuten del meacutetodo oacuteptimo para el caso claacutesico de δ=0 (test claacutesico de
homogeneidad de dos proporciones independientes) 79
II671 Seleccioacuten general 79
II672 Seleccioacuten para α=5 en el caso de grandes muestras (nge160) 81
II68 Evaluacioacuten del caso de la diferencia seguacuten el estudio de simulacioacuten del
Capiacutetulo I 81
II7 CONCLUSIONES FINALES Y EJEMPLOS 82
II71 Meacutetodo oacuteptimo 82
II72 Foacutermulas aconsejadas para realizar la inferencia 83
II721 Caso general (para todo δ) 83
II722 Caso particular (δ=0) 84
II73 Ejemplos praacutecticos 85
II731 Intervalo de confianza 85
II732 Test de homogeneidad 87
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE
III1 INTRODUCCIOacuteN 89
III2 NOTACIOacuteN 90
IacuteNDICE V
III21 Generalidades y estadiacutestico base 90
III22 Estimadores de las proporciones pi 91
III221 Estimadores no restringidos por H0 91
III222 Estimadores siacute restringidos por H0 92
III23 Procedimientos de inferencia que se obtienen con cada estimador 93
III24 Datos muestrales a utilizar y meacutetodos de inferencia que proporcionan 94
III3 RESULTADOS DE LA LITERATURA DE TIPO TEOacuteRICO 95
III31 Meacutetodos basados en el estadiacutestico Z 95
III311 Generalidad 95
III312 Meacutetodo claacutesico de Wald 96
III313 Meacutetodo condicionado 96
III314 Meacutetodo incondicionado exacto 97
III315 Meacutetodo incondicionado Peskun 97
III32 Meacutetodos basados en el estadiacutestico L 98
III321 Generalidades 98
III322 Meacutetodos claacutesicos de Woolf y ldquoadjustedrdquo Woolf 98
III323 Meacutetodos de tipo Newcombe 99
III324 Meacutetodos condicionado e incondicionado exacto 100
III33 Meacutetodos basados en el estadiacutestico X 100
III34 Propiedades de los diversos estadiacutesticos 101
III4 RESULTADOS DE LA LITERATURA DE TIPO PRAacuteCTICO 101
III41 Generalidades sobre los estudios a realizar 101
III42 Conclusiones de la literatura 102
III5 APORTACIONES DE TIPO TEOacuteRICO 104
III51 Procedimientos basados en el meacutetodo de Newcombe 104
III52 Valor aproximado del estimador de maacutexima verosimilitud (estimadores
Aa y Ab) y procedimientos que ocasionan 105
III53 Intervalo de confianza para los procedimientos ZPab 108
III54 Estadiacutesticos R y A 109
III55 Estadiacutesticos basados en los datos incrementados 109
III56 Estadiacutesticos con correccioacuten por continuidad 110
III57 Equivalencia entre la evaluacioacuten de un meacutetodo de obtencioacuten de intervalos
de confianza y su meacutetodo de test asociado 111
VI INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
III6 APORTACIONES DE TIPO PRAacuteCTICO 111
III61 Objetivo 111
III62 Descripcioacuten del estudio a realizar y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo 112
III63 Seleccioacuten del meacutetodo oacuteptimo de cada familia (en sus versiones sin cpc) 114
III631 Seleccioacuten entre los meacutetodos de tipo Z (α=5) 114
III632 Seleccioacuten entre los meacutetodos de tipo R (α=5) 116
III633 Seleccioacuten entre los meacutetodos de tipo L (α=5) 117
III634 Seleccioacuten entre los meacutetodos de tipo X (α=5) 119
III635 Seleccioacuten entre los meacutetodos de tipo A (α=5) 119
III64 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los mejores de cada familia
(α=1 5 10) caso general y caso particular de grandes muestras 120
III65 Seleccioacuten del meacutetodo oacuteptimo consin cpc de entre los dos meacutetodos
oacuteptimos seleccionados (α=5) 121
III66 Verificacioacuten de los resultados de la literatura 121
III67 Seleccioacuten del meacutetodo oacuteptimo para el caso claacutesico ρ=1 (test claacutesico de
homogeneidad de dos proporciones independientes) 122
III7 CONCLUSIONES FINALES Y EJEMPLOS 122
III71 Meacutetodo oacuteptimo 122
III72 Foacutermulas aconsejadas para realizar inferencia 123
III721 Meacutetodo oacuteptimo en general ZAb1 123
III722 Meacutetodo maacutes sencillo casi tan bueno como el anterior
(especialmente para valores moderados de ρ) ZW4 124
III723 Mejor meacutetodo claacutesico vaacutelido para n1+n2ge 200 α=5 y 01ltρlt10
LW1 125
III73 Ejemplos praacutecticos 125
III731 Evaluacioacuten de una vacuna 125
III732 Evaluacioacuten de un meacutetodo diagnoacutestico binario 126
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS
IV1 INTRODUCCIOacuteN 131
IV2 NOTACIOacuteN 132
IV21 Generalidades y estadiacutestico base 132
IacuteNDICE VII
IV22 Estimadores de las proporciones pi 133
IV221 Estimadores no restringidos por H0 133
IV222 Estimadores siacute restringidos por H0 134
IV23 Procedimientos de inferencia que se obtienen con cada estimador 135
IV24 Datos muestrales a utilizar y meacutetodos de inferencia que proporcionan 135
IV3 RESULTADOS DE LA LITERATURA 136
IV31 Resultados de tipo teoacuterico 136
IV311 Meacutetodo claacutesico de Wald 136
IV312 Meacutetodo incondicionado exacto 137
IV313 Meacutetodo incondicionado Peskun 137
IV314 Propiedades a verificar por cualquier estadiacutestico de contraste 138
IV32 Resultados de tipo praacutectico 138
IV4 APORTACIONES 138
IV41 Aportaciones de tipo teoacuterico 138
IV411 Meacutetodo de Newcombe-Zou 138
IV412 Meacutetodo de las marcas y equivalencia con el procedimiento ZE 139
IV413 Procedimiento y estimador A (incondicionado aproximado) 140
IV414 Propiedades de equivalencia 140
IV415 Estadiacutesticos basados en los datos incrementados 142
IV416 Estadiacutestico con correccioacuten por continuidad 142
IV42 Aportaciones de tipo praacutectico 143
IV421 Objetivo 143
IV422 Descripcioacuten del estudio a realizar y de los criterios a emplear para
la seleccioacuten del oacuteptimo 143
IV423 Seleccioacuten del meacutetodo oacuteptimo sin cpc (α=5) 147
IV424 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los seleccionados
anteriormente y para los errores α=1 5 y 10 evaluacioacuten
general y detallada 148
IV425 Seleccioacuten del meacutetodo oacuteptimo consin cpc (α=5) 149
IV5 CONCLUSIONES FINALES Y EJEMPLOS 149
IV51 Meacutetodo oacuteptimo 149
IV52 Foacutermulas aconsejadas para realizar inferencia cuando |β1|ne|β2| o β1=β2 150
IV521 Meacutetodo oacuteptimo para n1lt60 y α=10 ZW2 150
VIII INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
IV522 Meacutetodo oacuteptimo para el resto de los casos (y tambieacuten en general)
ZW4 150
IV53 Ejemplo praacutectico 150
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN
V1 INTRODUCCIOacuteN 153
V2 NOTACIOacuteN 154
V21 Generalidades y estadiacutestico base 154
V22 Generalidades sobre las proporciones pi 154
V23 Procedimientos de inferencia que se obtienen con cada estimador 155
V24 Datos muestrales a utilizar y meacutetodos que proporcionan 155
V3 RESULTADOS DE LA LITERATURA DE TIPO TEOacuteRICO 156
V31 Meacutetodos basados en el estadiacutestico Z 156
V311 Generalidad 156
V312 Meacutetodo claacutesico de Wald y meacutetodos ldquoadjustedrdquo Wald 157
V313 Meacutetodos condicionado 158
V314 Estadiacutestico Z con correccioacuten por continuidad 158
V32 Meacutetodos basados en el estadiacutestico G 158
V33 Meacutetodos basados en el estadiacutestico A 159
V4 RESULTADOS DE LA LITERATURA DE TIPO PRAacuteCTICO 159
V41 Generalidades sobre los estudios de simulacioacuten 159
V42 Conclusiones de la literatura 160
V5 APORTACIONES DE TIPO TEOacuteRICO 162
V51 Test e intervalo de confianza para el procedimiento GE 162
V52 Estadiacutesticos basados en los datos incrementados 163
V53 Estadiacutestico A con correccioacuten por continuidad 163
V54 Equivalencia entre la evaluacioacuten de un meacutetodo de obtencioacuten de intervalos
de confianza y su meacutetodo de test asociado 163
V6 APORTACIONES DE TIPO PRAacuteCTICO 164
V61 Objetivo 164
V62 Descripcioacuten del estudio a realizar y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo 165
IacuteNDICE IX
V63 Seleccioacuten del meacutetodo oacuteptimo de cada familia (en sus versiones sin cpc) 167
V631 Seleccioacuten entre los meacutetodos de tipo Z (α=5) 167
V632 Seleccioacuten entre los meacutetodos de tipo G (α=5) 167
V633 Seleccioacuten entre los meacutetodos de tipo A (α=5) 168
V64 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los mejores de cada familia
(α=15 y 10) caso general y evaluacioacuten detallada 168
V65 Seleccioacuten del meacutetodo oacuteptimo consin cpc de entre los cuatro meacutetodos
oacuteptimos seleccionados (α=5) 169
V66 Verificacioacuten de los resultados de la literatura 170
V7 CONCLUSIONES FINALES Y EJEMPLOS 171
V71 Meacutetodo oacuteptimo 171
V72 Foacutermulas aconsejadas para realizar inferencia 171
V721 Meacutetodo oacuteptimo para αge5 A1 171
V722 Meacutetodo oacuteptimo para α=1 (vaacutelido tambieacuten en general si nge50)
ZE0 172
V723 Meacutetodo maacutes sencillo y solo un poco peor que los anteriores
ZW2 172
V73 Ejemplos praacutecticos 172
CAPIacuteTULO VI K=2 EN EL CASO ESPECIAL DE LA RAZOacuteN DEL
PRODUCTO CRUZADO
VI1 INTRODUCCIOacuteN 175
VI2 NOTACIOacuteN 176
VI21 Generalidades y estadiacutesticos base 176
VI22 Estimadores de las proporciones pi 177
VI23 Procedimientos de inferencia que se obtienen con cada estimador 177
VI24 Datos muestrales a utilizar y meacutetodos de inferencia que proporcionan 178
VI3 RESULTADOS DE LA LITERATURA 178
VI31 Resultados de tipo teoacuterico 178
VI311 Meacutetodos basados en el estadiacutestico X 178
VI312 Meacutetodos basados en el estadiacutestico L 180
VI313 Estadiacutesticos con correccioacuten por continuidad 181
VI314 Estadiacutesticos desde la perspectiva del ln(O) 182
X INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
VI32 Resultados de tipo praacutectico 182
VI321 Generalidades sobre los estudios de simulacioacuten 182
VI322 Conclusiones de la literatura 183
VI4 APORTACIONES 184
VI41 Aportaciones de tipo teoacuterico 184
VI5 CONCLUSIONES FINALES Y EJEMPLOS 184
VI51 Meacutetodo oacuteptimo 184
VI52 Foacutermulas aconsejadas para realizar inferencia 185
VI521 Meacutetodo oacuteptimo en general XE0 185
VI522 Meacutetodo maacutes sencillo casi tan bueno como el anterior
(especialmente para grandes muestras) LW1 185
VI53 Ejemplo praacutectico 186
CONCLUSIONES 187
REFERENCIAS 191
APEacuteNDICE TABLAS 201
Tabla AI1 202
Tabla AI2 204
Tabla AI3 206
Tabla AI4 208
Tabla AI5 212
Tabla AI6 214
Tabla AI7 216
Tabla AI8 218
Tabla AI9 220
Tabla AII1 222
Tabla AII2 234
Tabla AII3 235
Tabla AII4 y Tabla AII5 238
Tabla AII6 Tabla AII7 y Tabla AII8 239
Tabla AII9 240
IacuteNDICE XI
Tabla AII10 241
Tabla AII11 242
Tabla AII12 243
Tabla AIII1 244
Tabla AIII2 268
Tabla AIII3 271
Tabla AIII4 277
Tabla AIII5 278
Tabla AIII6 Tabla AIII7 y Tabla AIII8 279
Tabla AIII9 280
Tabla AIV1 281
Tabla AIV2 287
Tabla AIV3 288
Tabla AIV4 y Tabla AIV5 291
Tabla AIV6 292
Tabla AV1 293
Tabla AV2 298
Tabla AV3 299
Tabla AV4 300
Tabla AV5 301
Tabla AV6 304
Tabla AV7 305
Tabla AV8 y Tabla AV9 306
PROacuteLOGO
Las i nferencias de dos c olas sobre una combinacioacuten l ineal L=Σβipi de K
proporciones bi nomiales i ndependientes pi son m uy f recuentes en l a investigacioacuten
aplicada (Tebbs and Roths 2008) En particular los casos con Kle2 han recibido gran
atencioacuten desde casi l os inicios d e l a E stadiacutestica C uando K=1 y β1=1 e l obj etivo e s
realizar inferencias sobre una proporcioacuten p1 (como en Agresti and Coull 1998) Cuando
K=2 los o bjetivos p ueden s er v arios l a d iferencia d=p2minusp1 de dos pr oporciones s i
β1=minus1 y β2=+1 ( como e n A gresti a nd C affo 2000) la s uma S=p1+p2 de dos
proporciones s i β1=+1 y β2=+1 (como e n l a e valuacioacuten de m eacutetodos d e di agnoacutestico
binarios) la razoacuten R= p2p1 de dos proporciones si β1=minusR y β2=+1 (como en Agresti
2003) o una c ombinacioacuten l ineal de dos pr oporciones c on β1lt0 ( como e n P hillips
2003) Los c asos c on Kgt2 s on hi stoacutericamente ba stante m enos ha bituales pe ro e n l os
uacuteltimos antilde os s e l es estaacute p restando m aacutes at encioacuten d ado s u gran i ntereacutes p raacutectico
(Newcombe 2001 P rice a nd Bonett 2004 S chaarschmidt et al 2008 T ebbs a nd
Roths 2008 Agresti et al 2008 Zou et al 2009 etc)
En unas ocasiones la combinacioacuten lineal L es un contraste (Σβ i=0) en cuyo caso
suele interesar realizar el test de hipoacutetesis para la hipoacutetesis nula H L=0 o determinar un
intervalo de confianza para L (IC en adelante) En otras ocasiones la combinacioacuten lineal
L no es un contraste (Σβ ine0) en cuyo caso suele interesar determinar un IC de dos colas
para L Sea cual sea el caso la realizacioacuten de ambas inferencias pueden enfocarse desde
la uacutenica perspectiva de la realizacioacuten de un test de hipoacutetesis acerca de L (H0 L=λ vs
H1 Lneλ e n donde λ es una constante t al que Bminus=0 0i i
i iβ ββ λ β
lt gtle lesum sum =B+) pues
como es habitual hoy diacutea el IC se obtiene mediante la inversioacuten del test anterior el IC
es el conjunto de todos los valores de λ en los que el test anterior da un valor p mayor
que α (si 1minusα es la confianza deseada para el IC) Como el test tambieacuten puede realizarse
a traveacutes del IC (el test es significativo si el IC no contiene al valor λ) en los proacuteximos
capiacutetulos se u tilizaraacute el p rocedimiento q ue s ea m aacutes coacute modo para l a d efinicioacuten o el
anaacutelisis que se persiga De todos modos en esta memoria se explicitaraacute generalmente
ambos tipos de inferencia
XIV INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
Adicionalmente a la h ora de e valuar un d eterminado pr ocedimiento puede
elegirse la perspectiva del test o la perspectiva del IC Para evaluar un procedimiento de
obtencioacuten de IC suelen utilizarse los paraacutemetros recubrimiento real y longitud media
para evaluar un procedimiento de realizacioacuten de un test suelen utilizarse los paraacutemetros
error real y potencia (todos estos paraacutemetros se definiraacuten expliacutecitamente maacutes adelante)
Como el recubrimiento real y el error real suman 1 (ver las demostraciones especiacuteficas
en aquellos capiacutetulos en los que la evaluacioacuten de los procedimientos se realizan a traveacutes
de un test de hipoacutetesis) y ademaacutes como cuanto mayor es la potencia del test menor seraacute
la longitud del IC que se obtenga mediante inversioacuten del mismo la consecuencia es que
ambas ev aluaciones s on eq uivalentes De ah iacute q ue en c ada o casioacuten s e u tilice l a
perspectiva que sea maacutes coacutemoda
Desde l a p erspectiva d e l a es tadiacutestica cl aacutesica ( no b ayesiana) q ue es l a de l a
memoria actual los procedimientos para realizar la inferencia pueden ser de tipo exacto
(el error real α nunca es mayor que el error nominal α) o de tipo aproximado (el error
real α puede ser mayor que el error nominal α) En el caso exacto los meacutetodos (cuando
existen) son c omputacionalmente i ntensivos requieren de pr ogramas in formaacuteticos
especiales y son poco factibles p ara t amantildeos de m uestra moderadamente g randes
(Santner et al 2007) salvo en el caso de una uacutenica proporcioacuten Esta memoria se dedica
al caso aproximado
En e l caso aproximado las i nferencias pueden e star basadas en l a d istribucioacuten
real d e l as v ariables i mplicadas ( una K-binomial) o e n l a di stribucioacuten a sintoacutetica de l
estadiacutestico utilizado pa ra l a i nferencia (usualmente l a di stribucioacuten nor mal) Las
primeras e n oc asiones de nominadas inferencias ldquoquasi-exactasrdquo (Chen 2002) o ldquocas i
exactasrdquo ( Agresti 2003) r equieren de c ierta i ntensidad de c oacutemputo y pueden e star
basadas en el p-value tradicional (Kang and Chen 2000) o e n el mid p-value (Agresti
and Gottard 2007) Las segundas generalmente denominadas inferencias asintoacuteticas o
con grandes muestras suelen ser maacutes sencillas de aplicar y algunas de ellas t ienen un
gran i ntereacutes p edagoacutegico (Agresti and C affo 200 0) Esta m emoria estaacute d edicada a l as
inferencias asintoacuteticas con la uacutenica exclusioacuten de que no s e analiza el claacutesico test de la
razoacuten de verosimilitudes La razoacuten para ello es doble Por un lado la experiencia con los
casos de la diferencia y razoacuten de proporciones indica que dicho meacutetodo funciona mal
salvo que los tamantildeos de muestra sean muy grandes (que es donde todos los meacutetodos
PROacuteLOGO XV
van bien) por otro el meacutetodo requiere de una cierta intensidad de coacutemputo (y uno de
los objetivos de esta memoria es obtener meacutetodos sencillos de utilizar)
Esta memoria tiene dos obj etivos P or un l ado proponer nue vos m eacutetodos
asintoacuteticos de tipo claacutesico para la realizacioacuten de inferencias de dos colas acerca de una
combinacioacuten lineal de K proporciones binomiales independientes Por otro seleccionar
el meacutetodo oacuteptimo de entre las nuevas propuestas y las proporcionadas por la literatura
con eacutenfasis especial en los meacutetodos de menor intensidad de coacutemputo
Con r especto a l as ap ortaciones p raacutecticas ( la s eleccioacuten d el m eacutetodo oacute ptimo)
conviene sentildealar que toda la memoria estaacute basada en el claacutesico criterio de Armitage el
valor p de cualquier test asintoacutetico de dos colas es el doble del valor p del mismo test
asintoacutetico de una cola (en l a di reccioacuten de m enor va lor p) U na opc ioacuten a lternativa
consistiriacutea en aplicar el criterio de Mantel (1974) seguacuten el cual el valor p del test de dos
colas es l a s uma d e l os valores p de dos t ests d e una c ola ( uno e n ba se a l resultado
observado ot ro e n ba se al r esultado de la o tra c ola q ue es t an ex tremo o m aacutes q ue el
observado) En nuestro caso multidimensional el criterio debe modificarse en el sentido
siguiente Si el valor observado es L gtλ (por ejemplo) entonces el valor simeacutetrico de la
otra cola seraacute Lprime=λminus( L minusλ) = 2 λminus L si el mismo es liacutecito (es decir s i estaacute entre Bminus y
B+) entonces el valor p es el de Armitage si no lo es entonces el valor p seraacute solo el
del test de una cola De un modo maacutes formal si z alude a una variable aleatoria normal
tiacutepica y zexp alude al valor observado del estadiacutestico de contraste entonces el valor p por
el meacutetodo de Armitage (lo claacutesico) seraacute 2timesPr zgezexp en tanto que por el meacutetodo de
Mantel el valor p seraacute el anterior solo si 2λminusB+le L le2λminusBminus pues su valor es de solo Pr
zgezexp e n ot ro caso La r azoacuten d e q ue es ta m emoria ex cluya el p rocedimiento d e
Mantel es que hemos comprobado que el mismo no mejora ninguna de las conclusiones
obtenidas
Esta m emoria estaacute o rganizada co mo s igue E n el C apiacutetulo I s e abordaraacuten l os
aspectos teoacutericos del caso general de K proporciones y los aspectos praacutecticos del caso
Kge3 En los Capiacutetulos II y III se abordaraacuten los aspectos teoacutericos y praacutecticos de los casos
de la diferencia y razoacuten de dos proporciones respectivamente (ambos pertenecientes al
caso K=2) reservando el Capiacutetulo IV para el resto de los casos con K=2 Finalmente en
el Capiacutetulo V se abordaraacuten los aspectos teoacutericos y praacutecticos del caso de una proporcioacuten
(K=1) S e nos va a disculpar que a fin d e que l os c apiacutetulos p uedan l eerse
XVI INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
independientemente determinados razonamientos y descripciones se repitan en muchos
de ellos (llegando a ser excesivamente reiterativos)
Adicionalmente e l C apiacutetulo V I a borda br evemente ( sin i ntencioacuten de e fectuar
aportaciones de r elevancia) el cas o d el co nocido p araacutemetro d e l a r azoacuten de l pr oducto
cruzado ( odds-ratio) D e un m odo obj etivo tal paraacutemetro no de beriacutea incluirse en l a
memoria por no s er susceptible d e s er analizado d esde l a p erspectiva act ual (una
combinacioacuten l ineal de pr oporciones) s in e mbargo he mos pr eferido h acerlo d ada s u
importancia su relacioacuten con los casos de dos proporciones y porque participa de ciertas
singularidades comunes a los casos de la diferencia y la razoacuten
Finalmente debe sentildealarse que como las selecciones realizadas en esta memoria
se b asan en un gran nuacute mero de t ablas -imposibles d e e xplicitar a l completo- en el
Apeacutendice final d e la mis ma se r ecogen s olo l as tablas maacutes imp ortantes E l le ctor
interesado puede solicitar al autor las tablas completas
CAPIacuteTULO I
K=CUALQUIERA Y CASO Kge 3
I1 INTRODUCCIOacuteN
En los uacuteltimos antildeos han tomado gran importancia (Tebbs amp Roths 2008) las
inferencias acerca de una combinacioacuten lineal L=ipi de varias proporciones binomiales
independientes pi (es decir inferencias basadas en la toma de muestras independientes
de las poblaciones objetivo) especialmente en el aacutembito de las Ciencias de la Salud
Tabla I1
Tabla 2timesK para muestras independientes
Muestras SIacute NO Total Coeficientes
1 x1 y1 n1 β1
2 x2 y2 n2 β2
hellip hellip hellip hellip hellip
K xk yk nk βk
Total a1 a2 n
Los datos obtenidos en este tipo de estudios suelen presentarse en el formato de
la Tabla I1 en donde SIacuteNO alude a la presencia o ausencia de la caracteriacutestica que se
estudia ix ( iy ) es el nordm de individuos de entre los in (tamantildeo de muestra) que siacute (no)
presentan la caracteriacutestica βi son los coeficientes de la combinacioacuten lineal (que
habitualmente son conocidos y distintos de 0) 1a =xi ( 2a =yi) es el total de individuos
que siacute (no) presentan la caracteriacutestica y finalmente n =ai=ni es el tamantildeo total de la
experiencia Las variables aleatorias xi siguen distribuciones binomiales independientes
( )i iB n p con 12i K en donde ip es la proporcioacuten (desconocida) de individuos
de la poblacioacuten i que presentan la caracteriacutestica en estudio
2 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
La combinacioacuten lineal L puede ser en unas ocasiones un contraste (i=0) y en
otras puede no serlo (i0) En funcioacuten de la situacioacuten interesaraacute realizar un test o un
IC para L Como el test puede realizarse a traveacutes del IC y el IC puede obtenerse
mediante la inversioacuten del test en lo que sigue se utilizaraacute la perspectiva que sea maacutes
coacutemoda
Histoacutericamente la atencioacuten se ha centrado en los casos con K2 especialmente
en el aacutembito de las investigaciones meacutedicas Ejemplos praacutecticos son el caso de los
ensayos cliacutenicos (que comparan dos tratamientos en funcioacuten de su respuesta
usualmente el eacutexito del tratamiento en donde K=2) el caso de estudios epidemioloacutegicos
(que tratan de ver la relacioacuten entre un factor de riesgo y una enfermedad o efecto
indeseado en donde tambieacuten K=2) o el caso maacutes frecuente de las inferencias acerca de
una uacutenica proporcioacuten (en donde K=1) Cuando K=2 los objetivos pueden ser varios
Realizar inferencias sobre la diferencia d=p2p1 de dos proporciones (es decir
sobre L para 1=1 y 2=+1) Newcombe (1998) Agresti amp Caffo (2000) Kang
amp Chen (2000) Martiacuten amp Herranz (2003) Brown amp Li (2005) Santner et al
(2007) etc
Realizar inferencias sobre la razoacuten R=p2p1 de dos proporciones (es decir sobre
H0 L=p2Rp1=0 para 1=R y 2=+1) Chan (2003) Agresti (2003) Dann amp
Koch (2005) Price amp Bonett (2008) etc
Realizar inferencias sobre una combinacioacuten lineal L=2p2+1p1 de dos
proporciones (en los ensayos de no-inferioridad con 1lt0) Phillips (2003) y
Martiacuten amp Herranz (2010)
Cuando K=1 (con lo que puede hacerse 1=1) el objetivo seraacute realizar inferencias sobre
la uacutenica proporcioacuten p1 Agresti amp Coull (1998) Newcombe (1998) Brown et al (2001)
Agresti amp Caffo (2000) etc
Los casos con Kgt2 son bastante menos habituales pero aunque en los uacuteltimos
antildeos se les estaacute prestando maacutes atencioacuten dado su gran intereacutes praacutectico (Newcombe 2001
Price amp Bonett 2004 Schaarschmidt et al 2008 Tebbs amp Roths 2008 Agresti et al
2008 Zou et al 2009) el problema solo se ha abordado desde el punto de vista de los
IC obtenidos por el meacutetodo claacutesico de Wald
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
3
Este capiacutetulo tiene dos finalidades Desde el punto de vista teoacuterico se analizaraacute
el caso de una combinacioacuten lineal de proporciones para cualquier valor de K Desde el
punto de vista praacutectico se seleccionaraacute el mejor meacutetodo para realizar inferencias en el
caso de Kgt2 (en realidad en los casos de K=3 o 4) El resto de casos es decir cuando
Kle2 se analizaraacuten especiacuteficamente en los capiacutetulos siguientes (pues ellos tienen un
intereacutes praacutectico extra)
I2 NOTACIOacuteN
I21 Generalidades y estadiacutestico base
Sean K variables aleatorias binomiales independientes xi~B(ni pi) con i=1 2hellip
K y sea L=ipi el paraacutemetro de intereacutes (con las proporciones pi desconocidas y los
paraacutemetros βi usualmente conocidos y distintos de 0) Sea i iL p con ip =xini las
proporciones muestrales Como el estadiacutestico L es asintoacuteticamente normal con media
y varianza las indicadas a continuacioacuten
2di i i i i i i iL p N p p q n
en donde qi=1ndashpi entonces para contrastar H0 L= vs H1 L hay que comparar del
modo claacutesico el valor experimental del estadiacutestico
2
22expi i i i
Lz
p q n
(11)
con 22z (en donde z2 es el percentil (1ndashα2)100 de la distribucioacuten normal tiacutepica)
El IC (1ndashα) para L se obtiene invirtiendo el test es decir despejando λ en la ecuacioacuten
2 22exp z z En particular si las proporciones pi no dependen de entonces el IC tendraacute
la forma
L L plusmn 22 i i i iz p q n (12)
Las expresiones (11) y (12) no tienen utilidad praacutectica alguna hasta que las
proporciones pi desconocidas sean sustituidas por una estimacioacuten de las mismas Como
4 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
tal estimacioacuten puede realizarse por muy diferentes caminos y los meacutetodos de tests que
se obtienen son muy variados en la literatura en esta seccioacuten se van a definir -sin
justificar- todos ellos a fin de homogeneizar la notacioacuten maacutes adelante se proporcionaraacuten
todas las justificaciones precisas
Para lo que sigue se notaraacute por B+=0i
i
Bndash=
0i
i
y B= i Obseacutervese que
B+ndashBndash =βi Como 0le pi ip le 1 y Bndashle Ble B+ entonces Bndash L B B+ y ademaacutes se
verifica que 2 2i i| | B L B L | |
I22 Estimadores de las proporciones pi
A continuacioacuten se describen los distintos estimadores de las proporciones pi que
se utilizan a lo largo de este capiacutetulo denotando en mayuacutesculas y negrita la letra
abreviada que designaraacute el procedimiento de inferencia que proporciona cada estimador
I221 Estimadores no restringidos por H0
La opcioacuten maacutes sencilla y maacutes empleada para estimar las proporciones pi consiste
en utilizar los estimadores claacutesicos de maacutexima verosimilitud simple (es decir las
proporciones muestrales)
W (Wald) i i ip x n (13)
Una opcioacuten maacutes reciente (Newcombe 1998) consiste en sustituir las
proporciones desconocidas por el extremo apropiado del IC de Wilson (1927)
N (Newcombe-Zou) (si 0) (si 0) si
(si 0) (si 0) si i i i i
ii i i i
u l Lp
l u L
(14)
con
2 22 2
2
22
2 4 i i
i i
ii
z z x yx z
nl
n z
y
2 22 2
2
22
2 4 i i
i i
ii
z z x yx z
nu
n z
(15)
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
5
siendo (li ui) el IC de dos colas al 100middot(1ndashα) para la proporcioacuten pi
I222 Estimadores siacute restringidos por H0
La principal aportacioacuten que se desarrolla en esta memoria consiste en utilizar los
estimadores de maacutexima verosimilitud ip bajo H0 siguientes
E (Incondicionado exacto) ip 2i i i in C R C (16)
en donde 2 2 2 22i i i i i iR n n bC C 1 2i ib p y C es la uacutenica solucioacuten distinta de 0
de la ecuacioacuten 2 0iy n B C R
Otro tipo de estimadores son los obtenidos por el meacutetodo de Peskun (1993)
P (Incondicionado tipo Peskun) 1
12
ii
i
np
donde
2B
n
(17)
Como puede suceder que el valor de ip
no esteacute comprendido entre 0 y 1 podriacutea ser
conveniente exigir que cumpla esta condicioacuten de ahiacute que los estimadores ip
tengan dos
versiones
Pa ip
= (17)
Pb ip
= (17) restringidos a estar entre 0 y 1 ( ip
=0 si ip
lt0 y ip
=1 si ip
gt1)
I23 Procedimientos de inferencia que se obtienen con cada estimador
Cuando en la expresioacuten (11) se sustituye cada uno de los estimadores aludidos
en la seccioacuten anterior se obtienen los estadiacutesticos 2Wz 2
Nz 2Ez 2
Paz y 2Pbz cada uno de
los cuales dan lugar a un procedimiento de test diferente Al invertir el mismo se
obtiene un procedimiento de IC diferente En ambos casos el nombre del procedimiento
es el mismo que el del estimador que se utiliza procedimiento W N E Pa o Pb A
continuacioacuten se explicita el IC (λI λS) obtenido en cada caso (pues no es tan evidente
como el del estadiacutestico de contraste) Los dos primeros casos no presentan dificultad
6 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
pues no dependiendo de el estimador de las pi basta con utilizar directamente la
expresioacuten (12)
ICW 2
2i i i
i
p qL L z
n
(18)
ICN 2
2i i i
i
p qL L z
n
(19)
en donde ip viene dada por (14) con (li ui) el IC de Wilson para una proporcioacuten
definido por (15) y cuyas ecuaciones provienen de la expresioacuten
22 22 2
222
1
2 2i ii
i i i i i i i
p pn z zl u p z
n z n n n
(110)
Para los otros casos hay que realizar ciertas operaciones (detalladas maacutes
adelante) que llevan a los siguientes IC
ICE Las uacutenicas dos soluciones (λI λS) de la ecuacioacuten
222 Signo 0 iy n L B L z L R (111)
con 22 2 4 4 22 22 1 2i i i i i i R n L z n p L z y I SB L
B Si no existe solucioacuten λI (λS) entonces λI=Bndash ( λS=B+ )
ICPa 2
2 2 22 2 2
2 22
2
2 2 i
i
B LBz z n znL L
n z n n n n
(112)
ICPb 22 2 22
2 2 22 2 2 2
2
2
2 2
nBz z n nzn B LL L S n
n nz n n n
(113)
con 2i
I i
Sn
i
I
n n e 1
2i
i
| |I i | B n
n
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
7
El problema con este uacuteltimo IC es que su obtencioacuten puede requerir aplicar variar veces
la expresioacuten (113) Para obtener el IC anterior es preciso realizar los pasos siguientes
1 Hacer I=1 2hellip K y obtener los dos valores λI y λS que proporcionan la
expresioacuten (113)
2 Si λI y λS verifican la expresioacuten 2i iB | | n n iI el proceso finaliza
3 En otro caso el extremo que haya fallado hay que obtenerlo de nuevo para un
nuevo conjunto I que se obtiene eliminando del anterior todos los valores r tales
que r r i I i i| | n min | | n
4 Asiacute sucesivamente hasta que el proceso finalice es decir hasta que λI y λS
verifiquen la expresioacuten 2i iB | | n n en todos los valores iI con I el
conjunto asociado al valor λI o λS considerado
I24 Modificacioacuten de los datos muestrales y meacutetodos de inferencia que se obtienen
Las foacutermulas anteriores pueden utilizarse en base a los datos originales (xi yi
ni) o en base a los datos incrementados en una cantidad determinada hi es decir en base
a los datos modificados (xi+hi yi+hi ni+2hi) Este incremento tiene su origen en los
meacutetodos ldquoadjustedrdquo Wald que consisten en aplicar el claacutesico procedimiento W a los
datos incrementados en una cierta cantidad (lo que para el caso de una proporcioacuten
veniacutea sugerido por el hecho de que el centro del intervalo ldquoadjustedrdquo Wald coincide con
el centro del intervalo de Wilson) La razoacuten de este modo de proceder radica en la
reconocida mala actuacioacuten del procedimiento W por lo que el objetivo de este
incremento es mejorar su comportamiento
A continuacioacuten se denotan los valores posibles del incremento hi y el diacutegito (en
negrita) que lo identificaraacute
0 hi=0 (claacutesico)
1 hi=2K (Price amp Bonett)
2 hi=2
2z 2K
8 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
3
22
22
11 si 1
con I en el extremo inferior 22
0 en otro caso
11 si 1
con S en el extremo superior 22
0 en otro caso
iii
i I
i
iii
i S
spz I K
K
hs
pz S K
K
1 si 0con
1 si 0i
ii
s
Existen otros posibles incrementos que se descartan aquiacute pues la literatura o nuestros
propios resultados aludidos maacutes abajo han demostrado que no mejoran a los anteriores
Cada uno de los 4 incrementos anteriores (0 1 2 y 3) puede aplicarse a cada uno
de los 5 procedimientos de la seccioacuten anterior (W N E Pa y Pb) dando lugar asiacute a 20
meacutetodos de inferencia distintos en lo que sigue ellos seraacuten notados por la letra del
procedimiento y el diacutegito del incremento correspondiente W0 W1 W2 W3 N0
Pb3
I3 RESULTADOS DE LA LITERATURA
I31 Resultados teoacutericos
I311 Meacutetodo claacutesico de Wald y meacutetodos ldquoadjustedrdquo Wald
El meacutetodo de inferencia maacutes simple y conocido consiste en sustituir las
proporciones pi por la expresioacuten (13) (estimador no restringido a H0 L=) Esto da
lugar al claacutesico estadiacutestico de Wald
2
22Wi i i i
Lz
p q n
(114)
y al claacutesico IC de Wald dado por la expresioacuten (18) ambos son los notados aquiacute de
modo geneacuterico por meacutetodo W0
Price amp Bonett (2004) comprueban heuriacutesticamente que el meacutetodo W0 mejora
sustancialmente si se le aplica a los datos incrementados en hi=2K es decir si se aplica el
meacutetodo ldquoadjustedrdquo Wald W1 El procedimiento es compatible con lo aconsejado por
Agresti amp Coull (1998) para el caso de una proporcioacuten y por Agresti amp Caffo (2000) para
el caso de la diferencia de dos proporciones
Schaarschmidt et al (2008) comprueban el comportamiento del procedimiento
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
9
W aplicado a los datos incrementados en las cantidades hi=1 y hi=05 seleccionando la
primera opcioacuten Estos autores no evaluacutean la propuesta de Price amp Bonett pues seguacuten sus
resultados (que no muestran) el meacutetodo W1 se comporta de forma maacutes liberal que el caso
de hi=1 cuando Kge6 y α=5 Sin embargo su anaacutelisis se centra en el caso de las
comparaciones muacuteltiples algo que no cae dentro de los objetivos de esta memoria y Price
and Bonett siacute presentaron datos de que el meacutetodo W1 es mejor que el basado en hi=1
I312 Meacutetodos de tipo bayesiano
Aparte del meacutetodo claacutesico W0 existen en la literatura otros procedimientos
Tebbs amp Roths (2008) proponen sustituir los Kndash1 paraacutemetros perturbadores por unos
estimadores de tipo bayesiano reparametrizando el estadiacutestico de intereacutes L y
generalizando el trabajo de Beal (1987) (que se centroacute en el caso particular de K=2)
Aunque este tipo de estimadores no se veraacuten en este trabajo siacute se tendraacuten en cuenta las
comparaciones que hacen los autores con respecto a los meacutetodos utilizados desde la
perspectiva claacutesica
I313 Meacutetodo de tipo Newcombe
Wilson (1927) indicoacute que el IC asintoacutetico para una uacutenica proporcioacuten p es la
solucioacuten de la ecuacioacuten 2 1p p z p p n Si esta foacutermula se aplica a cada una
de las proporciones pi actuales entonces las ecuaciones a resolver proporcionariacutean los
liacutemites li y ui para cada i=1hellip K dados por la expresioacuten (110) Tanto Newcombe
(2001) para K=2 y 4 y i=0 como Zou et al (2009) para cualquier valor de K y de i
proponen sustituir en el IC (12) las proporciones desconocidas pi por los valores
definidos a partir del IC de Wilson lo que lleva al ICN de la expresioacuten (19) Aunque la
propuesta inicial es de Newcombe son Zou et al los que proporcionan una justificacioacuten
de la misma (que a continuacioacuten se explica con maacutes detalle) La clave es la expresioacuten
2V Σ Vi iL p Si se conociera el valor del estimador V iˆ p entonces L L
22 Σ V i i
ˆz p en donde V iˆ p deben obtenerse en las cercaniacuteas de los extremos del
10 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
IC Como asintoacuteticamente 2 Vi i iˆp p z p =(li ui) entonces V i
ˆ p
2 22i i p l z o 2 2
2i i p u z seguacuten que pi=li o pi=ui Pero como en el hipercubo
i il u la funcioacuten L=ipi alcanza los valores extremos Miacuten L=0 0i i
i i i il u
y
Maacutex L=0 0i i
i i i iu l
entonces los valores de V iˆ p se calculan en pi=li (si igt0) y
en pi=ui (si ilt0) para obtener el extremo inferior de L y en pi=ui (si igt0) y en pi=li (si
ilt0) para obtener el extremo superior de L De ahiacute que
22 22 2
0 0
22 22 2
0 0
maacutex
miacuten
i i
i i
i i i i i i i i i i i i
i i i i i i i i i i i i
p u p l p l u
L Lp l p u p l u
(115)
en donde las segundas expresiones son las originales de Zou et al y las primeras son
una adecuacioacuten (personal) al formato de Newcombe Maacutes adelante se veraacute que esta
expresioacuten es la misma que la (19)
I32 Resultados praacutecticos
I321 Generalidades sobre los estudios de simulacioacuten
En general con el fin de realizar comparaciones entre los distintos meacutetodos la
mayoriacutea de los autores evaluacutean los IC obtenidos por cada meacutetodo al 100(1) a traveacutes
de los paraacutemetros recubrimiento real R y longitud l del intervalo para unos valores
fijados de pi El recubrimiento R del intervalo se define como
1 2
1 2
1 20 0 0 1
Ki i i
K
n n n Ki x n x
i i Kx x x i i
nR p q I x x x
x
(116)
en donde I(x1 x2 xK)=1 si el IC (λI λS) que ocasionan las observaciones (x1 x2 xK)
contiene a L=ipi e I(x1 x2 xK)=0 en otro caso es decir si L(λI λS) Dado que R es
una probabilidad entonces 0leRle1
La longitud l del intervalo se define como
1 2
1 20 0 0 1
K
i i i
K
n n n Ki x n x
i i S Ix x x i i
nl p q
x
(117)
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
11
Como I SB B y I S entonces 0 l B B
Para cada par de valores (ni i) los diversos autores generan aleatoriamente un
gran nuacutemero N de conjuntos de pi a partir de una distribucioacuten uniforme [0 1] calculando
el IC para cada L por el meacutetodo a evaluar y con una confianza que generalmente es del
95 A continuacioacuten calculan para cada meacutetodo todos o algunos de los siguientes
paraacutemetros la media de R (Rmean= jR N 100) la media de l
(lmean= jl N ) el miacutenimo valor de R (Rmin= j jmin R 100) correspondiendo el
subiacutendice j a cada repeticioacuten (j=0 1hellip N) y el porcentaje de veces (Rlt93) en que Rjlt93
(a fin de controlar el nuacutemero de veces en que el meacutetodo es demasiado liberal)
Lo deseable en general es que Rmean sea del 95 en promedio (el meacutetodo seraacute
conservador si Rmean es mayor que 95 siendo liberal en otro caso) que Rmin sea lo
maacutes cercano posible al 95 y que Rlt93 y lmean sean lo maacutes pequentildeos posible
I322 Conclusiones de la literatura
Las conclusiones obtenidas a partir de las diversas comparaciones efectuadas por
los distintos autores pueden resumirse del siguiente modo
1) Price amp Bonett (2004) comparan el meacutetodo claacutesico de Wald W0 con la propuesta de
Laplace (hi=1) recogida por Good (1983) para K=1 y Greenland (2001) para K=2 y el
meacutetodo adjusted Wald W1 que ellos proponen Entre sus resultados observan que
W1 se comporta mucho mejor que los otros dos procedimientos y entre estos dos
uacuteltimos es mejor el basado en hi=1 que el claacutesico W0 (algo que tambieacuten comproboacute
Greenland 2001 para K=2) Estas conclusiones ademaacutes se extienden para cualquier
valor de K demostrando que no hay ejemplos donde W1 sea inferior a los otros dos
meacutetodos comparados
2) Schaarschmidt et al (2008) comparan los meacutetodos basados en hi=05 hi=1 y el
claacutesico de Wald W0 hacieacutendolo tanto desde el punto de vista general como
evaluando maacutes detalladamente coacutemo influye las proporciones pi en el valor del
recubrimiento Omiten del anaacutelisis el meacutetodo W1 pues dicen haber comprobado que
tiene un comportamiento maacutes liberal que el basado en hi=1 para Kge6 (pero no
12 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
muestran esos datos) Entre las conclusiones particulares acerca de las proporciones
pi obtienen que cuando estas son cercanas a 0 o 1 los meacutetodos basados en hi=05 y
hi=1 son conservadores mientras que W0 es bastante liberal en algunos casos Por el
contrario si pi es cercana a 05 el recubrimiento en todos los casos es cercano al 95
nominal En general el incremento hi=1 es maacutes conservador mientras que el hi=05
tiende a ser liberal Su conclusioacuten es que puede ser recomendado el incremento hi=1
como la opcioacuten maacutes conservadora para tamantildeos de muestra moderados (nigt40) Si
los tamantildeos de muestra son maacutes pequentildeos hay un escaso porcentaje de casos en los
que el recubrimiento se acerca al nominal En esta situacioacuten (nile40) el incremento
hi=05 tiene un mejor comportamiento (incluso para tamantildeos de muestra grandes
alcanza en un porcentaje alto de ocasiones un recubrimiento aceptable comparado
con el hi=1) Adicionalmente los autores concluyen algo bien conocido que el
meacutetodo W0 es bastante liberal tanto para tamantildeos de muestra pequentildeos como para
tamantildeos de muestra grandes Finalmente sus resultados sentildealaron que todos los
meacutetodos obtienen ligeramente peores resultados cuando Kge6 siendo este efecto maacutes
pronunciado en el caso de W0
3) Tebbs amp Roths (2008) realizan una comparacioacuten entre 3 nuevos IC de tipo bayesiano
-H (basado en los estudios de Haldane) JP (basado en Jeffreys-Perks) y EB
(Empirical Bayesian MLE)- y los meacutetodos W0 W1 y el basado en hi=1 Sus
resultados indican que los nuevos intervalos tienen habitualmente un recubrimiento
inferior al nominal aunque en el caso de EB el recubrimiento es a menudo muy
cercano al 95 Por otro lado los meacutetodos W1 y el basado en hi=1 tienen un
comportamiento bastante bueno cuando K=3 o 4 cuando K=5 W1 puede ser algo
conservador aunque no demasiado En lo que se refiere a la longitud media los
nuevos meacutetodos proporcionan intervalos algo maacutes estrechos en general que los casos
hi=1 y W1 que son muy similares entre siacute Con respecto al recubrimiento miacutenimo
los casos hi=1 y W1 son sorprendentemente constantes siendo los nuevos intervalos
los que tienen valores de recubrimiento miacutenimo muy bajos De entre los 3 nuevos
intervalos el EB parece la mejor opcioacuten pues mantiene el recubrimiento real
cercano al nominal posee un recubrimiento miacutenimo maacutes adecuado que el resto y
proporciona una longitud media miacutenima
4) Zou et al (2009) basaacutendose en Newcombe (2001) para un contraste con K=4
comparan el meacutetodo W1 de Price amp Bonett con su propuesta N0 basada en el IC de
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
13
Wilson Su conclusioacuten es que para K=3 el meacutetodo N0 proporciona intervalos de
confianza estrechos y con recubrimiento medio cercano al recubrimiento nominal del
95 En cuanto al miacutenimo recubrimiento el procedimiento W1 el que tiene mejores
resultados que N0 Para K=4 N0 mejora sustancialmente en teacuterminos del
recubrimiento medio y de la anchura del intervalo no asiacute en cuanto al recubrimiento
miacutenimo en el que sigue destacando W1 Los resultados se mantienen a un nivel del
90 y del 99 En conclusioacuten el meacutetodo N0 se puede considerar como un meacutetodo
competitivo que aporta buenos resultados frente al procedimiento W1
I4 APORTACIONES DE TIPO TEOacuteRICO
I41 Propiedades a verificar por cualquier estadiacutestico para que la inferencia sea
coherente
Cualquier estadiacutestico zexp debe verificar ciertas propiedades para que sea uacutetil en la
inferencia Tales propiedades son las de convexidad espacial y convexidad parameacutetrica
que se justifican a continuacioacuten
La convexidad espacial fue propuesta por Barnard (1947) para el caso de las
tablas 22 quien indicoacute la conveniencia de que las regiones criacuteticas para el test claacutesico
de la diferencia (H0 p2p1=0) sean convexas Esto implica que el estadiacutestico zexp
utilizado debe ser creciente en 2p y decreciente en 1p aunque tales crecimiento o
decrecimiento no tienen que ser estrictos Roumlhmel amp Mansmann (1999 b) justificaron
que lo mismo debe suceder en el caso maacutes general de H0 p2p1= Por tanto en el caso
actual de una combinacioacuten lineal de proporciones (H0 L=) deberiacutea ocurrir que el
estadiacutestico zexp utilizado sea creciente en las ip con βigt0 y decreciente en las ip con
βilt0
En cuanto a la convexidad parameacutetrica Roumlhmel amp Mansmann (1999 a)
sentildealaron tambieacuten que el p-valor para el test de superioridad en el caso de la diferencia
(H0 dleδ vs H1 dgtδ) debiacutea ser creciente en δ De modo general para el test actual de
H0 L= vs H1 L el p-valor debe ser creciente en λ cuando L gtλ y decreciente en λ
cuando L ltλ lo que implica que el estadiacutestico zexp tiene que ser decreciente en λ
(convexidad parameacutetrica en ) La verificacioacuten de tal propiedad es la que garantiza que
14 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
la inversioacuten del test mediante la igualdad 2 22 expz z sea equivalente a resolver la
igualdad 2 22exp z z y proporcione un IC para λ que no presente huecos De modo
similar para que el IC para βi sea coherente es preciso que zexp sea creciente en βi
(convexidad parameacutetrica en βi)
Las tres propiedades descritas pueden resumirse en la expresioacuten siguiente
exp exp exp0 si 0 0 0
0 si 0i
ii i
dz dz dz
dp d d
(118)
I42 Redefinicioacuten del meacutetodo de Newcombe-Zou
Ya se vio en la seccioacuten I313 que en el meacutetodo de Wilson ocurre que
2 22i i i i ip p z p q n sustituyendo en la primera expresioacuten de (115) se obtiene
nuestro formato alternativo para el ICN dado por la expresioacuten (19) Operando en eacutel es
inmediato ver que el estadiacutestico de test tendraacute la forma
2 2
2
2 2
si lt
si gtN
L R Lz
L R L
en donde
2 2 2 2
0 0 0 0
1 1 1 1(+) ( )
i i i i
i i i i i i i i i i i i
i i i i
u u l l l l u uR = y R =
n n n n
lo cual da lugar al planteamiento resentildeado en la seccioacuten I221 alusivo al estimador ip
de la expresioacuten (14)
La ventaja de nuestro formato es que el mismo es vaacutelido tanto si son iguales los
errores empleados para el IC de Wilson y para la inferencia sobre L como si son
distintos Por el contrario los formatos claacutesicos exigen que ambos errores sean el
mismo
I43 Nuevo procedimiento y estimador E (meacutetodo de las marcas)
Cuando Kle2 los meacutetodos basados en el estimador de maacutexima verosimilitud ip
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
15
(bajo H0) tienen un gran predicamento (Wilson 1927 Roebruck amp Kuumlhn 1995 Chan
1998 Martiacuten amp Herranz 2004) y son equivalentes al meacutetodo de las marcas (como se
veraacute) Sin embargo la propuesta no se ha extendido al caso de Kgt2 Ese es el objetivo
actual
I431 Estimadores de maacutexima verosimilitud
La probabilidad restringida a H0 L=λ es Pr (x1hellip xK λ=βipi)= i i ii x n xi i
i
np q
x
con K i K i i Kp p Para obtener los estimadores de maacutexima verosimilitud
basta con maximizar la funcioacuten =ln P(x1hellip xK | λ=βipi) xi ln pi+(nindashxi) ln(1ndashpi)
En el caso de que L los estimadores de maacutexima verosimilitud ip son iguales a los
estimadores claacutesicos ip (no restringidos a H0) En cambio si L ip seraacuten las
soluciones de la ecuacioacuten d dpi=0 Por lo que
0 i i i K K KK K K
i i i K i i K i i i K K
n p p n p pdpdi
dp p dp p p p p q p q
ie
i i ii i i i
i i i i i i i
n p pn p n qC i
p q p q
(119)
con C una constante que estaacute por determinar De lo anterior se deduce que el estimador
seraacute ip 2i i i in C R C con 2 2 2 22i i i i i iR n n b C C y 1 2i ib p
Para ver cuaacutel de las dos soluciones ip o ip es la adecuada hay que tener
en cuenta que 22i i iR n C pues 0 1ip con lo cual Ri gendashni+βiC ge ni+βiC
Cuando βiC gt0 esto implica que 1ip lo que es imposible salvo que ip =+1
De ser asiacute es porque ip =+1 ni=βiC -por la expresioacuten (119)- y Ri=0 con lo que
i iˆ ˆp p =+1 De modo similar si βiClt0 entonces 0ip que tambieacuten es
imposible a menos que 0i iˆ ˆp p De ahiacute que la solucioacuten siempre seraacute ip
Esto quiere decir que 2 i i i i ip C n C R por lo que sumando en i y teniendo en
cuenta que i iˆ ˆL p se obtiene que C ha de ser la solucioacuten de la ecuacioacuten
16 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
y(C)=n+(Bndash2λ)CndashRi=0 (120)
Es por ello que el estimador ip viene dado por la expresioacuten (16)
La constante C se puede expresar de los siguientes modos
2 1 1i i i i i i i i iE
E i i i i i i i i
ˆ ˆ ˆn p p n p p n p pL zC
ˆ ˆ ˆ ˆ ˆ ˆV L K p q p q B p q
(121)
La primera igualdad se obtiene sumando en i la expresioacuten i i iˆp p 2
i i i iˆ ˆp q C n
obtenida a partir de (119) de modo que tenemos 2i i i i E
ˆ ˆL C p q n CV con
VE= 2i i i i
ˆˆ ˆp q n V L Las demaacutes igualdades se obtienen de modo similar salvo la
segunda que proviene del hecho de que 22E Ez L V
Para demostrar que la ecuacioacuten (120) tiene una solucioacuten uacutenica Cne0 cuando
L es preciso estudiar la funcioacuten y(C) Obseacutervese que y(C=0)=0 por lo que C=0 es
siempre una solucioacuten falsa de la ecuacioacuten (121) Por otro lado la ecuacioacuten dydC =
(B2λ) ndashβi(βiC+nibi)Ri=0 proporcionaraacute los extremos C de la funcioacuten y(C) De existir
los mismos ellos dan lugar a un maacuteximo puesto que 2 2 2 34 0i i i i idy dC n p q R
Por otro lado como
2 si2
2 sii
C
B m Cy( C )lim B
C B m C
entonces y(C) tiene dos asiacutentotas oblicuas de pendientes m+ y mndash y de ecuaciones y =
mplusmnC + hplusmn con
2 2i i i i ii i i
C C Ci i i
n n b Ch lim y C m C lim n C R lim
n C R
2 si1
2 sii i i
T h C +n s b
n T h C
en donde si=Signo (βi) y 0 0i i
i i iT x n x
Si denotamos por Ai = iC+nibi
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
17
24
0i i ii i i
i i i
n p qy C m C h s A R
s A R
(122)
pues como 2 2 24i i i i iR A n p q entonces Ri ge Ai ge plusmnAi = plusmnsiAi y por lo tanto el
denominador de la fraccioacuten anterior seraacute positivo La expresioacuten (122) indica que la
funcioacuten y(C) se encuentra siempre por debajo de las dos asiacutentotas y habraacute de tener un
maacuteximo en C C como vimos anteriormente Como ademaacutes corta al eje horizontal en
C=0 se deduce que tambieacuten debe cortar a dicho eje en otro punto C=C0ne0 que seraacute
C0gt0 (C0lt0) cuando L L Ademaacutes la solucioacuten C=C0 habraacute que buscarla
entre los cortes de las asiacutentotas con el eje horizontal h m T B y
h m n T B Finalmente como i iˆ ˆp q 14 entonces por la primera
igualdad de (121) 24 i iC L n En consecuencia puede afirmarse que la
ecuacioacuten y(C) tiene una solucioacuten uacutenica C0ne0 que estaacute comprendida entre las cotas
siguientes
20
20
Si 4
Si 4
i i
i i
L L n C T B
L n T B C L n
(123)
Una vez determinado el valor C0 entonces 20Ez C L por la expresioacuten (121)
I432 Equivalencia del planteamiento anterior y el test chi-cuadrado (o test de las
marcas)
El procedimiento E es equivalente al meacutetodo de las marcas en el que hay comuacuten
acuerdo en que produce mejores resultados que el de Wald en los casos K=1 (Agresti amp
Coull 1998) K=2 (Newcombe 1998) y en general para cualquier paraacutemetro de una
tabla de contingencia (Lang 2008) La expresioacuten siguiente demuestra que el test chi-
cuadrado de bondad de ajuste tradicional (que es la forma alternativa al test de las
marcas Lovinson 2005 y Bera and Bilias 2001) es equivalente al test actual
18 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
2 2 2
2 i i i i i i i i i i i i iexp i i i
i i i i i i i i
ˆ ˆ ˆ ˆx n p n x n q n p p n p pˆp p
ˆ ˆ ˆ ˆ ˆ ˆn p n q p q p q
2i i i EˆC p p C L z
Las tres uacuteltimas igualdades se deben respectivamente a la expresioacuten (119) a que
i iL p y i iˆn p y a la expresioacuten (121)
I433 Caacutelculos alternativos para el test y el intervalo
Por lo visto anteriormente el procedimiento E consiste en resolver la ecuacioacuten
y=n+(Bndash2λ)CndashRi=0 donde
2
2 2 2 22
1 2
E
i i i i i i
i i
C z L
R n n bC C
b p
(124)
Cuando el objetivo sea realizar el test (en cuyo caso λ es conocido) y L ne λ
entonces 2Ez es la uacutenica solucioacuten 2
Ez ne0 de la ecuacioacuten (124) cuando L =λ se asume
que 2Ez =0 Ademaacutes podemos calcular el valor del estadiacutestico en el formato habitual
2
22Ei i i i
Lz
ˆ ˆp q n
con 2i i i i ip n C R C (125)
La buacutesqueda del valor 2Ez se ve facilitada si se tiene en cuenta que
2
22
si4
siE
i i
T L B LLz
n n T L B L
con
0 0i i
i i iT x n x
(126)
Si se sustituye C por 2Ez L en la expresioacuten (120) y se multiplica por
L se obtiene la siguiente ecuacioacuten maacutes general
f=n L +(B2) 2Ez Signo L iR =0 (127)
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
19
con 22 2 4 22i i i E i i i ER n L z n b z L por tanto el estimador de maacutexima
verosimilitud ip seraacute (en este nuevo formato) ip =ni L + 2i Ez Signo L
iR 2 2i Ez Resolviendo f=0 se obtiene el valor de 2
Ez
Alternativamente si el investigador desea soacutelo saber si el test es significativo
al error α sin realizar demasiados caacutelculos no es preciso resolver la ecuacioacuten
(124) En efecto como se decidiraacute H1 cuando 2 20 2E z C L z entonces el test
seraacute significativo si 20 2C z L o 2
0 2C z L cuando L o L
respectivamente es decir
Decidir la hipoacutetesis alternativa 21 2 0H y C z L (128)
lo que siendo debido a que y(C)ge0 entre 0 y C0 como se indicoacute maacutes arriba simplifica el
proceso enormemente (la intensidad de caacutelculos es similar a la del test claacutesico de Wald)
Otro objetivo habitual es obtener el IC de las marcas para L (λI λS) Con tal fin
el modo maacutes directo de resolverlo es a traveacutes de la expresioacuten (120) Alternativamente
como 2Ez C L entonces 2
EL z C Sustituyendo en (124) se obtiene
22 2 0E iy C n z B L C R De nuevo haciendo 2Ez = 2
2z podemos
determinar los valores C=CIlt0 y C=CSgt0 que satisfacen la ecuacioacuten anterior y calcular
22I IL z C y 2
2S SL z C Con ello λIleλleλS seraacute la solucioacuten buscada
Basaacutendose en la expresioacuten (126) puede verse que unas cotas maacutes especiacuteficas en
donde buscar las soluciones son
2
2 4i
i
L zn
I 2
22
2
z B TL
z T
222
2
z B n T L
z n T
S 2
2 4i
i
L zn
De manera similar se actuaraacute cuando el objetivo sea obtener el IC para K en
valores fijados de λ βineβK y 2Ez = 2
2z
20 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
I434 Propiedades del estadiacutestico E
Sea zexp=zE en la expresioacuten (118) y sea ψ= ip λ o βi seguacuten lo que interese
Como 2Edz d=2zE(dzEd) entonces el signo de d 2
Ez d es el mismo (distinto) que el
signo de dzEd cuando L gtλ ( L ltλ) pues entonces zEgt0 (zElt0) Esto significa que las
propiedades de convexidad (118) se verifican para zE si 2Ez verifica las expresiones
(118) cuando L gtλ o las contrarias cuando L ltλ El objetivo es por tanto calcular
d 2Ez d
Por la expresioacuten (124) se deduce lo siguiente
2 2i i i i i i i iy C y p n C R y C R A R
2 i i iy C B A R D con minus2n le DC le0
en donde la uacuteltima afirmacioacuten se debe a que 2 i i iCD B C CA R o por la
expresioacuten (124) i i i i i i iDC n R CA R n n A R con iA=ni+biβiC
pero como 2 2 2 24i i i i iR A C p q entonces Rige| iA | minus1le iA Ri le+1 y minus2nleDCle0 Como
por las expresiones (119) y (121) se deduce que Signo (C) = Signo i i iˆp p =
Signo L entonces al ser DC0 Signo (D) ne Signo (C) = Signo L
Como y=0 entonces 0dy d y y C dC d de modo que
dC d y y C y asiacute
2 2 ( )
i i i i
i i i i
dC C dC n C dC C R A
d D dp DR d DR
(129)
Finalmente como 2Ez =C( L minusλ) entonces 2 2
E Edz d z L dC d por lo
que sustituyendo en las expresiones de (129) se obtienen las igualdades siguientes
2 2( )
1Edz LC
d D
2 2 ( )1 iE
ii i
n LdzC
dp DR
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
21
2 ( )( )i iE
ii i
R A LdzC p
d DR
(130)
Si en estas tres expresiones se tiene en cuenta la relacioacuten (sentildealada arriba) entre los
signos de los teacuterminos C D y ( L ) asiacute como que RigeAi se deduce que 2Ez verifica las
expresiones (128) cuando L gtλ y las contrarias cuando L ltλ
I435 Aproximaciones al meacutetodo de las marcas meacutetodos de tipo adjusted Wald
La dificultad del actual meacutetodo de las marcas es que se basa en resolver por
meacutetodos iterativos la ecuacioacuten (124) bien en 2Ez (si se trata del test) o bien en λ (si se
trata del IC) Con el fin de simplificar el meacutetodo desarrollemos en serie de Maclaurin
(en C=0) el teacutermino iR
2 3
2 32
2 2i i i i i i ii i i i
i i
p q p q bR n bC C C
n n
(131)
Sustituyendo en la expresioacuten (124) y dividiendo por 2C se obtiene que
21 2 0L CV C V con 1 i i i iV p q n y 3 2
2 i ii i iV p q b n Sustituyendo
C= 2Ez L y operando se obtiene la expresioacuten 3 2 4
1 2 0E EL z L V z V
Si se retienen soacutelo los teacuterminos de O(ni)gendash1 y se divide por L se obtienen
las claacutesicas soluciones de tipo Wald (procedimiento W) de las expresiones (18) y
(114) Si se retienen soacutelo los teacuterminos de orden O(ni)gendash2 se sustituye 4Ez
221Ez L V y se divide por L entonces se obtiene 2
1L V
22 EL V z 2
1 EV z 0 De esto se deducen los siguientes estadiacutestico e IC
aproximados
2 2
2 2 22 22 2 1 22
1 11 2 1 2 2 E
L V Vz L z z V z
V VV L V V
(132)
22 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
El origen de los meacutetodos heuriacutesticos de tipo adjusted Wald es la propuesta
de Agresti amp Coull (1998) quienes demostraron que para el caso K=1 el centro del IC
de Wilson (IC de las marcas para una proporcioacuten) era igual al centro del meacutetodo
adjusted Wald propuesto por ellos (datos incrementados en 22z 2) lo que justificaba la
buena actuacioacuten del meacutetodo En base a las aproximaciones anteriores es ahora factible
demostrar que sucede aproximadamente lo mismo en el caso general de Kgt1 Para
expresar el centro 22 2 12L z V V del IC (132) en el formato tradicional de Wald
(es decir para hacerlo igual al valor L que se obtiene al incrementar los datos en hi)
hay que tener en cuenta que
2 2
2
1
1 i ii i i i i i i i
i i i i
bV p q b p q
n n nV K n
pues V2V1 es la media ponderada de βibini y ella seraacute aproximadamente igual a su
media aritmeacutetica Con ello el centro del IC (132) seraacute
2 22 2 2
1
con2 2
i i i
i
z V x hb zL h
V n K
Como el centro del IC adjusted Wald W(+ci) es L= 2i i i i ix c n c entonces
igualando ambas expresiones se obtiene que hi ha de verificar la igualdad
2i i i i i i ix h n h x hb n con lo cual hi= 2 22 22i i n z Kn z =
2i in h n h h = 22 2z K Esto da una justificacioacuten teoacuterica del nuevo meacutetodo
adjusted Wald que se denominoacute por meacutetodo W2 Obseacutervese que si α=5 el meacutetodo es
el mismo que proponen Price amp Bonett (2004) pues 2 22 2 1 96 2 2z K K K El
meacutetodo es tambieacuten compatible con los meacutetodos adjusted Wald de Agresti amp Coull
(1998) para K=1 ( 22z 2) y Agresti amp Caffo (2000) para el caso de la diferencia en K=2
( 22z 4)
Las aproximaciones anteriores son correctas solo cuando los datos observados
no pertenecen a la frontera del espacio muestral es decir cuando 0ltxiltni ( i) En otro
caso cuando ip =0 o 1 (es decir bi=1) entonces Ri=ni+biiC y el desarrollo en serie
de la expresioacuten (131) da un valor ni+biiC que no necesariamente coincide con el
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
23
anterior En efecto si ip =0 y iClt0 por ejemplo la expresioacuten (119) indica que
iC= i iˆn q y por tanto 0 i i i i i i i i
ˆn q C n C n bC (en donde la desigualdad se
debe a que iq 1 y la igualdad a que bi=1) por ello Ri=(ni+biiC) y no ni+biiC como
indica la expresioacuten (131) El mismo resultado se obtiene cuando ip =1 y iCgt0 La
conclusioacuten es que Ri=(ni+biiC) cuando bi=1 y biiClt0 pudiendo aplicarse en otro
caso la aproximacioacuten de la expresioacuten (131) Si con esta nueva expresioacuten se actuacutea como
al inicio de la seccioacuten se obtiene la siguiente aproximacioacuten
3 2 2 4 61 20 j j E E EN L L L B z L V z V z (133)
en donde j=1 si L j=2 si L 1 i iN I n 2 i iN S n 1 i i iB I b
2 i i iB S b Ii=1 si ip =0 y ilt0 o ip =1 y igt0 (Ii=0 en otro caso) y Si=1 si
ip =0 y igt0 o ip =1 y ilt0 (Si=0 en otro caso) Por lo tanto cuando el punto
observado cae en una de las esquinas del espacio muestral (es decir cuando bi=1) se
obtienen los siguientes resultados (que coinciden con el del meacutetodo de las marcas)
12
2
si
si E
L N B Lz
L N B L
2 2
1 2 2 22 2
1 2 2 2
N L z B N L z BL
N z N z
De modo general si en la expresioacuten (133) se actuacutea como se hizo con la
expresioacuten 3 2 41 2 0L z L V z V se obtienen los IC siguientes
2
2 221 2 12
2
42
j j j
j
zCI L B B N z V
N z
22
2 2 22 2 22 2 2 2 12
1 12
42
j j j j j
j
z V VCI L B N z B N z N z V
V VN z
En todos los casos hay que hacer j=1 y emplear el signo para obtener el extremo
inferior y hacer j=2 y emplear el signo + para obtener el extremo superior entendiendo
que V2V1=0 cuando V1=0
24 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
Procediendo como en el caso anterior si el centro de los intervalos CI1 y CI2 se
iguala al centro del IC de Wald con los datos incrementados en ih y ih
respectivamente se obtiene que
2222
22 2
2
1
2 1
ij ii
j
i
ij ii
j
nn
K N zzh
nn z
K N z
y
22
22
(1 ) si
2
(1 ) si
2
i
i
i
z I KL
Khz S K
LK
El uacuteltimo incremento da lugar al meacutetodo adjusted Wald que hemos denominado por
meacutetodo W3 Conviene ademaacutes observar que cuando 0ltxiltni (i) entonces W2=W3 y si
ademaacutes se elige =5 entonces 22 2z K 2K y W1W2 =W3
I44 Procedimiento y estimador P (en sus dos versiones Pa y Pb)
I441 Obtencioacuten del procedimiento
Otra de las propuestas de esta memoria se basa en el criterio de Sterne (1954) el
cual fue utilizado por Peskun (1993) para el caso de la diferencia d El test de las marcas
para H0 L=ipi= seraacute significativo si 2 22E z z en todos los valores pi tales que
βipi=λ por lo tanto (seguacuten Sterne) el objetivo seraacute determinar el miacutenimo valor de 2Ez o
lo que es lo mismo el valor de pi que hace maacuteximo el denominador V= 2i piqini bajo
la condicioacuten βipi=λ Como dpKdpi=iK (ineK) entonces el maacuteximo se obtiene si
1 2 1 2
0i i K KK ii i
i i i K i K K i K
p pdV V dp V V VV
dp p dp p p p n n
(ineK)
lo cual ocurriraacute cuando 1 2i i ip n (i) con γ una constante que estaacute por
determinar Como 1 2i i in p entonces sumando en i se obtiene 2n B en
donde 2 i| B | | | por la expresioacuten 2 2i i| | B L B | | Por
tanto V alcanzaraacute un extremo en los valores ip
de las proporciones pi dados por la
expresioacuten (17) lo que se corresponde con el estimador P Dicho extremo es un maacuteximo
pues 2 2 22 1 1 0i i i i K K i i Kd V dp V p V p n n y su valor
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
25
sustituyendo pi por ip
seraacute aV
= 2 2i i n n 4 En consecuencia el estadiacutestico de
contraste para el procedimiento P seraacute (en su versioacuten Pa)
2
222
4
2Pa
i
i
Lz
B
n n
(134)
Para que la expresioacuten (134) sea un valor vaacutelido es preciso que su denominador
22 2i in B n no sea negativo Para verlo sea f = 2 2i i n n Como
2 2 0i i idf d n cuando βini=γ y como 2 2id f d =2(nni)nnigt0 entonces f
alcanza un miacutenimo cuando βi=niγ (i) y asiacute f gei
min f=0 Haciendo 2 22Pa z z se obtiene
el IC de la expresioacuten (112)
Si en alguacuten caso el estimador verifica que ip
lt0 ( ip
gt1) parece conveniente
sustituirlo por ip
=0 ( ip
=1) para que asiacute sea liacutecito De hacerlo asiacute i ip q
=0 y esos
teacuterminos no contribuyen al valor de la nueva varianza bV
Esto proporciona el nuevo
estadiacutestico (que es igual de sencillo que el anterior)
2
22 21
con e 4
i iPb b iI I
b i i
L | |z V n I i | |
V n n
(136)
Haciendo 2 22Pb z z y despejando λ se obtiene el (1ndashα)-IC para L de la expresioacuten (113)
Obseacutervese que tal expresioacuten contiene como caso particular a la expresioacuten (112)
Por tanto se pueden considerar dos versiones la primera versioacuten Pa (en la que los
valores de ip
no estaacuten restringidos a tomar valores entre 0 y 1) y la segunda versioacuten Pb
(en la que siacute se obliga a los valores ip
a tomar un valor liacutecito que esteacute comprendido
entre 0 y 1)
I442 Propiedades del estadiacutestico Pa
El objetivo actual es verificar si el estadiacutestico Pa verifica las propiedades
26 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
resentildeadas en la expresioacuten (118) no nos preocupamos de la versioacuten Pb pues como se
veraacute maacutes tarde la misma no mejora los resultados de la versioacuten Pa Como Padz d es
proporcional a 1 2PaL dz d g
con 4 2g V L
2i i n
2 2B L B n la condicioacuten exigida se verificaraacute si gge0 Cuando (Bndash2 L ) y (Bndash
2λ) tienen signos distintos gge0 seguro En otro caso 2i ig n
2 2| B L | | B | n 2i i n 2
i| | n h por la expresioacuten anteriormente
citada de 2i| | B L 2 iB | | Derivando h en |βi| se ve que h
alcanza un miacutenimo cuando i i i| | n | | n (i) Como tal miacutenimo es 0 entonces
ghge0 y la convexidad parameacutetrica en queda demostrada
Para demostrar la convexidad espacial basta ver que Pa idz dp es proporcional a
1 2Pa i iL dz dp
cantidad que es positiva (negativa) cuando βige0 (βile0)
Desgraciadamente la convexidad parameacutetrica en i no tiene porqueacute verificarse
Ahora Pa idz d es proporcional a 1 2Pa iL dz d
que a su vez es proporcional a
f= 22 2 2i h h i ip n B L B n n Como idf dp no depende
de ip entonces f es siempre creciente o siempre decreciente lo que quiere decir que
seraacute siempre positiva si lo es en los valores extremos ip =0 o 1 Pero cuando ip =0
entonces f= 2 i iL B n n cantidad que puede ser negativa (con lo que
no se verificariacutea la convexidad) cuando 0 2 0L B y igt0 Esto es lo que
sucede en el caso (que sirve de contraejemplo) de 1=1 2=+2 =14 1p =0 y
2p =116
I45 Meacutetodos con correccioacuten por continuidad
Cox (1970) plantea la conveniencia de efectuar una correccioacuten por continuidad
(cpc en adelante) cuando la distribucioacuten de una variable aleatoria discreta (como es la
variable xi) sea aproximada a traveacutes de una variable continua (como es la variable
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
27
normal) Haber (1980) propone ademaacutes que una cpc debe consistir en sumar o restar a la
variable la mitad de su salto promedio En nuestro caso el estadiacutestico de contraste es L
y como B L B su salto total seraacute i y cpc vendraacute dada por la expresioacuten
2 1ic N con 1iN n el nuacutemero total de puntos del espacio
muestral
Para determinar el estadiacutestico 2expz de la expresioacuten (11) con cpc basta con
redefinirlo asiacute
2
2 si
0 si
i i i iexpc
| L | c p q n | L | cz
| L | c
(137)
y en el caso de querer determinar el IC de la expresioacuten (12) con cpc basta antildeadirle a la
misma el teacutermino plusmnc
L plusmn 22 i i i iz p q n c (138)
Teniendo en cuenta esta cpc cualquier estadiacutestico o IC de los definidos anteriormente
podraacute expresarse tambieacuten en versioacuten con una cpc Esto se denotaraacute antildeadieacutendole el
subiacutendice c al nombre del procedimiento o meacutetodo afectado asiacute el procedimiento W da
lugar al procedimiento Wc el meacutetodo E2 al meacutetodo E2c etc
En el caso particular del test de las marcas el estadiacutestico se obtiene cambiando el
valor 2Ez de la expresioacuten (124) por el valor 2
2Ecz L L c siendo 2
Ecz el
valor del estadiacutestico de las marcas con cpc (la incoacutegnita de la ecuacioacuten en el caso del
test) Similarmente para el IC asociado al meacutetodo de las marcas basta cambiar el valor
2Ez en la expresioacuten (124) por el valor 2
22z L | L | c y determinar sus dos
soluciones con IB L c y SL c B
28 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
I5 APORTACIONES DE TIPO PRAacuteCTICO
I51 Objetivo
Como se indicoacute en el Proacutelogo la evaluacioacuten de los diferentes meacutetodos de
inferencia puede realizarse desde la perspectiva de los tests de hipoacutetesis o desde la
perspectiva de los IC puesto que los dos enfoques son equivalentes (si se realizan al
mismo error nominal α) En esta seccioacuten tal evaluacioacuten se efectuaraacute desde la perspectiva
de los IC pues asiacute es como lo hacen todos los autores (por ser estas las inferencias maacutes
habituales para L)
Los meacutetodos de inferencia a evaluar son inicialmente los 20 indicados al final de
la seccioacuten I2 (los meacutetodos W0 W1 W2 W3 N0 Pb3) lo que incluye las propuestas
maacutes relevantes de la literatura de ellos 17 son meacutetodos nuevos (los denominados en
esta memoria por W2 W3 N1 N2 N3 E0 E1 E2 E3 Pa0 Pa1 Pa2 Pa3 Pb0 Pb1
Pb2 Pb3) Adicionalmente se han evaluado otros meacutetodos nuevos de menor intereacutes
(ver la seccioacuten I53) En todo caso el objetivo es seleccionar el meacutetodo o meacutetodos
oacuteptimos (bajo los criterios que se especificaraacuten) Una vez realizada esa seleccioacuten
inicial se evaluaraacuten comparativamente esos meacutetodos seleccionados con los meacutetodos
con cpc a que dan lugar
I52 Descripcioacuten del estudio de simulacioacuten y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo
Para efectuar la evaluacioacuten anterior se va a realizar un estudio de simulacioacuten en
cada una de las siguientes combinaciones de los paraacutemetros (a K ni bi)
=5 (aunque en ocasiones especiales tambieacuten se contemplaraacuten los errores del 1 y
del 10)
K=3 (n1 n2 n3) = (10 10 10) (30 30 30) (30 10 10) y (30 20 10) (1 2 3) =
(13 13 13) (1 12 12) (1 12 2) y (1 1 1)
K=4 (n1 n2 n3 n4)=(10 10 10 10) (20 20 20 20) (20 20 10 10) y (20 15 10 5)
(1 2 3 4) = (14 14 14 14) (1 +1 1 +1) (13 13 13 1) y (3 1 1 3)
El proceso de simulacioacuten consistiraacute en lo siguiente
1) Fijar una combinacioacuten (a K ni bi meacutetodo a evaluar)
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
29
2) Para cada punto del espacio muestral (x1 x2hellip xK) obtener el IC (I S) para L al
(1ndash)100 de confianza
3) Generar K valores de una distribucioacuten uniforme [0 1] -los cuales formaraacuten el vector
de proporciones (p1 p2hellip pK)- y calcular el valor real de L para el mismo (L=ipi)
4) Calcular el recubrimiento R y la longitud l del IC del meacutetodo a partir de las
expresiones (116) y (117) respectivamente
5) El proceso se repite 10000 veces obteniendo asiacute 10000 valores Rj y lj a partir de
los cuales se determinan -como se indicoacute en la seccioacuten I321- el recubrimiento
medio (Rmean) el recubrimiento miacutenimo (Rmin) la longitud media (lmean) y el
porcentaje de ldquofallosrdquo del meacutetodo es decir el porcentaje de casos en los que el
recubrimiento es menor del 93 (Rlt93) este uacuteltimo paraacutemetro que fue definido
por Price and Bonett (2004) para el caso de α=5 se sustituiraacute por los paraacutemetros
Rlt99 y Rlt86 (definidos de modo similar) en los casos de α=1 y α=10
respectivamente a fin de que lo que se entiende por un ldquofallordquo sea relativo al error
real
Para seleccionar el meacutetodo oacuteptimo asumimos las siguientes reglas de actuacioacuten
(a) El primer paso seraacute eliminar aquellos meacutetodos que sean demasiado liberales es
decir los que tengan un valor excesivo del paraacutemetro Rlt93 (pues no tiene intereacutes un
meacutetodo que tenga muchos ldquofallosrdquo)
(b) De los meacutetodos que resten se seleccionaraacute aquellos que teniendo un valor de Rlt93
pequentildeo su valor de Rmean sea proacuteximo al 95 prefiriendo los meacutetodos
conservadores (Rmeangt95) sobre los liberales (Rmeanlt95) Hay que tener en
cuenta que de nada sirve un meacutetodo tan conservador que (Rlt93)=0 y
Rmean=100 (por aludir a un caso extremo)
(c) De entre los meacutetodos que resten se seleccionaraacuten aquellos en los que Rmin sea
grande (y cercano al nominal) y lmean sea pequentildeo
(d) Finalmente si sigue habiendo maacutes de un meacutetodo seleccionado se preferiraacute aquel
que sea maacutes sencillo de aplicar (es decir el que requiera de menos caacutelculos)
Dado que el nuacutemero de meacutetodos es excesivo (los 20 aludidos en la seccioacuten
anterior y algunos maacutes que se han ensayado) la seleccioacuten se efectuaraacute por fases
seleccionando el mejor de cada familia de meacutetodos (es decir de cada procedimiento) y
30 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
comparando al final entre siacute todos los seleccionados Con fines de comparabilidad ello
nos obliga a efectuar una simulacioacuten distinta para cada familia o grupo de meacutetodos
comparados (las 10000 reacuteplicas aludidas maacutes arriba) pero igual dentro de cada familia
o grupo lo que ocasionaraacute que algunos datos de Rmean lmean etc sean diferentes de
una tabla a otra
Adicionalmente la necesaria restriccioacuten de espacio que implica esta memoria
nos impide presentar los resultados de todos los meacutetodos comparados restringieacutendonos
exclusivamente a los 20 meacutetodos principales resentildeados arriba (los restantes estaacuten
disponibles para el lector que lo desee)
I53 Seleccioacuten del meacutetodo oacuteptimo de cada familia en la versioacuten sin cpc
I531 Seleccioacuten para los meacutetodos de tipo W (=5)
Los datos para los 4 meacutetodos W0 W1 W2 y W3 se encuentran en la Tabla AI1
y de su anaacutelisis puede concluirse lo siguiente
El claacutesico meacutetodo W0 es muy malo por tener un altiacutesimo porcentaje de fallos
Los meacutetodos W1 y W2 fallan demasiado en algunas ocasiones (que ademaacutes
coinciden con el caso de muestras grandes) y fallan algo en muchos otros casos Por
ello y aunque son solo ligeramente conservadores deben ser rechazados
El meacutetodo W3 tiene muy pocos fallos (aunque es algo conservador)
La conclusioacuten es que el mejor meacutetodo de este grupo es el W3 (el cual es
equivalente al meacutetodo W2 cuando los datos no estaacuten en los bordes del espacio
muestral)
Adicionalmente se han evaluado diversas modificaciones de los meacutetodos
anteriores pero ninguna de ellas logra mejorar la actuacioacuten del meacutetodo seleccionado
W3 Las 8 modificaciones evaluadas (con la descripcioacuten de su origen) se describen a
continuacioacuten
(1) Tres meacutetodos que son aproximaciones simples o dobles de los meacutetodos que maacutes
adelante se denominan como EA1 al EA3
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
31
W4 hi = 2
22i
i
n z
Kn z
W5 hi =
2
22
nz
K n z
W6 hi =
2
2 22 2i
i
nn z
K n z n nz
(2) Tres meacutetodos que son aproximaciones de los meacutetodos que maacutes adelante se
denominan como EA4 y EA5 por lo que participan de su filosofiacutea hay que
determinar los valores ih y sumar a los datos una cantidad hi diferente seguacuten que se
esteacute obteniendo el extremo inferior (hacer h=1 es decir usar i1) o el superior (hacer
h=2 es decir usar i2)
W7 2
2 1ih i
ih ih
n zh
N
W8 22
22
1
2 1
ih ii
hi
ih ii
h
nn
K N zzh
nn z
K N z
(3) Dos meacutetodos que son una simplificacioacuten del W3 a fin de hacerlo maacutes faacutecil de aplicar
(ahora se suma la misma cantidad hi con independencia del extremo del CI que se
esteacute calculando)
W9
2 2
1 2
2 2
si 0 y 1 en el interior si 02 2
2 2 en otro caso es extremo en otro caso
4 4
i i i i
i
i
z zp x
K Khz K z K
x K K
W10 (nueva) 2
12
ii
i
z nh K
K n
I532 Seleccioacuten para los meacutetodos de tipo N (=5)
Los datos para los 4 meacutetodos N0 N1 N2 y N3 se encuentran en la Tabla AI2
De su anaacutelisis puede concluirse que deben descartarse todos los meacutetodos que utilizan los
datos incrementados (N1 N2 y N3) en tanto que puede aceptarse el meacutetodo claacutesico N0
(por no contar con excesivos fallos y ser muy ligeramente conservador) La conclusioacuten
es por tanto que el mejor meacutetodo de este grupo es el N0
Adicionalmente hemos comprobado que en las expresiones (15) o (110) del IC
32 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
de Wilson que da lugar al estimador N conviene que =5 con independencia del
error deseado para el IC para L (1 5 o 10)
I533 Seleccioacuten para los meacutetodos de tipo E (=5)
Los datos para los 4 meacutetodos E0 E1 E2 y E3 se encuentran en la Tabla AI3 De
su anaacutelisis puede concluirse que deben descartarse todos los meacutetodos que utilizan los
datos incrementados (E1 E2 y E3) en tanto que puede aceptarse el meacutetodo claacutesico E0
por no tener un nuacutemero excesivos de fallos (salvo a veces en el caso de muestras muy
pequentildeas) y ser unas veces ligeramente conservador y otras ligeramente liberal La
conclusioacuten es por tanto que el mejor meacutetodo de este grupo es el E0
Adicionalmente se han evaluado diversas modificaciones de los meacutetodos
anteriores pero ninguna de ellas logra mejorar la actuacioacuten del meacutetodo seleccionado E0
Las 5 modificaciones evaluadas (con la descripcioacuten de su origen) se describen a
continuacioacuten
(1) Tres meacutetodos que provienen de las aproximaciones originales obtenidas en la
seccioacuten I425 (antes de utilizar la aproximacioacuten extra que implican los meacutetodos
adjusted Wald)
EA1 2
2 22 21
1 12 2
V VL L z z V z
V V
EA2 2
2 22 2 312 2
3 1 1 1 1
1
1 2 2
V V VL L z z V z
z V V V V V
EA3 2
2 2 32 21
1 1 12 2
VV VL L z z V z
V V V
con 2 3 2 4 31 2 3 5 1
i i i ii i i i i i i i i i iV p q n V p q b n V p q p q n Al aplicar
las expresiones anteriores aparece el problema de que los cocientes V2V1 y V3V1
estaacuten indeterminados cuando todas las ip valen 0 oacute 1 en esos casos se asume que
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
33
3 2
22
1
i ii
i i
b nV
V n
4 3
32
1
i i
i i
nV
V n
Complementariamente en los dos uacuteltimos casos hay que actuar asiacute
EA2 Si ip =0 oacute 1 (i) (o el interior de la raiacutez es negativo) tomar como solucioacuten la
de EA1
EA3 Cuando el interior de la raiacutez es negativo tomar como solucioacuten la de EA1
(2) Dos meacutetodos que tambieacuten son aproximaciones depuradas del meacutetodo E En ambos
casos hay que determinar primero las siguientes deltas de Kronecker ih (obseacutervese
que ellas siempre valen 0 en las clases cuyas proporciones no toman valores
extremos) y luego los valores Nh y Bh (con h=1 o 2)
1 1 1 1 1
2 2 2 2 2
1 si 1 2
0 en otro caso 1 si 0 con
1 si 01 si 1 2
0 en otro caso
i ii i i i i i
iii
iii ii i i i i i
p s N n B b
s
p s N n B b
Ahora los extremos del CI se obtienen mediante las expresiones que siguen (h=1
cuando se usa el signo h=2 cuando se usa el signo +)
EA4 2
2 212
42
h h h h
h
zL L B B N z V
N z
EA5 22
2 2 22 212
1 1
42
h h h h h h
h
z V VL L B N z B N z N z V
V VN z
(en EA5 hay que entender que si V1=0 entonces V2V1=0)
I534 Seleccioacuten para los meacutetodos de tipo P (=5)
Los datos para los 8 meacutetodos Pa0 Pa1 Pa2 Pa3 Pb0 Pb1 Pb2 y Pb3 se
encuentran en la Tabla AI4 De su anaacutelisis puede concluirse que
34 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
Deben descartarse todos los meacutetodos que utilizan los datos incrementados (Pa1 Pa2
Pa3 Pb1 Pb2 y Pb3) por tener maacutes fallos que el meacutetodo Pa0 y Pb0 de los datos sin
incrementar y un valor similar o superior de Rmean
Los meacutetodos Pa0 y Pb0 son muy similares pero el primero es ligeramente mejor que
el segundo (especialmente en los valores de lmean) y es bastante maacutes sencillo
(aunque es muy conservador)
La conclusioacuten es por tanto que el mejor meacutetodo de este grupo es el Pa0
Adicionalmente se han evaluado dos modificaciones de los meacutetodos anteriores
pero ninguna de ellas logra mejorar la actuacioacuten del meacutetodo seleccionado Pa0 Las dos
modificaciones evaluadas aluden a meacutetodos que son una aproximacioacuten del meacutetodo Pa0
APa01 2
2 2
2i
i
B LzL L
n n
APa02 El APa01 basado en los datos incrementados en 22 2i i h n z n
I54 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los mejores de cada familia
(=1 5 y 10) caso general y caso particular de un contraste
La Tabla AI5 del Apeacutendice de Tablas presenta los resultados de los meacutetodos
seleccionados en la seccioacuten anterior (W3 N0 E0 y Pa0) para =5 (confianza del
95) A la vista de los mismos puede deducirse que
El meacutetodo N0 tiene un buen valor de Rmean cercano al 95 nominal (en promedio
es ligeramente conservador) pero falla mucho y en todas las circunstancias (pues sus
valores de Rlt93 suelen ser demasiados grandes) por lo que hay que descartarlo
Los meacutetodo Pa0 y W3 son muy conservadores (valores muy grandes de Rmean) y
muy imprecisos (valores muy grandes de lmean) aunque W3 es menos extremo en
estos dos aspectos Ambos meacutetodos fallan muy poco aunque el meacutetodo Pa0 falla
algo menos que el meacutetodo W3 Globalmente es pues preferible el meacutetodo W3 al
meacutetodo Pa0
El meacutetodo E0 tiene los mejores valores de Rmean (es maacutes equilibrado en torno al
95) de lmean (es maacutes pequentildeo que los de Pa0 y W3) y solo falla demasiado
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
35
cuando ni=10 ( i ) de donde se deduce que (salvo en esta uacuteltima situacioacuten) es el
mejor meacutetodo
Con el fin de matizar yo ratificar dichos resultados las Tabla AI6 y AI7 presentan los
resultados para los errores del 1 (confianza del 99) y del 10 (confianza del 90)
respectivamente Analizando las mismas puede observarse que las conclusiones
anteriores permanecen de modo general En consecuencia la seleccioacuten actual para el
caso general es la siguiente
Si ni 10 (i) W3 es el mejor meacutetodo
En otro caso E0 es el mejor meacutetodo pero una alternativa mucho maacutes sencilla es el
meacutetodo W3 (aunque es algo conservador tiene alguacuten fallo y provoca unos IC algo
maacutes amplios que los del meacutetodo E0)
Si se desea un meacutetodo que no falle casi nunca la seleccioacuten es el meacutetodo Pa0 (pero es
demasiado conservador y proporciona unos IC excesivamente amplios)
Las selecciones realizadas en el paacuterrafo anterior se mantienen para el caso de un
contraste (i=0) con el uacutenico cambio de que ahora el meacutetodo W3 praacutecticamente no
falla Los datos son los de las Tablas AI5 a la AI7 para los casos con K=3 y βi=(1ndash
12ndash12) y K=4 en las combinaciones βi=(ndash1 1ndash1 1) y βi=(ndash3 ndash1 1 3) En
consecuencia la seleccioacuten actual para el caso de un contraste es la siguiente
Si ni 10 (i) W3 es el mejor meacutetodo
En otro caso E0 es el mejor meacutetodo (aunque falla algo) pero una alternativa mucho
maacutes sencilla (aunque algo conservadora y que provoca unos IC algo maacutes amplios) es
el meacutetodo W3
Si se desea un meacutetodo que no falle nunca la seleccioacuten es el meacutetodo Pa0 (pero es
demasiado conservador y proporciona unos IC excesivamente amplios)
I55 Seleccioacuten del meacutetodo oacuteptimo consin cpc de entre los mejores de cada familia
(=5)
La Tabla AI8 presenta los resultados para K=3 y =5 para los meacutetodos E0
36 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
N0 y Pa0 sin y con cpc (meacutetodos E0 N0 Pa0 E0c N0c y Pac respectivamente) Se
excluye el meacutetodo W3 pues ya de por siacute era muy conservador (y la aplicacioacuten de una
cpc ocasionaraacute que lo sea maacutes auacuten) Como era esperable los meacutetodos con cpc tienen un
nuacutemero de fallos menor o igual que los meacutetodos sin cpc Puede observarse lo siguiente
Los meacutetodos E0 y E0c son iguales en todos los paraacutemetros salvo cuando ni=10 ( i)
en cuyo caso E0c es algo mejor que E0 por tener menos fallos Como en este uacuteltimo
caso sigue sin ser competitivo frente a W3 se deduce que el meacutetodo E0 (aun con
cpc) no tiene intereacutes
El meacutetodo N0c es ligeramente mejor que el N0 en cuanto a fallos y a Rmin
sucediendo al contrario que con respecto a los paraacutemetros Rmean y lmean Como
esto no implica que N0 mejore su actuacioacuten como para ser competitivo con los
meacutetodos oacuteptimos E0 y W3 se deduce que la cpc no tiene intereacutes en este caso
De igual modo la cpc no tiene intereacutes en el caso del meacutetodo Pa0 pues unas pocas
veces tiene un efecto beneficioso y unas pocas maacutes de veces lo tiene perjudicial
Se ve pues que en el caso K=3 la cpc solo es uacutetil para mejorar ligeramente el
meacutetodo E0 para muestras pequentildeas Como la cpc decrece fuertemente seguacuten aumenta K
se deduce que su intereacutes seraacute auacuten menor en el caso de que Kgt3 La conclusioacuten es que se
mantiene la seleccioacuten realizada anteriormente con la matizacioacuten del caso E0c
I56 Verificacioacuten de los resultados de la literatura
La literatura ha analizado algunos de los meacutetodos descritos anteriormente y
establecido conclusiones acerca de su comportamiento absoluto o relativo a otros
meacutetodos Aquiacute se trata de ratificarlas o criticarlas en base a nuestros datos Las uacutenicas
conclusiones de la literatura (las mencionadas en la seccioacuten I322) (1) Price amp Bonett
(2004) que indican que el meacutetodo W1 es mejor que el meacutetodo W0 (que tiene muy mal
comportamiento) y (2) Zou et al (2009) que indican que el meacutetodo N0 es mejor que el
meacutetodo W1 que a su vez es mejor que el meacutetodo W0 (que tiene muy mal
comportamiento)
Seguacuten nuestros resultados resumidos en la Tabla AI9 el meacutetodo W0 es
claramente un meacutetodo muy malo Respecto de la otra afirmacioacuten (que el meacutetodo N0 es
mejor que el W1) de los datos de las tablas se observa que (en funcioacuten del paraacutemetro
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
37
analizado que se sentildeala al inicio de cada paacuterrafo)
Rlt93 aunque W1 es casi siempre mejor que N0 en ocasiones W1 falla demasiado
por lo que debe elegirse N0
Rmin la mitad de las veces es mejor N0 y la otra mitad W1
Rmean N0 es maacutes equilibrado que W1 en K=3 pero en K=4 ocurre al reveacutes
lmean N0 es algo mejor
De ahiacute la afirmacioacuten de Zou (especialmente porque solo mostroacute los datos para K=3 y
valores de ni maacutes pequentildeos que los actuales)
I6 CONCLUSIONES FINALES Y EJEMPLOS
I61 Meacutetodo oacuteptimo
Por todo lo resentildeado en la seccioacuten 15 pueden establecerse las conclusiones que
se indican en el cuadro de abajo Obseacutervese que todos los meacutetodos seleccionados son
nuevas aportaciones de esta memoria
SELECCIOacuteN DEL MEJOR MEacuteTODO PARA K3
Si ni 10 (i) W3 es el mejor meacutetodo (seguido de E0c que es bastante menos
fiable)
En otro caso E0 es el mejor meacutetodo pero una alternativa mucho maacutes sencilla es el
meacutetodo W3 (aunque es algo conservador tiene alguacuten fallo y provoca unos IC algo
maacutes amplios que los del meacutetodo E0)
Si se desea un meacutetodo que no falle casi nunca la seleccioacuten es el meacutetodo Pa0 (pero es
demasiado conservador y proporciona unos IC excesivamente amplios)
I62 Foacutermulas aconsejadas para realizar la inferencia
I621 Meacutetodo E0 (el mejor salvo que ni10 i)
La expresioacuten base es
38 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
2 Signo 0iy n L Β z L R
con 22 2 2 4 22 1 2i i i i i iR n L z n p z L y 0i
i I SΒ L
0i
+iΒ
Para obtener el intervalo (en cuyo caso es desconocido) basta hacer en la
misma z=z2 y obtener las dos soluciones (λI λS) de la ecuacioacuten en Para obtener el
estadiacutestico de contraste para el test (en cuyo caso es conocido) basta obtener la uacutenica
solucioacuten 20Ez de la ecuacioacuten en z2 En la direccioacuten httpwwwugreslocalbioest
Z_LINEAR_KEXE puede obtenerse un programa gratuito que realiza los caacutelculos
anteriores
I622 Meacutetodo W3 (el mejor si ni10 i y una buena alternativa en el resto de los
casos)
1) Incrementar todos los datos (los eacutexitos xi y los fracasos yi) en 22 2z K si 0ltxiltni
(i) o en otro caso incrementarlos en
22
22
1 si 1 21 con para
2 0 en otro caso
1 si 1 21 con para
2 0 en otro caso
i iii I
i
i iii S
p sz I K I
K h
p sz S K S
K
1 si 0
con 1 si 0
ii
i
s
2) El intervalo y el estadiacutestico de contraste vienen dados respectivamente por las
expresiones siguientes aplicadas a los datos incrementados anteriores
2
2i i i
i
p qL L z
n
2
223
i i iW
i
p qz L
n
I623 Meacutetodo Pa0 (meacutetodo muy conservador pero que no falla casi nunca)
El intervalo y el estadiacutestico de contraste vienen dados respectivamente por las
expresiones siguientes (en las que B=i)
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
39
2 22 2 2
22 2 20 22 2
2
2 4
2 2 2 i
Pa
i i
i
B L Ln Bz z n zL L z
n z n n n n B
n n
I63 Ejemplos praacutecticos
Price and Bonett (2004) aluden a un estudio de Cohen et al (1991) en el que se
anotoacute la presencia o ausencia de un tumor en cuatro grupos de 30 ratas sometidas a
cuatro dietas (con mayor o menor grasa y con o sin fibra) La Tabla I2 muestra los
resultados obtenidos y los tres contrastes de intereacutes para evaluar el efecto de la fibra (L2)
para evaluar el efecto del nivel de grasa (L3) o para evaluar la interaccioacuten entre ambos
efectos (L1 la diferencia entre los efectos de la fibra seguacuten que se determinen a uno u otro
nivel de grasa) En todos los casos βi=0 (por lo que se trata de contrastes)
Tabla I2
Fibra CON SIN
Grasa Alta Baja Alta Baja
Sample size (ni) 30 30 30 30
Rats showing cancer (xi) 20 14 27 19
Efectos β1 β2 β3 β4
L1=FibratimesGrasa +1 ndash1 ndash1 +1
L2=Fibra +1 +1 ndash1 ndash1
L3=Grasa +1 ndash1 +1 ndash1
Tebbs and Roths (2008) aluden a los datos (Tabla I3) de un ensayo cliacutenico
multiceacutentrico cuyo fin era evaluar la eficacia de un reacutegimen rebajado en sal en el
tratamiento de bebeacutes varones con diarrea aguda Una de las caracteriacutesticas a medir era el
nuacutemero de nintildeos que experimentan fiebre con la administracioacuten del tratamiento o
durante el ensayo El objetivo es estimar el porcentaje de sujetos que responden al
tratamiento A causa de que el nivel de participacioacuten es diferente pues depende de la
localizacioacuten una estimacioacuten natural de la proporcioacuten global es la media de las
probabilidades de respuesta pi en los K=6 lugares ie L=βipi con βi=ni ni (en nuestra
opinioacuten este modo de proceder es el adecuado si acaso los tamantildeos muestrales son
40 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
proporcionales a los tamantildeos poblacionales) Ahora βine0
Tabla I3
Localizacioacuten Tamantildeo de muestra (ni) Casos de fiebre (xi) Coeficientes (βi)
Bangladesh
Brasil
India
Peruacute
Vietnam
Total
158
107
175
092
143
675
73
32
44
34
104
287
158675
107675
175675
092675
143675
1
Si deseamos saber si el test de interaccioacuten para la Tabla I2 (H0 L1=0 vs H1
L1ne0) es significativo (a un error α=5) sin realizar demasiados caacutelculos podemos
utilizar la regla de la expresioacuten (128) Para el ejemplo se tiene que λ=B=0
22z = 2
2 5 z =1962 y 2 2 2 21 2 30 15 1 96 30 30 1 96 7 5 1 96i iL C R a
con ai=10 2 ndash24 y 8 para i=1 2 3 y 4 respectivamente Por ello el valor de C en la
funcioacuten es y(C)=120ndashRi= ndash129866 lt 0 luego el test no es significativo
El meacutetodo E0 aplicado a los contrastes L1 L2 y L3 proporciona los valores
zE0=0412 2424 y +2803 respectivamente lo que indica que son significativos los
efectos de la fibra (L2) y de la grasa (L3) pero que no hay interaccioacuten entre ambas (L1)
como se comproboacute en el paacuterrafo anterior Para cuantificar la magnitud de los efectos de
L2 y L3 hay que determinar el IC para cada una de ellas Alternativamente los tests
anteriores pueden realizarse a traveacutes del IC para L1 L2 y L3
La Tabla I4 contiene los IC al 95 para todos los contrastes de la Tabla I2 y de
la Tabla I3 realizados por los meacutetodos E0 W3 y Pa0 Puede observarse que como se
indicoacute arriba los contrastes L2 y L3 son significativos al error del 5 (pues sus IC
contienen al valor 0) pero el contraste L1 no lo es (pues sus IC no contienen al valor 0)
Sin embargo en la evaluacioacuten de la magnitud de los diversos intervalos para Li o L se
producen algunas diferencias entre meacutetodos Se observa que el meacutetodo Pa0 proporciona
unos IC excesivamente amplios salvo para tamantildeos muestrales grandes (como en el
caso de L) Finalmente se ve que el meacutetodo W3 proporciona unos IC de anchura similar
a la del meacutetodo E0 pero sus centros son algo maacutes diferentes (salvo en el caso de L de
CAPIacuteTULO I K=CUALQUIERA Y CASO Kge3
41
nuevo por causa de los grandes valores de ni)
Tabla I4 Anaacutelisis de los datos de las Tablas I2 y I3
IC (Tablas I2 y I3) = Centro (1ordf entrada) plusmn Radio (2ordf entrada)
Meacutetodo L1 L2 L3 L
E0 00719 03164 03934 03162 04581 03161 04256 00349
W3 00646 03162 03876 03162 04522 03162 04256 00348
Pa0 ndash00646 03520 ndash03876 03454 04522 03428 04256 00372
CAPIacuteTULO II
K=2 EN EL CASO DE LA DIFERENCIA
II1 INTRODUCCIOacuteN
Uno de los objetivos maacutes habituales en Ciencias de la Salud es la comparacioacuten
de las proporciones pi (i=1 o 2) de individuos que presentan una caracteriacutestica de intereacutes
en dos poblaciones distintas a cuyo fin lo maacutes habitual es tomar dos muestras
independientes de cada una de ellas Este es el caso de que se comparen la proporcioacuten
de curaciones con dos tratamientos distintos o la proporcioacuten de enfermos en los grupos
con y sin un determinado factor de riesgo etc En tales situaciones el paraacutemetro de
intereacutes suele ser la diferencia d=p2p1 entre ambas proporciones lo que constituye un
caso particular del caso general del capiacutetulo anterior ahora K=2 1=1 2=+1 L=d y la
Tabla I1 se particulariza en la actual Tabla II1 que se comenta de momento El
objetivo actual es pues la realizacioacuten de un test de dos colas sobre d (H0 d=δ vs H1
dδ) o la obtencioacuten de un IC de dos colas para d
Tabla II1
Tabla 2times2 para muestras independientes
Muestras SIacute NO Total Coeficientes
I x1 y1 n1 β1=1
II x2 y2 n2 β2=+1
Total a1 a2 n
La Tabla II1 presenta los datos obtenidos en este tipo de experimentos donde
de nuevo SIacuteNO alude a la presencia o ausencia de la caracteriacutestica que se estudia ix
( iy ) es el nordm de individuos de entre los in (tamantildeo de muestra) que siacute (no) presentan la
caracteriacutestica βi son los coeficientes de la combinacioacuten lineal 1a =xi ( 2a =yi) son los
totales de individuos que siacute (no) presentan la caracteriacutestica y finalmente n =a1+a2=ni
es el tamantildeo total de la experiencia Las dos variables aleatorias ( )ix siguen
44 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
distribuciones binomiales independientes ( )i i ix B n p con i=1 o 2 en donde ip es
la proporcioacuten (desconocida) de individuos de la poblacioacuten i que presentan la
caracteriacutestica
Las medidas utilizadas para evaluar la relacioacuten entre dos proporciones pi son de
muy diversos tipos siendo las maacutes frecuentes la diferencia de proporciones (diferencia
de Berkson) d el cociente de proporciones (riesgo relativo) R y la odds-ratio (razoacuten del
producto cruzado) O Como ya hemos indicado en este capiacutetulo nos centraremos en el
caso de la diferencia de proporciones d=p2ndashp1 posponiendo el resto de paraacutemetros para
los capiacutetulos siguientes
El caso d ha sido profusamente utilizado en la literatura tanto desde el punto de
vista exacto como desde el punto de vista asintoacutetico En el caso exacto ha sido tratado
por autores como Chan (1998) Roumlhmel amp Mansmann (1999 a) o Martiacuten amp Herranz
(2004 b) entre otros fundamentaacutendose en las ideas originales de Barnard (1947) Para
este tipo de meacutetodos la obtencioacuten de un IC es computacionalmente intensiva y poco
factible para tamantildeos de muestra moderadamente grandes es por ello que la mayoriacutea de
los investigadores se centran en el caso asintoacutetico para el que existen cientos de
artiacuteculos en los que se proponen yo analizan diversos meacutetodos (Newcombe 1998 a
Agresti amp Caffo 2000 Kang amp Chen 2000 Chan 2003 Agresti 2003 Martiacuten amp
Herranz 2003 Brown amp Li 2005 Santner et al 2007)
El objetivo de este capiacutetulo es proponer y evaluar nuevos meacutetodos asintoacuteticos
para el caso particular del paraacutemetro d y compararlos con las mejores propuestas de la
literatura
II2 NOTACIOacuteN
II21 Generalidades y estadiacutesticos base
Sean dos variables aleatorias binomiales independientes xi~B(ni pi) con i=1 o
2 y sea d=p2ndashp1 el paraacutemetro de intereacutes (con las proporciones pi desconocidas) Sean
ip =xini las proporciones muestrales y 2 1d p p la estimacioacuten muestral de la
diferencia poblacional d Sean tambieacuten qi=1pi y 1i iq p Para contrastar H0 d=δ vs
H1 dδ (con ndash1leδle1 ya que 0lepile1) es necesario seleccionar primeramente un
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 45
estadiacutestico de contraste que podraacute tener una de las tres formas siguientes (y que en
adelante seraacuten aludidas abreviadamente por el nombre en negrita que se indica)
Z
2
2
1 1 2 2
1 2
1 1Z
d δz
p p p p
n n
(21)
X 2
22 si | | 0
0 si | |=0
i i ii
X i i
n p pχ d δ
z p q
d δ
(22)
en donde 2
2
0 si 0 o 1
si 0 o 1
i i i i i
i i i i i
χ p p p p
χ p q p q
y
A 2
1 22
1 2
4A
n n d δz
n n
con
1 12 1
1 12 1
d sin p sin p
δ sin p sin p
(23)
En cualquiera de los tres casos habraacute que comparar el valor experimental del estadiacutestico
2expz (cualquiera de los tres anteriores) con 2
2z en donde 2z es el percentil (1ndash
α2)100 de la distribucioacuten normal tiacutepica Para obtener el IC (1ndashα) para d se invierte
el test despejando δ en la ecuacioacuten 2 22exp z z En unas ocasiones la solucioacuten seraacute
expliacutecita (y maacutes o menos sencilla) en otras requeriraacute de un procedimiento iterativo
II22 Estimadores de las proporciones pi
En los tres estadiacutesticos anteriores (Z X o A) las proporciones pi desconocidas
deben ser sustituidas por alguno de sus estimadores (con el fin de que tengan utilidad
praacutectica) En lo que sigue se describen los mismos y se pone en mayuacutesculas y negrita la
letra abreviada que designaraacute el procedimiento que proporciona cada estimador (letra
que hay que antildeadir a la del estadiacutestico Z X o A utilizado)
II221 Estimadores no restringidos por H0
El procedimiento claacutesico y maacutes utilizado a la hora de estimar las proporciones
consiste en sustituir los valores desconocidos pi por los estimadores claacutesicos de maacutexima
46 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
verosimilitud simple (es decir las proporciones muestrales)
W (Wald) i i ip x n (24)
Una opcioacuten maacutes reciente (Newcombe 1998 a) consiste en sustituir las
proporciones desconocidas por el extremo apropiado del IC de Wilson (1927)
N (Newcombe) 1 1 2 2
1 1 2 2
si d
si d
p u p l
p l p u
(25)
con
2 22 2
2
22
2 4 i i
i i
i
i
z z x yx z
nl
n z
y
2 22 2
2
22
2 4 i i
i i
i
i
z z x yx z
nu
n z
(26)
siendo (li ui) el IC de dos colas al 100middot(1ndashα) para la proporcioacuten pi
II222 Estimadores siacute restringidos por H0
El estimador de pi restringido por H0 maacutes habitual (por su sencillez) es el
obtenido por el meacutetodo condicionado de Dunnett and Gent (1977)
C (Condicionado) 1 21
a np
n
y 1 1
2 1
+a np p
n
(27)
Como puede suceder que el valor de ip no esteacute comprendido entre 0 y 1 parece
conveniente exigir que se cumpla esta condicioacuten de ahiacute que el estimador ip tenga dos
versiones
Ca ip = (27)
Cb ip = (27) restringida a que esteacute entre 0 y 1 ( ip =0 si ip lt0 y ip =1 si ip gt1)
Una opcioacuten maacutes complicada es utilizar los siguientes estimadores de maacutexima
verosimilitud bajo H0 (Mee 1984 Farrington and Manning 1990)
E (Incondicionado exacto) 0 51 2 32 3p c B cos c y 2 1ˆ ˆp p (28)
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 47
en donde 0 1 1c x 1 1 1 12c a n n x 2 2 1 12c n n n a 3c n
22 1 33B c c c 3
3 1 2 0 3 24 5 3A c c c c c c y 1 3 2 3cos A B
Otro tipo de estimadores son los obtenidos por el meacutetodo de Peskun (1993)
P (Incondicionado de Peskun) 11
2
n np
n
y 2
2 1 2
n np p
n
(29)
aunque al igual que el caso condicionado podriacutea ser conveniente exigir que ip
sea un
valor liacutecito (que esteacute comprendido entre 0 y 1) de ahiacute que ip
tenga dos versiones
Pa ip
= (29)
Pb ip
= (29) restringida a que esteacute entre 0 y 1 ( ip
=0 si ip
lt0 y ip
=1 si ip
gt1)
II23 Procedimientos de inferencia que se obtienen con cada estimador
Cuando en las 3 expresiones (21) (22) y (23) se sustituye cada uno de los 7
estimadores aludidos en la seccioacuten anterior se obtienen los 21 estadiacutesticos 2ZWz 2
ZNz
2ZCaz 2
ZCbz 2ZEz 2
ZPaz 2ZPbz 2
AWz hellip 2APbz cada uno de los cuales da lugar a un
procedimiento de test diferente Al invertir el mismo se obtiene un procedimiento de IC
diferente En ambos casos el nombre del procedimiento es la unioacuten de las letras de los
testsestimadores implicados en su definicioacuten por ello al combinar los 3 estadiacutesticos
(Z X y A) con los 7 estimadores (W N Ca Cb E Pa y Pb) se obtienen los 21
procedimientos iniciales ZW ZN ZCa ZCb ZE ZPa ZPb XWhellip APb Sin embargo
algunos de ellos deben omitirse por las razones que siguen
a) Los procedimientos XE y ZE son equivalentes (como se justificaraacute en la siguiente
seccioacuten) por lo que basta con considerar uno de ellos (el ZE por ser el maacutes
conocido)
b) Los procedimientos XW AW XN y AN no dependen de (y ademaacutes los dos
primeros tienen ademaacutes un valor nulo)
c) Los procedimientos ACa y APa pueden proporcionar valores de pilt0 o pi gt1 (en
cuyo caso no tiene sentido la trasformacioacuten arco seno)
48 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
A los 14 procedimientos restantes se les antildeade el siguiente procedimiento L
(contando asiacute con 15 procedimientos en total) cuyo IC viene dado por
L (I S) = 2
2 22 22 2 1 2
1 12 2α α α
V Vd z z V z
V V
(210)
en donde
1 1 2 21
1 2
p q p qV
n n y
1 1 1 2 2 22 2 2
1 2
2 1 1 2p q p p q pV
n n
(211)
con lo cual un punto (x1 x2) es de la regioacuten criacutetica (RC en adelante) del test para si el
intervalo de confianza que proporciona (I S) es tal que I o S La expresioacuten tiene
la dificultad de que el valor de V2V1 estaacute indeterminado en las esquinas del espacio
parameacutetrico (es decir si V1=0) Para solventar el problema asumimos que en estas
esquinas sucede que 1 1 2 2p q p q =1 con lo cual
1 22 2
2 1 21
1
1 2
2 1 1 2
Si = 0 1 1
p p
V n nV
Vn n
II24 Datos muestrales a utilizar y meacutetodos que proporcionan
Las foacutermulas anteriores pueden utilizarse en base a los datos (xi yi ni) originales
o en base a los datos originales incrementados en una cantidad hi determinada (xi+hi
yi+hi ni+2hi) Este incremento como se comentoacute en el capiacutetulo anterior tiene su origen
en los meacutetodos ldquoadjustedrdquo Wald cuyo objetivo no es otro que el de mejorar el
comportamiento del procedimiento ZW
Los valores posibles de hi se denotan con el diacutegito (en negrita) que los
identificaraacute (el cual se antildeadiraacute a las letras de los procedimientos descritos arriba)
0 hi=0 (claacutesico)
1 hi =05 (Woolf)
2 hi =1 (Agresti amp Caffo)
3 hi=2
2 4z
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 49
4
21 22
1 21 2
21 22
1 21 2
1 si 0 1 si 11 2con si
0 si 0 0 si 14
1 si 1 1 si 01 2con si
0 si 1 0 si 04
i
i
i
p pz I I I d
p ph
p pz S S S d
p p
Existen otros posibles incrementos que se descartan aquiacute pues la literatura o nuestros
propios resultados (aludidos maacutes adelante) han demostrado que no mejoran a los
anteriores
Cada uno de los 5 incrementos (0 1 2 3 y 4) puede aplicarse a cada uno de los
15 procedimientos anteriores (ZW ZNhellip APb y L) dando lugar a 75 meacutetodos de
inferencia distintos en lo que sigue ellos seraacuten notados por las letras del procedimiento
y el diacutegito del incremento correspondiente ZW0 ZW1 ZW2 ZW3 ZW4hellip L4
II3 RESULTADOS DE LA LITERATURA DE TIPO TEOacuteRICO
II31 Meacutetodos basados en el estadiacutestico Z
Desde casi el inicio de la Estadiacutestica es bien conocido que si i i ix B n p
con i=1 o 2 son independientes entonces las proporciones muestrales i i ip x n
convergen en distribucioacuten a una normal de media ip y varianza 1i i ip p n y la
diferencia 2 1d p p de las proporciones estimadas es asintoacuteticamente normal con
media y varianza las indicadas a continuacioacuten
1 1 2 22 1 2 1
1 2
d p q p qd p p N p p
n n
Para contrastar la hipoacutetesis H0 d=δ vs H1 dneδ hay que comparar el valor experimental
del estadiacutestico 2Zz dado por (21) con 2
2z (como se indicoacute entonces) El IC (1ndashα) para
d que se obtiene por inversioacuten del test tendraacute la forma
dd plusmn 1 1 2 22
1 2
p q p qz
n n
Las expresiones anteriores no tienen utilidad hasta que las proporciones pi
desconocidas sean sustituidas por una estimacioacuten de las mismas (como las resentildeadas en
50 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
la seccioacuten II22)
II311 Meacutetodo claacutesico de Wald y meacutetodo ldquoadjustedrdquo Wald
El procedimiento claacutesico de cualquier libro de texto elemental consiste en
sustituir los valores desconocidos pi por las proporciones muestrales (estimadores de
maacutexima verosimilitud simple) dados por la expresioacuten (24) lo que da lugar al
procedimiento ZW (el claacutesico procedimiento de Wald) Las expresiones siguientes
aluden al estadiacutestico de Wald y al IC de Wald que se obtiene por inversioacuten del test
ZW 2
2
1 1 2 2
1 2
ZW
dz
p q p qn n
(212)
ICZW dd plusmn 1 1 2 22
1 2
p q p qz
n n (213)
Es conocido que el meacutetodo de Wald tiene un mal comportamiento (Dunnet amp
Gent 1977 Hauck amp Anderson 1986 Roebruck amp Kuumlhn 1995 Feigin amp Lumelskii
2000 Brown amp Li 2005 Xu amp Kolassa 2007) Con el fin de mejorarlo Agresti amp
Caffo (2000) propusieron aplicarlo no en base a los datos originales (meacutetodo ZW0) sino
en base a los datos incrementados en una cantidad hi=1 (meacutetodo ZW2) para α=5
II312 Meacutetodo de Newcombe
Newcombe (1998 a) plantea un nuevo procedimiento basado en el IC asintoacutetico
para una uacutenica proporcioacuten dado por Wilson (1927) del cual se dieron datos detallados
en la seccioacuten I313 Su procedimiento basado en el estadiacutestico Z da lugar al test e IC
del procedimiento ZN
ICZN
2 1 1 1 2 2 2
2 1 1 1 2 2 2
1 1
1 1
d z l l n u u nd
d z u u n l l n
(214)
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 51
ZN
2 1 1 2 2
1 22
2 1 1 2 2
1 2
1 1 si
= 1 1
si ZN
l l u ud d
n nz
u u l ld d
n n
(215)
en donde li y ui se obtienen como en las expresiones (26) En realidad Newcombe solo
aludioacute a la expresioacuten (214) pero los estimadores ip de la expresioacuten (25) y la expresioacuten
(215) se deducen de modo inmediato
Zou and Donner (2008) generalizan y justifican teoacutericamente el procedimiento
de Newcombe Para tales autores si (li ui) es un IC cualquiera para pi al error α
entonces el IC aproximado para d tambieacuten al error α es
2 2
1 1 2 2
2 2
1 1 2 2
I
S
d u p p l
d p l u p
Es inmediato ver que si (li ui) han sido obtenidos por la foacutermula asintoacutetica claacutesica (26)
entonces el IC anterior es el mismo que el de Newcombe
II313 Meacutetodo condicionado
Bajo la hipoacutetesis nula H0 p2ndashp1=δ ocurre que p2=p1+δ por lo que el uacutenico
paraacutemetro desconocido es p1 Desde el punto de vista condicionado (es decir
condicionando en que los eacutexitos siempre sumen el valor observado de a1) el estimador
sugerido por Dunnett amp Gent (1977) viene dado por la expresioacuten (27) aunque
Farrington amp Manning (1990) matizan esta definicioacuten en el sentido de que si 0ip (o
1ip ) debe hacerse 0ip (o 1ip ) para que sean valores liacutecitos De ahiacute los dos
procedimientos ZCa y ZCb Sea cual sea el caso el estadiacutestico de contraste seraacute de la
forma
ZCab 2
2
1 1 2 2
1 2
ZCa b
dz
p q p qn n
(216)
El IC a traveacutes del procedimiento ZCa -Wallenstein (1997) y Martiacuten amp Herranz (2003)-
52 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
se obtiene determinando las dos soluciones de la ecuacioacuten de segundo grado
ICZCa 2 0A B C con
222 2 1 1 2 1 2
22 2 1 2 1 1 2
2 21 2 2 1 2
2
A z n n n n nn n
B z n n a a nn n d
C nn n d z a a
(217)
La solucioacuten es tambieacuten vaacutelida para el procedimiento ZCb si se verifica que
1 1 2 2 1 2 2 1I Smin a n a n min a n a n (Martiacuten amp Herranz 2003) pues solo
entonces 0le ip le1 La solucioacuten explicita de este caso se ve en la seccioacuten II53
II314 Meacutetodo incondicionado exacto
Desde el punto de vista incondicionado Mee (1984) propone el estimador de
maacutexima verosimilitud bajo H0 (sin condicionar en los marginales) y Miettinen amp
Nurminen (1985) proporcionan la foacutermula expliacutecita para su caacutelculo el valor 1p de la
expresioacuten (28) que es la uacutenica solucioacuten liacutecita que se obtiene de la ecuacioacuten de tercer
grado sentildealada entonces El estadiacutestico de contraste seraacute de la forma
ZE 2
2
1 1 2 2
1 2
ZE
dz
ˆ ˆ ˆ ˆp q p qn n
(218)
La desventaja de este meacutetodo de las marcas es que su IC (ICZE) no tiene solucioacuten
expliacutecita y hay que determinarlo de forma iterativa Aquiacute la palabra ldquoexactordquo se estaacute
utilizando en el sentido de que el estadiacutestico del procedimiento ZE se determina de
modo exacto (no de modo aproximado como se hace maacutes adelante)
II315 Meacutetodo incondicionado de Peskun
Peskun (1993) empleoacute el criterio de Sterne (1954) al indicar que el test Z de la
expresioacuten (21) seraacute significativo cuando lo sea para cualquier valor de p1 es decir
cuando su valor 2Zz sea mayor o igual que 2
2z para todo p1 Con tal objetivo determinoacute
el miacutenimo valor de 2Zz o lo que es lo mismo el valor de p1 que hace maacuteximo su
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 53
denominador i i iV p q n con i=1 o 2 encontrando que este maacuteximo se alcanza en
el valor 1p
de la expresioacuten (29) Esto proporciona el procedimiento ZPa el cual
ocasiona las dos expresiones siguientes para el test y el IC
ZPa 2
1 222 2
1 2
4
4ZPa
nn n dz
n n n
(219)
ICZPa 2 2
222 2
1 24
n z dd n d z n z
n n n
(220)
aunque Peskun no tuvo en cuenta que ip
puede ser un valor iliacutecito ( ip
lt0 o ip
gt1) lo
que siacute se considera en la seccioacuten II52
II316 Estadiacutestico Z con correccioacuten por continuidad
Es conocida la necesidad de utilizar una correccioacuten por continuidad (cpc en
adelante) (Cox 1970) cuando se aproxima una variable discreta (como las binomiales
actuales) a traveacutes de una variable continua (como es la normal) Haber (1972) propuso
que una cpc debe consistir en sumar o restar a la variable aleatoria la mitad de su salto
promedio En particular el estadiacutestico Z de la expresioacuten (21) se convierte en el
siguiente estadiacutestico Zc con cpc
Zc 2
1 1 2 22
1 2
si
0 si Zc
p q p q| d | c | d | c
z n n
| d | c
(221)
Para el procedimiento ZE Martiacuten amp Herranz (2004 a) comprobaron que la mejor
opcioacuten es efectuar una cpc muy suave dada por c=1(N1) o 2(N1) si los tamantildeos
muestrales son distintos o iguales respectivamente en donde N=(n1+1)times(n2+1) pues la
tradicional cpc de Yates (Cornfield 1956) de c=(n1+n2)(2n1n2) da lugar a resultados
muy conservadores Su razonamiento para la obtencioacuten del valor c es vaacutelido para
cualquier versioacuten del estadiacutestico Z por lo que la misma cpc puede ser asumida para
todos los procedimientos de tipo Z
54 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
II317 Propiedades que verifica el estadiacutestico ZE
Para que un estadiacutestico z2 sea uacutetil en la inferencia es preciso que verifique ciertas
propiedades de coherencia En el contexto de los tests exactos para H0 (Roumlhmel amp
Mansmann 1999 a) es necesario que las RC no presenten huecos Como la RC se
construye ordenando los puntos del espacio muestral de mayor a menor valor del
estadiacutestico z2 la ausencia de huecos en la misma implica que z2 debe ser creciente
(decreciente) en 2p ( 1p ) si d Esto es lo que se conoce como las dos propiedades
de convexidad de Barnard (convexidad espacial) La convexidad espacial del estadiacutestico
ZE fue demostrada primero de modo heuriacutestico por Chan (1998) y luego de modo maacutes
preciso por Martiacuten amp Herranz (2004 b) y Roumlhmel (2005) siendo tambieacuten cierta cuando
a ZE se le efectuacutea una correccioacuten por continuidad (Herranz amp Martiacuten 2008)
Por otro lado y por el principio de Sterne (1954) para que z2 sea liacutecito es
preciso que alcance su valor miacutenimo en la frontera del espacio nulo es decir que sea
decreciente en (convexidad parameacutetrica) ZE igualmente verifica tal propiedad
(Martiacuten amp Herranz 2004 b)
II32 Meacutetodos basados en el estadiacutestico X
El claacutesico estadiacutestico chi-cuadrado de Pearson tiene la forma
2
2exp
O E
E
con O las cantidades observadas (x1 x2 y1 y2) y E las cantidades esperadas (n1p1 n2p2
n1q1 n2q2) Sustituyendo tales valores en la foacutermula anterior y haciendo operaciones se
obtiene que
2 2 2
1 1 1 2 2 22
1 1 1 2 2 2
i i iexp
i i
x n p x n p n p p
n p q n p q p q
(222)
lo que da lugar al estadiacutestico 2Xz de la expresioacuten (22) Dunnett amp Gent (1977) proponen
utilizar este estadiacutestico en los estimadores condicionados ip dando asiacute lugar al
procedimiento XCa Alternativamente si se hace 1p p y se tiene en cuenta que el
teacutermino (OndashE)2 es siempre el mismo entonces
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 55
22
1 11 2
1 1
1 1XCaz n p xn p p n p p
(223)
Dunnet amp Gent (1977) comprobaron que 2ZCaz 2
XCaz Por el contrario Nam
(1995) demostroacute que si en la expresioacuten (222) se sustituye pi por sus estimadores
incondicionados de maacutexima verosimilitud ˆ ip entonces los procedimientos ZE y XE siacute
que son el mismo ( 2ZEz = 2
XEz ) por lo que ambos aluden al meacutetodo de las marcas Por
ello si se hace 1ˆ ˆp p entonces (Martiacuten amp Herranz 2004 b proporcionan una
demostracioacuten maacutes directa)
22 2
2 22 22 1 1 1
1 2
1 2
ˆ( )ˆ( ) ( )
ˆ ˆ ˆ ˆ(1 ) ( )(1 ) ˆ ˆ ˆ ˆ(1 ) ( )(1 )ZE XE
x n pp p x n pz z
p p p p n p p n p pn n
Una alternativa para ambas expresiones es (Martiacuten amp Herranz 2004 b)
1 1 2 12
2 2 2 1
1 si 0 1=
1 si 1ZE
ˆ ˆ ˆ ˆn p p p p p p p z
ˆ ˆ ˆ ˆn p p p p p p p
(224)
II33 Meacutetodos basados en el estadiacutestico A
Herranz amp Martiacuten (2008) proponen como estadiacutestico de contraste el valor
d con 1 12 1d sin p sin p y 1 1
2 1sin p sin p el cual se basa en
la conocida transformacioacuten arco seno Como asintoacuteticamente 1isin p se distribuye
como una 1 1 4i iN sin p n entonces d se distribuye como una normal con media
y varianza las que se indican
1 1 1 1 22 1 2 1 1 2 1 24dd sin p sin p N sin p sin p n n n n
En consecuencia el estadiacutestico de contraste seraacute
A 2
1 22
1 2
A
n n dz
n n
(225)
56 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
que es el mismo de la expresioacuten (23) Para que la expresioacuten sea uacutetil Herranz amp Martiacuten
sustituyen las proporciones pi desconocidas por el estimador de maacutexima verosimilitud
bajo H0 ( 1p 2 1ˆ ˆp p ) dando lugar a la expresioacuten
AE 2
1 22
1 2
AE
n n dz
n n
con
1 12 1
1 12 1
d sin p sin p
ˆ ˆsin p sin p
(226)
Es habitual utilizar la transformacioacuten arco seno con la transformacioacuten de
Anscombe la cual consiste (al igual que los meacutetodos ldquoadjusted Wald) en un
incremento inicial de los datos originales de 38 en ese caso el estadiacutestico 2AEz se
calculariacutea en base a los datos modificados (xi+38 yi+38 ni+34)
En todos los casos la determinacioacuten del IC (ICZE) debe hacerse por meacutetodos
iterativos
II4 RESULTADOS DE LA LITERATURA DE TIPO PRAacuteCTICO
II41 Generalidades sobre los estudios a realizar
A fin de seleccionar el meacutetodo de inferencia oacuteptimo la mayoriacutea de los autores
plantean el problema desde el punto de vista de los IC por lo que comparan el
recubrimiento real R y la longitud media l de cada meacutetodo de IC para unos valores
fijados de pi (i=1 o 2) Ambos paraacutemetros vienen dados por las expresiones
1 2
1 1 1 2 2 2
1 2
1 21 1 2 2 1 2
0 0 1 2
(1 ) (1 ) ( )n n
x n x x n x
x x
n nR p p p p I x x
x x
(227)
1 2
1 1 1 2 2 2
1 2
1 21 1 2 2
0 0 1 2
(1 ) (1 )n n
x n x x n xS I
x x
n nl p p p p
x x
(228)
en donde 1 2( ) 1I x x si ( )I S -el IC obtenido con la pareja (x1 x2)- e 1 2( )I x x 0
en otro caso Dado que R es una probabilidad ndash1le I S le+1 y I S se verifica que
0le R le1 y 0le l le2 Se considera que un meacutetodo de IC es mejor cuanto menor sea su
longitud l y cuanto maacutes cercano sea su recubrimiento real R al recubrimiento nominal de
1 En general los criterios para seleccionar el procedimiento oacuteptimo suelen ser los
siguientes (Brown amp Li 2005)
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 57
ndash R debe ser cercano al valor nominal (90 95 y 99 usualmente)
ndash l debe ser lo maacutes pequentildeo posible siempre y cuando R sea superior o proacutexima al
valor nominal
ndash R debe converger al nivel nominal uniforme y raacutepidamente con el incremento del
tamantildeo de la muestra especialmente si las probabilidades ip son cercanas a 0 o a 1
ndash Es aconsejable la simplicidad del IC es decir que sea faacutecil de recordar de calcular
de entender y de presentar
Alternativamente otros autores plantean la seleccioacuten desde el punto de vista de
los tests de hipoacutetesis Si el test asintoacutetico se realiza a un error nominal de la RC que
ocasiona estaraacute formada por todos los puntos (x1 x2) en los que 2 22exp z z el error real
del test (p) -con p=p1- vendraacute dado por
1 1 2 2 211 21 2 0
1 2
1 1n x x n xx
RC RC
n np P x x | H p p p p
x x
(229)
y el tamantildeo del mismo seraacute
maacutex con maacutex 0 miacuten 1 1p D p D= p p (230)
Adicionalmente la potencia (p1 p2) para una alternativa dada seraacute
1 1 1 2 2 21 21 2 1 1 2 2
1 2
(1 ) (1 )x n x x n x
RC
n np p p p p p
x x
Bajo este planteamiento el meacutetodo oacuteptimo seraacute aquel cuyo sea maacutes cercano a
(preferiblemente menor o igual) y cuya potencia sea lo mayor posible en la mayoriacutea de
las alternativas ensayadas
II42 Conclusiones de la literatura
La literatura ha analizado el problema actual con gran detalle y en numerosas
ocasiones pero todos los estudios realizados se limitan a comparar unos pocos meacutetodos
de entre los conocidos hasta ese momento Las conclusiones obtenidas a partir de las
diversas comparaciones efectuadas por los distintos autores pueden resumirse como
sigue
58 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
1) Dunnett amp Gent (1977) comparan los meacutetodos ZW0 ZCa0 y XCa0 -estos dos
uacuteltimos con y sin la cpc de Yates- por el meacutetodo condicionado (pues su referente
idoacuteneo es el meacutetodo condicionado de Gart) Para ellos el meacutetodo XCa0 con cpc es
mejor que XCa0 sin cpc el cual a su vez es mejor que el meacutetodo ZCa0 que a su vez
es mejor que el meacutetodo ZW0
2) Hauck amp Anderson (1986) realizan un anaacutelisis comparativo de distintos meacutetodos
concluyendo que ZW0 es demasiado liberal y proporciona por tanto un
recubrimiento inferior al nominal en la mayoriacutea de los casos Ademaacutes advierten que
nunca se debe utilizar dicho meacutetodo sin una correccioacuten por continuidad incluso
aunque los tamantildeos de muestra sean grandes
3) Roebruck amp Kuumlhn (1995) comparan la actuacioacuten de los meacutetodos ZW0 ZCb0 y ZE0
Uno de sus resultados es que debe rechazarse el meacutetodo ZCb0 debido a su mal
comportamiento especialmente cuando ademaacutes no supera a los meacutetodos ZW0 y
ZE0 en ninguna situacioacuten Para la mayoriacutea de los casos su anaacutelisis muestra que ZE0
proporciona resultados aceptables con la excepcioacuten de los casos en que los
paraacutemetros pi y δ son grandes
4) Wallenstein (1997) compara los meacutetodos ZW0 ZCb0 ZE0 ZPa0 concluyendo que
el meacutetodo ZW0 sobreestima la probabilidad de recubrimiento y que el meacutetodo ZPa0
proporciona un IC estrecho que converge maacutes despacio hacia la probabilidad
nominal Ademaacutes antildeade que si se considera una cpc como la de Yates los nuevos
IC tienen un recubrimiento al menos igual al nominal Finalmente defiende que el
meacutetodo ZCb0 es el que tiene un mejor comportamiento
5) Newcombe (1998 a) sentildeala que la uacutenica virtud del meacutetodo ZW0 es su sencillez de
caacutelculo pues el recubrimiento no es simeacutetrico y presenta anomaliacuteas cosa que no
ocurre con el resto de meacutetodos que compara En cuanto al meacutetodo ZE0 este tiene
una probabilidad pobre de recubrimiento Por uacuteltimo el meacutetodo ZN0 es
computacionalmente maacutes sencillo y tratable con tamantildeos de muestra grandes por lo
que el autor lo recomienda por encima del resto
6) Agresti amp Caffo (2000) reiteran el mal comportamiento del claacutesico meacutetodo ZW0
sentildealando que ademaacutes la probabilidad de recubrimiento tiende a ser muy pequentildea
cuando pi es un valor cercano a 0 o a 1 Por ello proponen el meacutetodo ZW2 tan
sencillo como el ZW0 pero con un mucho mejor comportamiento Comparando su
meacutetodo con el ZN0 los autores indican que ambos son conservadores cuando las
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 59
proporciones pi se acercan a 0 o a 1 aunque ZN0 es globalmente menos
conservador tiene un recubrimiento medio maacutes cercano al nominal y sus IC tienden
a ser un poco maacutes estrechos Aunque ZN0 tenga una buena actuacioacuten se
recomienda como meacutetodo oacuteptimo ZW2 incluso para el caso de un contraste (δ=0)
especialmente por su mayor sencillez
7) Feigin amp Lumelskii (2000) analizan varios meacutetodos siendo ZPa0 el que maacutes destaca
por su buen comportamiento y descartando ZW0 por tener una mala actuacioacuten Los
autores comprueban que el meacutetodo ZPa0 tiene una longitud de intervalo grande si
alguna de las proporciones pi son pequentildeas pero sin embargo para pi grandes y
tamantildeos de muestra moderados el IC es maacutes estrecho que con el resto de meacutetodos
por lo que concluyen que ZPa0 es el meacutetodo oacuteptimo
8) Martiacuten amp Herranz (2004 b) proponen dos cpc para el meacutetodo ZE0 (que seleccionan
frente a los meacutetodos ZW0 y ZCb0) con el objetivo de que disminuya su liberalidad
seleccionando de ellas la cpc que da lugar al meacutetodo ZE0c
9) Brown amp Li (2005) ademaacutes de proponer otro nuevo meacutetodo basado en una
reparametrizacioacuten del modelo llegan a la conclusioacuten de que para tamantildeos de muestra
pequentildeos el meacutetodo ZW0 tiene un recubrimiento menor que el nominal aunque
proporciona IC estrechos Los meacutetodos bayesianos que analizan son maacutes
conservadores que el resto teniendo los meacutetodos ZN0 y ZE0 un comportamiento
muy similar Estos dos uacuteltimos son los meacutetodos que seleccionan eligiendo el meacutetodo
ZN0 en el caso de tamantildeos de muestra pequentildeos y distintos y el ZE0 en cualquier
otro caso
10) Xu amp Kolassa (2007) proponen diversas cpc para el claacutesico meacutetodo ZW0 (del que
destacan su ya conocido mal comportamiento) todas ellas procedentes de malas
definiciones de cpc para el meacutetodo ZE0 en el caso =0
11) Santner et al (2007) comparan la actuacioacuten de diversos meacutetodos exactos (que no son
el objetivo de esta memoria) y del meacutetodo ZE0 indicando que este uacuteltimo es liberal
el 50 de las veces
Adicionalmente Anbar (1983) propuso utilizar el procedimiento de Wald solo para
la primera proporcioacuten (sustituir p1 por 1p ) pues la segunda es obligada a verificar la
hipoacutetesis nula (p2= 1p +) Es evidente lo inadecuado del procedimiento dado que las
inferencias para p2p1 no son concordantes con las inferencias para p1p2 (es decir si se
60 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
sustituye p2 por 2p y se hace p1= 2p )
Otra aportacioacuten reciente es la de Newcombe amp Nurminen (2011) Los autores
defienden el meacutetodo de las marcas (en la versioacuten de Miettinen amp Nurminen maacutes que en
la versioacuten de Mee empleada en esta memoria) pues opinan que las criacuteticas al mismo son
infundadas Como se ha sentildealado en los paacuterrafos anteriores (y se ratificaraacute en nuestra
evaluacioacuten de de la seccioacuten II6) el meacutetodo de las marcas es excesivamente liberal
Seguacuten Newcombe amp Nurminen la causa de ello es la utilizacioacuten del paraacutemetro
evaluador ldquomiacutenimo recubrimientordquo maacutes que el ldquorecubrimiento mediordquo Nuestra opinioacuten
es contraria a este planteamiento pues el ldquomiacutenimo recubrimientordquo viene forzado por el
hecho de que el IC se obtiene por inversioacuten del test y en la evaluacioacuten de los tests debe
emplearse el ldquomaacuteximo error real rdquo (con ldquomiacutenimo recubrimientordquo = 1) Como en la
praacutectica el investigador no conoce cuaacutel es el verdadero valor del paraacutemetro perturbador
p1 todo procedimiento aproximado de inferencia debe garantizar lo maacutes posible que el
recubrimiento nominal se alcanza o supera sea cual sea el valor de p1
II5 APORTACIONES DE TIPO TEOacuteRICO
II51 Aproximaciones al procedimiento de las marcas procedimiento L y meacutetodos
de tipo ldquoadjustedrdquo Wald
En el capiacutetulo anterior se desarrolloacute con detalle la principal aportacioacuten de esta
memoria el procedimiento de las marcas para una combinacioacuten lineal general de
proporciones independientes Todo lo indicado entonces puede aplicarse al caso
particular actual de L=d obtenieacutendose asiacute que las expresiones (120) y (121) son
equivalentes a las resentildeadas para este caso por Martiacuten and Herranz (2010) las cuales
son a su vez equivalentes al claacutesico procedimiento ZE de la literatura La dificultad del
procedimiento para el caso L era que tanto si se trata de realizar el test como de obtener
el IC hay que resolverlo por meacutetodos iterativos Es por ello que se buscaron
simplificaciones basadas en el desarrollo en serie de Maclaurin lo que de paso permitioacute
justificar teoacutericamente los meacutetodos heuriacutesticos de tipo ldquoadjustedrdquo Wald
En este caso para L=d la expresioacuten clave seraacute 2 0iy n δC R con
2ZEC z d δ y 2 2 2 22 1 2i i i iR n n p C C (utilizando el signo + para i=2 y el ndash
para i=1) Siguiendo el mismo proceso que en la seccioacuten I425 a partir del desarrollo
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 61
en serie se obtiene la expresioacuten 3 2 41 2 0ZE ZEd z d V z V siendo V1 y V2 los
valores dados por la expresioacuten (211) Si se retienen soacutelo los teacuterminos de grado 1 y se
divide por d se obtienen las soluciones claacutesicas de tipo Wald (procedimiento
ZW) dadas por las expresiones (212) y (213) Igualmente el desarrollo de grado 2 da
lugar a 2 2 21 2 1 0ZE ZEd V d V z z V De esto se deduce que un valor
aproximado para 2ZEz viene dado por el siguiente nuevo estadiacutestico
2
2
1 2 1
L
dz
V d V V
(231)
lo que da lugar al procedimiento L cuyo IC viene dado por la expresioacuten (210)
Obseacutervese que las expresiones (231) y (210) son comparables a las (132) para el caso
de una combinacioacuten general Las expresiones (210) y (231) tienen la dificultad de que
el valor de V2V1 estaacute indeterminado en las esquinas del espacio parameacutetrico (es decir si
V1=0) Para solventar el problema asumimos que en estas esquinas sucede que
1 1 2 2p q p q =1 con lo cual si V1=0
1 22 2
2 1 2
1
1 2
2 1 1 2
1 1
p p
V n n
Vn n
Respecto de los procedimientos ldquoadjustedrdquo Wald siguiendo el desarrollo de la
seccioacuten I425 se obtienen dos nuevos incrementos haciendo que el centro del intervalo
de Wald para los datos incrementados sea aproximadamente igual que el centro del IC
del procedimiento de las marcas para los datos originales Estas propuestas vienen dadas
por las expresiones 3 y 4 del apartado II24 Obseacutervese que el Caso 3 produce iguales
resultados que el Caso 4 cuando las observaciones originales no estaacuten en la frontera del
espacio muestral es decir cuando xine0 y xineni ( i ) pero si por ejemplo x1=0 y 0ltx2ltn2
entonces 21 2 2 4h h z en el Caso 3 pero en el Caso 4 2
1 23 4h z y 22 2 4h z
cuando se obtiene el extremo inferior y 21 2 2 4h h z cuando se obtiene el extremo
superior
62 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
II52 Procedimientos basados en el estimador Pb
El criterio de Sterne (1954) fue utilizado por Peskun (1993) bajo el principio de
que el test sea significativo para cualquier valor de p1 Asiacute obtuvo el procedimiento ZPa
como se mencionoacute en la seccioacuten II315 viniendo dados el estadiacutestico de contraste y el
IC por las expresiones (219) y (220) respectivamente Lo que Peskun no tuvo cuenta es
que el estimador ip
puede ser un valor iliacutecito (es decir que ip
lt0 o ip
gt1) Si se obliga
(como en el caso del estimador condicionado ip ) a que ip
esteacute entre 0 y 1 se obtiene el
procedimiento ZPb que viene dado expliacutecitamente por la expresioacuten que sigue
2 2 21 2 1 22
4 4 si 2 maacutex con
1 miacuten si 2 maacutex
i i
ZPb
i i i i
d n n n nn n n nz V=
V n n n
(232)
en donde la primera parte de la expresioacuten (sin restriccioacuten) se corresponde con el
procedimiento ZPa En consecuencia haciendo 2 22ZPb z z y realizando las operaciones
oportunas el IC para el procedimiento ZPb se obtiene mediante los siguientes pasos
1 Determinar ( I S ) a traveacutes de la expresioacuten (220)
2 Si I S verifican que 1 22maacutex| | n n n el proceso finaliza
3 En otro caso el extremo X que haya fallado hay que obtenerlo de nuevo
mediante la expresioacuten
22
2 212 12
1 2 1 1
4 12 2
X
sz znd z n sd sd
n z n n
(233)
con 1 i in min n s=signo( X ) y utilizando el signo + si X=S o si X=I
Como se ve el estimador ip
solo tiene sentido en el caso del estadiacutestico Z (que
es para el que se define) a pesar de todo los estimadores Pa y Pb se evaluaraacuten tambieacuten
(ver la seccioacuten siguiente) para los otros estadiacutesticos
II53 Test e intervalo de confianza para el procedimiento ZCb
El IC de la expresioacuten (217) para el procedimiento ZCa es vaacutelido tambieacuten para el
procedimiento ZCb -como se indicoacute entonces (Martiacuten amp Herranz 2003)- si se verifica
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 63
que 1 1 2 2 1 2 2 1miacuten miacutenI Sa n a n a n a n pues solo entonces 0le ip le1
Para ver coacutemo actuar en otro caso hagamos como en la seccioacuten anterior obtener el
estadiacutestico Z para el estimador Cb e invertirlo del modo tradicional Es faacutecil ver que las
nuevas expresiones son
1 2 1 2
1 2 1 2 2 12
2 1 2
2 2 2
2
1 1
1 1+ si miacuten miacuten
1 con si o
1si o
ZCb
p p p p a a a a
n n n n n n
d p p a az V=
V n n n
p p a
n n
1
1
a
n
(234)
en tanto que para el ICZCb en el caso de que alguno de los extremos δX de la expresioacuten
(217) falle el mismo debe calcularse en base a la misma expresioacuten pero para los
nuevos valores 2 2 21 2 2A n z n n 2 2
2 1 2 1 22B z n a a n n d 2 2 22 2 1 2C n n d z a a
si 2 2 1 2 o X Xa n a n o para 2 2 22 2 1A n z n n 2 2
2 2 2 1 12B z n a a n n d
2 2 21 2 1 2C n n d z a a si 1 1 2 1 o X Xa n a n De un modo maacutes expliacutecito
22 22 2 1 1 2 1 22 1 2 1 2
1 2 2 2 21 2 1 2
2 21 2 1 2 2 1 2
221 2 1 2 1 22 2 2
ZCb 2 22 2 2 22 1 2 2 2
21
21 2
4
2 2
IC 2 2
i i
i
i
z n n n n n a an n a a p qnn n d z z
nn n nnn n
nn n n n n n z
n a a n zn n p qd d z z
n n n z n n nn n
n n
n n n
2
2 2 1 2 2 2 1 12 22 2 2
2 1 12 2
i
n a a n z p qd z z
z n n nn n
en donde cada una de las tres expresiones anteriores es vaacutelida bajo cada una de las
condiciones de la expresioacuten (234) respectivamente
II54 Estadiacutestico A con correccioacuten por continuidad
Siguiendo la argumentacioacuten de Haber resentildeada en la seccioacuten II316 el salto
total del estadiacutestico de contraste d es de el cual se alcanza en las parejas (x1=0
64 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
x2=1) y (x1=1 x2=0) con lo que el salto promedio seraacute de 2 1c N pues el
nuacutemero total de puntos del espacio muestral es de N=(n1+1)(n2+1) Con ello el
estadiacutestico A con cpc seraacute
Ac 2
1 22
1 2
si
0 si
Ac
n n d cd cz = n n
d c
(235)
II55 Equivalencia entre la evaluacioacuten de un meacutetodo de obtencioacuten de intervalos de
confianza y su meacutetodo de test asociado
Desde el punto de vista de los IC exactos Agresti and Min (2001) hicieron ver la
conveniencia de obtener el IC de dos colas mediante la inversioacuten del test de dos colas
H0 d=δ vs H1 dneδ Desde un punto de vista maacutes general lo anterior tambieacuten es
conveniente a fin de que la inferencia estadiacutestica sea coherente si δ0 no pertenece al IC
(1minusα) entonces el test para δ=δ0 debe dar significativo al error α (y al reveacutes) Esto
significa dos cosas Por un lado que la definicioacuten de un procedimiento puede hacerse
desde la perspectiva del test o del IC Por otro que evaluar un procedimiento de IC es
equivalente a evaluar su procedimiento de test asociado (si ambos se realizan al mismo
error nominal α) como se ve a continuacioacuten
Para evaluar un IC suele utilizarse los paraacutemetros recubrimiento real R y
longitud media l Para evaluar un test suelen utilizarse los paraacutemetros error real
(tamantildeo del test) y potencia El error real del test se calcula mediante la expresioacuten
(230) teniendo en cuenta que 2 21 2 2exp RC x x | z z Como el IC se obtiene
mediante la inversioacuten del test entonces cada observacioacuten (x1 x2) ocasiona un IC para d
dado por 2 21 2 0 0 2exp IC x x | z z con lo que el recubrimiento real seraacute
1 2
1 2
1 2 0 1 20 0
miacutenn n
p Dx x
P x x | H I x x
en donde I(x1x2)=1 si 1 2IC x x e
I(x1x2)=0 en otro caso Como 1 2IC x x cuando 2 20 2exp z z entonces I(x1x2)=1
si 1 2x x RC y por tanto 1 2 0miacuten
p DRC
P x x | H
con RC aludiendo al conjunto
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 65
complementario del conjunto RC y finalmente =1α Esto quiere decir que calcular
el incremento del error nominal respecto del real es equivalente a calcular el incremento
del recubrimiento nominal respecto del real Δα=αminusα= (1minusα)minus(1minusα)=γminusγ con γ=1minusα
el recubrimiento nominal (la confianza nominal del intervalo)
Finalmente cuanto mayor sea la potencia del test menor seraacute la longitud
media l del IC que ocasiona (y al reveacutes)
II6 APORTACIONES DE TIPO PRAacuteCTICO
II61 Objetivo
Como se indicoacute en el Proacutelogo y en la seccioacuten anterior la evaluacioacuten de los
diferentes meacutetodos de inferencia puede realizarse desde la perspectiva de los tests de
hipoacutetesis o desde la perspectiva de los IC puesto que los dos enfoques son equivalentes
(si se realizan al mismo error nominal a) En esta seccioacuten tal evaluacioacuten se efectuaraacute
desde la perspectiva de los tests de hipoacutetesis al contrario que en el caso general
i iL p pues suele ser maacutes sencillo definir el test que el IC y la evaluacioacuten
comparativa de los valores de es maacutes sencilla (como se ve de momento) que la de los
valores de l
Los meacutetodos de inferencia a evaluar son inicialmente los 75 indicados al final de
la seccioacuten II2 (los meacutetodos ZW0 ZW1 ZW2 ZW3 ZW4hellip ZPb4 XCa0hellip XPb4
ACb0hellip APb4 y L) lo que incluye las propuestas maacutes relevantes de la literatura (en la
que cada autor solo compara unos pocos de ellos) De ellos 64 son meacutetodos nuevos (los
denominados por ZW3 ZW4 ZPb XPa XPb ACb APb y L con incrementos 0hellip 4 y
ZN ZCa ZCb ZE ZPa XCa XCb y AE con incrementos 1hellip4) Adicionalmente se
han evaluados otros meacutetodos nuevos de menor intereacutes (ver la seccioacuten II63) En todo
caso el objetivo es seleccionar el meacutetodos oacuteptimos bajo los criterios que se
especificaraacuten
II62 Descripcioacuten del estudio a realizar y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo
Para efectuar la evaluacioacuten anterior se va a realizar un estudio del
66 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
comportamiento de cada meacutetodo en cada una de las siguientes combinaciones de
paraacutemetros (a ni δ)
a=5 (aunque ocasionalmente tambieacuten se utilizaraacuten los valores del 1 y 10)
ni= 40 60 y 100 con n1n2 (en los estudios iniciales se ha contemplado el valor
ni=20 pero todos los meacutetodos van mal pues suelen fallar cuando |δ| toma valores
extremos) Se excluyen los casos n1gtn2 pues las hipoacutetesis nulas H0 p2minusp1=+δ y 0H
p1p2= son equivalentes
= 0 +01 +02 +03 +05 +07 +08 +09 y +095 Se excluyen los casos δlt0
pues las hipoacutetesis nulas H0 p2p1=+ y 0H q2q1= son equivalentes Esta
exclusioacuten y la del paacuterrafo anterior estaacute justificada por el hecho de que el estadiacutestico
2expz de cualquiera de cualquier meacutetodo coherente debe tomar el mismo valor bajo
las tres hipoacutetesis enunciadas (Martiacuten and Herranz 2010 comprueban que esto es lo
que sucede con todos los meacutetodos estudiados)
El proceso de obtencioacuten de datos consistiraacute en lo siguiente
1 Seleccionar una combinacioacuten (a n1 n2 δ meacutetodo a evaluar)
2 Construir la regioacuten criacutetica RC=(x1 x2)|2 2
2exp z z
3 Calcular el error real (tamantildeo) del test mediante la expresioacuten (230) y el
incremento del error real con respecto al error nominal Hay que tener
en cuenta que si 0 el test seraacute conservador (por lo que el IC tambieacuten lo seraacute y
tendraacute maacutes recubrimiento que el nominal) si 0 el test seraacute liberal (por lo que
el IC tambieacuten lo seraacute y tendraacute menos recubrimiento que el nominal)
4 Calcular =(nordm de puntos de la RC)times100N siendo N=(n1+1)times(n2+1) el nordm total de
puntos del espacio muestral El valor de es un buen indicativo de la potencia del
test (Upton 1982 Martiacuten amp Silva 1994 Chen et al 2007) siendo denominado por
los uacuteltimos autores como ldquopotencia a largo plazordquo de ahiacute que en adelante seraacute
aludido como ldquopotenciardquo a secas Se ha preferido esta definicioacuten global frente a la
definicioacuten tradicional (p1 p2) del final de la seccioacuten II41 pues esta uacuteltima
implicariacutea evaluar la potencia en diferentes alternativas (p1 p2) lo que complica la
seleccioacuten del meacutetodo oacuteptimo (pues ninguno de ellos lo seraacute uniformemente para
cualquier alternativa)
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 67
5 Determinar en cada caso si hay o no un ldquofallordquo es decir si ndash4 ndash2 o 1
para a=10 5 o 1 respectivamente Esta definicioacuten se introduce pues es
deseable que el meacutetodo asintoacutetico proporcione un error real cercano al nominal es
decir que α α o equivalentemente que Δα 0 Pero esto implica que habraacute que
permitir alguna discrepancia entre ambos Si α=5 por ejemplo es tradicional en
diversos aacutembitos (Agresti and Coull 1998 Price and Bonett 2004 Martiacuten et al
2005) permitir que αlt7 es decir que el recubrimiento real sea mayor del 93 o
equivalentemente que Δαgtminus2 en otro caso (Δαleminus2 α7 o 1 α93)
diremos que el test o el CI ldquofallardquo Si αlt3 (Δαgt+2) el test es muy conservador
pero no da significaciones falsas y la eventual mala actuacioacuten del mismo se pondraacute
de manifiesto en el bajo valor de θ
6 Para cada meacutetodo se construiraacute una tabla (como la Tabla AII1) que contemple los
valores individuales de Δα y asiacute como la informacioacuten de en queacute circunstancias
falla el meacutetodo
7 Por uacuteltimo para cada combinacioacuten se calcularaacute el nordm total de fallos (F) y los valores
medios de ( ) y de ( ) Como se han omitido los valores ndashδ (por dar los
mismo resultados que +δ) los caacutelculos anteriores se realizaraacuten asignaacutendole peso 1
al caso δ=0 y peso 2 al resto de los casos En ocasiones y con el fin de comprobar
la estabilidad de las conclusiones se calcularaacuten los mismos valores para cada
combinacioacuten (n1 n2)
Una vez obtenidos los resultados la seleccioacuten del meacutetodo oacuteptimo se realizaraacute bajo
los siguientes criterios
(a) Se daraacute especial importancia al caso α=5 (por ser el error nominal maacutes frecuente)
(b) Se descartaraacuten los meacutetodos con un excesivo nuacutemero de fallos (pues con demasiada
frecuencia son excesivamente liberales) mostrando preferencia por los meacutetodos con
menos fallos
(c) Entre los meacutetodos que queden se eligen los que tengan un maacutes cercano a 0 (es
decir los meacutetodos con un error medio cercano al nominal) En caso de empate se
prefieren los meacutetodos conservadores ( gt0) a los liberales ( lt0) para que asiacute
las significaciones sean fiables
(d) Entre los meacutetodos que queden se prefieren los de mayor potencia Aquiacute hay que
tener en cuenta que si un meacutetodo cualquiera A es maacutes liberal que otro B entonces
68 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
B A y es esperable que B A (lo que no significa que A sea mejor
meacutetodo que B)
Dado que el nuacutemero de meacutetodos es excesivo (los 75 aludidos en la seccioacuten
anterior y algunos maacutes que se han ensayado) la seleccioacuten se efectuaraacute por fases
seleccionando el mejor de cada familia de meacutetodos (es decir de cada procedimiento) y
comparando al final entre siacute todos los seleccionados
Adicionalmente la necesaria restriccioacuten de espacio que implica esta memoria
nos impide presentar los resultados de todos los meacutetodos comparados restringieacutendonos
exclusivamente a los 75 meacutetodos principales resentildeados arriba (los restantes estaacuten
disponibles para el lector que lo desee)
II63 Seleccioacuten del meacutetodo oacuteptimo de cada familia (en sus versiones sin cpc)
II631 Seleccioacuten entre los meacutetodos de tipo Z (a=5)
Una parte de la Tabla AII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico Z (se omiten los del procedimiento ZCa pues el mismo puede
dar lugar a una varianza negativa) Globalmente puede observase que
En general todos los procedimientos empeoran cuando los datos son incrementados
en cualquier cantidad salvo el procedimiento ZW que mejora conforme los datos se
incrementan en una cantidad cada vez mayor
Los valores de son siempre mayores con los procedimientos ZPb que con los
ZE Esto era deseable y esperable dado que el meacutetodo de Peskun se basa en el
miacutenimo valor del estadiacutestico del procedimiento ZE (por lo que el procedimiento ZPb
debe ser maacutes conservador que ZE)
Una parte de la Tabla AII2 contiene el resumen de los datos de todos los
meacutetodos basados en el estadiacutestico Z y de su anaacutelisis puede concluirse lo siguiente
Los peores meacutetodos son aquellos que aparecen en la tabla entre el meacutetodo ZPb1 al
ZW0 pues teniendo demasiados fallos deben descartarse
El reputado meacutetodo ZE0 ocupa una posicioacuten muy discreta pues aunque tiene buena
potencia la misma viene causada por ser un meacutetodo demasiado liberal que da lugar
a demasiados fallos
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 69
Los meacutetodos ZPa0 y ZPb0 deben descartase pues aunque no tienen fallos su
potencia es demasiado baja (en todo caso ZPa0 es mejor que ZPb0 por ser menos
conservador)
El meacutetodo ZN0 debe descartarse por tener cuatro fallos y ser demasiado liberal
Los meacutetodos ZW2 ZW3 y ZCb0 son bastante buenos solo tienen dos fallos (que lo
son por muy poco) y son bastante potentes aunque todos son ligeramente liberales
El meacutetodo ZW4 (que es igual al ZW3 cuando los valores observados no pertenecen
a la frontera del espacio muestral) es el oacuteptimo a este nivel de error no tiene fallos
tiene una buena potencia y es ligeramente conservador
La conclusioacuten es que el mejor meacutetodo de este grupo es el ZW4 (el cual es
equivalente al meacutetodo ZW3 cuando los datos no estaacuten en los bordes del espacio
muestral) Si no importa una ligera liberalidad tambieacuten pueden utilizarse cualquiera de
los meacutetodos ZW2 y ZCb0 pues tienen un buen y similar comportamiento
Adicionalmente se han evaluados diversas modificaciones de los meacutetodos
anteriores pero ninguna de ellas logra mejorar la actuacioacuten del meacutetodo seleccionado
ZW4 Las modificaciones evaluadas (con la descripcioacuten de su origen) se describen a
continuacioacuten
(1) Se ha comprobado que la propuesta de Borkowf (2006) para el caso de una
proporcioacuten -en el sentido de utilizar el procedimiento ZW en los valores (xi ni+1)
para el extremo inferior y (xi+1 ni+1) para el superior- no es de utilidad para el
actual caso d El nuevo estadiacutestico que por ser intermedio entre los ZW3 y ZW4
seraacute denominado por ZW35 viene dado por
ZW35
2 1 1 2
2 1 1 2
Si Utilizar 1
Si Utilizar 1
p p x x
p p x x
y siempre utilizar (n1+1) y (n2+1)
El resumen de su actuacioacuten indica que aunque el meacutetodo no tiene fallos es
demasiado conservador ( α =221) y tiene poca potencia (θ =8488) De ahiacute que se
le haya descartado
(2) Meacutetodos extras de tipo ZW Los siguientes meacutetodos incrementan los datos en una
cantidad fija
70 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
ZW5
22
222 2
i i
i
n zh
n z
ZW6
22
2 22 24 2
i i
i
nn zh
n z n nz
ZW7
222
24
i
nzh
n z
ZW8
2 2
2 2
2 22 22 2
i
i
i
n z n zh
nn z n z
ZW9 2
222
1 11
4 2
i i
zh z
n n
ZW10
22 2
2
22 2
2
11
4
14 1
4
i
hi
i
h
zn z
nh
zn z
n
ZW11 2 2
2 22
4 2
i
z n zh
n
ZW12 2 2
2 214 2
i
i
z zh
n
Los siguientes meacutetodos que son aproximaciones de los meacutetodos L3 y L4 que se
veraacuten maacutes adelante incrementan los datos en una cantidad variable que depende del
extremo que se esteacute calculando
ZW13
22
1
22
2
si 2 1
si 2 1
i i
ii
i i
i
I n zd
N Ih
S n zd
N S
ZW14
221 22
22 2
1 2
222 22
22 2
2 2
1
2 si
2 1
2
1
2 si
2 1
2
i ii
i ii
i
i ii
i ii
I nn
N zzd
I nn z
N zh
S nn
N zzd
S nn z
N z
en donde
1 21 2 1 1 1 1 2 2
1 2
1 21 2 2 2 1 1 2 2
1 2
1 si 0 1 si 1 2 1 1 2
0 si 0 0 si 1
1 si 1 1 si 0 2 1 1 2
0 si 1 0 si 0
i i
i i
p pI I N I n B I p I p
p p
p pS S N S n B S p S p
p p
(236)
Finalmente los siguientes dos meacutetodos son una simplificacioacuten de ZW4 a fin de
hacerlo maacutes faacutecil de aplicar
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 71
ZW15
22
22
si 0 y 14
en otro caso2
i i
i
zp p
hz
ZW16 2
2
1 2
21
4i
z nh
n n
(3) Meacutetodos extras de tipo ZN Los siguientes estimadoresestadiacutesticos son nuevas
propuestas relacionadas con la anterior
ZNA0 Obtener ip para el error 1 1
ZNC0 2 1
2 1
Cb para = si
Cb para = si
I
S
l u d
u l d
con las li y ui calculadas al error
ZNCA0 2 1
2 1
Cb para = si
Cb para = si
I
S
l u d
u l d
el ZNC0 para el error 1 1
(4) Meacutetodos extras de tipo ZE Si el estimador ip se condiciona a que sus valores sean
compatibles con los del intervalo de confianza de Wilson (li ui) para las pi a un error
entonces se obtienen el estimador y meacutetodo dado por
ZEN0 Si (li ui) alude al CI para las pi obtenido por el meacutetodo de Wilson sustituir en Z
ˆ ˆ ˆ ˆ si si si i i i i i i i i i i i i ip p l p u p l p l p u p u
(5) Meacutetodos de tipo ZC La versioacuten Cb del estimador condicionado ip se puede definir
expliacutecitamente asiacute (lo que da lugar al estimador y al estadiacutestico ya analizados que se
indica)
ZCb0
1 1 2 2 1 1 1 2 2 1 2 2 1
1 2 1 1 2 2 1 2
1 1 2 2 1 1 2 1
si miacuten miacuten
0 si o
0 si o
1p a n n p a +n n a n a n a n a n
p p a +n n a n a n
p a n n p a n a n
Si en lo anterior se obliga a que las dos proporciones se diferencien en (que
parece maacutes loacutegico pero que nunca se ha propuesto) se obtiene el estimador y
estadiacutestico
ZCbD0 1 1 2 2 1 1 1 2 2 1 2 2 1
1 2 2 2 1 2
1 2 1 1 2 1
si miacuten miacuten
0 si o
0 si o
1p a n n p a +n n a n a n a n a n
p p a n a n
p p a n a n
Los estadiacutesticos que siguen se obtienen como simplificaciones de las
expresiones que se deducen al resolver en la igualdad 2 22exp z z para los
estadiacutesticos ZCb0 y ZCbD0 Si se escogen soacutelo los teacuterminos de grado 05 se
72 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
obtienen los estimadores y estadiacutesticos que siguen
ZCbA0
1 1 2 2 1 2 2 1 2 2 1
1 2 2 2 2 1 2
1 1 2 1 1 2 1
si miacuten miacuten
0 si o
0 si o
1p p p =p a n a n a n a n
p p =p a n a n
p p p a n a n
ZCbDA0
1 1 2 2 1 2 2 1 2 2 1
1 2 2 2 1 2
1 2 1 1 2 1
si miacuten miacuten
0 si o
0 si o
1p p p =p a n a n a n a n
p p d a n a n
p d p a n a n
Si se acogen solo los teacuterminos de grado 1 y se asume que n1n2 y a1a2 se
obtienen los estadiacutesticos doblemente aproximados siguientes
ZCbAA0
22
2
1 2 1 22
2 2 11 1 2 2 2
2
22
2 2
22 2 12
22 2 2
2
si miacuten miacuten1 1
2
si o 1
2
1
1
exp
n zd c
n a a a a
n n n np p p p z
n n n
n z d c
n a az =
np p z
n n
2
22
1 2
11 2
21 11 1 2
1
2
si o 1
2
n
n z d c
n a a
n np p z
n n
ZCbDAA0
22
2
1 2 1 22
2 2 11 1 2 2 2
2
22 2
2 2 2
2 22 2 1
22 2
2
2 2
si miacuten miacuten1 1
2si o
1
2
1
1
exp
n zd c
n a a a a
n n n np p p p zn n n
z n zd sig c
n n a az =
n nd d z
n n
d sig
22 2
2 1 2
1 1 1 2
21 1
2
1 1
2si o
1
2
z n zc
n n a a
n nd d z
n n
Alternativamente si en todo lo anterior utilizamos la versioacuten Ca en lugar de la
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 73
Cb es decir si utilizamos soacutelo la primera expresioacuten de las tres de cada definicioacuten se
obtiene primero el estimador y estadiacutestico ya analizado ZCb0 y de modo extra los
estimadores y estadiacutesticos nuevos ZCaD0 (que se excluye pues puede dar una
varianza negativa) ZCaA0 = ZCaDA0 y ZCaAA0 = ZCaDAA0 Por tanto solo
tiene sentido analizar los dos casos marcados en negrita
Finalmente se puede condicionar al estimador Cb a que sus valores sean
compatibles con los del intervalo de confianza de Wilson (li ui) para las pi a un
error es decir que si ip alude al estimador Cb entonces el estimador y meacutetodo
viene dado por
ZCbN0
si
si
si
i i i i i
i i i i
i i i i
p p l p u
p l p l
p u p u
(6) Meacutetodos de tipo ZP El primer (segundo) estadiacutestico que sigue es una aproximacioacuten
del ZPb0 para el caso de que las ni sean grandes (n1n2 y las ni sean grandes)
ZPb01
2 2 21 2 1 2
24 4 si 2 maacutex
con 1 miacuten si 2 maacutex
i i
exp
i i i i
n n n d nn n n nd cz V=
V d d n n n
ZPb02
2 2
21 si 2 maacutex
con 1 miacuten si 2 maacutex
i i
exp
i i i i
d n n nd cz V=
V d d n n n
Otras opciones posibles son los meacutetodos
ZPa0x Si en cada una de las foacutermulas anteriores se escoge solo la primera
expresioacuten de V (esto se hace pues asiacute se obtiene un IC maacutes sencillo)
ZPa5 Si ZPa0 se aplica a los datos incrementados en hi=2
2 2i n z n
II632 Seleccioacuten entre los meacutetodos de tipo X (a=5)
Una parte de la Tabla AII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico X (no se incluyen procedimientos XCa y XPa pues los mismos
pueden dar lugar a varianzas negativas) en tanto que una parte de la Tabla AII2
contiene el resumen de los mismos Puede observarse que todos los meacutetodos presentan
74 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
muy mal comportamiento
Adicionalmente se han evaluado diversas modificaciones de los meacutetodos
anteriores pero ninguna de ellas compite con las seleccionadas en la seccioacuten anterior
Las tres modificaciones evaluadas (con la descripcioacuten de su origen) son las siguientes
(1) Meacutetodos extras de tipo XE
XEN0 El estadiacutestico X para el estimador de ZEN0
(2) Meacutetodos extras de tipo XC Otras opciones posibles son los meacutetodos
XCbD0 El estimador de ZCbD0 puesto en el estadiacutestico X
XCbN0 El estimador ZCaN0 puesto en el estadiacutestico X
II633 Seleccioacuten entre los meacutetodos de tipo A (a=5)
Una parte de la Tabla AII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico A en tanto que una parte de la Tabla AII2 contiene el resumen
de sus resultados De ellas se deduce que el uacutenico meacutetodo que presenta un buen
comportamiento es el meacutetodo AE1
Cuando se utiliza la transformacioacuten arco seno es frecuente incrementar los datos
en hi=38 (transformacioacuten de Ascombe) pero estos procedimientos no sirven para
mejorar la seleccioacuten anterior
II634 Seleccioacuten entre los meacutetodos de tipo L (a=5)
Una parte de la Tabla AII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico L en tanto que una parte de la Tabla AII2 contiene el resumen
de sus resultados De su anaacutelisis puede concluirse que todos los meacutetodos L presentan un
muy mal comportamiento
Adicionalmente se han evaluado diversas modificaciones de los meacutetodos
anteriores pero ninguna de ellas compite con los meacutetodos ya seleccionados Las cuatro
modificaciones evaluadas (con la descripcioacuten de su origen) se describen a continuacioacuten
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 75
(1) Para estos casos es necesario calcular tambieacuten el teacutermino
3 33 1 1 1 1 1 2 2 2 2 25 1 5 1V p q p q n p q p q n
La primera posibilidad es utilizar una aproximacioacuten de orden 3 lo que da lugar a
dos opciones La primera es
LA0
2
2 22 2 32 2 1 2
2 3 1 1 12 2
1
1
2 21
V V Vd z z V z
V V V VzV
con el caso particular de que si V1=0 (o el interior de la raiacutez es negativo) debe
aplicarse el procedimiento L La segunda se basa en otro modo de obtener la
aproximacioacuten
LB0 22 22 2 1 2 1 2 2 1 3 12 2 d z V V z V z V V V V
con los casos particulares de que si V1=0
1 22 2
2 1 2
1
1 2
2 1 1 2
1 1
p p
V n n
Vn n
y 3 3
3 1 2
1
1 2
1 1
1 1V n n
Vn n
y de que si el interior de la raiacutez es negativo se aplica L0
Los 2 siguientes meacutetodos (que son una mejora de la aproximacioacuten de Maclaurin)
requieren determinar previamente las cantidades de la expresioacuten (236) Ahora los
extremos (I S) del CI se obtienen mediante las expresiones que siguen (h=1 para
I cuando se usa el signo h=2 para S cuando se usa el signo +)
LC0
22 22
2 122
42
h h h h
h
zd B B N z V
N z
LD0 22
2 2 22 2 22 2 2 12
1 12
42
h h h h h h
h
z V Vd B N z B N z N z V
V VN z
(en el meacutetodo LD0 hay que entender que si V1=0 entonces V2V1=0)
76 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
II64 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los mejores de cada familia
(a=1 5 y 10) caso general y caso particular de grandes muestras
La primera parte de las Tablas AII3 y AII4 repite los resultados completos y
resumidos respectivamente para los cinco meacutetodos seleccionados en la seccioacuten anterior
al error a=5 (ZW4 ZW2 ZW3 ZCb0 y AE1) a fin de hacer maacutes faacutecil al lector la
comparacioacuten de los mismos Todos ellos excepto el uacuteltimo son de dificultad
operacional baja A la vista de los mismos puede deducirse que
Los meacutetodos ZW2 ZW3 y ZCb0 son muy similares tienen solo dos fallos y son
algo liberales en promedio siendo preferibles los dos primeros por proporcionar
unos IC maacutes sencillos de obtener
Los dos mejores meacutetodos son los AE1 y ZW4 no tienen fallos son ligeramente
conservadores en promedio y tienen una buena potencia En general es mejor el
meacutetodo AE1 que el ZW4 aunque sucede al contrario cuando ambas muestras estaacuten
equilibradas
Con el fin de matizar yo ratificar dichos resultados las mismas Tablas AII3 y
AII4 contienen tambieacuten los mismos resultados para los errores del 1 y 10
Analizando dichas tablas al completo puede observarse de modo general que
El meacutetodo oacuteptimo global es el AE1 que es ligeramente superior al ZW4 (ambos son
ligeramente conservadores)
El meacutetodo oacuteptimo sencillo es el ZW4 pues es solo ligeramente peor que el AE1 (de
hecho al 5 ambos son casi iguales) y a cambio es mucho maacutes faacutecil de aplicar
(pues se puede hacer a mano) Cuando el punto no es de la frontera este meacutetodo es
equivalente al ZW3
El meacutetodo claacutesico ZCb0 actuacutea tan bien como el ZW3 solo para valores 5 pero
es algo maacutes complicado (pues puede requerir de la resolucioacuten de dos ecuaciones de
2ordm grado) En general dicho meacutetodo es el maacutes potente pero ello se debe a que suele
ser demasiado liberal y suele dar muchos fallos (especialmente al error del 1)
Adicionalmente la Tabla AII5 presenta el resumen de los datos de todos los
meacutetodos con solo cero o dos fallos (que son los que tienen intereacutes) para el caso de
grandes muestras (n1=n2=100) y error =5 (pues puede observarse que los
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 77
desequilibrios muestrales en grandes muestras no producen fuertes discrepancias) De
ella se deduce que los mejores meacutetodos son por este orden los ZW4 AE1 y ZCb0
Como ademaacutes el ZW4 es el maacutes sencillo de los tres eacutel seraacute el aconsejado
De todo lo anterior se deduce que los meacutetodos oacuteptimos (que son siempre alguno
de los propuestos en esta memoria y en segundo lugar el claacutesico ZCb0) son
En general el AE1 (aunque el meacutetodo ZW4 es solo un poco peor es maacutes faacutecil y es
el oacuteptimo cuando las muestras son equilibradas) seguido del ZCb0
En grandes muestras (n200) el ZW4 (seguido de los AE1 y ZCb0 por ese orden)
II65 Seleccioacuten del meacutetodo oacuteptimo consin cpc de entre los dos oacuteptimos (a=5)
Con el fin de ver si la aplicacioacuten de una cpc mejora los resultados de los dos
meacutetodos seleccionados en la seccioacuten anterior (los AE1 y ZW4) la Tabla AII6 presenta
el resumen de los mismos en sus dos versiones sin y con cpc (meacutetodos AE1 ZW4
AE1c y ZW4c) al 1 5 y 10 De ella se deduce que en ninguno de los casos la cpc
mejora la actuacioacuten del meacutetodo por lo que se mantienen las conclusiones de la seccioacuten
anterior
II66 Verificacioacuten de los resultados de la literatura
La literatura ha analizado algunos de los meacutetodos descritos anteriormente y
establecido conclusiones acerca de su comportamiento absoluto o relativo a otros
meacutetodos Aquiacute se trata de ratificarlas o criticarlas en base a nuestros datos (algunas
conclusiones aparecen ya mencionadas en la seccioacuten II42) Con tal fin aludiremos a la
Tabla AII7 que resume los resultados de los meacutetodos implicados De esta uacuteltima se
deduce que (en lo que sigue el siacutembolo gt alude a que el meacutetodo de la izquierda es
mejor que el meacutetodo de la derecha)
ZCb0 gtgt ZW2 gt ZPa0 gt ZN0 gt ZE0 gtgt ZW1 gtgt ZW0
Las principales conclusiones de la literatura son las que siguen las cuales se
comentan si no se deducen directamente de las conclusiones especificadas arriba
No se analizan las afirmaciones de Dunnet amp Gent (1977) por estar basadas en los
78 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
estadiacutesticos con la cpc de Yates y en una evaluacioacuten condicional
Tanto Hauck amp Anderson (1986) como Xu amp Kolassa (2008) afirman que el meacutetodo
ZW0 presenta un muy mal comportamiento cosa que se confirma seguacuten nuestros
resultados
Seguacuten Roebruck amp Kuumlhn (1995) el meacutetodo ZE0 es mejor que los meacutetodos ZW0 (lo
que es conforme con nuestros datos) y ZCb0 pero seguacuten Wallenstein (1997) ocurre
lo contrario con respecto a la segunda afirmacioacuten ZCb0 es mejor que ZE0 Nuestros
resultados indican que sucede lo segundo Wallenstein (1997) tambieacuten afirma que el
meacutetodo ZCb0 es mejor que el meacutetodo ZPa0 nuestros resultados indican que esto es
verdad desde el punto de vista de la potencia pero no tan claramente en cuanto al
nuacutemero de fallos y al error medio
Chan (1998) indica que ZE0 es liberal si n1=n2 nuestros resultados indican que en
realidad ZE0 es liberal praacutecticamente siempre
Newcombe (1998 a) demostroacute que ZN0 es mejor que ZE0 Agresti amp Caffo (2000)
vieron que su propuesta ZW2 funciona bastante bien y Feigin amp Lumelskii (2000)
antildeadieron que el meacutetodo ZPa0 es mejor que el ZW0 Nuestros datos confirman
todas estas 3 afirmaciones
Martiacuten amp Herranz (2004 a) sugieren que el meacutetodo ZE0 debe aplicarse con cpc y en
la versioacuten de dos colas de Mantel Aquiacute no se ha evaluado pues ZE0 no ha llegado a
ser seleccionado y ademaacutes el meacutetodo de Mantel no ha sido contemplado Para este
meacutetodo el criterio de test consiste en comparar zexp con z2 (z) si 2 1d
( 2 1d ) La Tabla AII8 contiene los resultados para las cuatro combinaciones
que se obtienen con las versiones Armitage (actual)Mantel y consin cpc del
meacutetodo ZE0 De ella que se deduce que las versiones CON son siempre mejores que
las versiones SIN y que el meacutetodo oacuteptimo lo proporciona la versioacuten ZE0c (la actual
con cpc)
Brown amp Li (2005) indican que ZE0 es mejor que ZW0 y Santner et al (2007) que
ZE0 era liberal el 50 de las veces Nuestros resultados indican que en realidad el
meacutetodo ZE0 es liberal praacutecticamente siempre pero la discrepancia se debe a los
diferentes puntos de vista adoptados Santner et al (2007) aluden a que para un
dado ZE0 es liberal en la mitad de los posibles valores de p1 (caso de muestras muy
pequentildeas) Aquiacute se elige el peor valor de p1 (el que proporciona el valor de ) para
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 79
cada y se indica que el meacutetodo ZE0 es liberal para casi todos los (caso de
muestras moderadas)
Finalmente conviene resentildear la sorprendente mala actuacioacuten del reputado
meacutetodo ZE0 lo que es conforme con lo sentildealado por Chan (1998) Newcombe (1998) y
Santner et al (2007) Maacutes sorprendente auacuten es el hecho de que uno de los dos mejores
meacutetodos (el ZW4) sea una aproximacioacuten del meacutetodo ZE0
II67 Seleccioacuten del meacutetodo oacuteptimo para el caso claacutesico de =0 (test claacutesico de
homogeneidad de dos proporciones independientes)
II671 Seleccioacuten general
Un asunto complementario es el caso del test para δ=0 es decir el claacutesico test de
homogeneidad de dos proporciones independientes (H0 d=0 H0 p1=p2) Su estadiacutestico
de contraste tradicional suele expresarse de la forma 2 2exp 1 2 2 1 1 2 1 2( ) x y x y n n n a a el
cual se corresponde con los meacutetodos ZE0 y XE0 actuales En este caso particular los
meacutetodos de estimacioacuten Ca Cb y E proporcionan igual valor para las estimaciones de las
pi por lo que todos los meacutetodos que provocan (sean de tipo Z X o A) deben ser el
mismo Como por otro lado los procedimientos XE y ZE son tambieacuten el mismo la
afirmacioacuten anterior se traslada a ambos Adicionalmente en el caso del estadiacutestico A
ocurre que =0 siempre (pues p1=p2) con lo que todos los meacutetodos de tipo A son el
mismo Esto quiere decir que ahora se verifican las siguientes igualdades entre
procedimientos ZCa = ZCb = ZE = XCa = XCb y ACb =APb = AE de donde se deduce
que basta con que contemplemos los procedimientos ZE y AE (cada uno de ellos en sus
cinco versiones) como representantes de los anteriores A estos hay que antildeadir los
procedimientos basados en el estadiacutestico L La Tabla AII9 contiene el resumen de los
datos para todos los meacutetodos (extraiacutedos de los datos originales de la Tabla AII1) El
primer objetivo es seleccionar los mejores meacutetodos de modo global para =5 (que es
el error maacutes importante) De tales datos se deduce que
Se pueden descartar los meacutetodos ZW0 a XPb1 (al final en el orden de la tabla) por
tener dos o maacutes fallos y ser demasiado liberales
Se pueden descartar los meacutetodos L2 y L3 pues aunque no tienen fallos son
demasiado liberales
80 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
Se pueden descartar los todos los meacutetodos de tipo ZP (al inicio de la tabla) pues
aunque son equilibrados tienen poca potencia
Los meacutetodos que restan (todos ellos sin fallos) pueden dividirse en dos grupos los
que son ligeramente liberales (ZE2 a ZN4) y los que son algo maacutes liberales (AE3 a
ZW1) siendo preferibles los del primer grupo
De este primer grupo (ZE2 a ZN4) puesto que todos tienen un similar error son
preferibles los meacutetodos con mayor potencia En consecuencia los meacutetodos
seleccionados son los ZE2 y ZE3 (que solo son ligeramente liberales) aunque los
ZN2 y ZN3 son solo ligeramente peores
Obseacutervese que el meacutetodo claacutesico ZE0 y los dos meacutetodos seleccionados para todo
valor de (AE1 y ZW4) pertenecen al segundo grupo citado arriba los tres son
demasiado liberales
Se ve pues que los meacutetodos seleccionados en esta fase son los ZE2 y ZE3 A
ellos conviene antildeadirles los meacutetodos ZE0 (por razones histoacutericas) y los AE1 y ZW4
(por ser los meacutetodos seleccionados de modo general)
Para matizar dicha seleccioacuten se construye la Tabla AII10 para estos cinco
meacutetodos (con y sin cpc) y para los tres errores de la cual se deduce la tabla resumen
Tabla AII11 Su anaacutelisis da lugar a una seleccioacuten muy variada los mejores meacutetodos
son los AE1c AE1 ZE0c y ZE0 para =1 los ZE2c ZE2 ZE3c y ZE3 para =5 y
ZE3 para =10 Adicionalmente la tabla indica que los meacutetodos ZE0 no deben
utilizarse para =10 son poco convenientes para =5 pero son los mejores para
=1 En realidad lo que sucede es que la seleccioacuten depende fuertemente de los valores
de n1 y n2 Analizando en detalle dicha tabla podemos concluir que los meacutetodos
preferibles son
Para =1 ZE0c (seguido de AE1c)
Para =5 No hay una seleccioacuten clara pues seguacuten los valores de ni la seleccioacuten es
ZE0c (seguido de AE1c) para ni distintos y ZE3c para ni iguales De modo general
seleccionamos el meacutetodo ZE0c por ser el mejor en la mayoriacutea de las circunstancias el
maacutes sencillo y el claacutesico
Para =10 No hay una seleccioacuten unaacutenime pero ZE3 suele ser el mejor
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 81
En consecuencia la seleccioacuten final para el caso =0 es la siguiente
Para =1 y 5 ZE0c (seguido de AE1c) para ni distintos y ZE3c para ni iguales
Para =10 ZE3 (nunca utilizar ZE0)
II672 Seleccioacuten para =5 en el caso de grandes muestras (n160)
Ahora al contrario que en el caso general en el que se analizan globalmente
todos los (pues se piensa en un intervalo de confianza) la actuacioacuten de los distintos
meacutetodos variacutea seguacuten cual sea el desequilibrio muestral Es por ello que consideraremos
como grandes muestras los casos (n1=60 n2=100) y (n1=100 n2=100) es decir el caso
n160 En lo que sigue nos centramos en los casos =5 y n160 por ser los maacutes
habituales Observado los errores y potencias para =5 de las tablas de la seccioacuten
II64 se observa que
Para n=160 (n1=60 n2=100) los mejores meacutetodos son (por este orden) los ZE0 AE1
AE3 y ZE1 con errores de 006 006 +004 y 002 respectivamente y potencias
7541 7538 7512 y 7512 respectivamente Tambieacuten se observa que el meacutetodo ZW0
(seleccionado maacutes abajo) actuacutea muy mal (de hecho falla)
Para n=200 (n1=100 n2=100) los mejores meacutetodos son (por este orden) ZW0 ZE0 y
AE1 todos ellos con un error de 060 y una potencia de 7886 7874 y 7866
respectivamente
En consecuencia y dado que el meacutetodo AE1 es maacutes difiacutecil de aplicar que el
ZE0 la seleccioacuten es clara el meacutetodo oacuteptimo es el ZE0 (el claacutesico de la literatura) el
cual como vimos antes debe aplicarse con cpc
II68 Evaluacioacuten del caso de la diferencia seguacuten el estudio de simulacioacuten del
Capiacutetulo I
La metodologiacutea utilizada para seleccionar el meacutetodo oacuteptimo en el caso de una
combinacioacuten lineal general de K proporciones es diferente y menos perfecta que la
utilizada en el caso actual de la diferencia En el primer caso se eligen valores de δ al
azar y se determina el error a(p) solo para el valor p que se eligioacute al azar en el caso
actual se parte de una diferencia δ fijada de antemano y entonces se maximiza el error
82 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
a(p) en el paraacutemetro perturbador p Se ve pues la conveniencia de ratificar que ambas
metodologiacuteas dan lugar a resultados similares
Para tal fin se va a analizar por la metodologiacutea desarrollada en el capiacutetulo
anterior el caso actual de la diferencia de proporciones por lo que debemos suponer
que L=d b1=ndash1 b2=+1 El anaacutelisis se realizaraacute para tamantildeos muestrales ni=40 60 y 100
(a fin de que sus resultados sean comparables a los anteriores) y soacutelo para a=5 Los
meacutetodos elegidos para esta comparacioacuten son los maacutes habituales yo relevantes de este
caso ZE0 ZN0 ZW2 ZW3 ZPa0 y ZW4 Por el estudio realizado en las secciones
anteriores se ve que ZE0ltZN0ltZPa0lt ZW2 ZW3ltZW4
Analizando los meacutetodos notados en la seccioacuten I52 por E0 N0 Pa0 W1 W2 y
W3 (que son equivalentes a los citados arriba por ese orden) se obtienen los resultados
de la Tabla AII12 De ella se deduce que
El peor meacutetodo es el ZN0 (pues casi siempre presenta un apreciable nuacutemero de fallos)
Los siguientes peores meacutetodos son los ZE0 (da valores Rmin demasiado bajos) y ZPa0
(da valores Rmin demasiado bajo y sus lmean son demasiado grandes)
A continuacioacuten viene los meacutetodos ZW2 y ZW1 que siendo similares entre siacute tiene
algunos valores de Rmin demasiado bajos
Finalmente el mejor meacutetodo es el ZW3 (no falla nunca y sus valores de lmean son
mejores o iguales que los de cualquier otro meacutetodo) el cual tiene un comportamiento
ligeramente conservador
Se ve pues que globalmente los resultados de ambas metodologiacuteas de anaacutelisis
son compatibles especialmente en lo que respecta a cuaacuteles son los peores meacutetodos
(ZN0 y ZE0) y a cuaacutel es el mejor (el ZW3)
II7 CONCLUSIONES FINALES Y EJEMPLOS
II71 Meacutetodo oacuteptimo
Por todo lo resentildeado en las secciones anteriores pueden establecerse las
conclusiones que se indican en el cuadro de abajo Obseacutervese que casi todos los
meacutetodos seleccionados son nuevas aportaciones de esta memoria
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 83
SELECCIOacuteN DEL MEJOR MEacuteTODO PARA EL CASO DE LA DIFERENCIA
Caso General
AE1 es el mejor meacutetodo (aunque requiere de procedimientos iterativos para obtener
el IC)
Alternativamente puede emplearse el meacutetodo ZW4 pues siendo solo un poco peor
que el AE1 es maacutes sencillo e incluso lo supera en el caso de tamantildeos de muestra
equilibrados y en el caso de grandes muestras (n200)
Caso de un Contraste (es decir =0)
Para =1 o 5 ZE0c para ni distintos y ZE3c para ni iguales son los mejores
meacutetodos (seguido por el meacutetodo AE1c que tiene un comportamiento muy similar
pero que es maacutes complicado)
Para =10 ZE3 es el mejor meacutetodo
II72 Foacutermulas aconsejadas para realizar la inferencia
II721 Caso General (para todo )
Meacutetodo AE1 (meacutetodo oacuteptimo)
1) Incrementar los datos de ambos grupos (los eacutexitos xi y los fracasos yi) en 05
2) El estadiacutestico de contraste viene dado por la expresioacuten
2
1 1 1 11 2 2 1 2 1
21
1 2
AE
ˆ ˆn n sin p sin p sin p sin pz =
n n
(237)
con ip el estimador de maacutexima verosimilitud dado por 0 51 2 32 3p c B cos c
y 2 1ˆ ˆp p utilizando para ello 0 1 1c x 1 1 1 12c a n n x
2 2 1 12c n n n a 3c n 22 1 33B c c c 3
3 1 2 0 3 24 5 3A c c c c c c y
1 3 2 3cos A B
84 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
Si el objetivo es obtener el intervalo calcular por meacutetodos iterativos las dos
soluciones de la ecuacioacuten 2 21 2AE z z
Meacutetodo ZW4 (meacutetodo alternativo casi tan bueno como el oacuteptimo pero maacutes sencillo)
1) Incrementar todos los datos (los eacutexitos xi y los fracasos yi) en 22 4z si 0ltxiltni (i)
o en otro caso incrementarlos en
21 22
1 21 2
21 22
1 21 2
1 si 0 1 si 11 2con si
0 si 0 0 si 14
1 si 1 1 si 01 2con si
0 si 1 0 si 04
i
i
i
p pz I I I d
p ph
p pz S S S d
p p
2) El intervalo y el estadiacutestico de contraste vienen dados respectivamente por las
expresiones siguientes aplicadas a los datos incrementados anteriores
1 1 2 22
1 2
p q p qd d z
n n 2
24
1 1 2 2
1 2
ZW
dz
p q p q
n n
(238)
II722 Caso Particular (=0)
Ahora solo tiene sentido realizar el test siendo las opciones las que se indican a
continuacioacuten Una ventaja adicional de la seleccioacuten que sigue es que los meacutetodos
aconsejados no precisan de condicioacuten de validez alguna (salvo que n1+n240) no siendo
necesario por tanto verificar si las cantidades esperadas son mayores o no que un
determinado nuacutemero
Meacutetodo ZE0c el oacuteptimo si =1 o =5 y los tamantildeos de muestra son diferentes
El estadiacutestico de contraste tiene la siguiente forma claacutesica
2
2 11 22 1
1 1 220
21 21 2
1 22 1
1 si si
1 1 con y 2
si 0 si
ZE c
p p cc n np p c
p a n n n nz pq
q a nn n c n nn n np p c
(239)
Una versioacuten simplificada del mismo (aunque no exactamente igual) es la tambieacuten
claacutesica expresioacuten
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 85
2
1 2 2 1 1 2 1 2 1 2 2 1 1 220
1 21 2 2 1
si 1 si con
2 si 0 si ZE c
x y x y c n a a n n x y x y c n nz c
n nx y x y c
Meacutetodo ZE3c el oacuteptimo si =1 o =5 y los tamantildeos de muestra son iguales
1) Incrementar todos los datos (los eacutexitos xi y los fracasos yi) en 22 4z
2) Calcular el estadiacutestico de contraste
2
2 11 22 1
1 1 223
21 21 2
1 22 1
1 si si
1 1 con y
2 si
0 si
ZE c
p p cc n np p c
p a n n n nz pq
q a nn nc n n
n n np p c
(240)
Una versioacuten simplificada del mismo (aunque no exactamente igual) es
2
1 2 2 11 22 1 2 2 1
3 1 2 1 21 2
1 2 2 1
1 si si con
2 si 0 si
ZE c
x y x y cn nn x y x y c
z ca a n n n nx y x y c
Meacutetodo ZE3 el oacuteptimo si =10
1) Incrementar todos los datos (los eacutexitos xi y los fracasos yi) en 22 4z
2) Calcular el estadiacutestico de contraste
2
12 2 13
2
1 2
con 1 1
ZE
p a np pz
q a npq
n n
(241)
Una versioacuten simplificada del mismo (y exactamente igual) es
2
2 1 2 2 13
1 2 1 2ZE
x y x yz n
a a n n
II73 Ejemplos praacutecticos
II731 Intervalo de confianza
Rodary et al (1989) estudian la respuesta a la quimioterapia y a la radioterapia a
traveacutes de un ensayo cliacutenico en pacientes con nefroblastoma Los datos son los de la
Tabla II2 por lo que los porcentajes de respuesta positiva fueron 1p =09432=8388 y
86 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
2p =09079=6976 en el grupo de quimioterapia y radioterapia respectivamente (cuyos
valores poblacionales son p1 y p2 respectivamente) El meacutetodo oacuteptimo general para
obtener un IC aproximado al 95 para d=p2p1 es el AE1 de la expresioacuten (237) lo que
proporciona los valores d=p2p1(01290 00482) de longitud l(AE1) = 01772
Alternativamente puede emplearse el meacutetodo ZW4 (que en realidad es el
recomendado para tamantildeos de muestra similares como en el caso actual) Como
0ltxiltni los datos deben incrementarse en 19624=096 y la primera expresioacuten (238)
debe aplicarse a las dos muestras x1n1=83968992 y x2n2=69967792 esto
proporciona el IC dado por d=p2p1(01205 00488) de longitud l(ZW4) = 01693 lt
l(AE1) = 01772
Si se aplica el claacutesico y poco fiable meacutetodo ZE0c de las marcas con cpc de la
expresioacuten (239) se obtiene el intervalo (01287 00483) de longitud l(ZE0c) = 01770
(solucioacuten que en esta ocasioacuten es muy similar a la del meacutetodo AE1 pues con muestras
relativamente grandes y valores de cercanos a 0 el meacutetodo ZE0c no funciona mal)
Tabla II2
Respuestas favorables (SIacute) o desfavorables (NO) para los tratamientos indicados
Tratamiento SIacute NO Total
Quimioterapia 83 5 88
Radioterapia 69 7 76
Total 152 12 164
Finalmente el meacutetodo exacto oacuteptimo de Herranz and Martiacuten (2008) -programa
httpwwwugreslocalbioestSDGEXE seleccionando el test SG2 y el orden ZY-
proporciona el IC exacto d=p2p1(01352 00547) de longitud l(exacto) = 01899 El
meacutetodo exacto basado en el orden que proporciona el estadiacutestico AE1 da
d=p2p1(01295 00494) un intervalo que es muy similar al del meacutetodo asintoacutetico
AE1 y de menor longitud que el IC exacto anterior (lo que sugiere que este nuevo orden
podriacutea ser una buena alternativa para construir el meacutetodo exacto)
CAPIacuteTULO II K=2 EN EL CASO DE LA DIFERENCIA 87
II732 Test de homogeneidad
Antes de obtener el IC de la seccioacuten anterior los investigadores usualmente
comienzan determinando si las dos proporciones implicadas (p1 y p2) son iguales o no a
cuyo efecto suelen realizar el test de homogeneidad de dos proporciones al error =5
Aunque los tamantildeos de muestra son diferentes no lo son demasiado de modo que los
dos tests ZE0c y ZE3c son aplicables Las expresiones (239) y (240) proporcionan los
valores zZE0c=08617 y zZE3c=08372 ambos no significativos por ser inferiores a 196
debe aceptarse que las dos proporciones son iguales
Obseacutervese que los meacutetodos oacuteptimos aconsejados para el test no son los mismos
que los meacutetodos oacuteptimos aconsejados para el IC lo que ocasionalmente puede dar lugar
a que no sean compatibles los resultados de uno y otro
CAPIacuteTULO III
K=2 EN EL CASO DEL COCIENTE
III1 INTRODUCCIOacuteN
Como se indicoacute en el capiacutetulo anterior la comparacioacuten de las dos proporciones
pi (i=1 o 2) de individuos que presentan una caracteriacutestica de intereacutes en dos poblaciones
distintas es uno de los objetivos maacutes frecuentes en Ciencias de la Salud a cuyo fin lo
maacutes comuacuten es tomar dos muestras independientes de cada una de ellas En estadiacutestica
aplicada es habitual el uso del paraacutemetro d (desarrollado en el capiacutetulo II) pero en el
aacutembito de la medicina el paraacutemetro de intereacutes suele ser el cociente de dos proporciones
R=p2p1 Son ejemplos de ello los ensayos cliacutenicos donde se evaluacutea la eficacia de una
nueva vacuna los estudios de comparacioacuten de dos meacutetodos de diagnoacutestico binarios los
estudios sobre la comparacioacuten de dos tratamientos etc Igual que el paraacutemetro d R
constituye un caso particular del caso general del Capiacutetulo I ahora K=2 1=ndashρ 2=+1
L=p2ndashρp1 λ=0 y la Tabla I1 se particulariza en la actual Tabla III1 (que se comenta de
momento) El objetivo actual es pues la realizacioacuten de un test de dos colas sobre R (H0
R=ρ vs H1 Rρ equiv H0 p2ndashρp1=0 vs H1 p2ndashρp10) o la obtencioacuten de un IC de dos colas
para R
Tabla III1
Tabla 2times2 para muestras independientes
Muestras SIacute NO Total Coeficientes
I x1 y1 n1 β1=ndashρ
II x2 y2 n2 β2=+1
Total a1 a2 n
La Tabla III1 presenta los datos obtenidos en este tipo de experimentos donde
de nuevo SIacuteNO alude a la presencia o ausencia de la caracteriacutestica que se estudia ix
( iy ) es el nordm de individuos de entre los in (tamantildeo de muestra) que siacute (no) presentan la
90 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
caracteriacutestica βi son los coeficientes de la combinacioacuten lineal 1a =xi ( 2a =yi) es el
total de individuos que siacute (no) presentan la caracteriacutestica y finalmente n =a1+a2=ni es
el tamantildeo total de la experiencia Las dos variables aleatorias ( )ix siguen distribuciones
binomiales independientes ( )i i ix B n p con i=1 o 2 en donde ip es la proporcioacuten
(desconocida) de individuos de la poblacioacuten i que presentan la caracteriacutestica
El Caso d ha recibido la atencioacuten de cientos de artiacuteculos a lo largo de la
literatura en tanto que el nuacutemero de publicaciones acerca de R es bastante maacutes limitado
Desde el punto de vista exacto la obtencioacuten del IC para R es computacionalmente
intensiva (requiere de programas informaacuteticos especiacuteficos) y es poco factible para
tamantildeos de muestra moderadamente grandes (Reiczigel et al 2008) Por ello
investigadores como Farrington amp Manning (1990) Dann amp Koch (2005) o Price amp
Bonnet (2008) entre otros han dedicado gran atencioacuten al caso asintoacutetico proponiendo
yo analizando distintos meacutetodos para realizar inferencias
El objetivo de este capiacutetulo es proponer y evaluar nuevos meacutetodos asintoacuteticos
para el caso particular del paraacutemetro R y compararlos con las mejores propuestas de la
literatura
III2 NOTACIOacuteN
III21 Generalidades y estadiacutesticos base
Sean dos variables aleatorias binomiales independientes xi~B(ni pi) con i=1 o
2 y sea R=p2p1 el paraacutemetro de intereacutes (con las proporciones pi desconocidas) Sean
ip =xini las proporciones muestrales y 2 1R p p la estimacioacuten muestral del cociente
poblacional R Sean tambieacuten qi=1pi y 1i iq p Para contrastar H0 R=ρ vs H1 Rρ
(con 0leρleinfin ya que 0lepile1) es necesario seleccionar primeramente un estadiacutestico de
contraste que podraacute tener una de las cinco formas siguientes (que en adelante seraacuten
aludidas abreviadamente por el nombre en negrita que se indica)
Z
2
2 12
2 1 1 2 2
1 2
1 1Z
p ρpz
p p p pρ
n n
(31)
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 91
R
2
2 12
2 1 1 2 2
1 2
1 1R
p ρpz
p p p pR
n n
(32)
L
2
2 12 1 2
1 1 2 2
2 1
si 0
0 si =0
L
ln R ρ| p ρp |
q qz
n p n p
| p ρp |
(33)
X 22
2 12 2
2 1
si | | 0con =
0 si | |=0 i i i i
X ii i
χ p ρp n p pz χ
p qp ρp
(34)
en donde 2
2
0 si 0 o 1
si 0 o 1
i i i i i
i i i i i
χ p p p p
χ p q p q
A 2
1 22
1 2
4A
n n d δz
n n
donde
1 12 1
1 12 1
d sin p sin p
δ sin p sin p
(35)
En cualquiera de los cinco casos habraacute que comparar el valor experimental del
estadiacutestico 2expz (cualquiera de los cinco anteriores 2
Zz 2Rz hellip 2
Az ) con 22z (en donde
2z es el percentil (1ndashα2)100 de la distribucioacuten normal tiacutepica) Para obtener el IC
(1ndashα) para R se invierte el test despejando ρ en la ecuacioacuten 2 22exp z z En unas
ocasiones la solucioacuten seraacute expliacutecita (y maacutes o menos sencilla) en otras requeriraacute de un
procedimiento iterativo
III22 Estimadores de las proporciones pi
En los cinco estadiacutesticos anteriores (Z R L X o A) las proporciones pi
desconocidas deben ser sustituidas por alguno de sus estimadores (con el fin de que
tengan utilidad praacutectica) En lo que sigue se describen los mismos y se pone en
mayuacutesculas y negrita la letra abreviada que designaraacute el procedimiento que proporciona
cada estimador (letra que hay que antildeadir a la del estadiacutestico Z R L X o A utilizado)
III221 Estimadores no restringidos por H0
El procedimiento claacutesico y maacutes utilizado a la hora de estimar las proporciones
92 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
consiste en sustituir los valores desconocidos pi por los estimadores claacutesicos de maacutexima
verosimilitud simple (es decir las proporciones muestrales)
W (Wald) i i ip x n (36)
Una opcioacuten maacutes reciente (Newcombe 1998) consiste en sustituir las
proporciones desconocidas por el extremo apropiado del IC de Wilson (1927)
N (Newcombe) 1 1 2 2 2 1
1 1 2 2 2 1
si 0
si 0
p u p l p p
p l p u p p
(37)
con
2 22 2
2
22
2 4 i i
i i
i
i
z z x yx z
nl
n z
y
2 22 2
2
22
2 4 i i
i i
i
i
z z x yx z
nu
n z
(38)
siendo (li ui) el IC de dos colas al 100middot(1ndashα) para la proporcioacuten pi
III222 Estimadores siacute restringidos por H0
El estimador de pi restringido por H0 maacutes habitual (por su sencillez) es el
obtenido por el meacutetodo de tipo condicionado de Dunnett amp Gent (1977)
C (Condicionado) 11
1 2
ap
n n
y 2 1p p (39)
Como puede suceder que el valor de ip no esteacute comprendido entre 0 y 1 parece
conveniente exigir que cumpla esta condicioacuten de ahiacute que el estimador ip tenga dos
versiones
Ca ip = (39)
Cb ip = (39) restringida a que esteacute entre 0 y 1 ( ip =1 si ip gt1)
Una opcioacuten maacutes complicada es utilizar los siguientes estimadores de maacutexima
verosimilitud bajo H0 (Koopman 1984 Miettinen amp Nurminen 1985)
E (Incondicionado exacto)
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 93
2
1 2 2 1 1 2 2 1 1
1
4
2
n x n x n x n x nap
n
y 2 1ˆ ˆp p (310)
Un modo de simplificar lo anterior es a traveacutes de los siguientes estimadores
incondicionados aproximados
A (Incondicionado Aproximado) 2 11
x xp
n
y 2 1p p (311)
Al igual que en el caso de los estimadores de tipo condicionado parece conveniente
exigir que ip
sea un valor liacutecito (es decir que esteacute comprendido entre 0 y 1) de ahiacute que
ip
tenga dos versiones
Aa ip
= (311)
Ab ip
= (311) restringida a que esteacute entre 0 y 1 ( ip
=1 si ip
gt1)
Otro tipo de estimadores son los obtenidos por el meacutetodo de Peskun (1993)
P (Incondicionado de Peskun) 1 21
2
n np
n
y 2 1p p
(312)
aunque como en el caso de los estimadores de tipo condicionado e incondicionado
aproximado parece conveniente exigir que ip
sea un valor liacutecito de ahiacute que ip
tenga
tambieacuten dos versiones
Pa ip
= (312)
Pb ip
= (312) restringida a que esteacute entre 0 y 1 ( ip
=1 si ip
gt1)
III23 Procedimientos de inferencia que se obtienen con cada estimador
Cuando en las 5 expresiones (31) (32) (33) (34) y (35) se sustituye cada uno
de los 9 estimadores aludidos en la seccioacuten anterior se obtienen los 45 estadiacutesticos 2ZWz
2ZNz 2
ZCaz 2ZCbz 2
ZEz 2ZAaz 2
ZAbz 2ZPaz 2
ZPbz 2RWz hellipy 2
APbz cada uno de los cuales da
lugar a un procedimiento de test diferente Al invertir el mismo se obtiene un
procedimiento de IC diferente En ambos casos el nombre del procedimiento es la
unioacuten de las letras de los estadiacutesticos (Z R L X y A) y estimadores (W N Ca Cb E
Aa Ab Pa y Pb) implicados en su definicioacuten es por ello que los 45 procedimientos
94 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
aludidos seraacuten ZW ZN ZCa ZCb ZE ZAa ZAb ZPa ZPb RWhellip APb Sin
embargo algunos de ellos deben omitirse por las razones que siguen
a) El estadiacutestico R (cuyo origen como se ve maacutes adelante es obtener una
simplificacioacuten del estadiacutestico Z para que el IC se obtenga como solucioacuten de una
ecuacioacuten lineal) solo puede combinarse con los dos estimadores W y N pues ellos
son los uacutenicos que no dependen de De ahiacute que R solo proporcione dos
procedimientos los RW y RN
b) Los procedimientos XE y ZE son equivalentes (como se demostraraacute en la siguiente
seccioacuten) por lo que basta considerar uno de ellos (el ZE por ser el maacutes conocido)
c) Los procedimientos XW AW XN y AN no dependen de ρ (y ademaacutes los dos
primeros tienen un valor nulo) por lo que deben excluirse
d) Los procedimientos ACa AAa y APa pueden proporcionar valores de pigt1 (en cuyo
caso no tiene sentido la trasformacioacuten arco seno) por lo que tambieacuten deben
excluirse
Teniendo en cuenta estas exclusiones se obtienen 30 procedimientos en total de los 45
inicialmente propuestos
III24 Datos muestrales a utilizar y meacutetodos de inferencia que proporcionan
Las foacutermulas anteriores pueden utilizarse en base a los datos xi e yi originales o
en base a los datos originales incrementados en una cantidad hi determinada es decir en
base a (xi+hi yi+hi ni+2hi) Este incremento como se comentoacute en el Capiacutetulo I tiene su
origen en los meacutetodos ldquoadjustedrdquo Wald cuyo objetivo no es otro que el de mejorar el
comportamiento del procedimiento ZW adicionalmente el incremento es tambieacuten
habitual para mejorar el comportamiento del procedimiento LW del que tambieacuten se
sabe que funciona muy mal (Woolf 1955 Katz et al 1978 Koopman 1984 Dann amp
Koch 2005) Los valores posibles de hi se denotan con el diacutegito (en negrita) que los
identificaraacute (el cual se antildeadiraacute a las letras de los procedimientos descritos arriba)
0 hi=0 (claacutesico)
1 hi =05 (Woolf)
2 hi =1 (Dann amp Koch)
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 95
3 hi=2
2 4z
4
21 22
1 21 2
21 22
1 21 2
1 si 0 1 si 11 2con si
0 si 0 0 si 14
1 si 1 1 si 01 2con si
0 si 1 0 si 04
i
i
i
p pz I I I R
p ph
p pz S S S R
p p
Existen otros posibles incrementos que se descartan aquiacute pues la literatura o nuestros
propios datos (aludidos maacutes adelante) han demostrado que no mejoran a los anteriores
Cada uno de los 5 incrementos (0 1 2 3 y 4) puede aplicarse a cada uno de los
30 procedimientos anteriores (ZW ZNhellip APa y APb) dando lugar a 150 meacutetodos de
inferencia distintos en lo que sigue ellos seraacuten notados por las letras del procedimiento
y el diacutegito del incremento correspondiente ZW0 ZW1 ZW2 ZW3 ZW4hellip APb4
III3 RESULTADOS DE LA LITERATURA DE TIPO TEOacuteRICO
III31 Meacutetodos basados en el estadiacutestico Z
III311 Generalidad
Es bien conocido que si i i ix B n p con i=1 o 2 son dos distribuciones
binomiales independientes entonces las proporciones muestrales i i ip x n convergen
a una normal dip N(pi piqini) Como 0 2 1H p p es equivalente a
0 2 1 0H p p entonces el estadiacutestico de contraste 2 1p p (meacutetodo de Fieller
1944) bajo H0 se distribuye asintoacuteticamente como una normal con media y varianza
las indicadas a continuacioacuten
2 1 1 2 22 1
1 2
0 d p q p qp p N
n n
Para contrastar la hipoacutetesis H0 R=ρ vs H1 Rneρ hay que comparar el valor experimental
del estadiacutestico 2Zz dado por (31) con 2
2z (como se indicoacute anteriormente) El IC (1ndashα)
para R que se obtiene por inversioacuten del test vendraacute dado por las dos soluciones liacutecitas
de la ecuacioacuten 2 22 Zz z
Las expresiones anteriores no tienen utilidad hasta que las proporciones pi
desconocidas sean sustituidas por una estimacioacuten de las mismas (como las resentildeadas en
96 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
la seccioacuten III22)
III312 Meacutetodo claacutesico de Wald
El procedimiento claacutesico de cualquier libro de texto elemental consiste en
sustituir los valores desconocidos pi por las proporciones muestrales (estimadores de
maacutexima verosimilitud simple) dados por la expresioacuten (36) lo que da lugar al
procedimiento ZW (el claacutesico procedimiento de Wald contemplado por primera vez por
Katz et al 1978 para el actual caso de R) Las expresiones siguientes aluden al
estadiacutestico y al IC que se obtiene por inversioacuten del mismo
ZW 2
2 12
2 1 1 2 2
1 2
ZW
p pz
p q p qn n
(313)
ICZW R 21 2 1 22 22
2 1 1 1 1 1 2 2 1 1 2 2
11 ( )
y y y yRz z
z y n x n x n x n x n x
(314)
III313 Meacutetodo condicionado
Bajo la hipoacutetesis nula H0 p2p1=ρ ocurre que p2=p1ρ por lo que p1 es el uacutenico
paraacutemetro desconocido Desde el punto de vista condicionado (es decir condicionando
en que los eacutexitos siempre sumen el valor observado de a1) el estimador ip sugerido por
Farrington amp Manning (1990) viene dado por la expresioacuten (39) con la precaucioacuten de
que si 1ip debe hacerse 1ip para que sea un valor liacutecito Esto lleva a que se
consideren dos versiones ZCa (sin exigir que ip sea un valor liacutecito) y ZCb (exigiendo
que ip esteacute entre 0 y 1) Cualquiera que sea el caso el estadiacutestico de contraste seraacute de la
forma
ZCab 2
2 12
2 1 1 2 2
1 2
ZC
p pz
p q p qn n
(315)
La obtencioacuten del IC a traveacutes del procedimiento ZCab (ICZCab) no tiene una solucioacuten
expliacutecita sencilla y hay que determinarlo por meacutetodos iterativos
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 97
III314 Meacutetodo incondicionado exacto
Desde el punto de vista incondicionado Koopman (1984) y Miettinen amp
Nurminen (1985) proponen el estimador de maacutexima verosimilitud bajo H0 (sin
condicionar en los marginales) -el valor 1p dado por la expresioacuten (310)- y lo aplican al
estadiacutestico Z Por tanto el estadiacutestico de contraste para el procedimiento ZE seraacute de la
forma
ZE 2
2 12
2 1 1 2 2
1 2
ZE
p pz
ˆ ˆ ˆ ˆp q p qn n
(316)
y el IC se obtiene resolviendo en ρ por meacutetodos iterativos la ecuacioacuten 2 22ZE α z z
(aunque Nam 1995 proporciona la solucioacuten expliacutecita a traveacutes de las soluciones de una
ecuacioacuten cuacutebica) Para los casos maacutes extremos Koopman (1984) justificoacute que el IC
R(I S) es el siguiente (1) cuando x1=x2=0 (0 infin) (2) cuando x1=n1 y x2=n2
22 2 2I n n z 2
1 2 1S n z n (3) cuando x1=0 y x20 S= y (4)
cuando x10 y x2=0 I=0
III315 Meacutetodo incondicionado de Peskun
En el Caso d Peskun (1993) empleoacute el criterio de Sterne (1954) al indicar que el
estadiacutestico Z seraacute significativo cuando lo sea para cualquier valor de p1 es decir cuando
2 22Z z z para todo valor de p1 Martiacuten amp Herranz (2010) emplearon el mismo criterio
para el Caso R determinando el miacutenimo valor de 2Zz (es decir el maacuteximo valor de su
denominador) respecto de p1 Tales autores encuentran que este maacuteximo se alcanza en el
valor 1p
de la expresioacuten (312) y teniendo en cuenta que ip
puede ser un valor iliacutecito
expresan el estadiacutestico ZPb de la forma
ZPb
2 2
1 2 2 1 1 2 1 1 2 2
222 2 1 1 1
2
1 2 1 2 2
4 si
1 si
1 si
ZPb
nn n p p n n n n n n n n
z n p p n n n
n p p n n n
(317)
viniendo dado el estadiacutestico 2ZPaz por la primera expresioacuten de arriba (sin tener en cuenta
98 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
las restricciones para ρ) El IC para se obtiene resolviendo las ecuaciones de segundo
grado 2 22ZPa α z z y 2 2
2ZPb α z z (ver maacutes detalles en la seccioacuten III54)
III32 Meacutetodos basados en el estadiacutestico L
III321 Generalidades
Otro estadiacutestico bien conocido en el Caso R es el estadiacutestico L basado en la
transformacioacuten logariacutetmica En lugar de considerar la variable aleatoria R se
contempla su logaritmo neperiano 2 1ln R ln p ln p que se distribuye de manera
aproximadamente normal con media y varianza las siguientes
1 1 1 2 2 2dln R N ln q n p q n p
Para el caso de contrastar H0 R= el estadiacutestico apropiado viene dado por la expresioacuten
(33) invirtiendo la misma se obtiene el IC siguiente
ICL 2 1 1 1 2 2 2R R exp z q n p q n p (318)
Las expresiones anteriores como en el caso de otros estadiacutesticos no tienen utilidad
hasta que las proporciones pi desconocidas sean sustituidas por una estimacioacuten de las
mismas
III322 Meacutetodos claacutesicos de Woolf y ldquoadjustedrdquo Woolf
De nuevo el procedimiento maacutes sencillo para obtener las expresiones (33) y
(318) consiste en sustituir los valores desconocidos por las proporciones muestrales
dadas por la expresioacuten (36) lo que da lugar al procedimiento LW de Woolf (1955)
Ahora
LW 2 2
2
1 2
1 1 2 2 1 2 1 2
1 1LW
ln R ln R z
q q nn p n p x x n n
(319)
ICLW 2 1 1 1 2 2 2R R exp z y n x y n x (320)
Es conocido que el meacutetodo de Woolf tiene un mal comportamiento (Woolf
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 99
1955 Koopman 1984) Con el fin de mejorarlo diversos autores han propuesto
aplicarlo no en base a los datos originales (meacutetodo LW0) sino en base a los datos
incrementados en una cantidad hi (xi+hi yi+hi) Son tradicionales los incrementos hi=05
(meacutetodo LW1) de Woolf (1955) y hi=1 (meacutetodo LW2) de Dann amp Koch (2005) este
uacuteltimo propuesto en paralelo a la sugerencia de Agresti amp Caffo (2000) para el Caso d
III323 Meacutetodos de tipo Newcombe
Para el Caso d Newcombe (1998) plantea un nuevo procedimiento basado en el
IC asintoacutetico para una uacutenica proporcioacuten dado por Wilson (1927) del cual se dieron
datos detallados en los capiacutetulos anteriores Zou amp Donner (2008) generalizan y
justifican teoacutericamente el procedimiento de Newcombe (ver la seccioacuten I313)
incluyendo resultados para el Caso R Tales autores indican que si (li ui) es un IC para
pi al error α entonces un IC aproximado para R tambieacuten al error α es (procedimiento
LZ)
ICLZ
2 2
1 1 2 2
2 2
1 1 2 2
R exp ln u ln p ln p ln l
R
R exp ln p ln l ln u ln p
(321a)
Esto implica que para realizar el test para H0 R=ρ el formato no puede ser el
tradicional sino que se concluiraacute que el test es significativo cuando (la siguiente
expresioacuten no fue explicitada por los anteriores autores)
LZ
2
2 2
1 1 2 2
2
2 2
1 1 2 2
1 si
1 si
ln RR
ln u ln p ln p ln l
ln RR
ln p ln l ln u ln p
(321b)
Estos resultados se obtienen por el meacutetodo de Zou amp Donner descrito en la
seccioacuten I313 y que ellos llaman ldquomeacutetodo MOVERrdquo (method of variance estimates
recovery) El meacutetodo es coincidente con el de Newcombe solo cuando se trabaja con
funciones lineales de las pi lo que no es el caso actual De ahiacute que el actual
procedimiento LZ sea diferente al procedimiento LN definido en la seccioacuten III23 y que
se explicita en las expresiones (332) y (333) de las aportaciones El procedimiento
100 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
actual da lugar a los 5 meacutetodo LZx (con x=0 1 2 3 y 4) Ninguno de ellos se encuentra
entre los prometidos al inicio de este capiacutetulo por la razoacuten que se indica al final de la
seccioacuten III633
III324 Meacutetodo condicionado e incondicionado exacto
Martiacuten amp Herranz (2010) revisan y proponen nuevos estadiacutesticos para realizar
inferencias asintoacuteticas acerca de una combinacioacuten lineal de dos proporciones
particularizando sus resultados al Caso R actual Tales autores proponen sustituir en la
expresioacuten (33) las proporciones desconocidas pi por los estimadores condicionado de la
expresioacuten (39) o incondicionado de la expresioacuten (310) lo que da lugar a los
estadiacutesticos 2LCbz y 2
LEz respectivamente De manera que los estadiacutesticos de contraste
vienen dados por
LCb 2 2 1 2
1 1 2 2LCb
q qz ln R
n p n p
(322)
LE 2 2 1 2
1 1 2 2LE
ˆ ˆq qz ln R
ˆ ˆn p n p
(323)
III33 Meacutetodos basado en el estadiacutestico X
El claacutesico estadiacutestico chi-cuadrado de Pearson dado por la expresioacuten (222) fue
propuesto por Koopman (1984) para el Caso R dando lugar al estadiacutestico 2Xz de la
expresioacuten (34) La foacutermula anterior carece de sentido hasta que las pi desconocidas sean
sustituidas por la estimacioacuten apropiada Koopman propone el estimador ip de maacutexima
verosimilitud bajo H0 obteniendo asiacute el procedimiento XE Si se hace 1ˆ ˆp p el
estadiacutestico de contraste seraacute de la forma
XE
2 2
1 1 2 22
1 2 1ZE
ˆ ˆx n p x n pz
ˆ ˆ ˆ ˆn pq n p p
(324)
Gart amp Nam (1988) comprueban que el procedimiento ZE y XE son el mismo (pues se
verifica que 2 2ZE XEz z ) puesto que ambos aluden al meacutetodo de las marcas y Martiacuten amp
Herranz (2010) proporcionan una demostracioacuten maacutes directa Estos uacuteltimos autores
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 101
tambieacuten proponen el procedimiento XCb utilizar los estimadores condicionados de
(39) en la expresioacuten (34) comprobando que en este caso los procedimientos XCb y
ZCb son distintos el nuevo estadiacutestico de contraste es por tanto
XCb
2 2
2 1 1 2 2
1 2 1XCb
x n p x n pz
n pq n p p
(325)
III34 Propiedades de los diversos estadiacutesticos
Para que un estadiacutestico 2z sea uacutetil en la inferencia es preciso que verifique
ciertas propiedades de coherencia Como se ha comentado en la seccioacuten II317 es
necesario que las regiones criacuteticas no presenten huecos (convexidad espacial) por lo
que la ausencia de estos en la misma implica que 2z debe ser creciente (decreciente) en
2p ( 1p ) si R Por otro lado por el principio de Sterne (1954) para que 2z sea
liacutecito es preciso que alcance su valor miacutenimo en la frontera del espacio nulo es decir
que sea decreciente con ρ (propiedad de convexidad parameacutetrica)
Martiacuten amp Herranz (2010) demuestran que los estadiacutesticos 2ZWz 2
ZCbz 2ZEz 2
ZPbz
2XCbz 2
LWz verifican propiedades de convexidad tanto espacial como parameacutetrica salvo
el caso 2LWz que soacutelo crece en 2p (pero no decrece en 1p ) Adicionalmente demuestran
que tales estadiacutesticos alcanzan igual valor en las hipoacutetesis nulas (equivalentes) H0
p2=ρp1 y 0 1 2 1H p p lo que les sirvioacute para simplificar sus demostraciones
III4 RESULTADOS DE LA LITERATURA DE TIPO PRAacuteCTICO
III41 Generalidades sobre los estudios a realizar
Al igual que en los casos anteriores la mayoriacutea de los autores plantean el
problema de seleccionar el meacutetodo oacuteptimo desde el punto de vista de los IC Para ello
comparan el recubrimiento real R y la longitud media l de cada meacutetodo de IC para unos
valores fijados de pi (i=1 o 2) paraacutemetros que vienen dados por las expresiones
1 2
1 1 1 2 2 2
1 2
1 21 1 2 2 1 2
0 0 1 2
(1 ) (1 ) ( )n n
x n x x n x
x x
n nR p p p p I x x
x x
(326)
102 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
1 2
1 1 1 2 2 2
1 2
1 21 1 2 2
0 0 1 2
(1 ) (1 )n n
x n x x n xS I
x x
n nl p p p p
x x
(327)
en donde 1 2( ) 1I x x si ( )I S -el IC obtenido con la pareja (x1 x2)- e
1 2( )I x x 0 en otro caso Dado que R es una probabilidad se verifica que 0le Rle1 Se
considera que un meacutetodo de IC es mejor cuanto menor sea su longitud l y cuanto maacutes
cercano sea su recubrimiento real R al recubrimiento nominal de 1 Es aconsejable
igualmente la simplicidad del IC es decir que sea faacutecil de recordar de calcular de
entender y de presentar
Alternativamente otros autores plantean la seleccioacuten desde el punto de vista de
los tests de hipoacutetesis Si el test asintoacutetico se realiza a un error nominal de la RC que
ocasiona estaraacute formada por todos los puntos (x1 x2) en los que 2 22exp z z el error real
del test (p) -con p=p1- vendraacute dado por
1 1 2 22 11 21 2 0
1 2
1 1n x n xx a
RC RC
n np P x x | H p p p
x x
(328)
y el tamantildeo del mismo seraacute
maacutex con 0 miacuten 1 1p D p D= p p (329)
Adicionalmente la potencia (p1 p2) para una alternativa y error dados seraacute
1 1 1 2 2 21 21 2 1 1 2 2
1 2
(1 ) (1 )x n x x n x
RC
n np p p p p p
x x
Bajo este planteamiento el meacutetodo oacuteptimo seraacute aquel cuyo valor sea maacutes cercano a
(preferiblemente menor o igual) y cuya potencia sea lo mayor posible en la mayoriacutea
de las alternativas ensayadas
III42 Conclusiones de la literatura
La literatura no ha analizado tan profundamente el Caso R actual como lo ha
hecho con el Caso d Las principales conclusiones obtenidas a partir de las diversas
comparaciones efectuadas por los distintos autores pueden resumirse como sigue
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 103
1) Katz et al (1978) analizan los meacutetodos claacutesicos ZW0 y LW0 junto con otro
procedente de Thomas amp Gart (1977) en el que se considera el paraacutemetro odds-ratio
θ Seguacuten sus resultados el meacutetodo basado en θ es razonable (aunque ligeramente
conservador) y proporciona resultados similares al meacutetodo LW0 en tanto que ZW0
tiene una actuacioacuten muy mala y debe descartarse Los autores seleccionan el meacutetodo
LW0 como el oacuteptimo por ser menos conservador y maacutes coherente que el resto asiacute
como computacionalmente maacutes sencillo
2) Koopman (1984) compara el meacutetodo LW0 seleccionado por Katz et al (1978) con
el meacutetodo XE0 que eacutel propone Su recomendacioacuten es este uacuteltimo ya que
proporciona un recubrimiento maacutes cercano al nominal que el LW0 el cual es en
algunas ocasiones demasiado conservador
3) Gart amp Nam (1988) hicieron una revisioacuten acerca de los meacutetodos propuestos en la
literatura hasta ese momento Entre otros valoraron los meacutetodos ZW0 LW0 ZE0 y
XE0 demostrando primeramente la igualdad entre los procedimientos ZE y XE Los
autores comprobaron que ZW0 debe descartarse por su mala actuacioacuten En cuanto a
los meacutetodos LW0 y XE0 ambos proporcionan resultados muy similares con un
recubrimiento cercano al nominal De entre estos dos los autores seleccionaron
como meacutetodo oacuteptimo al XE0 (ya que tiene un recubrimiento maacutes cercano al nominal
que con LW0) aunque para valores grandes de es LW0 el que tiene un
comportamiento mejor
4) Farrington amp Manning (1990) analizaron los meacutetodos ZW0 ZCb0 y ZE0 El estudio
de simulacioacuten mostraba que ZE0 proporciona un IC con un recubrimiento cercano al
nominal y considerablemente mejor que en los otros dos casos ZW0 se descarta (a
pesar de ser el maacutes sencillo) por ser el de peor actuacioacuten ZCb0 es maacutes preciso que
ZW0 y maacutes simple que ZE0 pero ZE0 es el mejor meacutetodo
5) Dann amp Koch (2005) realizan un estudio completo de todos los meacutetodos aludidos en
los cuatro paacuterrafos anteriores (desde los puntos de vista del IC y del test) Los
autores analizan 3 grupos de procedimientos seguacuten que el estadiacutestico utilizado sea L
Z o X Los meacutetodos evaluados son (entre otros) LW0 LW1 LW2 ZW0 meacutetodo de
Bailey (una modificacioacuten de ZW0) ZCb0 ZE0 Desde el punto de vista del IC los
autores concluyen que LW2 produce un recubrimiento maacutes alto que con el resto de
meacutetodos del grupo L y que el meacutetodo de Bailey provoca IC maacutes estrechos que en el
caso ZW0 Desde el punto de vista del test el meacutetodo oacuteptimo es el ZE0 pues su
104 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
potencia es alta aunque tiene un error real bastante elevado y requiere de una
computacioacuten intensiva para su caacutelculo Los meacutetodos maacutes simples son los basados en
el estadiacutestico L que en la praacutectica tienen buena potencia y mantienen el error real
cercano al nominal En el grupo de Z destaca el meacutetodo de Bailey (que tiene buena
potencia y el mejor error real) aunque provoca en ciertos casos resultados erraacuteticos
Dann amp Koch destacan el buen comportamiento de LW2 y ZE0
6) Price amp Bonnet (2008) proponen meacutetodos de tipo bayesiano y basados en la inversa
del seno hiperboacutelico comparaacutendolos con ZE0 LW0 y diversas variantes del
procedimiento LW (sumando valores diferentes a xi que a yi) Los autores
comprueban que estos procedimientos ldquoadjustedrdquo LW tienen en general una
probabilidad de recubrimiento por debajo del nominal para muestras grandes
debiendo utilizarse con precaucioacuten Su conclusioacuten es que el meacutetodo ZE0 es
claramente superior al resto de meacutetodos y con caracteriacutesticas computacionales
similares a las de su meacutetodo bayesiano (que tambieacuten presenta un buen
comportamiento)
III5 APORTACIONES DE TIPO TEOacuteRICO
III51 Procedimientos basados en el meacutetodo de Newcombe
Newcombe (1998) propone un nuevo procedimiento para el Caso d basado en el
IC asintoacutetico para una uacutenica proporcioacuten dado por Wilson (1927) Para el actual Caso R
y el estadiacutestico Z siguiendo el razonamiento realizado en la seccioacuten I313 como
L=p2ndashρp1 entonces el test y el IC para el procedimiento ZN seraacuten
ZN
2
2 1
2 1 1 2 2
1 22
2
2 1
2 1 1 2 2
1 2
si 1 1
=
si 1 1
ZN
p pR
l l u u
n nz
p pR
u u l l
n n
(330)
ICZN
2 21 2 1 2 1 2 1 1 2 2
1 1 1
2 21 2 1 2 1 2 1 1 2 2
1 1 1
1 2 2
2
1 2 2
2
p p p p u l p u p lu p u
R
p p p p l u p l p ul p l
(331)
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 105
en donde li y ui se obtienen como en las expresiones (38) La expresioacuten (330) se deduce
de modo inmediato sustituyendo en (31) las proporciones desconocidas pi por los
estimadores ip dados por (37) La expresioacuten (331) ndashsimilar a la obtenida por Li et al
(2010) en el contexto maacutes amplio del cociente entre dos paraacutemetros cualesquiera y de
modo simultaacuteneo con nuestras deducciones se obtiene despejando de la expresioacuten
(330) y teniendo en cuenta la definicioacuten del IC de Wilson
De igual modo puede procederse con los demaacutes estadiacutesticos liacutecitos Por ejemplo
LN
2 1 2
21 1 2 22
1 2 2 1 2
1 1 2 21 1 2 2
1 1si
1 1si
LN
u lln R R
n u n lln R z
q q l uln R Rn p n p n l n u
(332)
ICLN
2 2
1 1 2 2
2 2
1 1 2 2
exp 1 1
exp 1 1
R p u p lR
R p l p u
(333)
Conviene sentildealar que el actual procedimiento es diferente al de las expresiones (321a)
y (321a) propuesto por Zou amp Donner
III52 Valor aproximado del estimador de maacutexima verosimilitud (estimadores Aa
y Ab) y procedimientos que ocasionan
Todo lo indicado en el Capiacutetulo I acerca del procedimiento de las marcas es
aplicable al caso de K=2 En particular el paraacutemetro de intereacutes es L=1p1+2p2 y los
estimadores de maacutexima verosimilitud ˆ ip bajo H0 L= son la solucioacuten de las ecuaciones
ˆ ˆ ˆi i i i i in p p p q =C (i) bajo la condicioacuten 1 1 2 2ˆ ˆβ p β p λ con C una constante que
estaacute por determinar Esto indica que para i=1 y 2 debe ocurrir que
2 2 21 1 1 1 1 1 1 1 1 1ˆ ˆ ˆn p n p C p p y 2 2 2
2 2 2 2 2 2 2 2 2 2ˆ ˆ ˆn p n p C p p
respectivamente Como 2 2 1 1ˆ ˆp p sustituyendo en la segunda igualdad se deduce
que
2 22 2 2 2 2 1 1 2 1 1 1 1 2ˆ ˆ ˆ 2n p n n p C p p (334)
106 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
de modo que restando esta igualdad de la de i=1 y despejando 1p se obtiene que
1 2 2 2 1 1 1 2 2 1 1 1 2ˆ 2p n p n p n C n C Efectuando la
divisioacuten teniendo en cuenta que C= 2ZE
ˆz L λ es de orden 0 en los valores usuales de
2ZEz y despreciando todos los teacuterminos de orden menor o igual que 1 se deduce que
1 1 1 2 2 2 21 1
1
ˆn p n p n
p pn
(335)
y como 2 1 1 2ˆ ˆ p p entonces 2 1 1 2p p es decir
2 2p p 1 1 1 2 2 2 1
2
n p n p n
n
(336)
Como se ha visto en secciones anteriores en el caso particular de R=p2p1 son
equivalentes las hipoacutetesis H0 R= y H0 L=p2p1=0 por lo que 1= 2=+1 y =0
Sustituyendo esos valores en las dos anteriores expresiones (335) y (336) se obtienen
los estimadores de la expresioacuten (311) Como puede suceder que ip
sea un valor iliacutecito
(es decir que no esteacute comprendido entre 0 y 1) parece conveniente considerar que
ip
=1 cuando ip
gt1 lo que da lugar a la versioacuten Ab del estimador (frente a la versioacuten Aa
que se obtiene si no se impone tal condicioacuten) Adicionalmente conviene resentildear una
circunstancia especial En el Caso d (en el que 1=1 2=+1 y =0) las expresiones
(335) y (336) proporcionan los estimadores condicionados claacutesicos de Dunnet amp Gent
de la expresioacuten (27) lo que indica que estos estimadores condicionados son tambieacuten
aproximaciones del estimador de maacutexima verosimilitud exacto
Combinando cada uno de los estadiacutesticos definidos en esta memoria con el
estimador incondicionado aproximado A se obtienen los procedimientos ZA LA XA y
AA (en sus dos versiones Aa y Ab) A la hora de deducir los distintos tests se
sustituyen como es habitual las proporciones desconocidas pi por los estimadores
incondicionados aproximados -dados por la expresioacuten (311)- en las estadiacutesticos (31)
(33) (34) y (35)
El IC para los procedimientos LAab XAab y AAab hay que determinarlo
por meacutetodos iterativos pero en el caso del procedimiento ZAa se obtiene de modo
expliacutecito resolviendo una ecuacioacuten de segundo grado Para ver esto comencemos por
adaptar la expresioacuten (311) a la exigencia de que 0 ip 1
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 107
1 2 1 2 2 1 2 1 2 1
1 2 2 1
1 2 2 1
si
1 si
1 1 si
p x x n p x x n x n x n x x
p p x n x
p p n x x
Sustituyendo estos valores en la expresioacuten (31) se obtiene que el estadiacutestico de test para
el procedimiento ZAb es
ZAb
2
1 2 2 1 2 2
1 12 1 1 2 2 1
2
2 2 12 2
1
2
1 2 1 2
1
si
si
si 1
ZAb
nn n p p x n x
n x xx x n x n x
n p p xz
n x
n p p n x
x
(337)
El IC (I S) por el procedimiento ZAb se obtiene despejando ρ de la ecuacioacuten
2 22ZAbz z proceso que hay que realizar para cada uno de los tres casos citados y que
proporciona respectivamente las ecuaciones
2 2 2 21 2 1 2 2 1 1 2 2 1 1 2 2 1 2 2 1 2 2 1 2
2 2 2 22 1 2 2 1 2 2 2 2
2 2 2 2 21 1 1 1 2 2 1 2 2
2 2 0
2 0
2 0
x nn p z n x nx x z n x n x x x x nn p z n x
n p z n p p z n p
n p n p p z n p z
Esto quiere decir que para obtener el IC del meacutetodo ZAb (ICZAb) hay que seguir el
proceso siguiente
1 Obtener primeramente los dos valores (I S) que proporciona la expresioacuten
2222 1 1 2 2 1 2 2 2 2 1 1
1 2 2 1 2 1 1 2
21 2 1 2 2 1
2
2 2
z n x n x x x z n x n xnx x z n x x a np p
Rx nn p z n x
(338)
Si las dos soluciones obtenidas verifican que 2 1 2 1I Sx n x n x x el
problema finaliza En otro caso puede que falle uno o dos de los extremos los
cuales se vuelven a determinar como en los pasos siguientes
2 Si el extremo que falla es I se obtiene su valor mediante la expresioacuten
108 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
2 2
2 22 1 2 2 1 22 2
2 1 2
1
2 4
I
z zx p z x p p
n p z
(339)
3 Si el extremo que falla es S se obtiene su valor mediante la expresioacuten
2 2
2 21 2 2 1 2 12
1 1
1
2 4
S
z zx p z x p p
n p
(340)
El procedimiento de test y de IC para la versioacuten ZAa seraacute similar al caso
anterior pero sin tener en cuenta las restricciones iniciales el estadiacutestico de test ( 2ZAaz )
viene dado por la primera expresioacuten de (337) -sin tener en cuenta las limitaciones para
ρ- y el IC (ICZAa) es el de la expresioacuten (338)
III53 Intervalo de confianza para los procedimientos ZPab
En la seccioacuten III314 ya se indicoacute el valor de los estadiacutesticos de contraste para
los procedimientos ZPa y ZPb de Martiacuten amp Herranz (2010) y coacutemo proceder para
obtener los IC Las expresiones expliacutecitas para los mismos son las que siguen En el
caso del procedimiento ZPa
ICZPa 2
1 2 2 1 2 1 2
21 2 2 1
4 2
4
np p z a z n n nR
np n z n
(341)
En el caso del procedimiento ZPb la solucioacuten anterior es vaacutelida si se verifica que
1 1 2 2I Sn n n n n n En otro caso si alguno de los extremos falla habraacute
que proceder como en la seccioacuten anterior Como la segunda y tercera expresioacuten de
(337) es la misma que las de (317) las soluciones tambieacuten seraacuten las mismas Es decir
bull Si 1 1I n n n la solucioacuten es la expresioacuten (339)
bull Si 2 2 Sn n n la solucioacuten es la expresioacuten (340)
Como se ve el estimador ip
solo tiene sentido en el caso del estadiacutestico Z (que
es para el que se define) A pesar de todo los estimadores Pa y Pb se evaluaraacuten tambieacuten
en los demaacutes estadiacutesticos
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 109
III54 Estadiacutesticos R y A
Con el fin de simplificar el IC que se obtiene a traveacutes del claacutesico estadiacutestico Z de
la expresioacuten (31) puede sustituirse en ella el valor de 2 de su denominador por 2R lo
que da lugar al estadiacutestico R de la expresioacuten (32) Para que la simplificacioacuten se
mantenga es preciso que los valores desconocidos pi se sustituyan por estimadores que
no dependan de es decir por los estimadores W o N Desde esa perspectiva los nuevos
procedimientos RW y RN vienen dados por los estadiacutesticos
2
2 2 1
2 1 1 2 2
1 2
RW
p ρpz
p q p qR
n n
y
2
2 2 1
2 1 1 2 2
1 2
RN
p ρpz
p q p qR
n n
los cuales proporcionan los IC
21 2 1 2
1 11 α
nρ R z
x x n n
y 1 1 2 22 2 2
1 1 2 2
1 α
p q p qρ R z
n p n p
Asimismo Herranz amp Martiacuten (2008) proponen para el Caso d el estadiacutestico de
contraste A dado por la expresioacuten (23) El mismo estadiacutestico puede ser utilizado
tambieacuten en el Caso R lo que nos lleva a la expresioacuten (35) y proporciona los
procedimientos ACb AE AAb y APb resentildeados anteriormente
III55 Estadiacutesticos basados en los datos incrementados
En la seccioacuten III322 ya se indicoacute que por causa del mal comportamiento del
meacutetodo LW0 conviene aplicar el procedimiento LW a los datos incrementados en una
cantidad hi = 05 o 1 Otras opciones son utilizar las propuestas realizadas en capiacutetulos
anteriores es decir los Casos 3 y 4 de la seccioacuten III24
Aunque lo anterior es inicialmente aconsejado para el procedimiento LW nada
impide que se haga igual para los demaacutes procedimientos (como se propone en esta
memoria)
A efectos praacutecticos el Caso 4 es el de mayor dificultad cuando los datos
observados estaacuten en la frontera del espacio muestral (es decir cuando ip = 0 o 1) La
Tabla III2 presenta los coeficientes por los que hay que multiplicar el factor 22 4z
110 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
para obtener el liacutemite inferior del IC (primera liacutenea) o el liacutemite superior del IC (segunda
liacutenea) en funcioacuten de los valores de ip
Tabla III2 Coeficientes para el Caso 4
2 0p 20 1p 2 1p
1 0p 3 1 3 1 3 3
1 3 1 1 1 1
10 1p 1 1 1 1 1 3
1 3 1 1 1 1
1 1p 1 1 1 1 1 3
3 3 3 1 3 1
III56 Estadiacutesticos con correccioacuten por continuidad
Siguiendo la argumentacioacuten de Haber resentildeada en la seccioacuten II316 el salto
total del estadiacutestico de contraste 2 1p p es de 1+ρ con lo que el salto promedio seraacute
de 1 2 1c N pues el nuacutemero total de puntos del espacio muestral es de
N=(n1+1)(n2+1) Con ello el estadiacutestico Z con cpc seraacute
Zc
2
2 1
2 12 2 1 1 2 2
1 2
2 1
si 1 1
0 si
Zc
p p cp p c
p p p pz = n n
p p c
(342)
De igual modo el salto total del estadiacutestico de contraste d es de (como se vio
en la seccioacuten II54) con lo que el salto promedio seraacute de 2 1c N Con ello el
estadiacutestico A con cpc seraacute
Ac
2
1 2 1 22 si
0 si Ac
n n d c n n d cz =
d c
(343)
La argumentacioacuten no produce efecto alguno en el caso del estadiacutestico L y no
tiene intereacutes en el caso de los estadiacutesticos R y X (pues como se veraacute estos estadiacutesticos
no dan lugar a procedimientos resentildeables)
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 111
III57 Equivalencia entre la evaluacioacuten de un meacutetodo de obtencioacuten de intervalos
de confianza y su meacutetodo de test asociado
Para el Caso d la equivalencia entre la evaluacioacuten de un meacutetodo de obtencioacuten de
IC y su meacutetodo de test asociado fue tratado en la seccioacuten II55 El mismo razonamiento
es aplicable al Caso R Dado el test de dos colas H0 R=ρ vs H1 Rneρ si ρ0 no pertenece
al IC (1minusα) entonces el test para ρ=ρ0 debe dar significativo al error α (y al reveacutes) Por
ello la definicioacuten de un procedimiento puede hacerse desde la perspectiva del test o del
IC y ademaacutes evaluar un procedimiento de IC es equivalente a evaluar su procedimiento
de test asociado (si ambos se realizan al mismo error nominal α)
La demostracioacuten de tal equivalencia es similar a la desarrollada en el capiacutetulo
anterior El error real del test se calcula mediante la expresioacuten (329) teniendo en cuenta
que 2 21 2 2exp RC x x | z z Como el IC se obtiene mediante la inversioacuten del test
entonces cada observacioacuten (x1 x2) ocasiona un IC para R dado por
2 21 2 0 0 2exp IC x x | z z con lo que el recubrimiento real seraacute de nuevo
1 2
1 2
1 2 0 1 20 0
miacutenn n
p Dx x
P x x | H I x x
en donde ahora I(x1x2)=1 si 1 2IC x x e
I(x1x2)=0 en otro caso Como 1 2IC x x cuando 2 20 2exp z z entonces
I(x1x2)=1 si 1 2x x RC y por tanto 1 2 0miacuten
p DRC
P x x | H
con RC aludiendo al
conjunto complementario del conjunto RC y finalmente =1α Esto quiere decir que
calcular el incremento del error nominal respecto del real es equivalente a calcular el
incremento del recubrimiento nominal respecto del real
Finalmente cuanto mayor sea la potencia del test menor seraacute la longitud
media l del IC que ocasiona (y al reveacutes)
III6 APORTACIONES DE TIPO PRAacuteCTICO
III61 Objetivo
Como se indicoacute en el Proacutelogo y en la seccioacuten anterior la evaluacioacuten de los
diferentes meacutetodos de inferencia puede realizarse desde la perspectiva de los tests de
hipoacutetesis o desde la perspectiva de los IC En esta seccioacuten tal evaluacioacuten se efectuaraacute
112 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
desde la perspectiva de los tests de hipoacutetesis al igual que en el Caso d pues suele ser
maacutes sencillo definir el test que el IC y la evaluacioacuten comparativa de los valores de es
maacutes sencilla (como se ve de momento) que la de los valores de l
Los meacutetodos de inferencia a evaluar son inicialmente los 150 indicados al final
de la seccioacuten III2 (los meacutetodos ZW0 ZW1 ZW2 ZW3 ZW4hellip ZPb4 RW0hellip
RN4 LW0hellip LPb4 XCa0hellip XPb4 ACb0hellip APb3 y APb4) lo que incluye las
propuestas maacutes relevantes de la literatura De ellos son nuevos los 137 meacutetodos
siguientes
LW3 y LW4
ZW ZCa ZCb ZE ZPa ZPb LN LCb LE XCb en los casos 1 al 4
ZN ZAa ZAb RW RN LCa LAa LAb LPa LPb XCa XAa XAb XPa XPb
ACb AE AAb y APb en los casos 0 al 4
Adicionalmente se han evaluados otros meacutetodos nuevos de menor intereacutes (ver la
seccioacuten III63) En todo caso el objetivo es seleccionar el meacutetodos oacuteptimos bajo los
criterios que se especificaraacuten
III62 Descripcioacuten del estudio a realizar y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo
Para efectuar la evaluacioacuten anterior se va a realizar un estudio del
comportamiento de cada meacutetodo en cada una de las siguientes combinaciones de
paraacutemetros (a ni ρ)
a=5 (aunque ocasionalmente tambieacuten se utilizaraacuten los valores del 1 y 10)
ρ= 001 01 02 05 08 1 125 2 5 10 y 100
ni= 40 60 y 100 con n1n2 Se excluyen los casos n1gtn2 pues las hipoacutetesis nulas H0
p2p1=ρ y 0H p1p2=1ρ son equivalentes (cualquiera de los procedimientos
descritos proporcionan igual valor del estadiacutestico bajo ambas hipoacutetesis)
Adicionalmente lo anterior significa que cuando n1=n2 debe ocurrir que los tests
para y 1 deben proporcionar los mismos valores de error real y potencia
El proceso de obtencioacuten de datos consistiraacute en lo siguiente
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 113
1 Seleccionar una combinacioacuten (a n1 n2 ρ meacutetodo a evaluar)
2 Construir la regioacuten criacutetica RC=(x1 x2)|2 2
2exp z z
3 Calcular el error real (tamantildeo) del test mediante la expresioacuten (329) y el
incremento del error real con respecto al error nominal De nuevo hay
que tener en cuenta que si 0 el test seraacute conservador (por lo que el IC
tambieacuten lo seraacute y tendraacute maacutes recubrimiento que el nominal) si 0 el test seraacute
liberal (por lo que el IC tambieacuten lo seraacute y tendraacute menos recubrimiento que el
nominal)
4 Calcular la potencia a largo plazo =(nordm de puntos de la RC)times100N siendo
N=(n1+1)times(n2+1) el nordm total de puntos del espacio muestral La conveniencia de la
misma frente a la potencia tradicional ya fue justificada en la seccioacuten II62
5 Determinar en cada caso si hay o no un ldquofallordquo es decir si ndash4 ndash2 o 1
para a=10 5 o 1 respectivamente La conveniencia de esta definicioacuten fue
resentildeada tambieacuten en la seccioacuten II62
6 Para cada meacutetodo se construiraacute una tabla (como la Tabla AIII1) que contemple los
valores individuales de Δα y asiacute como la informacioacuten de en queacute circunstancias
falla el meacutetodo
7 Por uacuteltimo para cada combinacioacuten se calcularaacute el nordm total de fallos (F) y los valores
medios de ( ) y de ( ) Estas tablas resumen seraacuten dobles unas para 01
10 y otras para =001 y =100 en conjunto La razoacuten para ello es que los
valores de Δα son mucho maacutes grandes en =001 o 100 que en los demaacutes casos
lo que puede afectar en exceso al valor medio y desvirtuar las conclusiones El
criterio seraacute entonces seleccionar y ordenar los mejores meacutetodos en el caso 01
10 y solo para ellos reordenarlos en los casos =001 o 100 (salvo excepcioacuten
especialmente remarcable)
Una vez obtenidos los resultados la seleccioacuten del meacutetodo oacuteptimo se realizaraacute bajo
los siguientes criterios
(a) Se daraacute especial importancia al caso α=5 (por ser el error nominal maacutes frecuente)
(b) Se descartaraacuten los meacutetodos con un excesivo nuacutemero de fallos (pues con demasiada
frecuencia son excesivamente liberales) mostrando preferencia por los meacutetodos con
menos fallos
114 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
(c) Entre los meacutetodos que queden se eligen los que tengan un maacutes cercano a 0 (es
decir los meacutetodos con un error medio cercano al nominal) En caso de empate se
prefieren los meacutetodos conservadores ( gt0) a los liberales ( lt0) para que asiacute
las significaciones sean fiables
(d) Entre los meacutetodos que queden se prefieren los de mayor potencia Aquiacute hay que
tener en cuenta que si un meacutetodo cualquiera A es maacutes liberal que otro meacutetodo B
entonces B A y es esperable que B A (lo que no significa que A sea
mejor meacutetodo que B)
Dado que el nuacutemero de meacutetodos es excesivo (los 150 aludidos en la seccioacuten
anterior y algunos maacutes que se han ensayado) la seleccioacuten se efectuaraacute por fases
seleccionando el mejor de cada familia de meacutetodos (es decir de cada procedimiento) y
comparando al final entre siacute todos los seleccionados
Adicionalmente la necesaria restriccioacuten de espacio que implica esta memoria
nos impide presentar los resultados de todos los meacutetodos comparados restringieacutendonos
exclusivamente a los 150 meacutetodos principales resentildeados arriba (los restantes estaacuten
disponibles para el lector que lo desee)
III63 Seleccioacuten del meacutetodo oacuteptimo de cada familia (en sus versiones sin cpc)
III631 Seleccioacuten entre los meacutetodos de tipo Z (a=5)
Una parte de la Tabla AIII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico Z (se omiten los procedimientos ZCa y ZAa pues pueden dar
lugar a varianzas negativas) Globalmente puede observarse que
Respecto del nuacutemero de fallos el hecho de sumar una cantidad hi es unas veces
positivo (ZW y ZA) otras negativo (ZN) y otras indiferente (ZC ZE y ZP) en
cuanto al nuacutemero de fallos
Los meacutetodos basados en el estimador exacto ZEx son todos ellos muy malos
especialmente el claacutesico y muy apreciado meacutetodo ZE0 Por el contrario
sorprendentemente casi todos los meacutetodos ZAx basados en el estimador
aproximado tienen un mejor comportamiento
El peor meacutetodo de todos los meacutetodos como era esperable es el claacutesico meacutetodo de
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 115
Wald (ZW0) Tambieacuten muy malos los meacutetodos ZCbx basados en el estimador
condicionado y sorprendentemente los meacutetodos maacutes complejos (ZEx)
Una parte de la Tabla AIII2 contiene el resumen de los datos de todos los
meacutetodos basados en el estadiacutestico Z Observando los resultados para la zona 01
10 puede concluirse lo siguiente
Los mejores meacutetodos (por no tener fallos) son los aparecen en las primeras
posiciones ZAb1 ZW2 a 4 ZPa0 a 4 y ZPb0 a 4
Todos los meacutetodos de tipo ZP deben descartarse por tener demasiado error y una
potencia muy baja (los ZPa2 a ZPb0 en el orden de la tabla) aunque ninguno de
ellos falla
De los cuatro meacutetodos restantes puede decirse que ZW4 gt ZAb1 gt ZW2=ZW3
Similarmente en el caso extremo (001 o 100) puede afirmarse que
Deben descartarse los meacutetodos ZW1 (por su baja potencia) y ZAb0 (por su mala
actuacioacuten para valores moderados de )
El mejor meacutetodo es el ZAb1 (pues aunque tiene un fallo -que lo es por poco- es el
menos conservador y el de mayor potencia) seguido de los meacutetodos ZW2 ZW3 y
ZW4 (que son similares entre siacute)
Con el fin de clarificar la seleccioacuten una parte la Tabla AIII3 presenta los
resultados completos para los datos de los cuatro meacutetodos seleccionados (ZAb1 ZW2
ZW3 y ZW4) para los errores del 1 y 10 y una parte de la Tabla AIII4 presenta el
resumen de los mismos De ellas junto con los resultados para el 5 se deduce que
globalmente el mejor meacutetodo es ZAb1 pero que el meacutetodo ZW4 es similar o muy poco
peor y algo maacutes faacutecil de aplicar
La conclusioacuten es que el mejor meacutetodo de entre los de tipo Z es el ZAb1 aunque
el meacutetodo ZW4 es similar o muy poco peor y algo maacutes faacutecil Es de resentildear lo curioso
del resultado el estimador A (que es una aproximacioacuten del estimador exacto E)
proporciona mejores resultados que el propio estimador exacto Asimismo puede
observarse que el claacutesico meacutetodo ZE0 (que sorprendentemente es superado por el
ZCb0) solo es vaacutelido al error del 5 para grandes muestras y para valores 02ltlt5
116 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
Adicionalmente se han evaluado diversas modificaciones de los meacutetodos
anteriores pero ninguna de ellas logra mejorar la actuacioacuten de los meacutetodos
seleccionados Las modificaciones evaluadas (con la descripcioacuten de su origen) se
describen a continuacioacuten
(1) Se ha comprobado que la propuesta de Borkowf (2006) para el caso de una
proporcioacuten -utilizando el procedimiento ZW en los valores (xi ni+1) para el
extremo inferior y (xi+1 ni+1) para el superior- no es de utilidad para el Caso R
Ahora el nuevo estadiacutestico ZW35 es el del estadiacutestico ZW con los datos
incrementados del siguiente modo
ZW35
2 1 1 2
2 1 1 2
Si 0 Utilizar 1
Si 0 Utilizar 1
p p x x
p p x x
y siempre utilizar (n1+1) y (n2+1)
El resumen de su actuacioacuten indica que aunque el meacutetodo no tiene fallos es
demasiado conservador ( =198) y tiene poca potencia ( =8058) respecto de
los meacutetodos seleccionados De ahiacute que se le haya descartado
Ademaacutes en general deben descartarse todos los meacutetodos con unos incrementos
constantes y asimeacutetricos (h1h2) pues ellos ocasionan que las inferencias acerca de
R no sean compatibles con las inferencias acerca de R1 (como le sucede a muchas
otras propuestas de la literatura)
(2) Se ha comprobado que si se desea simplificar el meacutetodo ZAb1 (que implica a tres
ecuaciones de segundo grado) por el meacutetodo ZAa1 (que implica solo a una
ecuacioacuten de segundo grado) mediante el artificio de considerar que cuando la
varianza da negativa entonces el test es siempre significativo el meacutetodo asiacute
obtenido tiene demasiados fallos y no actuacutea bien
III632 Seleccioacuten entre los meacutetodos de tipo R (a=5)
Una parte de la Tabla AIII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico R en tanto que una parte de la Tabla AIII2 contiene el
resumen de los mismos Puede observarse que todos los meacutetodos tienen muchos fallos
por lo que ninguacuten meacutetodo de tipo R es de utilidad
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 117
III633 Seleccioacuten entre los meacutetodos de tipo L (a=5)
Una parte de la Tabla AIII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico L (se omiten los procedimientos LCa y LAa pues pueden dar
lugar a una varianza negativa lo que es coherente con lo que sucediacutea en el caso del
estadiacutestico Z) en tanto que una parte de la Tabla AIII2 contiene el resumen de los
mismos De modo general puede observase que
En general todos los procedimientos mejoran cuando los datos son incrementados en
cualquier cantidad salvo en los procedimientos LPa y LPb (en los que resulta
indiferente) y LW (en el que resulta negativo)
Al contrario que en el caso del estadiacutestico Z algunos de los meacutetodos basados en el
estimador exacto (los LEx) tienen una muy buena actuacioacuten y casi todos los meacutetodos
basados en el estimador condicionado (los LCbx) son buenos en cambio todos los
meacutetodos basados en el estimador aproximado del exacto (los LAbx) son muy malos
Los claacutesicos meacutetodos LWx son todos ellos muy malos siendo LW1 el mejor de todos
Por lo que respecta a la seleccioacuten del meacutetodo oacuteptimo para 01 10 puede
concluirse lo siguiente
Casi todos los meacutetodos deben descartarse por tener muchos fallos y ser excesivamente
liberales Esto incluye a todos los meacutetodos LWx basados en el claacutesico procedimiento
LW de ellos solo es aprovechable el claacutesico meacutetodo LW1 el cual seraacute vaacutelido solo
cuando los tamantildeos de muestra son grandes (superiores a 100) y los valores de son
moderados (01ltlt10)
Los meacutetodos con 0 fallos (LE2 a 4) son conservadores siendo los mejores los
meacutetodos LE2 y LE3 (que son casi iguales entre siacute como era esperable por la
definicioacuten de ambos)
Los meacutetodos con solo 1 fallo (los LCb2 a 4) fallan por poco de modo que pueden
incluirse en la seleccioacuten
Comparativamente los mejores meacutetodos son (el siacutembolo gt indica que el meacutetodo que
hay a su izquierda es mejor que el que hay a su derecha) LE3 gt LE2=LCb4 gt
LCb2=LCb3 gt LE4 pudiendo observarse que todos ellos son meacutetodos complejos
Similarmente en el caso de extremo (001 o 100) se observa que los meacutetodos
aceptables son LCb2=LCb3=LCb4 gt LE2=LE3=LE4 Se descartan los meacutetodos LN1 y
118 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
LCb1 (por su muy mala actuacioacuten en el caso de valores moderados de ) y LE1 (por su
baja potencia)
Con el fin de clarificar la seleccioacuten una parte de la Tabla AIII3 presenta los
resultados completos para los meacutetodos seleccionados (LE2 LE3 LE4 LCb2 LCb3 y
LCb4) en los errores del 1 y 10 y una parte de la Tabla AIII4 presenta el resumen
de los mismos De ellas junto con los resultados para el error del 5 se deduce lo
siguiente
El meacutetodo oacuteptimo es el LE3 para valores moderados de y el LCb3 para valores
extremos de
Si se desea el oacuteptimo para cualquier valor de la mejor seleccioacuten es el meacutetodo LCb3
El claacutesico meacutetodo LW1 solo es vaacutelido al error del 5 para grandes muestras y para
valores moderados de (01ltlt10)
En consecuencia puede concluirse que el mejor meacutetodo de entre los de tipo L es el
LCb3 (aunque para valores moderados de lo supera el meacutetodo LE3)
Adicionalmente se han evaluado diversas modificaciones de los meacutetodos
anteriores y un meacutetodo nuevo pero ninguno de ellos logra mejorar la actuacioacuten de los
meacutetodos seleccionados Las meacutetodos analizados (con la descripcioacuten de su origen) se
describen a continuacioacuten
(1) Price and Bonett (2008) propusieron un meacutetodo de tipo LW consistente en antildeadir
025 a las xi y 15 a las yi Seguacuten nuestros resultados el meacutetodo tiene muchos fallos
(concentrados en los valores extremos de ) Por otro lado Walter (1975) propuso
otro meacutetodo de tipo LW consistente en antildeadir 05 a las xi y 0 a las yi Nuestros
resultados indican que el meacutetodo tiene muchos fallos en muy diversos valores de
De modo general la asignacioacuten de diferentes incrementos a los eacutexitos y a los
fracasos hace que los intervalos para R y R1 no sean compatibles lo que es una
razoacuten maacutes para que dichos meacutetodos se descarten
(2) Zou amp Donner (2008) propusieron el procedimiento LZ que proporciona las
expresiones (321a) y (321b) lo que da lugar a 5 nuevos meacutetodos LZx Nuestros
datos indican que en general los meacutetodos LNx propuestos en esta memoria
proporcionan mejores resultados que los meacutetodos LZx Por ejemplo para valores
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 119
moderados o extremos de los tres mejores meacutetodos son siempre de tipo LN Esto
junto a que el procedimiento LN es expresable en el formato general utilizado en
esta memoria (pero no el LZ) ha hecho que sea el primero el que se haya incluido
en la misma
III634 Seleccioacuten entre los meacutetodos de tipo X (a=5)
Una parte de la Tabla AIII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico X (los meacutetodos XCa XAa y XPa se eliminan del anaacutelisis pues
en ocasiones proporcionan una varianza negativa) en tanto que una parte de la Tabla
AIII2 contiene el resumen de los mismos Puede observarse que todos los meacutetodos
presentan un mal comportamiento
III635 Seleccioacuten entre los meacutetodos de tipo A (a=5)
Una parte de la Tabla AIII1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico A en tanto que una parte de la Tabla AIII2 contiene el
resumen de los mismos Se excluyen todas las versiones ldquoardquo (los procedimientos ACa
AAa y APa) pues en ocasiones producen estimaciones de las pi menores que 0 o
mayores que 1 (lo que no permite aplicar el meacutetodo arco seno) Ahora surge la novedad
de que en la transformacioacuten arco seno es frecuente incrementar los datos en hi=38
(transformacioacuten de Ascombe) lo que llamaremos Caso 15 (por encontrarse a mitad de
camino entre los Casos 1 y 2) Esto hace que ahora aparezcan los meacutetodos especiales
ACb15 AE15 APb15 y AAb15 Se observa que los uacutenicos meacutetodos de intereacutes son
los AEx (que es precisamente en los uacutenicos donde es positivo el efecto de sumar una
determinada cantidad a los datos) y que de ellos los mejores son los meacutetodos AE1 y
AE15 (no tienen fallos y tienen una buena potencia) que siempre son conservadores en
promedio
Con el fin de clarificar la seleccioacuten una parte de la Tabla AIII3 presenta los
resultados de los dos meacutetodos (AE1 y AE15) para los errores del 1 y 10 y una
parte de la Tabla AIII4 presenta el resumen de los mismos De ellas junto con los
resultados al error del 5 se deduce que ambos meacutetodos son similares pero que para
los valores moderados (grandes) es algo mejor el meacutetodo AE15 (AE1) siendo este
120 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
uacuteltimo el mejor en general La conclusioacuten es por tanto que el mejor meacutetodo de entre los
de tipo A es el AE1 (aunque para valores moderados de lo supera el meacutetodo AE15)
Adicionalmente se ha evaluado una modificacioacuten del meacutetodo de Anscombe
consistente en aplicar el meacutetodo AE15 con una varianza de 1(4ni+2) para cada
proporcioacuten pi en lugar de la varianza 1[4(ni+34)] asumida aquiacute pero ello no logra
mejorar la actuacioacuten de los meacutetodos seleccionados
III64 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los mejores de cada familia
(α=1 5 y 10) caso general y caso particular de grandes muestras
La Tabla AIII5 repite el resumen de los resultados para los seis meacutetodos
seleccionados en la seccioacuten anterior (ZAb1 ZW4 LE3 LCb3 AE1 y AE15) a fin de
hacer maacutes faacutecil al lector la comparacioacuten de los mismos (los datos completos se
encuentran en las Tablas AIII1 y AIII3) Se observa que
Los meacutetodos de tipo L deben descartarse por ser menos potentes que el resto
El meacutetodo oacuteptimo en general es el ZAb1 (con la ventaja antildeadida de ser sencillo de
aplicar) aunque para valores moderados de el meacutetodo ZW4 es casi igual o un
poco peor y auacuten maacutes sencillo (para los valores grandes de las demaacutes alternativas
son maacutes complicadas y el meacutetodo ZW4 es bastante peor)
Adicionalmente la Tabla AIII6 presenta el resumen de los datos de todos los
meacutetodos con dos o menos fallos (que son los que tienen intereacutes) para el caso de grandes
muestras (n1=n2=100) y error α=5 (pues puede observarse que los desequilibrios
muestrales en grandes muestras no producen fuertes discrepancias) De ella se deduce
que aunque ahora los meacutetodos ZW2 a 3 y ZAb1 a 3 actuacutean bien en las dos gamas de
se mantienen de modo general las conclusiones anteriores (aunque ahora ZAb3 es muy
ligeramente superior a ZAb1)
De lo anterior se deduce que los meacutetodos oacuteptimos (que son siempre alguno de
los propuestos en esta memoria) son
En general el meacutetodo ZAb1 (aunque el meacutetodo ZW4 es una buena y maacutes sencilla
alternativa especialmente cuando es moderado)
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 121
En grandes muestras (n200) el meacutetodo ZAb3 (muy ligeramente superior al
ZAb1)
III65 Seleccioacuten del meacutetodo oacuteptimo consin cpc de entre los dos meacutetodos oacuteptimos
seleccionados (α=5)
Con el fin de ver si la aplicacioacuten de una cpc mejora los resultados de los dos
meacutetodos seleccionados en la seccioacuten anterior (los ZAb1 y ZW4) la Tabla AIII7
presenta el resumen de los mismos en sus dos versiones sin y con cpc (meacutetodos ZAb1
ZW4 ZAb1c y ZW4c) al 1 5 y 10 De ella se deduce que en ninguno de los casos
la cpc mejora la actuacioacuten del meacutetodo por lo que se mantienen las conclusiones de la
seccioacuten anterior
III66 Verificacioacuten de los resultados de la literatura
La literatura ha analizado algunos de los meacutetodos descritos anteriormente y
establecido conclusiones acerca de su comportamiento absoluto o relativo a otros
meacutetodos Aquiacute se trata de ratificarlas o criticarlas en base a nuestros datos (algunas
conclusiones aparecen ya mencionadas en la seccioacuten III42) Con tal fin aludiremos a la
Tabla AIII8 que resumen los resultados de los meacutetodos implicados De esta uacuteltima se
deduce que todos los meacutetodos son muy malos (pues tienen muchos fallos) y
excesivamente liberales por lo que nunca deben utilizarse Comparativamente entre
ellos (y sin tener en cuenta su nuacutemero de fallos puesto que siempre es elevado) la
conclusioacuten es
Si es moderado ZCb0 gt ZE0 gt LW1 gt LW0 gt ZW0
Si es grande LW0 gt ZC0 ZE0 gt LW1 gt ZW0
Las principales conclusiones de la literatura son las que siguen las cuales se
comentan si no se deducen directamente de las conclusiones especificadas arriba
ndash Katz et al (1978) afirman que el meacutetodo LW0 es mejor que el meacutetodo ZW0 el cual
es erraacutetico y no debe utilizarse cosa que se confirma seguacuten nuestros resultados
122 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
ndash Tanto Price amp Bonnett (2008) como Koopman (1984) indican que el meacutetodo ZE0
es mejor que el LW0 nuestros resultados indican que esto es cierto para el caso de
moderado pero para grande sucede al contrario
ndash Seguacuten Farrington amp Manning (1990) el meacutetodo ZE0 es mejor que el ZCb0 que a
su vez es mejor que el ZW0 Nuestros datos son conformes con la afirmacioacuten de
que ZE0 es mejor que ZW0 pero el meacutetodo ZCb0 actuacutea mejor que el ZE0 en los
valores moderados de
III67 Seleccioacuten del meacutetodo oacuteptimo para el caso claacutesico =1 (test claacutesico de
homogeneidad de dos proporciones independientes)
Un asunto complementario es el caso del test para =1 es decir el claacutesico test de
homogeneidad de dos proporciones independientes (H0 R=1 equiv H0 p2=p1) Como el
caso actual de =1 es el mismo caso que el de =0 ya analizado en el Caso d las
conclusiones de entonces solo pueden mejorarse por causa de los nuevos estadiacutesticos L
y R que no se utilizaron en el Caso d En este caso particular los meacutetodos de estimacioacuten
Ca Cb Aa Ab y E proporcionan igual valor para las estimaciones de las pi por lo que
todos los procedimientos L que provocan deben ser el mismo Esto quiere decir que
ahora se verifican las siguientes igualdades entre procedimientos LCa = LCb = LAa =
LAb = LE de donde se deduce que basta con que contemplemos los procedimientos LE
(en sus cinco versiones) como representantes de los anteriores A ellos hay que antildeadirle
los procedimientos extras LW LN LP RW y RN
La Tabla AIII9 contiene el resumen de los datos para todos los nuevos meacutetodos
incorporados por el caso =1 respecto de los del caso =0 los cuales han sido extraiacutedos
de los datos originales de la Tabla AIII1 De tales datos se deduce que los uacutenicos
meacutetodos de intereacutes son los LW1 y LE2 (por ese orden) que no mejoran claramente la
seleccioacuten realizada en el caso =0 (los ZE0c y AE1c) especialmente por cuanto LW1
no verifica las propiedades de convexidad
III7 CONCLUSIONES FINALES Y EJEMPLOS
III71 Meacutetodo oacuteptimo
Por todo lo resentildeado en las secciones anteriores pueden concluirse que todos los
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 123
meacutetodos claacutesicos de la literatura funcionan muy mal siendo los meacutetodos oacuteptimos los
resentildeados en el cuadro de abajo Obseacutervese que todos los meacutetodos seleccionados son
nuevas aportaciones de esta memoria
SELECCIOacuteN DEL MEJOR MEacuteTODO PARA EL CASO DEL COCIENTE
ZAb1 es el mejor meacutetodo
Alternativamente puede emplearse el meacutetodo ZW4 pues siendo solo un poco peor
que el ZAb1 es maacutes sencillo y funciona bien para valores moderados de
Comentarios sobre los meacutetodos claacutesicos
El meacutetodo LW1 es vaacutelido para grandes muestras =5 y 01ltlt10 (pero es
incoherente por no ser convexo en 1p )
El meacutetodo ZE0 es vaacutelido para grandes muestras =5 y 02ltlt5
III72 Foacutermulas aconsejadas para realizar inferencia
III721 Meacutetodo oacuteptimo en general ZAb1
1) Incrementar todos los datos de ambos grupos (los eacutexitos y los fracasos) en 05
2) El estadiacutestico de contraste viene dado por la expresioacuten
2
1 2 2 1 2 2
1 12 1 1 2 2 1
2
2 2 12 2
1
2
1 2 1 2
1
si
si
si 1
ZAb
nn n p p x n x
n x xx x n x n x
n p p xz
n x
n p p n x
x
(344)
3) Si el objetivo es obtener el IC calcular las dos soluciones de la ecuacioacuten
2 2 2 21 2 1 2 2 1 1 2 2 1 1 2 2 1 2 2 1 2 2 1 22 2 0 x nn p z n x nx x z n x n x x x x nn p z n x
o alternativa y equivalentemente obtener los valores (I S) de
124 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
222 2 2 2 1 12
1 2 1 1 2 2 1 2 2 1 2 1 1 2
21 2 1 2 2 1
22 2
z n x n xznx x n x n x x x z n x x a np p
x nn p z n x
(345a)
Si las soluciones obtenidas verifican que 2 1 2 1 I Sx n x n x x el
problema finaliza En otro caso puede que falle uno o dos de los extremos Si el
extremo que falla es I obtener la menor de las dos soluciones de la ecuacioacuten
2 2 2 2 22 1 2 2 1 2 2 2 22 0 n p z n p p z n p
o alternativa y equivalentemente obtener el valor
2 2
2 22 1 2 2 1 22 2
2 1 2
1
2 4
I
z zx p z x p p
n p z
(345b)
Si el extremo que falla es S obtener la mayor de las dos soluciones de la ecuacioacuten
2 2 2 2 21 1 1 1 2 2 1 2 22 0 n p n p p z n p z
o alternativa y equivalentemente obtener el valor
2 2
2 21 2 2 1 2 12
1 1
1
2 4
S
z zx p z x p p
n p
(345c)
III722 Meacutetodo maacutes sencillo casi tan bueno como el anterior (especialmente para
valores moderados de ) ZW4
1) Incrementar todos los datos (los eacutexitos xi y los fracasos yi) en 22 4z si 0ltxiltni (i)
o en otro caso incrementarlos en
21 22
1 21 2
21 22
1 21 2
1 si 0 1 si 11 2con si
0 si 0 0 si 14
1 si 1 1 si 01 2con si
0 si 1 0 si 04
i
i
i
p pz I I I R
p ph
p pz S S S R
p p
2) El intervalo y el estadiacutestico de contraste vienen dados respectivamente por las
expresiones siguientes aplicadas a los datos incrementados anteriores
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 125
21 2 1 2
2 1 1 1 2 2 1 1 2 22
1 1
11
y y y yRR z z
y n x n x n x n xzn x
2
2 124
2 1 1 2 2
1 2
ZW
p pz
p q p q
n n
(346)
III723 Mejor meacutetodo claacutesico vaacutelido para n1+n2200 =5 y 01ltlt10 LW1
1) Incrementar todos los datos de ambos grupos (los eacutexitos y los fracasos) en 05
2) El estadiacutestico de contraste y el IC vienen dados por la expresiones
2 2
2
1 2
1 1 2 2 1 2 1 2
1 1LW
ln R ln R z
q q nn p n p x x n n
y 1 2
21 1 2 2
y yR R exp z
n x n x
(347)
III73 Ejemplos praacutecticos
III731 Evaluacioacuten de una vacuna
Maxwell (1961) estudia el riesgo relativo acerca de la presencia de una infeccioacuten
viacuterica entre dos grupos de personas inoculando el virus a uno de los grupos pero no al
otro En el grupo en el que no se inoculoacute el virus tuvieron la infeccioacuten 48 de 102
individuos en tanto que en el grupo en el que siacute se inoculoacute tuvieron la infeccioacuten 11 de
46 individuos Los datos son los de la Tabla III3 La estimacioacuten muestral de R es
R =(48102)(1146)=197 pero el objetivo es obtener un IC al 95 para el verdadero
paraacutemetro poblacional R
Tabla III3
Presencia (SIacute) o ausencia (NO) de una infeccioacuten viacuterica en dos grupos
independientes
Infeccioacuten viacuterica SIacute NO Total
Virus
Inoculado
SIacute 11 35 46
NO 48 54 102
Total 59 89 148
Aplicando el meacutetodo oacuteptimo ZAb1 a los datos de Maxwell (x2=48 n2=102
x1=11 y n1=46) lo primero es reconvertir los mismos en x2=485 n2=103 x1=115 y
n1=47 La expresioacuten (345a) indica que R(11659 35082) un IC de longitud l(ZAb1)
126 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
= 23423 El intervalo es correcto pues 485(150115) = 03502 11659 35082
(150485)115 = 88261
Alternativamente puede emplearse el meacutetodo ZW4 Como 0ltxiltni los datos deben
incrementarse en 19624=096 y la expresioacuten (346) debe aplicarse a los datos
x2n2=489610392 y x1n1=11964792 Esto proporciona el IC R(11887 37853) de
longitud l(ZW4)=25966 que como era de esperar (pues el meacutetodo ZW4 suele tener
menos puntos en la RC que el ZAb1) es superior a l(ZAb1)=23423
Si se aplica el claacutesico y poco fiable meacutetodo ZE0 de las marcas se obtiene el IC
R(11768 34976) de longitud l(ZE0)=23208 inferior a las dos anteriores Esta
ventaja es tan solo aparente pues como se ha dicho el meacutetodo de las marcas es
excesivamente liberal El tambieacuten claacutesico meacutetodo LW1 de la expresioacuten (349) que es
auacuten maacutes liberal que el ZE0 y que como eacutel no es fiable para menos de 200 datos (como
aquiacute) proporciona un IC tambieacuten maacutes estrecho R(11187 33104) de longitud l(LW1)
= 21917
Finalmente el meacutetodo exacto basado en el orden ZE0 (Agresti and Min 2001)
proporciona el intervalo R(11705 36164) de longitud l(exacto)=24459 Como se ve
el meacutetodo aproximado seleccionado en este artiacuteculo (el ZAb1) es el que maacutes se acerca a
los valores exactos
Tabla III4
Resultado de un test diagnoacutestico frente la presencia o ausencia de la enfermedad
Test
+ (T) ndash (T ) Total
Enfermedad SI (E) x1 y1 n1
NO ( E ) x2 y2 n2
Total a1 a2 n
III732 Evaluacioacuten de un meacutetodo de diagnoacutestico binario
En el aacutembito meacutedico es muy frecuente la necesidad de evaluar la eficacia de un
test diagnoacutestico binario La Tabla III4 presenta el formato habitual para la evaluacioacuten
de un test diagnoacutestico donde SIacuteNO alude a la presencia o ausencia real de la
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 127
enfermedad y +ndash alude al resultado positivo o negativo del test mediante el cual se
pretende detectar dicha enfermedad (el resto de valores son anaacutelogos a lo explicado en
la Tabla III1)
Para evaluar la calidad del test diagnoacutestico suelen utilizarse diversos paraacutemetros
Si no se tiene en cuenta la prevalencia p de la enfermedad (proporcioacuten de enfermos en la
poblacioacuten) los investigadores suelen fijarse en los paraacutemetros ldquosensibilidadrdquo (SN =
proporcioacuten de enfermos diagnosticado positivamente) y ldquoespecificidadrdquo (EP =
proporcioacuten de sanos diagnosticados negativamente) En base a los datos de la Tabla
III4 las estimaciones muestrales para dichas medidas vendraacuten dados por 1 1SN x n
(es decir 1p ) y 2 2EP y n (es decir 2q ) en tanto que los IC para las mismas se
obtienen mediante las foacutermulas claacutesicas del IC para una proporcioacuten (ver el Capiacutetulo V)
A fin de poner en relacioacuten ambas cosas suelen utilizarse los paraacutemetros RVP =
SN(1EP) y RVN = (1SN)EP o razones de verosimilitud del positivo y del negativo
respectivamente Las estimaciones muestrales de ambas medidas se obtienen
sustituyendo SN y EP por los estimadores indicados arriba Obseacutervese que los
paraacutemetros RVP y RVN son en realidad dos riesgos relativos -p1p2 y q1q2
respectivamente en la notacioacuten de este capiacutetulo- por lo que el IC para los mismos se
obtiene por los meacutetodos actuales
Cuando se tiene en cuenta la prevalencia p de la enfermedad los investigadores
suelen fijarse en los paraacutemetros ldquovalor predictivo positivordquo (VPP = proporcioacuten de
enfermos de entre los diagnosticados positivamente) y ldquovalor predictivo negativordquo (VPN
= proporcioacuten de sanos de entre los diagnosticados negativamente) cuyos valores se
relacionan con los de SN y EP a traveacutes del Teorema de Bayes
11
11 1
p SN pVPP
p SN p EP p
con
1 1EP
SN RVP (348)
11
11 1 1
p EP pVPN
p EP p SN p
con 1 SN
RVNEP
(349)
Las estimaciones muestrales de ambas medidas se obtienen sustituyendo SN y EP por
los estimadores indicados en el paacuterrafo anterior Para obtener un IC para VPP o VPN
basta obtener un IC para o rsquo respectivamente e invertir las expresiones (348) y
128 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
(349) Como en la notacioacuten actual =p2p1 y rsquo=q1q2 entonces los IC para y rsquo son
en realidad un IC para un riesgo relativo (lo que de nuevo cae dentro del objetivo del
capiacutetulo actual)
Mercaldo et al (2007) aluden a un estudio de Li et al para diagnosticar el
Alzheimer en base a la presencia (diagnoacutestico positivo) o ausencia (diagnoacutestico
negativo) del alelo ApoEe4 La clasificacioacuten de un grupo de 418 enfermos y otro de
375 en base a este criterio se presenta en la Tabla III5 El objetivo es evaluar la calidad
del meacutetodo de diagnoacutestico teniendo en cuenta o no la prevalencia de la enfermedad lo
que implica estimar los paraacutemetros VPP y VPN o los paraacutemetros y rsquo En lo que
sigue ejemplificamos el caso de (al que llamaremos R por coherencia con el resto del
capiacutetulo)
Tabla III5
Datos del ejemplo de Li et al
Resultado del test
+ ndash Total
Resultado del estaacutendar
+ 240 178 418
ndash 87 288 375
Total 327 466 793
La estimacioacuten muestral de R es R =(87375) (240418) = 04041 pero el
objetivo es obtener su IC Aplicando el meacutetodo ZAb1 los datos reconvertidos seraacuten
x2=875 n2=376 x1=2405 y n1=419 Aplicando la expresioacuten (345a) se obtiene que el
IC es R(03291 04928) de longitud l(ZAb1) = 01637 El intervalo es correcto pues
875(7952405) = 01578 03291 04928 (795875)2405 = 29418
Alternativamente puede emplearse el meacutetodo ZW4 Como 0ltxiltni los datos
deben incrementarse en 19624=096 y la expresioacuten (346) debe aplicarse a las dos
muestras x2n2=879637692 y x1n1=2409641992 Esto proporciona el IC R(03275
04914) de longitud l(ZW4)=01639 que como era de esperar (pues el meacutetodo ZW4
suele tener menos puntos en la RC que el ZAb1) es superior a l(ZAb1)=01637 (solo
ligeramente pues el tamantildeo muestral es muy grande)
CAPIacuteTULO III K=2 EN EL CASO DEL COCIENTE 129
Si se aplica el claacutesico y poco fiable meacutetodo ZE0 de las marcas se obtiene el IC
R(03293 04925) de longitud l(ZE0)=01632 algo inferior a las dos anteriores Esta
ventaja es tan solo aparente pues como se ha dicho el meacutetodo de las marcas es
excesivamente liberal El tambieacuten claacutesico meacutetodo LW1 de la expresioacuten (347) que es
maacutes fiable que el ZE0 en la situacioacuten actual de muchos datos y valores moderados de
proporciona el IC R(03315 04958) de longitud l(LW1) =01643 ligeramente
superior
CAPIacuteTULO IV
K=2 EN EL RESTO DE LOS CASOS
IV1 INTRODUCCIOacuteN
En los uacuteltimos antildeos la literatura ha mostrado gran intereacutes acerca de las
inferencias asintoacuteticas sobre una combinacioacuten lineal L=ipi de K proporciones
binomiales independientes pi (Tebbs amp Roths 2008) a cuyo fin lo maacutes habitual es
tomar muestras independientes de las poblaciones objetivo En realidad este intereacutes
alude al caso general para Kgt2 (desarrollado en el capiacutetulo I) aunque puede seguirse un
razonamiento similar para el caso general de solo dos proporciones Para K=2 el
paraacutemetro de intereacutes seraacute la combinacioacuten lineal L=1p1+2p2 lo que engloba los casos
claacutesicos de la diferencia (d) y del cociente (R) de dos proporciones ya comentadas en los
dos capiacutetulos anteriores Como es tradicional la Tabla VI1 ilustra la presentacioacuten de
los datos (un caso particular de la Tabla I1) la cual se comenta de momento El
objetivo actual es pues la realizacioacuten de un test de dos colas sobre L (H0 L=λ vs H1
Lneλ) o la obtencioacuten de un IC de dos colas para L
Tabla IV1
Tabla 2times2 para muestras independientes
Muestras SIacute NO Total Coeficientes
1 x1 y1 n1 β1
2 x2 y2 n2 β2
Total a1 a2 n
La Tabla IV1 presenta los datos obtenido en este tipo de estudios en donde de
nuevo SIacuteNO alude a la presencia o ausencia de la caracteriacutestica que se estudia ix ( iy )
es el nordm de individuos de entre los in (tamantildeo de muestra) que siacute (no) presentan la
caracteriacutestica βi son los coeficientes de la combinacioacuten lineal (que habitualmente son
132 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
conocidos y distintos de 0) 1a =xi ( 2a =yi) es el total de individuos que siacute (no)
presentan la caracteriacutestica y finalmente n =ai=ni es el tamantildeo total de la experiencia
Las dos variables aleatorias (xi) siguen distribuciones binomiales independientes
( )i i ix B n p con 12i en donde ip es la proporcioacuten (desconocida) de
individuos de la poblacioacuten i que presentan la caracteriacutestica en estudio
Como se ha mencionado a lo largo de esta memoria son habituales las
inferencias para K=2 con β1=ndash1 y β2=+1 (diferencia de proporciones) y con β1=ndashρ
β2=+1 y λ=0 (cociente de proporciones) desarrolladas en los capiacutetulos II y III
respectivamente En los siguientes apartados nos centraremos en el resto de casos K=2
los cuales han recibido escasa atencioacuten usualmente centrada en el caso β1lt0 (Phillips
2003 Martiacuten amp Herranz 2010)
Este capiacutetulo tiene como finalidad proponer nuevos meacutetodos asintoacuteticos y
compararlos con los meacutetodos propuestos en la literatura seleccionando el meacutetodo
oacuteptimo para realizar inferencias en los casos menos estudiados de K=2
IV2 NOTACIOacuteN
IV21 Generalidades y estadiacutestico base
Sean dos variables aleatorias binomiales independientes xi~B(ni pi) con i=1 y 2
y sea L=1p1+2p2 el paraacutemetro de intereacutes (con las proporciones pi desconocidas y los
paraacutemetros βi usualmente conocidos y distintos de 0) Sea i iL p la estimacioacuten
muestral del paraacutemetro poblacional L con ip =xini las proporciones muestrales Como
se comentoacute en la seccioacuten I21 el estadiacutestico L sigue una distribucioacuten normal de media
i ip y varianza 2 i i i ip q n en donde qi=1ndashpi Para contrastar H0 L= vs H1 L
(teniendo en cuenta que Bndash=0i
i
le λ le0i
i
= B+ con B= B B =sumβi) hay que
comparar del modo claacutesico el valor experimental del estadiacutestico (que en adelante seraacute
aludido abreviadamente por el nombre en negrita que se indica)
Z 2
22Zi i i i
Lz
p q n
(41)
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 133
con 22z (en donde z2 es el percentil (1ndashα2)100 de la distribucioacuten normal tiacutepica)
Para obtener el IC (1ndashα) para L se invierte el test despejando λ en la ecuacioacuten 2 22Z z z
En unas ocasiones la solucioacuten seraacute expliacutecita (maacutes o menos sencilla) en otras requeriraacute
de un procedimiento iterativo
IV22 Estimadores de las proporciones pi
Las expresiones anteriores no tienen utilidad hasta que las proporciones pi
desconocidas sean sustituidas por una estimacioacuten de las mismas En lo que sigue se
describen tales estimadores y se pone en mayuacutescula y negrita la letra abreviada que
designaraacute el procedimiento que cada uno de ellos proporciona (letra que habraacute que
antildeadir a la letra Z alusivo al uacutenico estadiacutestico propuesto)
IV221 Estimadores no restringidos por H0
El estimador maacutes simple y conocido a la hora de sustituir las proporciones pi
desconocidas es el estimador claacutesico de maacutexima verosimilitud simple (es decir las
proporciones muestrales)
W (Wald) i i ip x n (42)
Otra opcioacuten maacutes complicada y novedosa (Newcombe 1998 a) consiste en
sustituir las proporciones desconocidas por el extremo apropiado del IC de Wilson
(1927)
N (Newcombe-Zou) (si 0) (si 0) si
(si 0) (si 0) si i i i i
ii i i i
u l Lp
l u L
(43)
con
2 22 2
2
22
2 4 i i
i i
ii
z z x yx z
nl
n z
y
2 22 2
2
22
2 4 i i
i i
ii
z z x yx z
nu
n z
(44)
siendo (li ui) el IC de dos colas al 100middot(1ndashα) para la proporcioacuten pi
134 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
IV222 Estimadores siacute restringidos por H0
El estimador de pi restringido por H0 maacutes habitual (por su sencillez) es el
obtenido por el meacutetodo de tipo condicionado de Dunnett amp Gent (1977)
C (Condicionado) 2 1 21
1 2 2 1
a np
n n
y 2 1 1
21 2 2 1
a np
n n
(45)
Como puede suceder que el valor de ip no esteacute comprendido entre 0 y 1 parece
conveniente exigir que cumpla esta condicioacuten de ahiacute que el estimador ip tengan dos
versiones
Ca ip = (45)
Cb ip = (45) restringida a estar entre 0 y 1 ( ip =0 si ip lt0 y ip =1 si ip gt1)
Una opcioacuten maacutes complicada consiste utilizar los estimadores de maacutexima
verosimilitud ip bajo H0 (Martiacuten amp Herranz 2010) dados por
E (Incondicionado exacto) 0 51 2 32 3p c B cos c y 2 1ˆ ˆp p (46)
con α=λβ2 y β= ndashβ1β2 en donde 0 1 1c x 1 1 1 2 11 2c a n n x
2 1 1 2 2 1c n n n x n x c3=nβ2 B= 22c ndash3c1c3 A=45c3(c1c2ndash3c0c3)ndash
32c
y 1 3 2 3cos A B
Un modo de simplificar lo anterior es a traveacutes de los siguientes estimadores
incondicionados aproximados
A (Incondicionado Aproximado)
1 1 2 2 21
1
x x np
n
y 1 1 2 2 1
22
x x np
n
(47)
Al igual que en el caso de los estimadores de tipo condicionado parece conveniente
exigir que ip
sea un valor liacutecito (es decir que esteacute comprendido entre 0 y 1) de ahiacute que
los estimadores ip
tengan dos versiones
Aa ip
= (47)
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 135
Ab ip
= (47) restringidos a estar entre 0 y 1 ( ip
=0 si ip
lt0 y ip
=1 si ip
gt1)
Otro tipo de estimadores son los obtenidos por el meacutetodo de Peskun (1993)
P (Incondicionado tipo Peskun)
2 1 1 2 11
1
2
2
n n np
n
y 2 1 1 2 1
22
2
2
n n np
n
(48)
aunque como en el caso de los estimadores de tipo condicionado e incondicionado
aproximado parece conveniente exigir que ip
sea un valor liacutecito de ahiacute que los
estimadores ip
tenga tambieacuten dos versiones
Pa ip
= (48)
Pb ip
= (48) restringidos a estar entre 0 y 1 ( ip
=0 si ip
lt0 y ip
=1 si ip
gt1)
IV23 Procedimientos de inferencia que se obtienen con cada estimador
Cuando en el estadiacutestico Z de la expresioacuten (41) se sustituye cada uno de
los 9 estimadores aludidos en la seccioacuten anterior se obtienen los 9 estadiacutesticos 2ZWz
2ZNz 2
ZCaz 2ZCbz 2
ZEz 2ZAaz 2
ZAbz 2ZPaz y 2
ZPbz cada uno de los cuales dan lugar a un
procedimiento de test diferente Al invertir el mismo se obtiene un procedimiento de IC
diferente En ambos casos se obtienen los siguientes 9 procedimientos iniciales ZW
ZN ZCa ZCb ZE ZAa ZAb ZPa o ZPb Obseacutervese que cada procedimiento se inicia
con la letra Z lo que es innecesario dado que solo se propone un estadiacutestico (el Z) sin
embargo se ha preferido hacerlo asiacute por homogeneidad con el resto de los capiacutetulos Sin
embargo por las razones que se sentildealan maacutes tarde (seccioacuten IV414) los
procedimientos ZCa y ZCb deben excluirse por lo que en este capiacutetulo solo se
analizaraacuten 7 procedimientos (los ZW ZN ZE ZAa ZAb ZPa o ZPb)
IV24 Datos muestrales a utilizar y meacutetodos de inferencia que proporcionan
Las foacutermulas anteriores pueden utilizarse en base a los datos originales (xi yi) o
en base a los datos incrementados en una cantidad determinada hi es decir en base a
(xi+hi yi+hi ni+2hi) Este incremento como se comentoacute en el Capiacutetulo I tiene su origen
136 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
en los meacutetodos ldquoadjustedrdquo Wald cuyo objetivo no es otro que el de mejorar el
comportamiento del procedimiento ZW Los valores posibles de hi se denotan con el
diacutegito (en negrita) que los identificaraacute (el cual se antildeadiraacute a las letras de los
procedimientos descritos arriba)
0 hi=0 (claacutesico)
1 hi=05 (Woolf)
2 hi=1 (Dann amp Koch)
3 hi=2
2z 4
4
22
22
1 si 1 21 2 con si
4 0 en otro caso 1 si 0 en donde
1 si 01 si 1 21 2 con si
4 0 en otro caso
i iii
ii i
ii iii
p sz II L
h sp sz S
S L
Cada uno de los 5 incrementos anteriores (0 1 2 3 y 4) puede aplicarse a cada
uno de los 7 procedimientos de la seccioacuten anterior (ZW ZN ZE ZAa ZAb ZPa o
ZPb) dando lugar asiacute a 35 meacutetodos de inferencia distintos En lo que sigue ellos seraacuten
notados por la letra del procedimiento y el diacutegito del incremento correspondiente ZW0
ZW1 ZW2 ZW3 ZW4 ZPb4
IV3 RESULTADOS DE LA LITERATURA
IV31 Resultados de tipo teoacuterico
IV311 Meacutetodo claacutesico de Wald
El meacutetodo de inferencia al que maacutes se recurre por su sencillez consiste en
sustituir los valores desconocidos pi por las proporciones muestrales (estimadores de
maacutexima verosimilitud simple no restringidos a H0 L=) dadas por la expresioacuten (42) lo
que da lugar al procedimiento ZW (el claacutesico procedimiento de Wald) Para K=2 este
meacutetodo fue propuesto por Phillips (2003) el cual lo obtuvo como una generalizacioacuten
del Caso d asumiendo que el paraacutemetro δ es una funcioacuten lineal de p1 Bajo esta
perspectiva el estadiacutestico de contraste y el IC que se obtiene por inversioacuten del mismo
tienen las expresiones siguientes
ZW 2
22ZWi i i i
Lz
p q n
(49)
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 137
ICZW 22 i i i iL L z p q n (410)
Phillips (2003) menciona la posibilidad (sin entrar a valorar la opcioacuten) de que existan
aproximaciones que mejoren el comportamiento de ZW como la propuesta de Agresti
amp Coull (2000) de incrementar los datos en hi=1 (realizada para el Caso d)
IV312 Meacutetodo incondicionado exacto
Desde el punto de vista incondicionado Martiacuten amp Herranz (2010) proponen el
estimador de maacutexima verosimilitud bajo H0 sin condicionar en los marginales Tales
autores obtuvieron los valores expliacutecitos de ip dados por la expresioacuten (46) que a su
vez contiene como caso particular a los estimadores de Miettinen amp Nurminen (1985)
para el caso de la diferencia d y a los de Koopman (1984) para el caso del cociente R
Por tanto el estadiacutestico de contraste para el procedimiento ZE seraacute de la forma
ZE 2
22ZEi i i i
Lz
ˆ ˆp q n
(411)
y el IC se obtiene resolviendo en λ por meacutetodos iterativos la ecuacioacuten 2 22ZE z z
IV313 Meacutetodo incondicionado Peskun
Para el Caso d Peskun (1993) empleoacute el criterio de Sterne (1954) al indicar que el
estadiacutestico 2Zz seraacute significativo cuando lo sea para cualquier valor de p1 Martiacuten amp
Herranz (2010) emplearon el mismo criterio para el caso general de K=2 determinando
que el estimador ip
viene dado por la expresioacuten (48) El estadiacutestico e IC del
procedimiento ZPa (sin tener en cuenta si los valores de ip
son liacutecitos) seraacute de la forma
ZPa
2
222
4
2ZPa
i
i
Lz
B
n n
(412)
ICZPa 2
2 2 22 2 2
22
2
2 2 i
i
B LB z z n znL L
n z n n n n
(413)
138 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
En el caso de obligar a que el estimador ip
tome un valor liacutecito (es decir a que verifique
0le iple1) habraacute que tener en cuenta que ip
=0 si ip
lt0 y que ip
=1 si ip
gt1 obteniendo
asiacute el procedimiento ZPb
IV314 Propiedades a verificar por cualquier estadiacutestico de contraste
Para que un estadiacutestico z2 sea uacutetil en la inferencia es preciso que verifique ciertas
propiedades de coherencia Como se ha comentado en capiacutetulos anteriores es necesario
que las regiones criacuteticas no presenten huecos (convexidad espacial) por lo que la
ausencia de estos en la misma implica que z2 debe ser creciente (decreciente) en ip si
0i ( 0i ) Por otro lado por el principio de Sterne (1954) para que z2 sea liacutecito es
preciso que alcance su valor miacutenimo en la frontera del espacio nulo es decir que sea
decreciente con λ y creciente en i (convexidad parameacutetrica) Martiacuten amp Herranz (2010)
demuestran que los estadiacutesticos 2ZWz 2
ZEz y 2ZPa bz verifican todas estas propiedades de
convexidad
IV32 Resultados de tipo praacutectico
Como se ha indicado anteriormente la literatura ha prestado muy escasa atencioacuten al
caso de K=2 (y siempre limitadas al caso de 1lt0) En particular
1) Phillips (2003) indica que el meacutetodo ZW0 aplicado como test de una cola
funciona razonablemente bien puesto que el tamantildeo real del test es cercano al
nominal
2) Martiacuten amp Herranz (2010) basaacutendose en las conclusiones de la literatura acerca de
los Casos d y R sugieren (sin prueba empiacuterica alguna) que de entre los meacutetodos
ZW0 ZE0 y ZPab0 el mejor debe ser el reputado meacutetodo ZE0
IV4 APORTACIONES
IV41 Aportaciones de tipo teoacuterico
IV411 Meacutetodo de Newcombe-Zou
Newcombe (1998) plantea un nuevo procedimiento para el Caso d basado en el
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 139
IC asintoacutetico para una uacutenica proporcioacuten dado por Wilson (1927) Posteriormente Zou et
al (2009) justifican teoacutericamente y generalizan dicho procedimiento para cualquier
valor de K Siguiendo el razonamiento realizado en la seccioacuten I313 para el caso actual
el estadiacutestico de contraste y el IC seraacuten de la forma
ZN
2 2
2
2 2
si lt
si gtZN
L R Lz
L R L
(414)
ICZN
2
2
L z RL
L z R
(415)
en donde
2 2 2 2
0 0 0 0
1 1 1 1(+) ( )
i i i i
i i i i i i i i i i i i
i i i i
u u l l l l u uR = y R =
n n n n
siendo (li ui) los valores obtenidos por las expresiones (44) Como se comentoacute en la
seccioacuten I42 la ventaja de este formato es que el mismo es vaacutelido tanto si los errores α
empleados para el IC de Wilson y para la inferencia sobre L son iguales como si son
distintos
IV412 Meacutetodo de las marcas y equivalencia con el procedimiento ZE
La propuesta maacutes relevante de esta memoria es la mencionada en el Capiacutetulo I
acerca del meacutetodo de las marcas desarrollado para una combinacioacuten lineal de K
proporciones binomiales independientes Anaacutelogamente a lo indicado en la seccioacuten
I43 el meacutetodo de las marcas para K=2 consiste en resolver en 2ZEz o en λ la ecuacioacuten
2 0iy n B C R donde 2ZEC z L (416)
con 2 2 2 2 2i i i i i iR n C n b C y 1 2i ib p con i=1 2 Cuando el objetivo es realizar
el test (en cuyo caso λ es conocido) 2ZEz es la uacutenica solucioacuten 2 0ZEz de la ecuacioacuten
(416) si L en tanto que si L se asume que 2ZEz =0 Cuando el objetivo es
obtener el IC I SL (en cuyo caso es 2 22ZE z z conocido) entonces λi son las
uacutenicas dos soluciones de la ecuacioacuten (416)
140 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
Esta metodologiacutea es equivalente a la del procedimiento ZE mencionado en la
seccioacuten IV312 ya que ambos se obtienen sustituyendo las proporciones desconocidas
pi por sus estimadores de maacutexima verosimilitud ip bajo H0 dando lugar a expresiones
equivalentes tanto para el test como para el IC
IV413 Procedimiento y estimador A (incondicionado aproximado)
El estimador incondicionado aproximado fue desarrollado en la seccioacuten III52
de modo general para K=2 por lo que las definiciones dadas en la expresioacuten (47) son
las mismas expresiones (335) y (336) Como puede suceder que ip
sea un valor iliacutecito
(es decir que no esteacute comprendido entre 0 y 1) parece conveniente considerar que
ip
=0 cuando ip
lt0 y que ip
=1 cuando ip
gt1 lo que da lugar a la versioacuten Ab (frente a
la versioacuten Aa que se obtiene si no se impone tal condicioacuten)
Sustituyendo las proporciones desconocidas pi por el estimador A se obtiene
como estadiacutestico de contraste el siguiente
ZA 2
22 ZAi i i i
Lz
p q n
(417)
obteniendo por inversioacuten del mismo el intervalo ICZA Es algebraicamente faacutecil de
comprobar que el estadiacutestico (417) es el mismo de la expresioacuten (412)
IV414 Propiedades de equivalencia
Para que un procedimiento de test actuacutee coherentemente es razonable exigirle
que verifique tanto las propiedades de convexidad espacial y parameacutetrica (seccioacuten
IV314) como las propiedades de equivalencia siguientes cualquier estadiacutestico z2 debe
tomar el mismo valor al contrastar la hipoacutetesis nula original H0 β1p1+β2p2=λ que al
contratar las cuatro hipoacutetesis nulas equivalentes 0 1 1 2 2 1H q p
0 1 1 2 2 2H p q 0 1 1 2 2 1 2H q q y 0 1 2 1 2 1 vH p p
Esto quiere decir que las cinco ternas (β1 β2 λ) (ndashβ1 β2 λndashβ1) (β1 ndashβ2 λndashβ2) (β1 β2
β1+β2ndashλ) y (1 β2β1 λβ1) deben ocasionar el mismo valor del estadiacutestico z2
En este capiacutetulo se ha propuesto un uacutenico estadiacutestico ndashdado por la expresioacuten
(41)- descartando otras posibilidades que ofrece esta memoria o la literatura pues todas
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 141
ellas presentan alguna incoherencia relativa a las propiedades de convexidad espacial
yo convexidad parameacutetrica y a las propiedades de equivalencia actuales Esto es lo que
sucede con los estadiacutesticos basados en la transformacioacuten logariacutetmica (Martiacuten amp Herranz
2010) y en la transformacioacuten arco seno pues es faacutecil ver que en ambos casos no se
verifican las 4 propiedades de equivalencia (de hecho la transformacioacuten logariacutetmica
solo verifica una de las dos propiedades de convexidad espacial en el Caso R) Por
ejemplo en el caso de la transformacioacuten arco seno (cuya definicioacuten puede verse en la
seccioacuten II33) el estadiacutestico de contraste para las hipoacutetesis H0 y 0H toma el valor
221 2 2 1 2 1 1 24Az n n n n mientras que para las hipoacutetesis 0H y 0H
toma el valor 221 2 2 1 2 1 1 24Az n n n n siendo 1
i isin p y
1i isin p en ambos casos Adicionalmente se ha descartado el claacutesico estadiacutestico
chi-cuadrado pues los procedimientos que se obtienen a partir de eacutel suelen tener en
general un mal comportamiento (con la salvedad del procedimiento basado en el
estimador ip en cuyo caso 2E coincide con el procedimiento 2
ZEz ) como se ha visto en
los capiacutetulos II y III de esta memoria
Respecto de los estimadores se ha excluido el estimador condicionado ip
(correspondiente al procedimiento ZCab) pues los procedimientos que ocasiona
tampoco verifican las 4 propiedades de equivalencia Por ejemplo para las ternas (β1
β2 λ) (β1 β2 β1+β2ndashλ) obtenidas a partir de las hipoacutetesis H0 y 0H las expresiones i ip q
son de la forma
2 1 2 2 1 22 1 21 1
1 2 2 1 1 2 2 1
y x n na np q
n n n n
1 1 2 1 2 11 1 12 2
1 2 2 1 1 2 2 1
x y n na np q
n n n n
en cambio para las ternas (ndashβ1 β2 λndashβ1) (β1 ndashβ2 λndashβ2) obtenidas a partir de las
hipoacutetesis 0H y 0H dichas expresiones son
2 1 2 2 1 2 2 1 2 21 1
1 2 2 1 1 2 2 1
y x n n x x np q
n n n n
142 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
1 2 1 1 1 1 2 1 2 12 2
1 2 2 1 1 2 2 1
x x n x y n np q
n n n n
de modo que el estadiacutestico 2ZCa bz toma valores distintos no cumpliendo asiacute las
propiedades de equivalencia
IV415 Estadiacutesticos basados en los datos incrementados
A menudo por causa del mal comportamiento del meacutetodo ZW0 conviene
aplicar el procedimiento ZW a los datos incrementados en una cantidad hi con i=1 2
Como se ha citado en otros capiacutetulos son tradicionales los incrementos hi=05 y hi=1
Otras posibilidades son los incrementos propuestos en los capiacutetulos anteriores es decir
los Casos 3 y 4 de la seccioacuten IV24 Aunque lo anterior es inicialmente aconsejado para
el procedimiento ZW nada impide que se haga igual para los demaacutes procedimientos
(como se propone en esta memoria)
A efectos praacutecticos el Caso 4 es el de mayor dificultad cuando los datos
observados estaacuten en la frontera del espacio muestral (es decir cuando ip =0 o 1) pues
entonces el valor de hi es diferente seguacuten que se vaya a determinar el extremo inferior λI
(caso de L ) o el extremo superior λS (caso de L ) Cuando 0ltxiltni para i=1 y 2
los Casos 3 y 4 proporcionan la misma solucioacuten Adicionalmente cuando α=5 los
Casos 2 y 3 proporcionan praacutecticamente la misma solucioacuten pues 19624asymp1
IV416 Estadiacutestico con correccioacuten por continuidad
Siguiendo la argumentacioacuten de Haber resentildeada en la seccioacuten I44 el salto total
del estadiacutestico de contraste L es de i| | con lo que el salto promedio seraacute de
2 1ic | | N con 1 21 1N n n el nuacutemero total de puntos del espacio
muestral Con ello el estadiacutestico Z con cpc seraacute
Zc 2 2
2 si
0 si
i i i iZc
| L | c p q n | L | cz
| L | c
(418)
En el caso particular del test de las marcas el estadiacutestico se obtiene cambiando
el valor 2ZEz de la expresioacuten (416) por el valor 2
2ZEcz L L c siendo 2
ZEcz
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 143
el valor del estadiacutestico de las marcas con cpc (la incoacutegnita de la ecuacioacuten en el caso del
test) Similarmente para el IC asociado al meacutetodo de las marcas basta cambiar el valor
2ZEz en la expresioacuten (416) por el valor 2
22z L | L | c y determinar sus
dos soluciones con IB L c y SL c B
IV42 Aportaciones de tipo praacutectico
IV421 Objetivo
Como se indicoacute en el Proacutelogo la evaluacioacuten de los diferentes meacutetodos de
inferencia puede realizarse desde la perspectiva de los tests de hipoacutetesis o desde la
perspectiva de los IC puesto que los dos enfoques son equivalentes (si se realizan al
mismo error nominal α) En esta seccioacuten tal evaluacioacuten se efectuaraacute desde la perspectiva
de los test de hipoacutetesis pues ella permite una evaluacioacuten maacutes coacutemoda que desde la
perspectiva de los IC
Los meacutetodos de inferencia a evaluar son inicialmente los 35 indicados al final de
la seccioacuten IV2 (los meacutetodos ZW0 ZW1 ZW2 ZW3 ZW4 ZN0 ZPb4) lo que
incluye las propuestas maacutes relevantes de la literatura de ellos 31 son meacutetodos nuevos
(los denominados por ZW ZE ZPa y ZPb con incrementos 1 al 4 y ZN ZAa y ZAb con
incrementos 0 al 4) Por tanto el objetivo es seleccionar el meacutetodos oacuteptimos bajo los
criterios que se especificaraacuten
IV422 Descripcioacuten del estudio a realizar y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo
Para efectuar la evaluacioacuten anterior se va a realizar un estudio del
comportamiento de cada meacutetodo en cada una de las siguientes combinaciones de los
paraacutemetros (a ni bi λ)
=5 (aunque en ocasiones tambieacuten se contemplaraacuten los valores del 1 y del 10)
ni = 40 60 y 100 con n1len2 Se excluyen los casos n1gtn2 pues las hipoacutetesis nulas H0
β1p1+β2p2=λ y 0H β2p2+β1p1=λ son equivalentes (cualquiera de los procedimientos
descritos proporcionan igual valor del estadiacutestico bajo ambas hipoacutetesis)
144 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
Las parejas (β1 β2) son las indicadas en la Tabla IV2 habiendo sido seleccionadas
de modo que verifiquen las siguientes condiciones
Tabla IV2
Combinaciones de tamantildeos muestrales (n1 n2) ternas (β1 β2 λ) y peso a asignar en
las evaluaciones de los distintos meacutetodos
n1 n2 1 2 Peso n1 n2 1 2 Peso n1 n2 1 2 Peso
40 40 +3 +1 +05 2 40 100 +3 +1 +05 2 60 100 +3 +1 +05 2
+1 2 +1 2 +1 2
+2 1 +2 1 +2 1
+5 +1 +05 2 +5 +1 +05 2 +5 +1 +05 2
+1 2 +1 2 +1 2
+2 2 +2 2 +2 2
+3 1 +3 1 +3 1
40 60 +3 +1 +05 2 +1 +3 +05 2 +1 +3 +05 2
+1 2 +1 2 +1 2
+2 1 +2 1 +2 1
+5 +1 +05 2 +1 +5 +05 2 +1 +5 +05 2
+1 2 +1 2 +1 2
+2 2 +2 2 +2 2
+3 1 +3 1 +3 1
+1 +3 +05 2 60 60 +3 +1 +05 2 100 100 +3 +1 +05 2
+1 2 +1 2 +1 2
+2 1 +2 1 +2 1
+1 +5 +05 2 +5 +1 +05 2 +5 +1 +05 2
+1 2 +1 2 +1 2
+2 2 +2 2 +2 2
+3 1 +3 1 +3 1
ndash Debe ocurrir que βine0 con i=1 o 2 pues el caso de solo una proporcioacuten no es
el objetivo actual y se trata aparte (ver el proacuteximo capiacutetulo)
ndash Debe ocurrir que |β1|ne|β2| pues el caso |β1|=|β2| provocaraacute las mismas
conclusiones obtenidas en el Caso d Esto es asiacute pues las ternas (β1 β2 λ) (ndash
β1 β2 λndashβ1) (β1 ndashβ2 λndashβ2) y (ndashβ1 ndashβ2 λndashβ1ndashβ2) dan lugar al mismo valor del
estadiacutestico analizado lo cual se debe a que las hipoacutetesis nulas
correspondientes son equivalentes (ver las propiedades de equivalencia de la
seccioacuten IV414)
ndash Debe ocurrir que β1=1 o β2=1 (si n1nen2) o β2=1 (si n1=n2) pues las ternas (β1
β2 λ) (1 β2β1 λβ1) y (β1β2 1 λβ2) ocasionan hipoacutetesis nulas que tambieacuten
son equivalentes
ndash Por tanto se contemplan soacutelo los casos con βigt0 β1=1 o β2=1 (si n1nen2) o
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 145
β2=1 (si n1=n2) y |β1|ne|β2| En particular la pareja (β1 β2)=(+1+1) no se
evaluacutea dado que por ser equivalentes las hipoacutetesis H0 β1p1+β2p2=λ y
0 1 1 2 2 1H q p sus conclusiones seraacuten las del Caso d
Para cada pareja (1 2) λ tomaraacute los valores 1 20B B Como ya se
indicoacute antes la hipoacutetesis nula H0 β1p1+β2p2=λ es equivalente a la hipoacutetesis
0 1 1 2 2 1 2H q q de ahiacute que si se evaluacutea el valor λ no hace falta evaluar
el valor β1+β2ndashλ A cambio a las salidas para 1 2 2 hay que asignarle
peso 2 en el caacutelculo de los promedios frente al peso 1 de las salidas con
1 2 2 De ahiacute los valores a evaluar y los pesos indicados en la Tabla
IV2
El proceso de obtencioacuten de datos consiste en realizar los siguientes pasos
1 Seleccionar una combinacioacuten (a n1 n2 b1 b2 λ meacutetodo 2Xz a evaluar)
2 Construir la regioacuten criacutetica RC= 2 21 2 2X x x | z z
3 Calcular el error real (tamantildeo) del test mediante la expresioacuten
1 1 2 21 2
1
1 21 1 2 2
1 2
maacutex 1 1n x n xx x
A p BRC
n np p p p
x x
(419)
en donde
2 1 1 1 2
1 2 1 1 2
maacutex 0 miacuten 1 si 0
maacutex 0 miacuten 1 si 0
A B
A B
y 1 1
22
pp
(420)
siendo las cantidades A y B debidas a que 0lepile1 y λ=β1p1+β2p2 Tal y como
sucedioacute en los capiacutetulos anteriores el recubrimiento real R para un valor fijado de
p1 viene dado por la expresioacuten
1 2
1 1 1 2 2 2
1 2
1 21 1 1 2 2 1 2
0 0 1 2
(1 ) (1 ) ( )n n
x n x x n x
x x
n nR p p p p p I x x
x x
en donde 1 2( ) 1I x x si ( )I S el IC obtenido con la pareja (x1 x2)
1 2( )I x x 0 en otro caso y p2 el indicado en la expresioacuten (420) Como el valor de
p1 es desconocido el recubrimiento relevante viene dado por R=
miacuten 1 1 A p B R p =1
146 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
4 Calcular el incremento del error real con respecto al error nominal De
nuevo hay que tener en cuenta que si 0 el test seraacute conservador (por lo que el
IC tambieacuten lo seraacute y tendraacute maacutes recubrimiento que el nominal) por el contrario si
0 el test seraacute liberal (por lo que el IC tambieacuten lo seraacute y tendraacute menos
recubrimiento que el nominal)
5 Calcular la potencia a largo plazo =(nordm de puntos de la RC)times100N siendo
N=(n1+1)times(n2+1) el nordm total de puntos del espacio muestral La conveniencia de la
misma frente a la potencia tradicional
1 1 1 2 2 21 21 2 1 1 2 2
1 2
(1 ) (1 )x n x x n x
RC
n np p p p p p
x x
(421)
ya fue justificada en la seccioacuten II62 Como en ocasiones anteriores una mayor
potencia a largo plazo es indicativo de una menor longitud media de los IC que se
obtengan por inversioacuten del test en donde
1 2
1 1 1 2 2 2
1 2
1 21 1 2 2
0 0 1 2
(1 ) (1 )n n
x n x x n xS I
x x
n nl p p p p
x x
(422)
6 Determinar en cada caso si hay o no un ldquofallordquo es decir si ndash4 ndash2 o 1
para a=10 5 o 1 respectivamente La conveniencia de esta definicioacuten fue
resentildeada tambieacuten en la seccioacuten II62
7 Para cada meacutetodo se construiraacute una tabla (como la Tabla AIV1) que contemple los
valores individuales de Δα y asiacute como la informacioacuten de en queacute circunstancias
falla el meacutetodo
8 Por uacuteltimo para cada combinacioacuten se calcularaacute el nordm total de fallos (F) y los valores
medios de ( ) y de ( )
Una vez obtenidos los resultados la seleccioacuten del meacutetodo oacuteptimo se realizaraacute bajo
los siguientes criterios
(a) Se daraacute especial importancia al caso α=5 (por ser el error nominal maacutes frecuente)
(b) Se descartaraacuten los meacutetodos con un excesivo nuacutemero de fallos (pues con demasiada
frecuencia son excesivamente liberales) mostrando preferencia por los meacutetodos con
menos fallos
(c) Entre los meacutetodos que queden se eligen los que tengan un maacutes cercano a 0 (es
decir los meacutetodos con un error medio cercano al nominal) En caso de empate se
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 147
prefieren los meacutetodos conservadores ( gt0) a los liberales ( lt0) para que asiacute
las significaciones sean fiables
(d) Entre los meacutetodos que queden se prefieren los de mayor potencia
IV423 Seleccioacuten del meacutetodo oacuteptimo sin cpc (α=5)
La Tabla AIV1 contiene los datos completos de todos los meacutetodos (se omite el
procedimiento ZAa pues puede dar lugar a varianzas negativas) Globalmente se
observa que
Respecto al nuacutemero de fallos el hecho de sumar una cantidad hi es positivo
uacutenicamente en el caso del procedimiento ZW El resto de procedimientos
empeoran salvo el ZPb que apenas variacutea
Los meacutetodos basados en los estimadores exacto de Newcombe y aproximado (ZEx
ZNx y ZAbx) son todos ellos muy malos pues aunque tienen una buena potencia
son meacutetodos demasiado liberales que dan lugar a demasiados fallos (de hecho lo
primero es causa de lo segundo)
El peor meacutetodo de todos (como es tradicional) es el claacutesico meacutetodo ZW0 de Wald
La Tabla AIV2 contiene el resumen de los datos de todos los meacutetodos Del
anaacutelisis de la misma puede concluirse lo siguiente
La seleccioacuten del meacutetodo oacuteptimo debe centrarse en los meacutetodos con pocos fallos (4 o
menos) es decir en los 11 primeros meacutetodos de la tabla
Todos los meacutetodos de tipo ZP deben descartarse por tener una potencia muy baja
De los tres restantes (ZW2 ZW3 y ZW4) puede afirmarse que el meacutetodo ZW4 (que
no tiene fallos) es mucho mejor que los ZW2 y ZW3 que siendo iguales entre siacute
tienen 4 fallos (aunque estos lo son por muy poco)
La conclusioacuten es que el mejor meacutetodo de todos es el ZW4 aunque los meacutetodos
ZW2 y ZW3 proporcionan tambieacuten buenos resultados y tienen un comportamiento muy
similar
148 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
IV424 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los seleccionados anteriormente
y para los errores =1 5 y 10 evaluaciones general y detallada
La Tabla AIV3 contiene los datos completos de los meacutetodos seleccionados en la
seccioacuten anterior (ZW2 ZW3 y ZW4) para los tres errores analizados en tanto que la
Tabla AIV4 contiene el resumen de los mismos De ellas se deduce que
Para α=1 el mejor meacutetodo es el ZW3 que es similar al meacutetodo ZW4 pero
preferible a este (por ser algo maacutes potente y muy poco maacutes liberal) El meacutetodo ZW2
es el peor de los tres
Para α=5 el mejor meacutetodo es el ZW4 el cual es mucho mejor que los otros dos
(ZW2 y ZW3) que son similares entre siacute
Para α=10 el mejor meacutetodo es el ZW2 que es similar al meacutetodo ZW4 pero
preferible a este (por ser algo maacutes potente y muy poco maacutes liberal) El meacutetodo ZW3
es el peor de los tres
De lo anterior se deduce que para los errores α=1 5 y 10 los meacutetodos
oacuteptimos son los ZW3 ZW4 y ZW2 respectivamente aunque el meacutetodo ZW4 puede ser
considerado el mejor de modo global
Adicionalmente con el fin de determinar maacutes detalladamente en queacute momento
(en funcioacuten de los tamantildeos muestrales ni) es preferible un meacutetodo u otro la Tabla AIV5
presenta el resumen de los resultados de los meacutetodos seleccionados para cada pareja de
tamantildeos de muestra (n1 n2) y para los tres errores citados (α=1 5 y 10) A la vista
de la misma se observa que
Para α=1 se descarta inicialmente ZW2 pues tiene errores demasiado grandes
seleccionando ZW4 frente a ZW3 (a pesar de tener mejor potencia)
Para α=5 destaca el mejor comportamiento de ZW4 frente a ZW2 y ZW3 (que
son praacutecticamente iguales)
Para α=10 en general ZW3 no tiene buena actuacioacuten pues tiene errores muy
grandes a pesar de su buena potencia Para tamantildeos pequentildeos (n1=40) ZW2 es el
meacutetodo maacutes adecuado tanto bajo el punto de vista del error como de la potencia en
tanto que para tamantildeos maacutes grandes (n1ge60) es ZW4 el meacutetodo oacuteptimo
De lo anterior se deduce que los meacutetodos oacuteptimos (que son siempre alguno de
los propuestos en esta memoria) son
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 149
En general el meacutetodo ZW4 (pues tiene el mejor comportamiento)
En particular el meacutetodo ZW4 para los errores α=1 y α=5 asiacute como para n1ge60
al error α=10 En otro caso (para n1lt60 y α=10) el oacuteptimo es el meacutetodo ZW2
IV425 Seleccioacuten del meacutetodo oacuteptimo consin cpc (=5)
Con el fin de ver si la aplicacioacuten de una cpc mejora el resultado del meacutetodo ZW4
seleccionado la Tabla AIV6 presenta los datos completos del mismo en sus dos
versiones sin y con cpc (meacutetodos ZW4 y ZW4c) al 5 De ella se deduce que el meacutetodo
oacuteptimo sigue siendo el ZW4 (por ser maacutes sencillo) ya que ninguno de los dos meacutetodos
presenta fallos y el comportamiento global es similar Por lo tanto la cpc no mejora la
actuacioacuten del meacutetodo y se mantienen las conclusiones de la seccioacuten anterior
IV5 CONCLUSIONES FINALES Y EJEMPLOS
IV51 Meacutetodo oacuteptimo
Por todo lo resentildeado en las secciones anteriores para el caso de 12
puede concluirse que todos los meacutetodos claacutesicos de la literatura funcionan muy mal
siendo los meacutetodos oacuteptimos los indicados en el cuadro de abajo Respecto del caso
1=2 ya se indicoacute en la seccioacuten IV422 que las conclusiones son las mismas
que la del Caso d con la salvedad de que la solucioacuten basada en la transformacioacuten arco
seno solo es vaacutelida cuando 2=1 (pues en otro caso no se verificaban las propiedades
de equivalencia) de ahiacute lo indicado en el cuadro de maacutes abajo Obseacutervese que todos los
meacutetodos seleccionados son nuevas aportaciones de esta memoria
SELECCIOacuteN DEL MEJOR MEacuteTODO PARA K=2
Casos de 12 y 1=2
De modo general ZW4 es el mejor meacutetodo
De modo maacutes particular el meacutetodo oacuteptimo es ZW4 cuando α=1 y 5 (asiacute como
para n1ge60 al error α=10) para n1lt60 y α=10 el meacutetodo oacuteptimo es el ZW2
Casos de 1=2
Proceder como en el caso de la diferencia (Capiacutetulo II)
150 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
IV52 Foacutermulas aconsejadas para realizar inferencia cuando 12 o 1=2
IV521 Meacutetodo oacuteptimo para n1lt60 y α=10 ZW2
1) Incrementar todos los datos de ambos grupos (los eacutexitos y los fracasos) en 1
2) El estadiacutestico de contraste y el intervalo vienen dados respectivamente por las
expresiones siguientes aplicadas a los datos incrementados anteriores
2
22ZWi i i
i
Lz
p q
n
y
2
2i i i
i
p qL L z
n
(423)
IV522 Meacutetodo oacuteptimo para el resto de los casos (y tambieacuten en general) ZW4
1) Incrementar todos los datos (los eacutexitos xi y los fracasos yi) en 22 4z si 0ltxiltni (i=1
2) o en otro caso incrementarlos en
22
22
1 si 1 21 con para
2 0 en otro caso
1 si 1 21 con para
2 0 en otro caso
i iii I
i
i iii S
p sz I K I
K h
p sz S K S
K
1 si 0con
1 si 0i
ii
s
2) El estadiacutestico de contraste y el intervalo vienen dados de nuevo por las expresiones
(423) aplicadas a los datos incrementados anteriores
IV53 Ejemplo praacutectico
Tebbs and Roths (2008) aluden a los datos de un ensayo cliacutenico multiceacutentrico
(ver la Tabla I3) cuyo fin era evaluar la eficacia de un reacutegimen rebajado en sal en el
tratamiento de bebeacutes varones con diarrea aguda A causa de que el nivel de
participacioacuten es diferente pues depende de la localizacioacuten una estimacioacuten natural de la
proporcioacuten global es la media de las probabilidades de respuesta pi en los K=6 lugares
ie L=βipi con βi=ni ni Si se desea separar la inferencia acerca de la zona
sudamericana (Brasil y Peruacute) del resto entonces K=2 y βi=ni (n1+n2) para dicha zona Los
datos se muestran en la Tabla IV3(a)
CAPIacuteTULO IV K=2 EN EL RESTO DE LOS CASOS 151
Aplicando el meacutetodo ZW4 (en este caso equivalente al meacutetodo ZW3 ya que
0ltxiltni) para el caacutelculo del IC al 95 de confianza entonces 22z 4=19624=09604 y el
meacutetodo de Wald de la expresioacuten (423) debe aplicarse a los datos de la Tabla IV3(b) El
resultado es L (02700 03996)
Tabla IV3
Datos de un ensayo cliacutenico multiceacutentrico
(a) Datos originales
Localizacioacuten Tamantildeo de muestra (ni) Casos de fiebre (xi) Coeficientes (βi)
Brasil
Peruacute
Total
107
092
199
32
34
66
107199
092199
1
(b) Datos incrementados en 09604
Localizacioacuten Tamantildeo de muestra (ni) Casos de fiebre (xi) Coeficientes (βi)
Brasil
Peruacute
Total
1089208
0939208
2028416
329604
349604
679208
107199
092199
1
CAPIacuteTULO V
K=1 O EL CASO DE UNA PROPORCIOacuteN
V1 INTRODUCCIOacuteN
Uno de los problemas maacutes baacutesicos de inferencia estadiacutestica es la obtencioacuten de un
intervalo de confianza de dos colas para una proporcioacuten binomial p desconocida asiacute
como la resolucioacuten de un contraste de hipoacutetesis H0 p=π siendo π un valor conocido y
dado de antemano Igual que para otros paraacutemetros el caso de una proporcioacuten
constituye un caso particular del caso general del Capiacutetulo I ahora K=1 L=p y λ=π
(pues si H0 1p1= basta dividir por 1 para obtener H0 p1=1= y evitar el
subiacutendice que ya no tiene intereacutes haciendo p1=p y 1=1) El objetivo actual es pues la
realizacioacuten de un test de dos colas sobre p (H0 p=π vs H1 pneπ) o la obtencioacuten de un IC
de dos colas para p
En este caso tendremos una uacutenica muestra de tamantildeo n donde x (y) es el nordm de
individuos de entre los n que siacute (no) presentan la caracteriacutestica aludida en el estudio La
variable aleatoria (x) sigue una distribucioacuten binomial x B n p en donde p es la
proporcioacuten (desconocida) de individuos de la poblacioacuten que presentan la caracteriacutestica
Desde el punto de vista de las inferencias exactas lo habitual de los libros de
texto avanzados es recomendar el meacutetodo de Clopper amp Pearson (1934) basado en la
inversioacuten de un test de dos colas con la ventaja de poder determinar el IC a partir de las
tablas de la distribucioacuten F de Snedecor Por razones de simplicidad de las foacutermulas y
del intereacutes pedagoacutegico de algunas de las soluciones muchos autores abogan por
resolver el problema de modo asintoacutetico (Newcombe 1998 b Agresti amp Caffo 2000)
El objetivo de este capiacutetulo es valorar los meacutetodos asintoacuteticos ya existentes y
proponer nuevos meacutetodos evaluando comparativamente todos ellos
154 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
V2 NOTACIOacuteN
V21 Generalidades y estadiacutesticos base
Sea una variable aleatoria binomial x~B(np) en donde p la proporcioacuten
desconocida es el paraacutemetro de intereacutes Sean p =xn la proporcioacuten muestral q=1p y
1q p Para contrastar H0 p=π vs H1 p π (con 0le π le1 ya que 0leple1) es necesario
seleccionar primeramente un estadiacutestico de contraste de entre los cuatro que siguen los
cuales en adelante seraacuten aludidos abreviadamente por el nombre en negrita que se
indica
Z
2
2
1Z
p πz
p p
(51)
L 22 1Lz ln p lnπ np p (52)
G 2
2 11 1G
p πz np p ln ln
p π
(53)
A 22 1 14Az n sin p sin π (54)
En cualquiera de los cuatro casos habraacute que comparar el valor experimental del
estadiacutestico 2expz (cualquiera de los cuatro anteriores 2
Zz 2Lz 2
Gz 2Az ) con 2
2z (en donde
2z es el percentil (1ndashα2)100 de la distribucioacuten normal tiacutepica) Para obtener el IC
(1ndashα) para p se invierte el test despejando π en la ecuacioacuten 2 22exp z z (en todas las
ocasiones se obtiene solucioacuten expliacutecita maacutes o menos sencilla)
V22 Generalidades sobre las proporciones pi
En los estadiacutesticos Z L y G la proporcioacuten p desconocida debe ser sustituida por
alguno de sus estimadores con el fin de que tengan utilidad praacutectica En lo que sigue se
describen los mismos y se pone en mayuacutesculas y negrita la letra abreviada que designaraacute
el procedimiento que proporciona cada estimacioacuten (letra que hay que antildeadir a la del
estadiacutestico Z L o G utilizado)
La solucioacuten maacutes habitual para estimar p (por su sencillez) consiste en utilizar el
estimador claacutesico de maacutexima verosimilitud simple es decir la proporcioacuten muestral la
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 155
cual no estaacute restringida por H0
W (Wald) p x n (55)
El estimador de p restringido por H0 es el uacutenico posible y propuesto por Wilson (1927)
E (Wilson) p=π (56)
V23 Procedimientos de inferencia que se obtienen con cada estimador
Cuando en las 3 expresiones (51) (52) y (53) se sustituye cada uno de los 2
estimadores aludidos en la seccioacuten anterior se obtienen los 6 estadiacutesticos 2ZWz 2
ZEz
2LWz 2
LEz 2GWz y 2
GEz cada uno de los cuales da lugar a un procedimiento de test
diferente Al invertir el mismo se obtiene un procedimiento de IC diferente En ambos
casos el nombre del procedimiento es la unioacuten de las letras de los estadiacutesticos (Z L y
G) y estimadores (W y E) implicados en su definicioacuten es por ello que los 7
procedimientos iniciales seraacuten ZW ZE LW LE GW GE y A (en donde se ha antildeadido
el procedimiento A que se obtiene a partir del estadiacutestico 2Az )
Sin embargo los procedimientos LW y LE deben omitirse pues presentan la
dificultad de que actuacutean incoherentemente el test para H0 p=π no da igual resultado
que el test (equivalente) para 0 H 1ndashp=1ndashπ (por lo que el IC para p tampoco es
compatible con el IC para 1ndashp) Teniendo en cuenta estas exclusiones se obtienen
finalmente 5 procedimientos en total
V24 Datos muestrales a utilizar y meacutetodos que proporcionan
Las foacutermulas anteriores pueden utilizarse en base a los datos x e y originales o en
base a los datos originales incrementados en una cantidad h determinada (x+h y+h
n+2h) Este incremento como se ha venido comentando en capiacutetulos anteriores tiene su
origen en los meacutetodo ldquoadjustedrdquo Wald cuyo objetivo es mejorar el comportamiento del
meacutetodo ZW el cual se sabe que funciona muy mal (Ghost 1979 Chen 1990
Newcombe 1998) Los valores posibles de h se denotan con el diacutegito (en negrita) que
los identificaraacute (el cual se antildeadiraacute a las letras descritas arriba)
156 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
0 h=0 (claacutesico)
1 h =05 (Woolf)
2 h =2 (Agresti amp Coull)
3 h= 22 2z (Chen)
4
22
22
1 si 11con si
0 si 12
1 si 01con si
0 si 02
pz I I pgt
ph
pz S S plt
p
5
Si sustituir por 1
Si sustituir por 1 1
p p x n
p p x n
(Barkowf)
Existen otros posibles incrementos que se descartan aquiacute pues la literatura o nuestros
propios datos aludidos maacutes adelante han demostrado que no mejoran a los anteriores
Cada uno de los 6 incrementos anteriores (0 1 2 3 4 y 5) puede aplicarse a
cada uno de los 5 procedimientos definidos (ZW ZE GW GE y A) dando lugar asiacute a
30 meacutetodos de inferencia distintos en lo que sigue ellos seraacuten notados por las letras del
procedimiento y el diacutegito del incremento correspondiente ZW0 ZW1 ZW2 ZW3
ZW4 ZW5hellip A5
V3 RESULTADOS DE LA LITERATURA DE TIPO TEOacuteRICO
V31 Meacutetodos basados en el estadiacutestico Z
V311 Generalidad
Es de sobra conocido que si x B n p entonces la proporcioacuten muestral
p x n converge en distribucioacuten a una normal con media y varianza las indicadas a
continuacioacuten
dp N(p pqn)
Para contrastar la hipoacutetesis H0 p=π vs H1 pneπ hay que comparar el valor experimental
del estadiacutestico 2Zz dado por (51) con 2
2z (como se indicoacute anteriormente) El IC (1ndashα)
para p que se obtiene por inversioacuten del test vendraacute dado por las dos soluciones de la
ecuacioacuten 2 22 Zz z
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 157
Las expresiones tanto del test como del IC no tienen utilidad hasta que las
proporciones p desconocidas sean sustituidas por una estimacioacuten de las mismas (como
las resentildeadas en la seccioacuten V22)
V312 Meacutetodo claacutesico de Wald y meacutetodos ldquoadjustedrdquo Wald
El procedimiento claacutesico de los libros de texto elementales consiste en sustituir p
por la proporcioacuten muestral (estimador de maacutexima verosimilitud simple) dados por la
foacutermula (55) lo que da lugar al procedimiento ZW (claacutesico procedimiento de Wald
introducido por Wilson (1927) para el caso actual de p) Las expresiones siguientes
aluden al estadiacutestico y al IC que se obtiene por inversioacuten del mismo
ZW
2
2
1ZW
pz n
p p
(57)
ICZW p 2 1p z p p n (58)
Diversos autores han comprobado que el claacutesico procedimiento ZW funciona
mal (Ghost 1979 Chen 1990 Newcombe 1998 b) La mejora tradicional consiste en
utilizar el estadiacutestico no en base a los datos originales (meacutetodo ZW0) sino en base a los
datos incrementados en una determinada cantidad h es decir en base a los datos (x+h
y+h n+2h) En este contexto Agresti amp Coull (1998) propusieron incrementar los datos
en una cantidad h=2 (basaacutendose en las ideas de Wilson 1927) y Chen (1990) propuso el
incremento h= 22 2z
Por otro lado Borkowf (2006) planteoacute un nuevo meacutetodo ldquoadjustedrdquo Wald que
garantizara una probabilidad de recubrimiento cercana a la nominal y cuyo IC fuera
sencillo y faacutecil de interpretar y calcular Para ello sugirioacute incrementar en uno los eacutexitos
(x+1) en el caso de calcular el liacutemite superior del ICZW e incrementar en uno los
fracasos (y+1) en el caso de calcular el liacutemite inferior del ICZW de forma que la
proporcioacuten muestral tendraacute el valor p = x(n+1) para pI y el valor p = (x+1)(n+1) para
pS
158 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
V313 Meacutetodo condicionado
Bajo la hipoacutetesis nula H0 p=π Wilson (1927) propuso sustituir p por π dando
lugar al estadiacutestico de contraste y al IC siguientes
ZE
2
2
1ZE
pz n
(59)
ICZE p 22
2 222
2
1
2 2
p pz znp z
n z n n n
(510)
V314 Estadiacutestico Z con correccioacuten por continuidad
Es conocida la necesidad de utilizar una correccioacuten por continuidad (Cox 1970)
cuando se aproxima una variable binomial (discreta) a una normal (continua) Siguiendo
la argumentacioacuten de Haber resentildeada en II316 el salto total del estadiacutestico de contraste
p es de 1 (pues toma valores entre 0 y 1) y como tiene un total de n saltos (0le xle n) la
cpc seraacute la claacutesica c=12n Con ello Blyth amp Still (1983) proponen el siguiente
estadiacutestico Z con cpc
Zc
2
2 si 1
0 si Zc
| p | cn | p | c
z p p
| p | c
(511)
El nuevo estadiacutestico Zc proporciona los dos nuevos procedimientos ZWc y ZEc y los 6
meacutetodos ZWac y ZEac con a aludiendo a los incrementos de los Casos 0 al 5
V32 Meacutetodos basados en el estadiacutestico G
Otro tipo de estadiacutestico desarrollado para el caso de una proporcioacuten es el
estadiacutestico G (de tipo logit) obtenido a partir de la transformacioacuten logariacutetmica de la
odds p(1ndashp) En lugar de considerar la variable aleatoria p se contempla el logaritmo
neperiano 1ln p p que se distribuye de manera aproximadamente normal con
media y varianza las siguientes
1 1 1 1dln p p N ln p p np p
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 159
Para el caso de contrastar H0 p=π el estadiacutestico apropiado viene dado por la expresioacuten
(53) la cual carece de sentido hasta que p sea sustituida por la estimacioacuten apropiada
Brown et al (2001) proponen sustituir la proporcioacuten p desconocida de (53) por su
estimador muestral dando lugar al procedimiento GW Por tanto el estadiacutestico de
contraste y el IC obtenido por inversioacuten del mismo tienen la forma
GW 2
2
1GW
pz ln ln npq
q
(512)
ICGW p
11
21 zqexp
p npq
(513)
Anscombe (1956) sugiere como en el caso de los meacutetodos ldquoadjustedrdquo Wald que
el procedimiento GW se obtenga a partir de los datos incrementados en 05 (incremento
tambieacuten utilizado por Wolf 1955 para el procedimiento LW del caso R)
V33 Meacutetodos basado en el estadiacutestico A
Otra alternativa basada en la transformacioacuten arco seno es considerar la variable
aleatoria 1sin p Como el estadiacutestico bajo H0 se distribuye asintoacuteticamente como
una normal con media y varianza las siguientes
1 1 1 4dsin p N sin n
Ghosh (1979) propone el estadiacutestico 2Az de la expresioacuten (54) y el siguiente IC que
obtiene por inversioacuten del mismo
ICA 2 12 2p sin sin p z n
(514)
Es habitual utilizar el procedimiento A con la transformacioacuten de Anscombe
(1948) la cual consiste (como en los meacutetodos ldquoadjustedrdquo Wald) en incrementar los
datos en la cantidad h=38
V4 RESULTADOS DE LA LITERATURA DE TIPO PRAacuteCTICO
V41 Generalidades sobre los estudios de simulacioacuten
De manera similar a los capiacutetulos anteriores la mayoriacutea de los autores plantean
el problema de seleccionar el meacutetodo oacuteptimo desde el punto de vista de los IC Para ello
160 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
comparan el recubrimiento real R y la longitud media l de cada meacutetodo de IC para un
valor fijado de p paraacutemetros que vienen dados por las expresiones
0
(1 ) ( )n
x n x
x
nR I x
x
(515)
0
(1 )n
x n xS I
x
nl p p
x
(516)
en donde I(x)=1 si ( )I Sp p p e I(x)=0 en otro caso en donde ( )I Sp p p alude al IC
que se obtiene en el valor x utilizado Dado que R es una probabilidad se verifica que
0leRle1 En general se considera que un meacutetodo de IC es oacuteptimo (Blyth amp Still 1983
Newcombe 1998 b) si se verifica que la probabilidad de recubrimiento R es cercana al
valor nominal 1ndashα que la anchura l del intervalo es pequentildea y que es sencillo de
utilizar
Alternativamente otros autores plantean la seleccioacuten desde el punto de vista de
los tests de hipoacutetesis Si el test asintoacutetico se realiza a un error nominal de la RC que
ocasiona estaraacute formada por todos los puntos x en los que 2 22exp z z y el error real del
test seraacute
100 1n xx
RC
n
x
(517)
Adicionalmente la potencia (p|) para una alternativa p y un error dados seraacute
| (1 )x n x
RC
np p p
x
Bajo este planteamiento el meacutetodo oacuteptimo seraacute aquel cuyo valor sea maacutes cercano a
(preferiblemente menor o igual) y cuya potencia sea lo mayor posible en la mayoriacutea
de las alternativas ensayadas
V42 Conclusiones de la literatura
Las principales conclusiones obtenidas a partir de las diversas comparaciones
efectuadas por los distintos autores pueden resumirse como sigue
1) Ghosh (1979) valoroacute los meacutetodos ZE0 ZW0 y A0 desde la perspectiva de los IC
Seguacuten sus resultados para el caso de tamantildeos de muestra grandes el recubrimiento
de A0 es cercano al recubrimiento nominal de forma maacutes satisfactoria que con
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 161
ZW0 Numeacutericamente esto se confirma para muestras de menor tamantildeo
observando en este caso que tanto ZE0 como A0 tienen un comportamiento similar
lo que hace que su distincioacuten no sea muy clara Para tamantildeos muestrales grandes la
actuacioacuten de A0 es un poco peor que con ZE0 que finalmente es el meacutetodo oacuteptimo
aconsejado
2) El estudio realizado por Boumlhning (1998) compara los meacutetodos ZW0 ZE0 A0 y
A15 (el procedimiento A con los datos incrementados en 38) sugiriendo
inicialmente que tanto el meacutetodo ZW0 como el A0 son inadecuados por su mal
comportamiento en el borde del espacio muestral Para tamantildeos de muestra
pequentildeos era de esperar la mala actuacioacuten de ZW0 siendo ZE0 el que mejores
resultados aporta En cuanto a los meacutetodos A0 y A15 concluye que el segundo es
mejor pero que no supera al meacutetodo ZE0
3) Chen (1990) sugiere el meacutetodo ZW3 el cual compara con los ZW0 y A0 El autor
concluye que aunque el meacutetodo A0 se comporta mucho mejor que el ZW0
(teniendo un recubrimiento maacutes cercano al nominal) no supera al meacutetodo oacuteptimo
ZW3
4) Newcombe (1998 b) evaluacutea los meacutetodos ZW0 ZW0c ZE0 y ZE0c entre otros Su
conclusioacuten inicial es la claacutesica el meacutetodo ZW0 es el maacutes simple y ampliamente
utilizado aunque es demasiado liberal Ademaacutes observa que si se le antildeade una cpc
su comportamiento mejora en algunos aspectos pero sigue siendo inadecuado
(fallando demasiado en el borde del espacio muestral) Por el contrario el meacutetodo
ZE0 tiene un recubrimiento cercano al nominal y aunque en ocasiones se comporta
de forma conservadora es casi tan faacutecil de calcular como el ZW0 y su actuacioacuten es
muy buena en todos los sentidos Comparando ZE0 con ZE0c advierte que ZE0c es
demasiado conservador por lo que elige como meacutetodo oacuteptimo al ZE0 (ya que
ninguacuten otro meacutetodo de los que evaluacutea es capaz de superarle)
5) Brown et al (2001) realizan un estudio completo de todos los meacutetodos propuestos
en la literatura hasta ese momento Entre otros valoraron los meacutetodos ZW0 ZW2
ZE0 A0 GW0 y GW1 Los autores comprueban lo ya conocido (que ZW0 es muy
conservador y debe ser descartado) que ZW2 tiene un recubrimiento bastante
conservador para valores de p cercanos a 0 o a 1 y su comportamiento es
comparable con el intervalo de Jeffreys (que utiliza como distribucioacuten a priori una
distribucioacuten beta Berger 1985) que ZE0 y ZW2 tienen casi la misma longitud de
162 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
intervalo y su diferencia praacutectica no es relevante Sin embargo cuando n es
pequentildeo la longitud media de ZW2 es notablemente maacutes grande que la de ZE0
Adicionalmente comproboacute que el meacutetodo A0 tiene un recubrimiento mayor que en
los otros casos que GW0 se comporta bien en teacuterminos de recubrimiento (pero el
intervalo es innecesariamente largo) y que GW1 no tiene una buena actuacioacuten En
conclusioacuten la recomendacioacuten final de los autores es la siguiente para tamantildeos de
muestra pequentildeos (nle40) debe utilizarse el meacutetodo ZE0 (el de Jeffreys es muy
similar y puede utilizarse indistintamente) para tamantildeos de muestra grandes (ngt40)
el oacuteptimo es el meacutetodo ZW2 (que supera al ZE0 incluso en simplicidad)
6) Borkowf (2006) propone un nuevo meacutetodo ldquoadjustedrdquo Wald (el ZW5) que compara
con los meacutetodos ZW0 y ZW3 Sus conclusiones son que el meacutetodo ZW0 tiene un
recubrimiento inferior al nominal cuando p es cercano a 0 o a 1 que el
recubrimiento de ZW3 es el que maacutes se estabiliza en torno al valor nominal que
ZW5 da niveles ligeramente inferiores al nominal para valores de p intermedios y
por encima del nominal cuando p es cercano a 0 o a 1 En cuando a la longitud del
intervalo para p cercano al 05 el meacutetodo oacuteptimo aconsejado es el ZW3 mientras
que para p cercano a 0 o a 1 el meacutetodo oacuteptimo aconsejado es el ZW5 Su conclusioacuten
final es que el meacutetodo ZW5 es el mejor (siendo el meacutetodo ZW3 una buena
alternativa)
Adicionalmente Newcombe (2011) y Newcombe amp Nurminen (2011) defienden el
meacutetodo de las marcas (el de Wilson) por la razoacuten ya sentildealada (y discutida) en el uacuteltimo
paacuterrafo de la seccioacuten II42 De todos modos su conclusioacuten (que no se basa en un
estudio amplio del problema) no entra en contradiccioacuten con las conclusiones del final de
este capiacutetulo (especialmente por cuanto estos autores no evaluacutean el meacutetodo arcoseno)
V5 APORTACIONES DE TIPO TEOacuteRICO
V51 Test e intervalo de confianza para el procedimiento GE
Como se comentoacute en la seccioacuten V32 Brown et al (2001) sugieren el
procedimiento GW Nuestra propuesta actual es utilizar el procedimiento GE cuyo
estadiacutestico de contraste e IC son los siguientes
GE 2
2 1 1GEz ln p q ln n (518)
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 163
ICGE p 1
1
21 1
qexp z n
p
(519)
V52 Estadiacutesticos basados en los datos incrementados
En las secciones V312 y V32 se indicoacute que por causa del mal
comportamiento de los procedimientos ZW y GW la literatura ha sugerido incrementar
los datos en una cantidad h que variacutea con el autor La propuesta actual es utilizar el
incremento del Caso 4 de la seccioacuten V24 ya ampliamente comentado en los primeros
capiacutetulos para todos los procedimientos de este capiacutetulo
La definicioacuten del Caso 5 presenta el inconveniente de que el valor n no siempre
es sustituido por (n+1) lo cual entra en contradiccioacuten con la filosofiacutea actual de esta
memoria Hemos comprobado que si el Caso 5 se modifica haciendo que el valor n sea
siempre sustituido por el valor n+1 la nueva propuesta suele ofrecer mejores resultados
que con la definicioacuten particular de Borkowf De todos modos no se la incluye en lo que
sigue pues sus resultados no son competitivos con los de los meacutetodos que se
seleccionaraacuten
V53 Estadiacutesticos A con correccioacuten por continuidad
Para el estadiacutestico A puede hacerse un razonamiento similar al realizado en la
seccioacuten V314 respecto del estadiacutestico Z Ahora el salto total del estadiacutestico de
contraste 1sin p es de 314162 con lo que el salto promedio seraacute de c=314164n
Con ello el estadiacutestico A con cpc seraacute
Ac 2
1 1 1 12
1 1
4 si
0 si Ac
| sin p sin | c n | sin p sin | cz
| sin p sin | c
(520)
La argumentacioacuten no tiene intereacutes en el caso del estadiacutestico G (pues como se
veraacute no da lugar a ninguacuten procedimiento resentildeable)
V54 Equivalencia entre la evaluacioacuten de un meacutetodo de obtencioacuten de intervalos de
confianza y su meacutetodo de test asociado
El mismo razonamiento que ha sido empleado en capiacutetulos anteriores puede
ahora aplicarse al caso de una proporcioacuten Tanto desde el punto de vista exacto como
164 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
del asintoacutetico es habitual obtener el IC de dos colas mediante la inversioacuten de un test de
dos colas H0 p=π vs H1 pneπ Esto significa que la definicioacuten de un procedimiento
puede hacerse desde las perspectivas del test o del IC y ademaacutes que evaluar un
procedimiento de IC es equivalente a evaluar su procedimiento de test asociado (si
ambos se realizan al mismo error nominal α)
La demostracioacuten de tal equivalencia es similar a la desarrollada en otras
ocasiones El error real del test se calcula mediante la expresioacuten (517) teniendo en
cuenta que 2 22exp RC x | z z Como el IC se obtiene mediante la inversioacuten del test
entonces cada observacioacuten x ocasiona un IC para p dado por IC(p)=
2 20 0 2exp p | z p z con lo que el recubrimiento real seraacute 0
0
n
x
P x | H I x
en
donde ahora I(x)=1 si p IC x e I(x)=0 en otro caso Como p IC x cuando
2 22exp z p z entonces I(x)=1 si x RC y por tanto 0100
RC
P x | H con RC
aludiendo al conjunto complementario del conjunto RC y finalmente =1α Esto
quiere decir que calcular el incremento del error nominal respecto del real es
equivalente a calcular el incremento del recubrimiento real respecto del nominal
Finalmente cuanto mayor sea la potencia del test menor seraacute la longitud
media l del IC que ocasiona (y al reveacutes)
V6 APORTACIONES DE TIPO PRAacuteCTICO
V61 Objetivo
Como se indicoacute en el Proacutelogo y en la seccioacuten anterior la evaluacioacuten de los
diferentes meacutetodos de inferencia puede realizarse desde la perspectiva de los tests de
hipoacutetesis o desde la perspectiva de los IC En esta seccioacuten tal evaluacioacuten se efectuaraacute
desde la perspectiva de los tests de hipoacutetesis
Los meacutetodos de inferencia a evaluar son inicialmente los 30 indicados al final de
la seccioacuten V2 (los meacutetodos ZW0 ZW1 ZW2 ZW3 ZW4 ZW5hellip ZE5 GW0hellip
GE5 A0hellip A4 y A5) lo que incluye las propuestas maacutes relevantes de la literatura De
ellos 22 son nuevos meacutetodos (los denominados por ZW1 y ZW4 GW con incrementos
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 165
2hellip5 ZE y A con incrementos 1hellip5 y GE con incrementos 0hellip5) Adicionalmente
se han evaluado otros meacutetodos nuevos de menor intereacutes (ver la seccioacuten V63) En todo
caso el objetivo es seleccionar el meacutetodos oacuteptimos bajo los criterios que se
especificaraacuten
V62 Descripcioacuten del estudio a realizar y de los criterios a emplear para la
seleccioacuten del meacutetodo oacuteptimo
Para efectuar la evaluacioacuten anterior se va a realizar un estudio del
comportamiento de cada meacutetodo en cada una de las siguientes combinaciones de los
paraacutemetros (a n π)
a=5 (aunque ocasionalmente tambieacuten se utilizaraacuten los valores del 1 y 10)
n= 20 40 60 80 100 y 200
π= 005 01 02 03 04 05 Se excluyen los casos πgt05 pues las hipoacutetesis nulas
H0 p=π y 0H 1ndashp=1ndashπ son equivalentes (cualquiera de los procedimientos
descritos proporcionan igual valor del estadiacutestico bajo ambas hipoacutetesis)
El proceso de obtencioacuten de datos consistiraacute en lo siguiente
1 Seleccionar una combinacioacuten (a n π meacutetodo a evaluar)
2 Construir la regioacuten criacutetica RC=x | 2 22exp z z
3 Calcular el error real del test mediante la expresioacuten (517) y el incremento del
error nominal respecto del error real De nuevo hay que tener en
cuenta que si 0 el test seraacute conservador (por lo que el IC tambieacuten lo seraacute y
tendraacute maacutes recubrimiento que el nominal) si 0 el test seraacute liberal (por lo que
el IC tambieacuten lo seraacute y tendraacute menos recubrimiento que el nominal)
4 Calcular la potencia a largo plazo =(nordm de puntos de la RC)times100N siendo N=n+1
el nordm total de puntos del espacio muestral La conveniencia de la misma frente a la
potencia tradicional ya fue justificada en la seccioacuten II62
5 Determinar en cada caso si hay o no un ldquofallordquo es decir si ndash4 ndash2 o 1
para a=10 5 o 1 respectivamente La conveniencia de esta definicioacuten fue
resentildeada tambieacuten en la seccioacuten II62
166 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
6 Para cada meacutetodo se construiraacute una tabla (como la Tabla AV1) que contemple los
valores individuales de Δα y asiacute como la informacioacuten de en queacute circunstancias
falla el meacutetodo
7 Por uacuteltimo para cada combinacioacuten se calcularaacute el nordm total de fallos (F) y los valores
medios de ( ) y de ( ) Como se han omitido los valores πgt05 los
caacutelculos anteriores se realizaraacuten asignaacutendole peso 1 al caso π=05 y peso 2 al resto
de casos Estas tablas resumen seraacuten dobles unas para nle60 y otras para nge80 la
razoacuten para ello es que hemos comprobado que las conclusiones variacutean fuertemente
seguacuten sea la gama de n que se contemple
Una vez obtenidos los resultados la seleccioacuten del meacutetodo oacuteptimo se realizaraacute bajo
los siguientes criterios
(a) Se daraacute especial importancia al caso α=5 (por ser el error nominal maacutes frecuente)
(b) Se descartaraacuten los meacutetodos con un excesivo nuacutemero de fallos (pues con demasiada
frecuencia son excesivamente liberales) mostrando preferencia por los meacutetodos con
menos fallos
(c) Entre los meacutetodos que queden se eligen los que tengan un maacutes cercano a 0 (es
decir los meacutetodos con un error medio cercano al nominal) En caso de empate se
prefieren los meacutetodos conservadores ( gt0) a los liberales ( lt0) para que asiacute
las significaciones sean fiables
(d) Entre los meacutetodos que queden se prefieren los de mayor potencia Aquiacute hay que
tener en cuenta que si un meacutetodo cualquiera A es maacutes liberal que otro meacutetodo B
entonces B A y es esperable que B A (lo que no significa que A sea
mejor meacutetodo que B)
La seleccioacuten se efectuaraacute por fases seleccionando primero el mejor meacutetodo de
cada familia (es decir de cada procedimiento) y comparando al final entre siacute todos los
seleccionados
Adicionalmente la necesaria restriccioacuten de espacio que implica esta memoria
nos impide presentar los resultados de todos los meacutetodos comparados restringieacutendonos
exclusivamente a los 30 meacutetodos principales resentildeados arriba (los restantes estaacuten
disponibles para el lector que lo desee)
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 167
V63 Seleccioacuten del meacutetodo oacuteptimo de cada familia (en sus versiones sin cpc)
V631 Seleccioacuten entre los meacutetodos de tipo Z (a=5)
Una parte de la Tabla AV1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico Z en tanto que una parte de la Tabla AV2 contiene el resumen
de los mismos A la vista de los resultados puede observarse que
Los meacutetodos ZW0 ZW1 ZE2 ZE3 y ZE4 deben descartarse por su gran nuacutemero de
fallos Tambieacuten se descartan los meacutetodos ZW5 y ZE5 pues aunque no tienen fallos
son demasiado conservadores y tienen poca potencia
Para n60 los mejores meacutetodos son por este orden los ZW2 ZW3 y ZW4 (todos
ellos muy conservadores)
Para ngt60 se observa que el meacutetodo ZE0 (ligeramente conservador) es mucho mejor
que los meacutetodos ZW2 ZW3 y ZW4 (que son muy conservadores e iguales entre siacute)
los cuales a su vez son mejores que el meacutetodo ZE1 (que es liberal)
De lo anterior se deduce que una seleccioacuten global aconseja descartar los meacutetodos ZW4
(peor o igual que los ZW2 y ZW3 pero maacutes complicado) y ZE1 (que no resulta
seleccionado para n60 y es el peor de los seleccionados para ngt60)
La conclusioacuten es que el mejor meacutetodo de este grupo es ZW2 para tamantildeos de
muestra n60 seguido de ZW3 Para tamantildeos de muestra ngt60 se selecciona ZE0
(seguido de ZW2 y ZW3 que son iguales entre siacute)
V632 Seleccioacuten entre los meacutetodos de tipo G (a=5)
Una parte de la Tabla AV1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico G en tanto que una parte de la Tabla AV2 contiene el
resumen de los mismos Puede observarse que todos los meacutetodos G son peores que los
seleccionados en el caso Z pues los primeros tienen maacutes error yo menos potencia que
los segundos Aunque para ngt60 los meacutetodos GW1 GE2 GE3 y GE4 no son mucho
peores que los meacutetodos Z seleccionados siacute que son maacutes complicados de ahiacute que ninguacuten
meacutetodo de tipo G sea seleccionado
168 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
V633 Seleccioacuten entre los meacutetodos de tipo A (a=5)
Una parte de la Tabla AV1 contiene los datos completos de todos los meacutetodos
basados en el estadiacutestico A en tanto que una parte de la Tabla AV2 contiene el
resumen de los mismos De esta uacuteltima se deduce que todos los meacutetodos A son peores
que los seleccionados en el caso Z por tener maacutes error y menos potencia que ZW2 (en
n60) o ser maacutes liberales que ZE0 sin ganar por ello en potencia (en ngt60) A pesar de
todo si se permite alguacuten fallo en el caso de n60 el mejor de estos meacutetodos es el A1 el
cual es conservador para n60 y algo liberal para ngt60
Adicionalmente se ha evaluado la Transformacioacuten de Anscombe en el
estadiacutestico arco seno (incrementar los datos en h=38) lo que hemos denominado
anteriormente por Caso 15 (por encontrarse a mitad de camino entre los Casos 1 y 2)
que proporciona el meacutetodo A15 Por otro lado en el caso del meacutetodo A15 el
estadiacutestico original de Anscombe era
AA 2 1 1 4 0 25expz | sen p sen | c n
lo que da lugar al meacutetodo AA15 Hemos comprobado que ninguna de las
modificaciones anteriores logra mejorar la actuacioacuten del meacutetodo seleccionado (solicitar
los datos al autor)
V64 Seleccioacuten del meacutetodo oacuteptimo sin cpc de entre los mejores de cada familia
(α=1 5 y 10) caso general y evaluacioacuten detallada
Con el fin de comparar los meacutetodos ZE0 ZW2 ZW3 y A1 seleccionados en la
seccioacuten anterior y evaluarlos para los errores del 1 5 y 10 se han obtenido las
Tablas AV3 y AV4 que contienen los resultados completos y resumidos para los
cuatro meacutetodos respectivamente (las tablas del 5 ya son conocidas pero se las vuelve
a incluir para facilitar las comparaciones) Analizando dichas tablas puede observarse
de modo general que
Para nle60 los mejores meacutetodos son el A1 para αle5 y el ZW2 para α=10 De
entre los sencillos el mejor es el ZW3 Ademaacutes no debe utilizarse el meacutetodo ZE0
pues puede tener muchos fallos
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 169
Para ngt60 el mejor meacutetodo es ZE0 seguido de A1 De entre los sencillos el mejor
vuelve a ser el ZW3
Con el fin de evitar la excesiva globalizacioacuten anterior y determinar maacutes
detalladamente en queacute momento (en funcioacuten del tamantildeo muestral n) es preferible un
meacutetodo u otro las Tablas AV5 y AV6 presentan los resultados completos y el resumen
de los mismos (respectivamente) para los cuatro meacutetodos aludidos (ZE0 ZW2 ZW3 y
A1) para n=10 (10) 100 150 200 y para los tres errores A partir de ellas se observa
que la seleccioacuten de un meacutetodo u otro en cada circunstancia no es totalmente estable
pero siacute apuntan ciertas tendencias claras que pueden resumirse en lo que sigue
Para α=1 el mejor meacutetodo es el ZE0 seguido del A1 (aunque los meacutetodos ZW2
y ZW3 van bien)
Para α=5 el mejor meacutetodo es el A1 seguido de los ZW2 y ZW3 primero (que
son similares) y del ZE0 despueacutes (que solo debe utilizarse para nge50)
Para α=10 el mejor meacutetodo es el A1 (salvo para 40lenle70) seguido de los ZW2 y
ZW3 primero (que vuelven a ser similares) y del ZE0 despueacutes (que solo debe
utilizarse para nge30)
La conclusioacuten global es por tanto que los meacutetodos oacuteptimos son el A1 (para
α=5 o 10) y el ZE0 (para α=1) seguidos de cerca por los meacutetodos ZW2 y ZW3
que son similares entre siacute (de estos dos uacuteltimos seraacute preferible el ZW2 por ser el maacutes
sencillo) Tambieacuten conviene resentildear que aunque de modo general el meacutetodo ZE0 no va
mal el mismo solo debe aplicarse para nge50
V65 Seleccioacuten del meacutetodo oacuteptimo consin cpc de entre los cuatro meacutetodos oacuteptimos
seleccionados (α=5)
Con el fin de ver si la aplicacioacuten de una cpc mejora los resultados de los cuatro
meacutetodos seleccionados en la seccioacuten V63 la Tabla AV7 presenta los datos originales
y la Tabla AV8 el resumen de los mismos en sus dos versiones sin y con cpc (meacutetodos
ZW2 ZW3 ZE0 A1 en el caso de SIN cpc meacutetodos ZW2c ZW3c ZE0c y A1c en el
caso de CON cpc) y a los errores del 1 5 y 10 De ella se deduce que solo los
meacutetodos ZE0c y A1c mejoran respecto a su versioacuten sin cpc para nle60 (pues dejan de
tener fallos) pero ello es a cambio de perder bastante potencia De ahiacute que se
mantengan las conclusiones de la seccioacuten anterior
170 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
V66 Verificacioacuten de los resultados de la literatura
La literatura ha analizado algunos de los meacutetodos descritos anteriormente y
establecido conclusiones acerca de su comportamiento absoluto o relativo a otros
meacutetodos Aquiacute se trata de ratificarlas o criticarlas en base a nuestros datos (algunas
conclusiones aparecen ya mencionadas en la seccioacuten V42) Con tal fin aludiremos a la
Tabla AV9 que resumen los resultados de los meacutetodos implicados Comparativamente
entre ellos (y sin tener mucho en cuenta su nuacutemero de fallos) la conclusioacuten es
Para nle60 ZW2 gt ZW3 gt ZE0 gt ZW5 gt ZE0c gt A0 gt ZW0c gt ZW0
Para ngt60 ZE0 gt ZW2=ZW3 gt ZW5 gt A0 gt ZE0c gt ZW0c gt ZW0 (los tres
meacutetodos subrayados son de diferenciacioacuten dudosa)
Globalmente ZE0 ZW2 ZW3 gt ZW5 gt ZE0c A0 ZW0c gt ZW0
Las principales conclusiones de la literatura son las que siguen las cuales se
comentan si no se deducen directamente de las conclusiones especificadas arriba
ndash Tanto Ghost (1979) como Boumlhning (1988) afirman que el meacutetodo ZE0 es mejor que
el A0 superando ambos al ZW0 (que es erraacutetico y no debe utilizarse) nuestros
resultados son conformes con la afirmacioacuten
ndash Blyth amp Still (1983) y Newcombe (1998) indican que el meacutetodo ZW0c es mejor
que el ZW0 pero nuestros resultados indican que esto es cierto siempre Los
primeros autores tambieacuten afirman que ZE0c es mejor que ZE0 mientras que el
segundo afirma lo contrario nuestro anaacutelisis avala la segunda afirmacioacuten
ndash Blyth amp Still (1983) tambieacuten afirman que ZE0c es mejor que ZW0c Nuestros
resultados indican que eso es bien claro para el caso de nle60 pero que no lo es
tanto para ngt60
ndash Seguacuten Newcombe (1998 b) el meacutetodo ZE0 es mejor que los meacutetodos ZW0 y ZWc
nuestros resultados son conformes con la afirmacioacuten
ndash Seguacuten Chen (1990) el meacutetodo ZW3 es mejor que el A0 que a su vez es mejor que
el ZW0 nuestros resultados son conformes con la afirmacioacuten
ndash Agresti amp Coull (1998) abogan por el buen comportamiento de los meacutetodos ZW3
ZW2 y ZE0 nuestros resultados son conformes con la afirmacioacuten
ndash Borkowf (2006) indica que el meacutetodo ZW5 es mejor que el ZW3 nuestros datos
indican lo contrario
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 171
Adicionalmente Brown et al (2001) afirman que los meacutetodos GW0 y GW1
funcionan mal y que el meacutetodo A0 es peor que el A15 que a su vez es peor que los
ZW2 y ZE0 Nuestros resultados de las secciones V632 y 3 (con sus tablas) son
conformes con lo anterior Por otra parte los mismos autores defienden que los meacutetodos
oacuteptimos son ZE0 para nle40 y ZW2 o ZE0 (que son iguales entre siacute) para ngt40
Nuestros resultados indican lo contrario en el caso de nle40 asiacute como que ZE0 algo
mejor que ZW2 para ngt40
V7 CONCLUSIONES FINALES Y EJEMPLOS
V71 Meacutetodo oacuteptimo
Por todo lo resentildeado en las secciones anteriores pueden concluirse que todos los
meacutetodos claacutesicos de la literatura funcionan muy bien siendo los meacutetodos oacuteptimos los
resentildeados en el cuadro de abajo Obseacutervese que uno de los meacutetodos seleccionados es
una nueva aportacioacuten de esta memoria
SELECCIOacuteN DEL MEJOR MEacuteTODO PARA EL CASO DE UNA
PROPORCIOacuteN
α=1 ZE0 es el mejor meacutetodo (pero es fiable de modo general cuando nge50)
α=5 o 10 A1 es el mejor meacutetodo
En ambos casos (para cualquier ) puede emplearse el meacutetodo ZW2 pues siendo
solo un poco peor que los anteriores es maacutes sencillo
V72 Foacutermulas aconsejadas para realizar inferencia
V721 Meacutetodo oacuteptimo para 5 A1
El estadiacutestico de contraste y el IC viene dados por las expresiones (el incremento
ya ha sido incluido en las mismas)
2
2 1 11
0 54 1
1A
x z sin sin n
n
y
2 1 20 5
1 2 1zx
p sin sinn n
172 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
V722 Meacutetodo oacuteptimo para =1 (vaacutelido tambieacuten en general si n50) ZE0
El estadiacutestico de contraste y el IC viene dados por las expresiones
2
20
1ZE
x nz
n
y
2 22 2
2
22
2 4
x n xz zx z
npn z
V723 Meacutetodo maacutes sencillo y solo un poco peor que los anteriores ZW2
El estadiacutestico de contraste y el IC viene dados por las expresiones (el incremento
ya ha sido incluido en las mismas)
2
22
2 4
4 2 2ZW
x nz
n x n x
y
2
2 22
44
x n xx z
npn
V73 Ejemplos praacutecticos
Newcombe (1998) cita varios ejemplos alusivos a un estudio realizado por
Turnbull et al (1992) sobre la prevalencia del VIH en la poblacioacuten de ex prisioneros de
Inglaterra de 1990 De estos ejemplos seleccionamos dos uno con un valor de n grande
y otro con un valor de n pequentildeo En el primero de ellos se considera una muestra de
148 individuos toxicoacutemanos (hombres y mujeres) de los que en 15 se han detectado
anticuerpos positivos del VIH En el segundo se considera una muestra de 29 mujeres
no toxicoacutemanas de las que solo 1 da positiva en el anaacutelisis de dichos anticuerpos La
Tabla V1 muestra los intervalos de confianza para cada una de las muestras utilizando
los tres meacutetodos seleccionados
Tabla V1
Intervalos de confianza al 95 (en ) para una proporcioacuten p calculada con los tres meacutetodos oacuteptimos (entre pareacutentesis se indica la amplitud del intervalo)
Meacutetodo ZW2 ZE0 A1 n=145 x=15
630 - 1651 (1021 )
637 - 1637 (1000)
616 - 1611 (995)
n=29 x=1
000 - 1890 (1890 )
061 - 1718 (1657 )
022 - 1548 (1526 )
CAPIacuteTULO V K=1 O EL CASO DE UNA PROPORCIOacuteN 173
En ambos casos se observa que el meacutetodo ZW2 (que es el maacutes conservador) es
el que proporciona unos IC maacutes amplios en tanto que el meacutetodo A1 (que es el oacuteptimo)
es el que proporciona unos IC maacutes estrechos Tambieacuten se observa que los tres meacutetodos
proporcionan similares resultados cuando n es grande (n=145) pero que los mismos
difieren bastante cuando n es pequentildeo (n=29) En este uacuteltimo caso ya se ha dicho que el
meacutetodo ZE0 no es fiable (pues nlt50) y ello a pesar de proporcionar un intervalo maacutes
amplio que el meacutetodo oacuteptimo A1 (que siacute es fiable) por el contrario el meacutetodo ZW2 siacute
es fiable pero ello ha sido a costa de proporcionar un IC bastante maacutes amplio que el que
proporciona el meacutetodo A1
CAPIacuteTULO VI
K=2 EN EL CASO ESPECIAL DE LA RAZOacuteN DEL
PRODUCTO CRUZADO
VI1 INTRODUCCIOacuteN
Como se ha indicado en capiacutetulos anteriores uno de los objetivos tradicionales
en Ciencias de la Salud es la comparacioacuten de las dos proporciones de individuos pi (i=1
2) que presentan una caracteriacutestica de intereacutes en dos poblaciones distintas a cuyo fin lo
maacutes habitual es tomar dos muestras independientes de cada una de ellas Para evaluar la
relacioacuten entre ambas proporciones existen muy diversas medidas pero las maacutes
frecuentes son d=p2ndashp1 (diferencia de proporciones) R=p2p1 (cociente de
proporciones) y O=p2q1p1q2 (razoacuten de producto cruzado u odds-ratio) El caso d fue
abordado en el capiacutetulo II el caso R lo fue en el III siendo el objetivo actual el caso O
En consecuencia nuestro intereacutes radica ahora en las inferencias asintoacuteticas de dos colas
sobre O (test H0 O=θ vs H1 Oneθ o IC para O)
Como se sabe la odds-ratio es una de las medidas estadiacutesticas y epidemioloacutegicas
maacutes importantes siendo el uacutenico paraacutemetro del modelo condicionado (una distribucioacuten
hipergeomeacutetrica generalizada) De hecho es el mejor paraacutemetro posible para medir la
asociacioacuten en una Tabla 22 pues puede estimarse en cualquier tipo de estudio y su
magnitud absoluta no variacutea al permutar filas entre siacute columnas entre siacute o filas por
columnas (cosa que no sucede con otros paraacutemetros como d o R)
Como se ha comentado en el Proacutelogo el paraacutemetro O no puede estimarse desde
la perspectiva de una combinacioacuten lineal de proporciones (que es la planteada en esta
memoria) pero conviene aludirlo aquiacute dado lo frecuente de su uso y su relacioacuten con el
paraacutemetro R cuando la prevalencia de la enfermedad es pequentildea (que es lo usual) Este
capiacutetulo tiene pues la finalidad de recoger resumir y discutir los meacutetodos propuestos en
la literatura acerca de las inferencias asintoacuteticas sobre O
176 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
La Tabla VI1 presenta los datos obtenidos en este tipo de estudios en donde de
nuevo SIacuteNO alude a la presencia o ausencia de la caracteriacutestica que se estudia ix ( iy )
al nordm de individuos de entre los in (tamantildeo de muestra) que siacute (no) presentan la
caracteriacutestica 1a =xi ( 2a =yi) al total de individuos que siacute (no) presentan la
caracteriacutestica y finalmente n =ai=ni al tamantildeo total de la experiencia Las dos
variables aleatorias (xi) siguen distribuciones binomiales independientes ( )i i ix B n p
con 12i en donde ip es la proporcioacuten (desconocida) de individuos de la poblacioacuten i
que presentan la caracteriacutestica en estudio
Tabla VI1
Tabla 2times2 para muestras independientes
Muestras SIacute NO Total
1 x1 y1 n1
2 x2 y2 n2
Total a1 a2 n
VI2 NOTACIOacuteN
VI21 Generalidades y estadiacutesticos base
Sean dos variables aleatorias binomiales independientes xiB(ni pi) con i=1 y
2 y 2 1 2 1O p q q p el paraacutemetro de intereacutes (con las proporciones pi desconocidas y
qi=1ndashpi) Sea 2 1 2 1O p q q p la estimacioacuten muestral del paraacutemetro poblacional O con
ip =xini las proporciones muestrales y 1i iq p Para contrastar H0 O=θ vs H1 Oθ
(con 0le θ le infin ya que 0lepile1) es necesario seleccionar primeramente un estadiacutestico de
contraste de entre los siguientes (que en adelante seraacute aludido abreviadamente por el
nombre en negrita que se indica)
X 2 2
2 i i i i i iX
i i i i i
n p p x n pz
p q n p q
(61)
L 2 2
2
1 1 1L
i i i i i i i
lnO lnθ lnO lnθz
n p q n p n q
(62)
CAPIacuteTULO VI K=2 EN EL CASO ESPECIAL DE LA RAZOacuteN DEL PRODUCTO CRUZADO 177
En cualquiera de los dos casos habraacute que comparar el valor experimental del
estadiacutestico 2expz ( 2
Xz o 2Lz ) con 2
2z en donde 2z es el percentil (1ndashα2)100 de la
distribucioacuten normal tiacutepica Para obtener el IC (1ndashα) para O se invierte el test despejando
θ en la ecuacioacuten 2 22exp z z En algunas ocasiones la solucioacuten seraacute expliacutecita (y maacutes o
menos sencilla) en otras requeriraacute de un procedimiento iterativo
VI22 Estimadores de las proporciones pi
En los dos estadiacutesticos anteriores (X o L) y con el fin de que tengan utilidad
praacutectica las dos proporciones pi desconocidas deben ser sustituidas por alguno de sus
estimadores En lo que sigue se describen los mismos y se pone en mayuacutesculas y negrita
la letra abreviada que designaraacute el procedimiento que proporciona cada estimador (letra
que hay que antildeadir a la del estadiacutestico X o L utilizado)
El estimador maacutes simple y conocido es el estimador claacutesico de maacutexima
verosimilitud simple (es decir las proporciones muestrales)
W (Wald) i i ip x n (63)
El estimador de pi restringido por H0 es el obtenido por el meacutetodo condicionado
Cornfield (1956) o por el meacutetodo incondicionado Miettinen amp Nurminen (1985)
dado por la uacutenica expresioacuten
E (Condicionado o Incondicionado) 1 2 1Si =1 ˆ ˆp p a n en otro caso (si 1 )
2
1 2 1 1 1 2 1 1 1 1
11
1 1 12
2
4 1
2 1
a n a n a n a n n ap
n
ˆa n pp
n
(64)
VI23 Procedimientos de inferencia que se obtienen con cada estimador
Cuando en las dos expresiones (61) y (62) se sustituye cada uno de los dos
estimadores aludidos en la seccioacuten anterior se obtienen cuatro estadiacutesticos que dan
178 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
lugar a los cuatro procedimientos de inferencia que notaremos por XW XE LW y LE
respectivamente (la unioacuten de las letras del estadiacutestico y del estimador) Sin embargo en
lo que sigue se excluiraacuten los procedimientos XW (pues su estadiacutestico tiene un valor
nulo) y LE (pues la literatura no suele aludirlo) Por ello en este capiacutetulo solo se
consideraraacuten 2 procedimientos (los XE y LW) que proporcionan dos estadiacutesticos (los
2XEz y 2
LWz ) y dos IC (los ICXE e ICLW)
VI24 Datos muestrales a utilizar y meacutetodos de inferencia que proporcionan
Las foacutermulas anteriores pueden utilizarse en base a los datos originales (xi yi) o
en base a los datos incrementados en una cantidad determinada hi es decir en base a los
datos (xi+hi yi+hi ni+2hi) Este incremento como se ha comentado repetidamente en los
capiacutetulos anteriores tiene su origen en los meacutetodos ldquoadjustedrdquo Wald cuyo objetivo no
es otro que el de mejorar el comportamiento de los procedimientos basados en el
estimador W Los valores posibles de hi se denotan con el diacutegito (en negrita) que los
identificaraacute (el cual se antildeadiraacute a las letras de los procedimientos descritos arriba)
0 hi=0 (claacutesico)
1 hi=05 (Woolf)
Cada uno de los 2 incrementos anteriores (0 y 1) puede aplicarse a cada uno de
los 2 procedimientos de la seccioacuten anterior (XE o LW) dando lugar asiacute a 4 meacutetodos de
inferencia distintos En lo que sigue ellos seraacuten notados por la letra del procedimiento y
el diacutegito del incremento correspondiente XE0 LW0 y LW1 (no se tendraacute en cuenta el
meacutetodo XE1 ya que no es mencionado por la literatura)
VI3 RESULTADOS DE LA LITERATURA
VI31 Resultados de tipo teoacuterico
VI311 Meacutetodos basados en el estadiacutestico X
El claacutesico estadiacutestico chi-cuadrado de Pearson dado por la expresioacuten (222) fue
propuesto por Cornfield (1956) para el Caso O dando lugar al estadiacutestico 2Xz de la
expresioacuten (61) La foacutermula anterior carece de sentido hasta que las pi desconocidas sean
sustituidas por la estimacioacuten apropiada restringida a la hipoacutetesis nula Bajo H0 O=θ
sucede que
CAPIacuteTULO VI K=2 EN EL CASO ESPECIAL DE LA RAZOacuteN DEL PRODUCTO CRUZADO 179
12
11 1
pp
p
(65)
por lo que p1 es el uacutenico paraacutemetro desconocido Desde el punto de vista condicionado
(es decir condicionando en que los eacutexitos siempre sumen el valor observado a1) el
estimador sugerido por Cornfield (1956) viene dado por la expresioacuten (64)
Alternativamente desde el punto de vista incondicionado Miettinen amp Nurminen
(1985) proponen el estimador de maacutexima verosimilitud bajo H0 (sin condicionar en los
marginales) dando la foacutermula expliacutecita para su caacutelculo
1 221 4 2
p B B AC A
y 2 1 11 1ˆ ˆ ˆp p p (66)
con A=n1(θndash1) B=n2θ+n1ndasha1(θndash1) y C=ndasha1 Se puede observar que la expresioacuten (66) es
ideacutentica a la expresioacuten (64) por lo que los valores de 1p y 2p son los mismos bajo
ambas perspectivas (de ahiacute que se use la misma notacioacuten) La clave de esta equivalencia
estaacute en la expresioacuten 2 2 2 1 1 1n p p n p p obtenida en la estimacioacuten de pi tanto
por el meacutetodo condicionado (a1=x1+x2) como por el meacutetodo de maacutexima verosimilitud
por lo que aunque el anaacutelisis condicional en los marginales es admisible para O este
punto de vista no es necesario (Miettinen amp Nurminen 1985)
Con ello las proporciones estimadas (independientemente del punto de vista
utilizado) seraacuten
2
1 1 2 1 1 1 2 1 1 1 11
2
2 1 2 1 1 1 2 1 1 1 12
14 1
2 1
14 1
2 1
p a n a n a n a n n an
p a n a n a n a n n an
(67)
donde 2p se obtiene sustituyendo en (65) el valor de 1p (con las dos excepciones
indicadas entonces para el caso de =1)
En base a lo anterior el estadiacutestico 22XE i i i i iacute i
ˆ ˆ ˆz x n p n p q puede ponerse en
funcioacuten de 1p (Miettinen amp Nurminen proponen el mismo estadiacutestico pero
multiplicado por (n1)n)
2
22 1 1 121 1 1 1 1 2
1 1
11 1 1XE
i i i
ˆx n pˆ ˆz x n p n p n
ˆ ˆ ˆ ˆn p q p q
(68)
o bien en funcioacuten de 2p
180 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
2
22 2 2 222 2 2 2 2 1
2 2
11 1 1XE
i i i
ˆx n pˆ ˆz x n p n q n
ˆ ˆ ˆ ˆn p q p q
(69)
Si el objetivo es obtener el IC basta con resolver en θ la ecuacioacuten 2 22XE z z
(Cornfield 1956) obteniendo de modo iterativo las dos soluciones (θL θU) Gart amp
Thomas (1982) sentildealan que un modo maacutes simple consiste en utilizar la notacioacuten
i i iˆ ˆn p x y i i iˆ ˆn q y de modo que la expresioacuten 2 22 XEz z en funcioacuten de 1x seraacute
22 1 2
2 1 11 1 1 1 1 2 1 1
n nˆz x x
ˆ ˆ ˆ ˆx n x a x n a x
2
1 11 1 1 1 1 2 1 1
1 1 1 1ˆx x
ˆ ˆ ˆ ˆx n x a x n a x
lo que proporciona una ecuacioacuten de cuarto grado en 1x de soluciones 1 1L Uˆ ˆx x
Trasladando dichas soluciones al paraacutemetro θ en base a la expresioacuten
1 1 1 1
1 2 1 1
ˆ ˆa x n x
ˆ ˆx n a x
(610)
se consigue el intervalo deseado (θL θU) para O
VI312 Meacutetodos basados en el estadiacutestico L
Otro estadiacutestico bien conocido propuesto por Woolf (1955) es el estadiacutestico L
basado en la transformacioacuten logariacutetmica En lugar de considerar la variable aleatoria O
se contempla su logaritmo neperiano 2 1 2 1lnO ln p q q p que se distribuye de modo
aproximadamente normal con media y varianza las siguientes
2 1
2 1 1 1 1 2 2 2
1 1
1 1dp p
lnO ln ln N lnOp p n p q n p q
Es por ello que para contrastar H0 O=θ el estadiacutestico apropiado viene dado por la
expresioacuten (62) Invirtiendo la misma se obtiene el IC siguiente
ICL 2 1 1 1 2 2 21 1O O exp z n p q n p q
Las expresiones anteriores como en el caso del estadiacutestico chi-cuadrado no tienen
utilidad hasta que las proporciones pi desconocidas sean sustituidas por una estimacioacuten
de ellas Woolf propone el estimador de maacutexima verosimilitud simple dado por (63)
CAPIacuteTULO VI K=2 EN EL CASO ESPECIAL DE LA RAZOacuteN DEL PRODUCTO CRUZADO 181
obteniendo asiacute el claacutesico procedimiento LW El estadiacutestico de contraste e IC seraacuten por
tanto los siguientes
22 1 1LW
i i i
z ln O x n x
(611)
ICLW 21 1 1 2 2 2
1 1 1 1O O exp z
x n x x n x
(612)
Es conocido que el procedimiento LW de Woolf tiene en general un mal
comportamiento Con el fin de mejorarlo diversos autores han propuesto aplicarlo no
en base a los datos originales (meacutetodo LW0) sino en base a los datos incrementados en
una cantidad hi dando lugar a los denominados meacutetodos ldquoadjustedrdquo Woolf El
incremento maacutes habitual es hi=05 (meacutetodo LW1) propuesto por Gart (1966) y evaluado
en el trabajo de Gart amp Thomas (1982) Agresti et al (2008) en su artiacuteculo acerca de
comparaciones muacuteltiples (que no son objeto de esta memoria) mencionan para el Caso
O un incremento propuesto por Agresti (1999) para el procedimiento LW el mismo
consiste en antildeadir a cada valor xi (yi) la cantidad 212 in a n ( 2
22 in a n ) con i=1 o 2
pero este tipo de incremento solo se recomendaba en el caso de contar con alguacuten dato
nulo y para tamantildeos de muestra pequentildeos
VI313 Estadiacutesticos con correccioacuten por continuidad
Es conocida la necesidad de utilizar una cpc cuando se aproxima una variable
discreta (como las actuales binomiales) a traveacutes de una variable continua En el caso del
estadiacutestico chi-cuadrado es habitual aplicar la claacutesica cpc de Yates es decir c=05
Utilizando la expresioacuten (61) se obtiene el estadiacutestico
2
2 si
0 si i i i i i i i i i
Xc
i i i
| x n p | c n p q | x n p | cz
| x n p | c
(613)
En particular el procedimiento XEc fue propuesto inicialmente por Cornfield (1956)
cuyo estadiacutestico de contraste -utilizando la primera expresioacuten de (68)- seraacute de la forma
2
2 1 1 1 1 1 1
1 1 1
1 si
0 si i i i
XEc
ˆ ˆ ˆ ˆ| x n p | c n p q | x n p | cz
ˆ| x n p | c
(614)
182 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
VI314 Estadiacutesticos desde la perspectiva del ln O
Siqueira et al (2008) trabajan tomando como referencia el paraacutemetro ψ= ln O
y la hipoacutetesis nula H0 ψ=ψ0 en donde ψ0= ln con nuestra notacioacuten Utilizando el
meacutetodo de las marcas obtienen el siguiente estadiacutestico de contraste
2 2 22 1 02 2 2
2 2 1 2 0
2
2 2u
n k n g exp ψa x hyW
a h a hn n exp ψ
(615)
con g=2a2+h 2 02k a exp ψ h y 214h b a d donde 2 0d a exp ψ y
2 1 0 1 1b n a exp ψ n a En el mismo estudio Siqueira et al obtienen tambieacuten
el siguiente estadiacutestico We (que aluden como el estadiacutestico de Wald)
2
0
1 1 1 2 2 2e
ψ ψW
n x y n x y
donde ψ ln O (616)
VI32 Resultados de tipo praacutectico
VI321 Generalidades sobre los estudios de simulacioacuten
Al igual que en los casos anteriores la mayoriacutea de los autores plantean el
problema de seleccionar el meacutetodo oacuteptimo desde el punto de vista de los IC Para ello
comparan el recubrimiento R y la longitud media l da cada meacutetodo de IC para unos
valores fijados de pi (i=1 2) paraacutemetros que vienen dados por las expresiones
1 2
1 1 2 21 2
1 2
1 21 1 2 2 1 2
0 0 1 2
1 1n n
n x n xx x
x x
n nR p p p p I x x
x x
(617)
1 2
1 1 2 21 2
1 2
1 21 1 2 2
0 0 1 2
1 1n n
n x n xx xS I
x x
n nl p p p p O O
x x
(618)
en donde I(x1 x2)=1 si I SO O O -el IC obtenido con la pareja (x1 x2)- e I(x1 x2)=0 en
otro caso Dado que R es una probabilidad entonces 0leRle1 Se considera como es
habitual que un meacutetodo de IC es mejor cuanto menor sea su longitud l y cuanto maacutes
cercano sea su recubrimiento real R al recubrimiento nominal de 1ndashα Adicionalmente es
CAPIacuteTULO VI K=2 EN EL CASO ESPECIAL DE LA RAZOacuteN DEL PRODUCTO CRUZADO 183
aconsejable la simplicidad del IC es decir que sea faacutecil de recordar de calcular de
entender y de presentar
VI322 Conclusiones de la literatura
Las principales conclusiones obtenidas a partir de las diversas comparaciones
efectuadas por los distintos autores pueden resumirse como sigue
1) Gart amp Thomas (1982) evaluacutean los meacutetodos XE0 y LW1 (ademaacutes de uno erroacuteneo
de Miettinen) Los autores observan que el meacutetodo LW1 tiene un recubrimiento en
general superior al recubrimiento nominal y en el caso de que Ogt1 tiende a
subestimar el liacutemite superior del intervalo En cuando al meacutetodo XE0 el mismo se
comporta mucho mejor que el anterior (para cualquier valor de O) y alcanza
uniformemente el recubrimiento nominal Es por ello que concluyen que el meacutetodo
oacuteptimo estaacutendar para cualquier caso es el XE0
2) Lui amp Lin (2003) evaluacutean los meacutetodos LW0 LW1 XE0 y XE0c observando que el
meacutetodo XE0c es demasiado conservador y puede perder eficacia (especialmente
cuando los tamantildeos de muestra no son grandes) mientas que el meacutetodo XE0 tiene
un comportamiento bastante bueno (tanto por el recubrimiento como por la longitud
del intervalo) Su conclusioacuten final es que cuando los tamantildeos de muestra son
pequentildeos o los valores de pi extremos (muy pequentildeos o muy grandes) es preferible
el meacutetodo XE0 mientras que para tamantildeos de muestra grandes o valores de pi
cercanos a 05 el meacutetodo oacuteptimo es el LW1
3) Lawson (2004) compara varios meacutetodos exactos o asintoacuteticos (los meacutetodos XE0
XE0c LW0 y LW1 en el uacuteltimo caso) Sobre estos uacuteltimos comprueba que (i) El
meacutetodo XE0 tiene mejor comportamiento sin cpc ya que XE0c es demasiado
conservador (aunque provoca buenos IC en cuanto a su anchura siempre que
ninguacuten dato sea nulo) (ii) El meacutetodo LW1 produce intervalos de longitud adecuada
y aunque en teacuterminos de recubrimiento no es el mejor el meacutetodo es preferible para
valores pequentildeos de O (con la ventaja antildeadida de su sencillez) (iii) En general el
mejor meacutetodo es el XE0
4) Siqueira et al (2008) concluyen que los meacutetodos XE0 y LW0 son muy similares
pero su evaluacioacuten estaacute basada en muy grandes muestras (que es donde casi
184 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
cualquier meacutetodo tendraacute un buen comportamiento) y en el caso del test de no
inferioridad
VI4 APORTACIONES
VI41 Aportaciones de tipo teoacuterico
En la seccioacuten IV314 se han mencionado dos nuevos estadiacutesticos de contraste
We y Wu obtenidos por Siqueria et al (2008) desde la perspectiva del paraacutemetro ln(O)
Sin embargo ninguno de ellos es novedoso ya que se trata de alguno de los estadiacutesticos
ya conocidos por la literatura (y definidos en este capiacutetulo)
Por un lado el estadiacutestico Wu no es otro que el claacutesico estadiacutestico 2XEz propuesto
por Cornfield (1956) y por Miettinen amp Nurminen (1985) y contemplado en la seccioacuten
VI311 aunque en un formato bastante distinto (que es lo que los confunde) Para ver
esto basta con tener en cuenta en la expresioacuten (615) que 1 1 12 1 2ˆh n p θ a
1 1 1 12 2 2 1ˆk n a θ a n p θ y 1 12 2 1ˆg n n p θ realizando operaciones
puede verse que el primer factor de (615) es el primer factor de (68) (y de igual modo
con el segundo factor) En el caso del estadiacutestico We este no es otro que el estadiacutestico
2LWz de Woolf comentado en la seccioacuten VI312 las expresiones (616) y (611) son
iguales Por tanto los estadiacutesticos Wu y We no son maacutes que los viejos estadiacutesticos 2XEz y
2LWz de los meacutetodos XE0 y LW0 respectivamente
Siqueira et al (2008) confirman con sus resultados que el meacutetodo que
proporciona el estadiacutestico We (LW0) y el meacutetodo que proporciona el estadiacutestico Wu
(XE0) tienen un comportamiento similar En nuestra opinioacuten su conclusioacuten estaacute
fuertemente influenciada por el hecho de que su trabajo se centra en el test de no
inferioridad y sobretodo por los elevados tamantildeos de muestra considerados en la
mayoriacutea de los casos
VI5 CONCLUSIONES FINALES Y EJEMPLOS
VI51 Meacutetodo oacuteptimo
Por todo lo resentildeado en las secciones anteriores pueden concluirse que en la
CAPIacuteTULO VI K=2 EN EL CASO ESPECIAL DE LA RAZOacuteN DEL PRODUCTO CRUZADO 185
literatura hay comuacuten acuerdo acerca de cuales son los meacutetodos oacuteptimos El cuadro de
abajo muestra la conclusioacuten maacutes aceptada
SELECCIOacuteN DEL MEJOR MEacuteTODO PARA EL CASO DE LA
RAZOacuteN DE PRODUCTO CRUZADO
De modo general XE0 es el mejor meacutetodo
Alternativamente con grandes muestras puede emplearse el meacutetodo LW1 (por ser
maacutes sencillo que el XE0 y funcionar bien en ese caso)
VI52 Foacutermulas aconsejadas para realizar inferencia
VI521 Meacutetodo oacuteptimo en general XE0
1) El estadiacutestico de contraste viene dado por la expresioacuten
221 1 12
0 1 1 21 1
1 1 1XE
ˆx n pˆz n p n
ˆ ˆp q
(619)
con 1p el estimador de maacutexima verosimilitud dado por
1
21 1 2 1 1 1 2 1 1 1 1
1
si 1
4 1 si 1
2 1
a n
p a n a n a n a n n a
n
2) Si el objetivo es obtener el IC calcular por meacutetodos iterativos las dos soluciones θ
de la ecuacioacuten 2 20 2XE z z
VI522 Meacutetodo maacutes sencillo casi tan bueno como el anterior (especialmente para
grandes muestras) LW1
1) Incrementar todos los datos de ambos grupos (los eacutexitos y los fracasos) en 05
2) El intervalo y el estadiacutestico de contraste vienen dados respectivamente por la
expresiones siguientes aplicadas a los datos incrementados anteriores
21 1 1 2 2 2
1 1 1 1O O exp z
x n x x n x
y
2
21
1 1LW
i i i
ln O z
x n x
(620)
186 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
VI53 Ejemplo praacutectico
Lui amp Lin (2003) citan un ejemplo proveniente del estudio realizado por Fleiss
(1979) para los datos hipoteacuteticos que aparecen en la Tabla VI2 en la que se consideran
dos muestras de igual tamantildeo para el grupo de casos y del grupo control (n1=n2=50)
Para los datos observados 1p =2050=04 y 2p =1050=02 son las proporciones
muestrales de individuos expuestos al factor de riesgo en cada uno de los grupos
obteniendo una odds-ratio muestral de 0 375O
Tabla VI2
Factor de Riesgo
Muestras Expuestos No expuestos Total
Casos 20 30 50
Control 10 40 50
Total 30 70 100
Si el objetivo es obtener un IC al 95 para el verdadero paraacutemetro poblacional
O el meacutetodo oacuteptimo XE0 aplicado a estos datos foacutermula (619) da O(01554
09072)
Alternativamente puede emplearse el meacutetodo LW1 Reconvirtiendo los datos en
x1=205 n1=51 x2=105 y n2=51 y aplicando la expresioacuten (620) el intervalo que se
obtiene es O(01600 09298) La relativamente fuerte discrepancia con el anterior
(especialmente en el extremo superior) se debe a que los tamantildeos de muestra son
pequentildeos
CONCLUSIONES
Las inferencias de dos colas sobre una combinacioacuten lineal de K proporciones
binomiales independientes son muy frecuentes en investigacioacuten aplicada especialmente
en el aacutembito de las Ciencias de la Salud Como se indicoacute en el Proacutelogo el objetivo de
esta memoria era doble (i) Proponer nuevos meacutetodos asintoacuteticos de tipo claacutesico para la
realizacioacuten de tales inferencias (ii) Seleccionar los meacutetodos oacuteptimos de entre las nuevas
propuestas y las proporcionadas por la literatura (con eacutenfasis especial en los meacutetodos de
menor intensidad de coacutemputo) En esta memoria se han efectuado aportaciones sobre
los casos generales de Kgt2 (maacutes de dos proporciones) K=2 (diferencia cociente y
combinacioacuten de dos proporciones) y K=1 (una proporcioacuten) adicionalmente y fuera del
marco anterior se ha analizado el caso de la razoacuten de producto cruzado En todos los
casos se han considerado tanto los aspectos teoacutericos como los aspectos praacutecticos
Las aportaciones maacutes relevantes de esta memoria son las siguientes
1 Definicioacuten del meacutetodo de las marcas para una combinacioacuten lineal de K proporciones
binomiales independientes meacutetodo que para K=1 o 2 es equivalente a los ya
conocidos
2 Demostracioacuten de que el claacutesico meacutetodo ldquoadjustedrdquo Wald de Agresti y otros (que es
de tipo heuriacutestico) es en realidad una aproximacioacuten del meacutetodo de las marcas (pues el
centro del intervalo del primero es aproximadamente igual al centro del intervalo de
segundo) Adicionalmente se propone una modificacioacuten del meacutetodo que mejora casi
siempre los resultados (y que es equivalente a la anterior si los datos observados no
estaacuten en la frontera del espacio muestral)
3 Generalizacioacuten de los meacutetodos de Peskun (1993) Newcombe (1998) y del arco seno
que han sido definidos por la literatura solo para unos pocos casos particulares a
todos los casos estudiados en esta memoria (los dos primeros) o a todos los casos de
K=1 o 2 (el tercero)
4 Definicioacuten de la correccioacuten por continuidad a emplear en algunos de los estadiacutesticos
estudiados
5 Definicioacuten (caso de K=2) de un nuevo estimador incondicionado de las proporciones
desconocidas pi (bajo la hipoacutetesis nula) que siendo una aproximacioacuten del estimador
incondicionado de maacutexima verosimilitud coincide con el estimador condicionado en
188 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K
PROPORCIONES INDEPENDIENTES
el caso de la diferencia de proporciones y da lugar a un meacutetodo oacuteptimo en el caso del
cociente
6 Justificacioacuten y verificacioacuten de que cualquier estadiacutestico de contraste debe verificar
determinadas propiedades de coherencia las aquiacute denominadas propiedades de
convexidad espacial y parameacutetrica
7 Justificacioacuten de la equivalencia entre la evaluacioacuten de un meacutetodo de test de hipoacutetesis
y un meacutetodo de obtencioacuten de intervalos de confianza (si el segundo se obtiene por
inversioacuten del primero)
8 Determinacioacuten del meacutetodo de inferencia asintoacutetico oacuteptimo en cada uno de los casos y
obtencioacuten de las foacutermulas expliacutecitas para el test y el intervalo de confianza (cuando
esto es posible) informacioacuten que puede encontrarse al final de cada capiacutetulo de esta
memoria Las conclusiones se han obtenido mediante la evaluacioacuten de cientos de
meacutetodos (la mayoriacutea de ellos nuevos) o en el caso del Capiacutetulo VI mediante la
discusioacuten de las afirmaciones de la literatura La siguiente tabla resume el nuacutemero de
meacutetodos evaluados el nuacutemero de ellos que son nuevas aportaciones y los meacutetodos
seleccionados en cada caso
Caso Nordm de
meacutetodos evaluados
Nordm de meacutetodosnuevos
Meacutetodos seleccionados (en negrita los que son nuevos)
K ge 3 20 17
E0 (salvo que ni10 i) W3 en otro caso (y como alternativa maacutes sencilla a
E0 aunque algo peor) Pa0 si se desea un meacutetodo que no falle casi nunca
K=2 DIFERENCIA DE PROPORCIONES
75 64
Caso general AE1 (requiere de procedimientos iterativos) ZW4 alternativa maacutes sencilla (aunque algo peor)
Caso de un contraste (δ=0) ZE0c (ZE3c) para α=1 o 5 con ni distintos
(iguales) ZE3 para α=10
K=2 COCIENTE DE
PROPORCIONES 150 137
ZAb1 ZW4 alternativa maacutes sencilla (aunque algo peor)
K=2 RESTO DE CASOS
35 31
Caso de |β1|ne|β2| oacute β1=β2 ZW4 de modo general y de modo maacutes particular
cuando α=1 o 5 (asiacute como para n1ge60 y α=10)
ZW2 para n1lt60 y α=10 Caso de β1= ndashβ2
Proceder como en el caso de la diferencia
K=1 UNA PROPORCIOacuteN
30 22
ZE0 para α=1 A1 para α=5 o 10 ZW2 alternativa maacutes sencilla (aunque un poco peor
que los dos anteriores)
CONCLUSIONES 189
9 Construccioacuten y colocacioacuten en la red de un programa gratuito (httpwwwugres
localbioestZ_LINEAR_KEXE) que permite aplicar el meacutetodo de las marcas a
cualquier valor de K del caso lineal (test o intervalo de confianza)
Adicionalmente conviene efectuar un anaacutelisis global acerca de los meacutetodos
oacuteptimos seleccionados (que se aluden en la aportacioacuten nuacutemero 8 anterior) Puede
observarse que
a) El meacutetodo oacuteptimo no es sistemaacuteticamente el mismo en todos los casos lineales
analizados (K3 K=2 ndashen sus tres versiones de la diferencia razoacuten y combinacioacuten
general y K=1)
b) El reconocido meacutetodo de las marcas (E0 en K3 y ZE0 en K2) es el mejor solo
cuando K3 (y cuando K=1 si el error objetivo es pequentildeo) teniendo muy mal
comportamiento en el caso de K=2
c) De modo general el meacutetodo ldquoadjustedrdquo Wald definido en esta memoria (E4 en K3 y
ZE4 en K2 es decir aplicar la foacutermula de Wald a los datos incrementados en una
cantidad que generalmente es de 22 2z K ) es siempre una buena y sencilla opcioacuten
aunque casi nunca es la oacuteptima (por dar lugar a un meacutetodo algo conservador)
d) Casi la totalidad de los meacutetodos oacuteptimos del caso lineal son nuevas propuestas de
esta memoria
REFERENCIAS
Agresti A ( 1999) O n l ogit c onfidence i ntervals f or t he odds -ratio w ith s mall s amples
Biometrics 55 597-602
Agresti A (2002) Categorical Data Analysis (2nd edn) Wiley New York
Agresti A ( 2003) D ealing w ith di screteness making lsquo exactrsquo co nfidence i ntervals f or
proportions d ifferences of pr oportions a nd odd s r atios m ore e xact Statistical
Methods in Medical Research 12 3-21
Agresti A and Caffo B (2000) Simple and effective confidence intervals for proportions
and difference of proportions result from adding two successes and two failures The
American Statistician 54 (4) 280-288
Agresti A a nd Coull B A ( 1998) Approximate I s B etter t han Exact f or I nterval
Estimation of Binomial Proportions The American Statistician 52 (2) 119-126
Agresti A a nd G ottard A ( 2007) N onconservative e xact s mall-sample i nference f or
discrete data Computational Statistics amp Data Analysis 51 6447-6458
Agresti A a nd M in Y ( 2001) O n s mall-sample co nfidence i ntervals f or p arameters in
discrete distributions Biometrics 57 963-971
Agresti A B ini M B ertaccini B and R yu E ( 2008) S imultaneous c onfidence
intervals for comparing binomial parameters Biometrics 64 1270-1275
Anbar D ( 1983) O n e stimating t he di fference between t wo pr obabilities w ith s pecial
reference to clinical trials Biometrics 39 257-262
Anscombe FJ (1948) The transformation of Poisson binomial and negative-binomial data
Biometrika 35 246-254
Anscombe FJ (1956) On estimating binomial response relations Biometrics 43 461-464
Armitage P (1971) Statistical Methods in Medical Research Oxford Blackwell Scientific
Publications
Baptista J and Pike MC (1977) Exact two-sided confidence limits for the odds ratio in a
2x2 table Applied Statistics 26 (2) 214-220
Barnard GA (1947) Significance tests for 2times2 tables Biometrika 34 123-138
Beal S L ( 1987) Asymptotic C onfidence Intervals f or t he D ifference b etween T wo
Binomial Parameters for Use with Small Samples Biometrics 43 (3) 941-950
Bera AK and Bilias Y (2001) Raorsquos score Neymanrsquos C(α) and Silveyrsquos LM tests an
essay on hi storical de velopments a nd s ome ne w r esults Journal of Statistical
192 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
Planning and Inference 97 9-44
Berger J O (1985) Statistical decision theory and bayesian analysis 2nd ed Springer New
York
Blyth CR and Still HA (1983) Binomial confidence intervals Journal of the American
Staistical Association 78 (381) 108-116
Boumlhning D (1988) Confidence interval estimation of a rate and the choice of sample size
Statistics in Medicine 7 865-875
Borkowf C B ( 2006) Constructing bi nomial c onfidence i ntervals w ith ne ar nom inal
coverage by adding a s ingle imaginary failure or success Statistics in Medicine 25
3679-3695
Brown L a nd Li X ( 2005) Confidence i ntervals f or two sample bi nomial d istribution
Journal of Satistical Planning and Inference 130 359-375
Brown L D C ai T T a nd D asGupta A ( 2001) I nterval e stimation for a b inomial
proportion Statistical Science 16 (2) 101-133
Brumback B a nd Berg A ( 2008) On e ffect-measure m odification r elationships a mong
changes in the relative risk odds ratio and risk difference Statistics in Medicine 27
3453-3465
Chan ISF (1998) Exact tests of equivalence and efficacy with a non-zero lower bound for
comparative studies Statistics in Medicine 17 1403-1413
Chan I SF ( 1999) Reply t o R oumlhmel a nd M ansmann ( 1999) Statistics in Medicine 18
1735-1737
Chan I SF ( 2003) Proving non -inferiority or e quivalence of t wo treatments w ith
dichotomous endpoints using exact methods Statistical Methods in Medical Research
12 37-58
Chan ISF and Zhang Z (1999) Test-based exact confidence intervals for the difference
of two binomial proportions Biometrics 55(4) 1202-1209
Chen H ( 1990) T he accuracy o f a pproximate i ntervals f or a bi nomial pa rameter
Journal of the American Statistical Association 85 (410) 514-518
Chen L -A H ung H -N a nd Chen C -R ( 2007) Maximum a verage-power ( MAP) t ests
Communications in Statistics-Theory amp Methods 36 2237-2249
Chen X (2002) A quasi-exact method for the confidence intervals of the difference of two
independent binomial proportions in small s ample c ases Statistics in Medicine 21
943-956
REFERENCIAS 193
Clopper CJ and Pearson ES (1934) The use of confidence or fiducial limits illustrated
in the case of the binomial Biometrika 26 404-413
Cohen L A Kendall M E Zang E Meschter C and D P Rose (1991) Modulation
of N -Nitrosomethylurea-Induced M ammary T umor P romotion b y Dietary Fiber
and Fat Journal of National Cancer Institution 83 496-501
Cornfield J (1956) A statistical problem arising from retrospective studies Proceedings of
Third Berkeley Symposium on Mathematical Statistics and Probability University of
California Press Berkeley and Los Angeles 135-148
Cox DR (1970) The continuity correction Biometrika 57 217-219
Dann R S a nd K och GG ( 2005) Review a nd e valuation of methods f or c omputing
confidence intervals f or the r atio of t wo pr oportions a nd c onsiderations f or non -
inferiority clinical trials Journal of Biopharmaceutical Statistics 15 85-107
Dunnett CW and Gent M (1977) Significance testing to establish equivalence between
treatments with special reference to data in the form of 2times2 tables Biometrics 33
593-602
Farrington C P a nd M anning G ( 1990) T est statistics a nd s ample s ize f ormulae f or
comparative binomial trials with null hypothesis of non-zero risk difference or non-
unity relative risk Statistics in Medicine 9 1447-1454
Feigin P D a nd L umelskii Y P ( 2000) O n c onfidence l imits f or t he di fference of t wo
binomial parameters Communications in Statistics-Theory amp Methods 29 (1) 131-
141
Fieller EC (1944) A Fundamental Formula in the Statistics of Biological Assay and Some
Applications Quarterly Journal of Pharmacy and Pharmacology 17 117-123
Fleiss JL (1979) Confidence intervals for the odds ration in case-control studies the state
of the art Journal of Chronic Diseases 32 69-77
Gart JJ (1966) Alternative analyses of contingency tables Journal of the Royal Statistical
Society B 28 164-179
Gart JJ a nd N am J ( 1988) A pproximate i nterval e stimation of t he r atio of bi nomial
parameters A review and corrections for skewness Biometrics 44 323-338
Gart JJ and Thomas DG (1982) The performance of three approximate confidence limit
methods for the odds ratio American Journal of Epidemiology 115 (3) 453-470
Ghosh B K ( 1979) A c omparison of s ome a pproximate c onfidence i ntervals f or t he
binomial parameter Journal of the American Statistical Association 74 (368) 894-
194 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
900
Good I J ( 1983) G ood t hinking t he f oundations of pr obability a nd its a pplications
Minneapolis MN University of Minnesota press
Greenland S ( 2001) Simple a nd e ffective c onfidence i ntervals f or p roportions a nd
difference of proportions result from adding two successes and two failures (Letter to
the Editor) The American Statistician 55 (2) 172
Haber M (1980) A comparison of some continuity corrections for the chi-squared test on
2times2 tables Journal of the American Statistical Association 75 510-515
Hauck W W a nd A nderson S ( 1986) A c omparison of l arge-sample c onfidence
interval m ethods f or t he di fference of t wo bi nomial pr obabilities The American
Statistician 40 (4) 318-322
Herranz T ejedor I a nd M artiacuten A ndreacutes A (2008) A numerical c omparison of s everal
unconditional e xact t ests i n pr oblems of e quivalence ba sed on t he di fference of
proportions Journal of Statistical Computation and Simulation 78 (11) 969-981
Kabaila P ( 2008) S tatistical p roperties o f e xact co nfidence intervals f rom d iscrete d ata
using studentized test statistics Statistics amp Probability Letters 78 720-727
Kang S -H a nd C hen JJ ( 2000) A n a pproximate unc onditional t est of non-inferiority
between two proportions Statistics in Medicine 19 2089-2100
Katz D Baptista J Azen SP and Pike MC (1978) Obtaining confidence intervals for
the risk ratio in cohort studies Biometrics 34 469-474
Koopman P AR ( 1984) C onfidence i ntervals f or t he r atio of t wo bi nomial pr oportions
Biometrics 40 513-517
Lang J B (2008) Score and profile likelihood confidence intervals for contingency table
parameters Statistics in Medicine 27 (28) 5975-5990
Lawson R (2004) Small sample confidence intervals for the odds ratio Communications in
Statistics - Simulation and Computation 33 (4) 1095-1113
Lecoutre B and Faure S (2007) A note on ne w confidence intervals for t he di fference
between t wo pr oportions ba sed on a n E dgeworth e xpansion Journal of Statistical
Planning and Inference 137 355-356
Lin Ch-Y and Yang M-Ch (2006) Improved exact confidence intervals for the odds ratio
in two independent binomial samples Biometrical Journal 48 (6) 1008-1019
Lovison G (2005) On Rao score and Pearson X 2 statistics in generalized linear models
Statistical Papers 46(4) 555-574
REFERENCIAS 195
Lui K-J and Lin CH-D (2003) A revisit on comparing the asymptotic interval estimators
of odds ratio in a single 2times2 table Biometrical Journal 45 226-237
Mantel N ( 1974) Some r easons f or n ot u sing the Y ates c ontinuity c orrection o n 2times 2
contingency tables Comment and a suggestion Journal of the American Statistical
Association 69 378-380
Martiacuten Andreacutes A and Herranz Tejedor I (2003) Unconditional confidence interval for the
difference between two proportions Biometrical Journal 45 (4) 426-436
Martiacuten Andreacutes A and Herranz Tejedor I (2004 a) Asymptotical tests on the equivalence
substantial difference and non-inferiority problems with two proportions Biometrical
Journal 46 (3) 305-319
Martiacuten Andreacutes A and Herranz Tejedor I (2004 b) Exact unc onditional non -classical
tests on t he di fference of t wo pr oportions Computational Statistics and Data
Analysis 45 (2) 373-388
Martiacuten Andreacutes A a nd Herranz T ejedor I ( 2004 c) T he e quivalence of t wo pr oportions
revisited Journal of Applied Statistics 31 (1) 61-72
Martiacuten Andreacutes A and Herranz Tejedor I (2010) Asymptotic inferences about a l inear
combination of two proportions JP Journal of Biostatistics 4(3) 253-277
Martiacuten Andreacutes A and Silva Mato A (1994) Choosing the optimal unconditioned test for
comparing two independent proportions Computational Statistics and Data Analysis
17 555-574
Martiacuten Andreacutes A Tapia Garcia J M and Del Moral Aacutevila MJ (2005) Unconditional
inferences o n t he d ifference o f two p roportions i n c ross-sectional s tudies
Biometrical Journal 47 (2) 177-187
Martiacuten A ndreacutes A T apia G arcia J M a nd Del M oral Aacute vila M J (2008) Two-tailed
unconditional i nferences on t he di fference of t wo pr oportions i n c ross-sectional
studies Communications in Statistic - Simulation and Computation 37 (3) 455-465
Maxwell AE (1961) Analysing Qualitative Data Methuen London
Mee R W ( 1984) C onfidence B ounds f or t he di fference be tween two pr obabilities
Biometrics 40 (4) 1175-1176
Mercaldo N D L au K F a nd Z hou X H ( 2007) C onfidence intervals f or pr edictive
values w ith an em phasis t o cas eminuscontrol s tudies Statistics in Medicine 26 2170 -
2183
Miettinen O a nd N urminen M ( 1985) Comparative a nalysis of t wo r ates Statistics in
196 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
Medicine 4 213-226
Nam Jun-Mo (1995) Confidence limits for the ratio of two binomial proportions based on
likelihood scores Non-iterative method Biometrical Journal 37(3) 375-379
Newcombe R G ( 1998 a) Interval e stimation for t he di fference be tween i ndependent
proportions comparison of eleven methods Statistics in Medicine 17 873-890
Newcombe R G ( 1998 b) T wo-sided c onfidence i ntervals f or t he s ingle pr oportion
comparison of seven methods Statistics in Medicine 17 857-872
Newcombe R G ( 2001) Estimating t he d ifference between d ifferences measurement o f
additive scale interaction for proportions Statistics in Medicine 20 (19) 2801-2994
Newcombe R G ( 2011) M easures of l ocation f or c onfidence i ntervals f or pr oportions
Communications in Statistics ndash Theory and Methods 40 (10) 1743-1767
Newcombe RG and Nurminen M (2011) In de fence of s core i ntervals for proportions
and their differences Communications in Statistics ndash Theory and Methods 40 (7)
1271-1282
Peskun PH (1993) A new confidence interval method based on the normal approximation
for the difference of two binomial probabilities Journal of the American Statistical
Association 88 (422) 656-661
Phillips K F ( 2003) A ne w t est of non -inferiority fo r a nti-infective tr ials Statistics in
Medicine 22 201-212
Price R M a nd B onett D G ( 2004) An i mproved c onfidence interval f or a l inear
function of binomial proportions Computational Statistics amp Data Analysis 45 (3)
449-456
Price R M and Bonett D G (2008) Confidence intervals for a ratio of two independent
binomial proportions Statistics in Medicine 27 5497-5508
Reiczigel J A bonyi-Toacuteth Z and S inger J ( 2008) A n e xact c onfidence s et f or t wo
binomial proportions and e xact unc onditional c onfidence i ntervals for t he
difference and ratio of proportions Computational Statistics and Data Analysis 52
5046-5053
Rodary C C om-Nougue C a nd Tournade M F ( 1989) H ow to e stablish e quivalence
between t reatments a o ne-sided c linical tr ial in p aediatric o ncology Statistics in
Medicine 8 593-598
Roebruck P a nd K uumlhn A ( 1995) Comparison of t ests a nd s ample s ize f ormulae f or
proving t herapeutic e quivalence ba sed on t he d ifference of bi nomial probabilities
REFERENCIAS 197
Statistics in Medicine 14 1583-1594
Roumlhmel J ( 2005) Problems w ith existing pr ocedures t o c alculate exact unconditional P -
values for non-inferioritysuperiority and confidence intervals for two binomials and
how to resolve them Biometrical Journal 47 (1) 37-47
Roumlhmel J and Mansmann U (1999) Exact tests of equivalence and efficacy with a n on-
zero l ower bound f or c omparative s tudies b y ISF C han (Letters to th e E ditor)
Statistics in Medicine 18 1734-1737
Roumlhmel J a nd M ansmann U ( 1999) U nconditional n on-asymptotic one -sided t ests for
independent binomial proportions w hen t he i nterest lies i n s howing non -inferiority
andor superiority Biometrical Journal 41 (2) 149-170
Roussou V a nd S eifert B ( 2008) A m ixed a pproach for pr oving no n-inferiority in
clinical trials with binary endpoint Biometrical Journal 50 190-204 DOI 101002
bimj200710410
Santner TJ and Snell MK (1980) Small-sample confidence intervals for p1-p2 and p1p2
in 2X2 contingency tables Journal of the American Statistical Association 75 (370)
386-394
Santner TJ Pradhan V Senchaudhuri P Metha CR and Tamhane A (2007) Small-
sample c omparison of c onfidence i ntervals f or t he di ference of t wo i ndependent
binomial proportions Computational Statistics amp Data Analysis 51 5791-5799
Schaarschmidt F S till M a nd H othorn L A ( 2008) Approximate S imultaneous
Confidence Intervals f or M ultiple C ontrasts of Binomial P roportions Biometrical
Journal 50 (5) 782-792
Siqueira AL Whitehead A and Todd S (2008) Active-control trials with binary data a
comparison of methods for testing superiority or non-inferiority using the odds ratio
Statistics in Medicine 27 353-370
Statxact Cytel Software Corporation Cambridge Mass
Sterne T E (1954) Some remarks on c onfidence of f iducial limits Biometrika 41 (12)
275-278
Tebbs J M and Roths S A (2008) New large-sample confidence intervals for a linear
combination of binomial proportions Journal of Statistical Planning and Inference
138 (6) 1884-1893
Thomas DG and Gart JJ (1977) A table of exact confidence limits for differences and
ratios of two pr oportions a nd t heir odds r atios Journal of the American Statistical
198 INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K PROPORCIONES INDEPENDIENTES
Association 72 (357) 73-76
Turnbull PJ S timson GV a nd D olan K ( 1992) P revalence of H IV infection a mog
exprisioners in England British Medical Journal 304 90-91
Upton G JG ( 1982) A c omparison of a lternative t ests f or t he 2 times2 co mparative t rial
Journal of the Royal Statistical Society A 145 (1) 86-105
Upton GJG (1982) Encyclopedia of Statistical Sciences Vol 1 pp 381 John Wiley amp
Sons (Ed Kotz and Johnson)
Vos P W a nd H udson S ( 2008) P roblems with b inomial two-sided t ests an d t he
associated confidence intervals Australian amp New Zealand Journal of Statistics 50
(1) 81-89
Wallenstein S (1997) A non-iterative accu rate as ymptotic co nfidence i nterval f or t he
difference between two proportions Statistics in Medicine 16 1329-1336
Walter SD (1975) The distribution of Levinacutes measure of attribuible risk Biometrika 62
371-375
Wilson E B ( 1927) P robable i nference t he l aw of s uccession a nd statistical i nference
Journal of the American Statistical Association 22 209-212
Woolf B (1955) On estimating the relation between blood group and disease Annals of
Human Genetics 19 (4) 251-352
Xu L and K olassa J E ( 2008) T esting t he d ifference of t wo bi nomial pr oportions
Comparison of c ontinuity corrections f or s addlepoint a pproximation
Communications in Statistic-Theory and Methods 37(14) 2213-2218
Yates F (1934) Contingency tables involving small numbers and the χ2 test Journal of the
Royal Statistical Society Suppl 1 217-235
Zou G and Donner A (2004) A simple alternative confidence interval for the difference
between two proportions Controlled Clinical Trials 25 3-12
Zou G and Donner A (2008) Construction of confidence limits about effect measures A
general approach Statistics in Medicine 27 1693-1702
Zou G Huang W and Zhang X (2009) A note on c onfidence interval estimation for a
linear function of binomial proportions Computational Statistics amp Data Analysis
53 1080-1085
APEacuteNDICE TABLAS
202
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI1
Meacutetodos de tipo W K=3 confianza=95
Meacutetodo W0 W1 W2 W3
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
917
940
916
921
320
717
383
381
027
016
024
022
892
36
962
830
956
952
955
954
883
927
922
914
028
016
025
022
01
00
01
01
955
952
954
954
891
927
922
914
028
016
025
022
01
00
01
01
970
956
967
964
895
931
935
929
030
017
026
023
01
00
00
00
i = (1 12 12)
101010
303030
301010
302010
904
936
927
930
211
752
388
350
057
034
044
041
983
87
477
323
955
952
954
954
876
922
921
900
058
035
044
041
06
00
01
01
955
951
954
953
876
922
921
900
058
035
044
041
08
00
01
00
969
956
965
962
931
930
925
928
064
036
047
043
00
00
00
00
i = (1 12 2)
101010
303030
301010
302010
892
932
877
871
195
581
373
307
106
064
097
096
993
217
973
968
954
951
954
953
879
930
894
897
109
065
102
100
14
00
47
82
954
951
952
952
875
931
877
897
109
065
102
100
18
00
64
109
969
956
967
966
907
941
915
910
118
066
109
107
01
00
06
33
i = (1 1 1)
101010
303030
301010
302010
916
940
916
921
456
687
494
318
082
049
072
064
891
35
960
836
956
952
955
954
900
925
901
907
083
049
073
066
02
00
00
01
955
952
955
954
900
955
901
906
083
049
073
066
01
00
00
02
970
957
968
964
905
928
926
934
090
051
079
069
00
00
00
00
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
203
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodos de tipo W K=4 confianza=95
Meacutetodo W0 W1 W2 W3
n1n2n3n4 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
I=(14 14 14 14)
10101010
20202020
20201010
2015105
924
938
927
903
559
665
731
566
024
017
021
023
887
29
720
955
953
951
952
953
929
932
930
857
024
017
021
024
00
00
00
06
952
951
952
952
930
932
930
857
024
017
021
024
00
00
00
07
972
960
968
975
936
938
940
937
027
018
023
027
00
00
00
00
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
924
938
927
903
629
870
730
449
095
069
083
094
895
30
716
956
953
951
952
953
930
936
927
913
096
069
084
097
00
00
00
05
952
951
951
953
930
936
927
913
096
069
084
097
00
00
00
07
971
961
967
975
936
938
942
940
106
073
091
108
00
00
00
00
I=(13 13 13 1)
10101010
20202020
20201010
2015105
899
926
890
801
624
671
501
241
053
039
051
062
987
605
978
987
949
949
948
948
902
923
870
808
055
040
053
069
45
01
138
407
948
948
947
945
900
921
870
808
055
040
053
069
64
01
202
424
969
959
967
978
926
937
926
935
060
041
057
077
00
00
04
00
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
911
632
915
857
655
679
536
481
210
153
183
215
985
230
916
949
951
950
950
951
914
929
901
858
214
154
186
229
01
00
06
350
950
949
949
950
914
932
901
853
214
154
186
229
02
00
07
360
970
959
966
977
936
940
918
940
235
161
201
255
00
00
00
00
204
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI2
Meacutetodos de tipo N K=3 confianza=95
Meacutetodo N0 N1 N2 N3
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
953
952
953
953
867
904
888
890
027
016
024
021
52
03
09
03
945
950
945
946
00
304
243
288
028
016
023
021
210
91
214
179
946
950
945
947
00
304
243
288
026
016
023
021
205
86
207
173
952
953
950
951
00
304
243
288
028
017
023
022
194
81
195
164
i = (1 12 12)
101010
303030
301010
302010
953
952
952
952
887
905
887
896
057
034
044
041
14
01
06
03
943
948
948
948
209
347
245
319
055
034
043
040
215
100
168
145
944
949
948
949
209
487
297
382
055
034
043
040
209
94
163
138
950
951
953
953
209
487
297
382
059
035
045
042
196
88
152
131
i = (1 12 2)
101010
303030
301010
302010
953
952
953
953
898
905
910
914
105
064
098
096
16
01
08
05
940
947
938
939
293
296
148
377
103
064
096
095
226
109
230
239
941
948
939
940
303
296
185
377
103
064
096
095
220
103
223
232
947
950
944
943
303
296
185
377
109
065
101
098
205
97
206
218
i = (1 1 1)
101010
303030
301010
302010
953
952
953
953
870
915
885
911
081
049
072
064
51
03
08
04
945
950
945
947
273
481
185
525
079
049
070
063
209
91
210
174
946
951
945
947
273
481
185
525
079
049
070
063
202
85
202
166
953
953
951
951
273
481
185
525
084
050
074
063
192
78
189
159
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
205
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodos de tipo N K=4 confianza=95
Meacutetodo N0 N1 N2 N3
n1n2n3n4 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
I=(14 14 14 14)
10101010
20202020
20201010
2015105
952
952
952
952
892
912
908
897
024
017
021
023
45
05
05
12
951
952
951
948
563
663
659
174
023
017
020
023
154
80
131
180
951
952
951
948
563
663
659
174
023
017
020
023
150
77
126
175
956
952
952
953
593
663
659
509
025
018
022
025
186
197
218
187
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
952
952
952
952
890
916
902
904
094
069
082
094
52
05
06
10
950
952
951
949
435
702
548
423
092
068
081
091
157
77
133
178
951
952
951
949
435
702
548
423
092
068
081
091
152
73
129
174
955
952
952
952
643
703
601
423
101
071
087
100
186
199
218
193
I=(13 13 13 1)
10101010
20202020
20201010
2015105
952
952
952
953
903
912
914
914
053
039
051
064
13
02
06
18
946
949
945
940
332
728
421
281
052
039
050
061
164
95
177
259
947
949
946
941
332
728
439
281
052
039
050
062
159
90
170
254
942
941
936
933
332
758
439
281
057
041
053
068
398
420
458
434
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
953
952
953
953
902
922
908
909
209
153
182
217
11
02
04
11
948
950
949
943
457
694
665
00
205
152
180
210
177
98
146
229
948
951
949
944
458
718
669
00
205
152
180
210
171
93
140
223
947
946
945
941
567
718
669
00
221
158
191
230
316
312
334
362
206
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI3
Meacutetodos de tipo E K=3 confianza=95
Meacutetodo E0 E1 E2 E3
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
943
948
950
951
915
929
924
929
027
016
024
022
71
00
00
00
959
954
957
956
610
759
428
538
028
016
024
022
74
23
83
56
959
954
957
956
610
759
428
538
028
16
024
022
70
21
75
50
967
958
964
961
610
759
428
538
030
017
026
023
66
17
71
49
i = (1 12 12)
101010
303030
301010
302010
951
950
944
946
926
939
923
928
058
034
044
041
01
00
02
00
956
953
957
956
428
727
497
778
058
035
044
041
89
27
55
44
956
953
957
956
428
727
497
788
058
035
04
041
82
25
50
39
964
956
964
962
428
727
497
788
062
035
047
043
80
23
47
36
i = (1 12 2)
101010
303030
301010
302010
954
951
955
956
591
942
916
883
107
064
099
097
01
00
01
00
953
952
948
946
00
659
322
472
106
065
098
096
119
39
150
182
954
952
949
947
00
659
322
517
107
065
098
096
113
35
140
171
961
955
954
951
00
659
322
517
113
066
103
100
102
33
128
155
i = (1 1 1)
101010
303030
301010
302010
944
948
950
951
919
921
917
931
082
049
073
065
69
00
00
00
959
953
957
955
00
793
518
405
083
049
073
065
75
26
81
55
959
953
958
956
432
793
518
405
083
049
073
065
69
24
75
50
968
957
964
961
432
793
518
405
089
051
077
068
66
19
70
49
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
207
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodos de tipo E K=4 confianza=95
Meacutetodo E0 E1 E2 E3
n1n2n3n4 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
I=(14 14 14 14)
10101010
20202020
20201010
2015105
938
945
944
951
917
923
930
919
024
017
021
024
72
00
00
00
968
960
965
970
451
755
859
812
025
018
02
025
13
06
09
20
967
959
965
970
451
755
859
822
025
018
022
025
12
05
08
18
979
967
974
979
451
755
859
822
028
019
024
028
11
04
08
17
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
938
945
944
951
918
924
933
932
094
069
083
096
68
01
00
00
968
960
966
970
773
852
883
799
001
071
087
101
13
06
11
21
968
959
965
969
836
952
883
806
101
071
087
101
11
05
09
18
979
974
979
836
883
806
112
094
112
11
09
17
I=(13 13 13 1)
10101010
20202020
20201010
2015105
953
952
955
956
937
944
942
930
054
039
051
065
00
00
00
00
965
959
962
964
672
830
684
649
057
040
053
067
24
12
38
95
965
959
962
964
672
830
684
649
056
040
053
067
23
11
35
89
974
964
969
972
672
830
684
649
062
042
057
074
21
11
31
74
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
950
947
952
956
935
933
941
932
212
153
185
223
00
00
00
00
967
960
964
967
523
866
739
680
223
158
192
232
28
12
24
47
967
960
964
967
523
867
741
705
223
158
119
232
25
09
21
44
976
966
971
975
523
867
741
705
244
166
206
254
20
08
19
37
208
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI4
Meacutetodo de tipo Pa K=3 confianza=95
Meacutetodo Pa0 Pa1 Pa2 Pa3
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
974
973
976
975
920
930
940
942
031
019
029
026
01
00
00
00
973
973
976
975
428
775
860
893
030
019
028
025
54
17
08
06
973
973
977
975
428
818
860
893
030
019
028
025
50
15
06
05
976
974
979
977
428
818
860
893
032
019
029
026
49
14
06
05
i = (1 12 12)
101010
303030
301010
302010
975
974
974
974
936
941
935
941
067
040
051
047
00
00
00
00
974
974
973
973
737
913
551
781
064
040
049
046
28
02
28
18
974
974
973
974
737
913
551
809
064
040
049
046
26
02
25
16
977
975
976
976
737
913
551
809
068
040
051
047
26
02
25
15
i = (1 12 2)
101010
303030
301010
302010
975
974
976
976
937
945
945
945
125
075
122
121
00
00
00
00
975
974
974
977
900
942
927
944
120
074
116
116
06
00
00
00
975
974
977
977
900
942
945
944
120
074
116
116
05
00
00
00
978
975
979
979
900
945
945
944
126
075
121
120
05
00
00
00
i = (1 1 1)
101010
303030
301010
302010
974
974
976
976
925
930
936
943
095
057
087
077
01
00
00
00
973
973
976
976
399
786
852
887
091
056
083
074
50
15
09
06
973
973
976
976
421
786
852
887
091
056
083
074
45
13
07
04
977
974
979
978
421
786
852
887
096
057
083
077
44
12
07
04
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
209
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodo de tipo Pb K=3 confianza=95
Meacutetodo Pb0 Pb1 Pb2 Pb3
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
974
974
977
976
923
931
933
943
032
019
029
026
01
00
00
00
973
973
977
976
441
970
929
939
030
019
028
025
51
16
00
00
973
973
978
976
441
810
929
935
030
019
028
025
48
14
00
00
971
973
74
975
441
824
85
45
031
019
029
026
48
15
04
11
i = (1 12 12)
101010
303030
301010
302010
974
974
973
974
932
942
937
947
067
040
051
047
00
00
00
00
974
974
972
974
878
926
834
903
064
040
049
046
22
01
35
15
974
974
973
974
878
926
835
913
065
040
049
046
19
00
31
11
908
934
970
974
00
00
835
801
063
039
050
047
198
91
44
12
i = (1 12 2)
101010
303030
301010
302010
975
975
976
976
939
946
945
948
128
076
124
124
00
00
00
00
976
975
978
978
926
948
946
952
122
075
118
118
00
00
00
00
976
975
978
978
926
947
946
952
123
075
119
118
00
00
00
00
920
949
792
719
00
00
00
00
122
075
101
092
176
63
372
470
i = (1 1 1)
101010
303030
301010
302010
974
974
977
976
923
929
935
942
095
057
088
078
01
00
00
00
973
973
977
976
591
691
929
928
091
056
084
075
53
14
00
00
973
973
977
976
609
691
930
937
091
056
084
075
48
12
00
00
971
973
974
975
609
691
904
124
094
057
086
076
51
14
03
11
210
A
PEacute
ND
ICE
TA
BL
AS
Meacutetodo de tipo Pa K=4 confianza=95
Meacutetodo Pa0 Pa1 Pa2 Pa3
n1n2n3n4 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
I=(14 14 14 14)
10101010
20202020
20201010
2015105
977
976
977
978
932
930
941
948
028
020
025
029
00
00
00
00
978
977
979
980
744
854
866
911
027
020
024
028
14
05
03
02
978
977
979
980
744
854
866
912
027
020
024
028
12
04
03
01
983
979
982
985
744
854
866
912
029
021
025
030
11
03
03
01
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
977
976
977
978
931
939
941
948
113
082
100
117
00
00
00
00
978
977
979
980
791
829
899
907
109
080
096
111
16
06
03
01
978
977
979
980
791
829
899
907
109
080
097
111
14
05
03
01
983
979
982
958
791
829
899
907
116
083
101
118
13
05
03
01
I=(13 13 13 1)
10101010
20202020
20201010
2015105
976
976
977
978
942
945
947
939
065
047
064
086
00
00
00
00
976
976
978
981
876
940
952
950
063
046
062
081
00
00
00
00
978
976
978
981
917
937
952
950
063
046
062
081
00
00
00
00
982
978
981
986
917
943
952
950
066
048
064
085
00
00
00
00
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
977
976
977
978
943
946
947
951
252
182
223
283
00
00
00
00
978
977
978
980
895
945
942
945
243
179
216
265
01
00
00
00
978
977
978
980
895
945
945
947
243
179
216
266
00
00
00
00
982
979
981
985
895
947
945
947
257
184
225
280
00
00
00
00
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
211
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodo de tipo Pb K=4 confianza=95
Meacutetodo Pb0 Pb1 Pb2 Pb3
n1n2n3n4 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i=(14 14 14 14)
10101010
20202020
20201010
2015105
977
977
97
978
932
938
943
949
028
020
025
029
00
00
00
00
978
977
979
980
721
808
913
936
027
020
024
028
15
06
02
00
978
977
979
980
721
838
918
936
027
020
024
028
14
06
01
00
982
979
982
985
721
838
919
937
029
021
025
030
13
05
01
00
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
977
976
977
979
930
934
941
948
113
082
100
118
00
00
00
00
978
977
979
981
687
811
918
937
109
080
097
111
14
06
02
00
978
977
979
981
706
857
924
940
109
080
097
112
13
06
01
00
983
979
982
985
706
857
924
940
116
083
101
119
12
04
01
00
i=(13 13 13 1)
10101010
20202020
20201010
2015105
976
976
977
978
941
945
947
939
066
047
065
088
00
00
00
00
978
977
979
981
933
941
954
956
063
046
062
082
00
00
00
00
978
977
979
981
933
941
954
956
063
047
063
082
00
00
00
00
982
978
982
986
933
946
959
956
067
048
065
086
00
00
00
00
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
977
977
977
978
944
945
947
951
256
184
226
287
00
00
00
00
979
978
979
981
945
948
955
957
246
118
218
268
00
00
00
00
979
978
979
981
944
948
955
959
247
1181
219
269
00
00
00
00
983
979
982
986
945
948
959
959
261
186
228
283
00
00
00
00
212
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI5
Meacutetodos seleccionados K=3 confianza=95
Meacutetodo W3 N0 E0 Pa0
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
970
956
967
964
895
931
935
929
030
017
026
023
01
00
00
00
953
952
953
953
887
909
897
901
027
016
024
021
55
04
08
03
944
948
950
951
899
929
902
930
027
016
024
022
71
00
00
00
974
974
976
975
923
934
940
944
031
019
029
026
01
00
00
00
i = (1 12 12)
101010
303030
301010
302010
969
956
965
962
931
930
925
928
064
036
047
043
00
00
00
00
953
952
952
952
886
918
877
902
057
034
044
040
15
01
07
04
951
949
944
947
924
939
924
929
058
035
044
041
01
00
03
00
97 4
974
974
973
933
942
935
939
067
040
051
047
00
00
00
00
i = (1 12 2)
101010
303030
301010
302010
969
956
967
966
907
941
915
910
118
066
109
107
01
00
06
33
953
952
953
953
891
911
909
914
105
064
098
096
16
01
08
05
954
951
955
955
916
944
898
889
107
064
099
097
01
00
01
00
975
974
976
976
939
944
940
947
125
075
122
121
00
00
00
00
i = (1 1 1)
101010
303030
301010
302010
970
957
968
964
905
928
926
934
090
051
079
069
00
00
00
00
953
952
953
953
862
907
893
907
081
049
072
064
54
03
07
03
943
948
950
951
921
924
918
930
082
049
073
065
70
00
00
00
974
973
976
976
923
933
937
944
095
057
087
077
01
00
00
00
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
213
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodos seleccionados K=4 confianza=95
Meacutetodo W3 N0 E0 Pa0
n1n2n3n4 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
I=(14 14 14 14)
10101010
20202020
20201010
2015105
972
960
968
975
936
938
940
937
027
018
023
027
00
00
00
00
952
952
952
952
897
900
909
907
024
017
021
023
49
07
05
10
938
945
944
951
917
929
931
931
024
017
021
024
71
00
00
00
977
976
977
978
932
931
942
958
028
020
025
029
00
00
00
00
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
971
961
967
975
936
938
942
940
106
073
091
108
00
00
00
00
952
952
953
952
900
906
908
910
094
069
082
094
48
04
05
11
938
945
944
951
920
921
930
929
094
069
083
096
64
00
00
00
977
976
977
978
931
939
943
943
113
082
100
117
00
00
00
00
I=(13 13 13 1)
10101010
20202020
20201010
2015105
969
959
967
978
926
937
926
935
060
041
057
077
00
00
04
00
952
952
953
953
893
914
906
912
053
039
051
064
14
01
06
17
953
952
954
956
928
943
935
903
054
039
052
065
00
00
00
01
976
976
977
978
940
944
947
941
065
047
064
086
00
00
00
00
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
970
959
966
977
936
940
918
940
235
161
201
255
00
00
00
00
953
952
953
953
902
915
908
907
208
153
182
217
10
01
06
14
950
947
952
956
932
938
939
923
212
153
185
223
00
00
00
00
977
976
977
978
943
943
947
950
252
183
223
283
00
00
00
00
214
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI6
Meacutetodos seleccionados K=3 confianza=99
Meacutetodo E0 Pa0 W3
n1n2n3 Rmean Rmin lmean Rlt98 Rmean Rmin lmean Rlt98 Rmean Rmin lmean Rlt98
i = (13 13 13)
101010
303030
301010
302010
991
990
992
991
963
984
967
982
036
022
032
028
01
00
00
00
996
996
997
996
970
984
988
989
040
025
037
033
01
00
00
00
995
992
994
994
971
978
977
971
039
022
034
030
02
00
00
00
i = (1 12 12)
101010
303030
301010
302010
990
990
990
990
968
982
981
982
075
045
058
054
00
00
00
00
996
996
996
996
985
988
988
989
085
052
065
061
00
00
00
00
995
992
994
993
967
980
969
976
083
047
062
057
01
00
01
00
i = (1 12 2)
101010
303030
301010
302010
990
991
990
990
957
978
967
965
138
084
126
123
02
00
05
05
996
996
996
996
988
989
989
990
159
098
156
156
00
00
00
00
995
992
994
994
971
982
976
974
153
087
142
140
01
00
01
01
i = (1 1 1)
101010
303030
301010
302010
991
990
992
991
968
978
965
981
109
065
096
085
01
00
01
00
996
996
997
996
968
978
987
988
120
074
111
099
01
00
00
00
995
992
994
994
973
974
980
965
117
067
103
091
01
00
00
00
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
215
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodos seleccionados K=4 confianza=99
Meacutetodo E0 Pa0 W3
n1n2n3n4 Rmean Rmin lmean Rlt98 Rmean Rmin lmean Rlt98 Rmean Rmin lmean Rlt98
I=(14 14 14 14)
10101010
20202020
20201010
2015105
989
989
990
991
981
984
982
979
031
023
028
031
00
00
00
00
997
997
997
997
981
987
989
997
036
026
032
038
00
00
00
00
997
997
997
997
981
987
989
991
036
026
032
038
00
00
00
00
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
989
989
991
991
981
982
981
980
126
091
110
125
00
00
00
00
997
997
997
997
981
982
987
991
144
106
129
150
00
00
00
00
997
997
997
997
981
982
987
991
144
106
129
150
00
00
00
00
I=(13 13 13 1)
10101010
20202020
20201010
2015105
990
991
990
989
967
982
978
965
070
052
066
080
01
00
01
30
996
996
997
997
989
989
991
991
083
061
082
110
00
00
00
00
996
996
997
997
989
989
991
991
083
061
082
110
00
00
00
00
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
992
990
991
990
976
982
975
970
279
202
241
282
01
00
00
04
997
997
997
997
989
989
990
990
322
236
287
363
00
00
00
00
997
997
997
997
989
989
990
990
322
236
287
363
00
00
00
00
216
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI7
Meacutetodos seleccionados K=3 confianza=90
Meacutetodo E0 Pa0 W3
n1n2n3 Rmean Rmin lmean Rlt86 Rmean Rmin lmean Rlt86 Rmean Rmin lmean Rlt86
i = (13 13 13)
101010
303030
301010
302010
884
891
891
897
831
866
838
865
023
014
020
018
40
00
01
00
939
940
944
943
831
869
873
878
027
016
024
022
01
00
00
00
931
909
928
922
861
879
840
874
025
014
022
019
00
00
00
00
i = (1 12 12)
101010
303030
301010
302010
899
897
888
892
833
875
848
852
049
029
037
034
01
00
03
00
942
941
939
940
876
882
860
891
057
034
043
040
00
00
00
00
931
909
924
919
833
875
844
856
053
030
039
036
00
00
00
00
i = (1 12 2)
101010
303030
301010
302010
904
899
908
909
863
874
868
871
090
054
084
082
00
00
00
00
942
942
945
945
876
892
879
892
106
064
103
103
00
00
00
00
932
909
929
927
851
890
849
805
099
055
091
089
00
00
01
02
i = (1 1 1)
101010
303030
301010
302010
884
896
891
897
828
866
852
860
068
041
061
055
42
00
01
00
940
939
944
943
828
866
883
887
080
048
073
065
01
00
00
00
932
909
928
922
860
880
843
840
076
042
066
058
00
00
00
00
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
217
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodos seleccionados K=4 confianza=90
Meacutetodo E0 Pa0 W3
n1n2n3n4 Rmean Rmin lmean Rlt86 Rmean Rmin lmean Rlt86 Rmean Rmin lmean Rlt86
I=(14 frac14 14 14)
10101010
20202020
20201010
2015105
881
892
886
896
829
859
861
863
020
014
017
020
17
00
00
00
944
945
946
947
861
872
880
883
024
017
021
025
00
00
00
00
944
945
946
947
861
872
880
883
024
017
021
025
00
00
00
00
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
881
892
886
897
827
844
863
867
079
058
069
081
19
00
00
00
945
944
946
947
867
875
882
886
096
069
084
099
00
00
00
00
945
944
946
947
867
875
882
886
096
069
084
099
00
00
00
00
I=(13 13 13 1)
10101010
20202020
20201010
2015105
903
900
906
913
870
871
876
845
046
033
044
055
00
00
00
01
945
945
947
948
883
888
891
871
055
040
054
074
00
00
00
00
945
945
947
948
883
888
891
871
055
040
054
074
00
00
00
00
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
891
894
899
910
856
871
882
863
177
128
155
190
00
00
00
00
945
945
946
948
885
891
893
870
214
154
189
240
00
00
00
00
945
945
946
948
885
891
893
870
214
154
189
240
00
00
00
00
218
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI8
Meacutetodos seleccionados K=3 CONSIN cpc confianza=95
Meacutetodo E0 E0c N0 N0c
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin Lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
944
948
950
951
921
929
931
932
027
016
024
022
72
00
00
00
944
948
950
951
921
929
931
932
027
016
024
022
67
00
00
00
953
952
953
953
876
909
896
890
027
016
024
021
54
03
07
05
953
952
953
953
876
909
896
890
027
016
024
021
50
03
07
00
i = (1 12 12)
101010
303030
301010
302010
951
950
944
946
919
917
923
928
058
035
044
041
01
00
02
00
952
950
944
947
926
917
923
928
058
035
044
041
01
00
02
00
953
952
953
952
888
906
891
904
057
034
044
041
17
01
06
04
953
952
953
953
891
906
891
904
057
034
044
041
16
01
06
04
i = (1 12 2)
101010
303030
301010
302010
953
951
955
956
925
928
906
901
107
064
099
097
00
00
01
01
954
951
955
956
925
928
906
901
107
064
099
097
00
00
01
01
953
952
953
953
900
908
903
916
105
064
098
096
17
01
09
06
953
952
953
953
900
908
903
916
106
064
098
096
14
01
08
05
i = (1 1 1)
101010
303030
301010
302010
943
948
950
951
921
930
913
921
082
049
073
065
73
00
00
00
944
948
950
951
921
930
913
921
082
049
073
065
68
00
00
00
953
952
953
953
870
902
884
895
081
049
072
064
54
03
07
04
953
952
953
953
870
902
904
895
082
049
072
064
49
03
06
04
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
219
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Meacutetodo Pa0 Pa0c
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
974
973
976
976
923
929
942
940
031
019
029
026
01
00
00
00
974
973
976
976
923
929
942
940
032
019
029
026
01
00
00
00
i = (1 12 12)
101010
303030
301010
302010
974
974
974
974
935
942
936
939
067
040
051
047
00
00
00
00
975
974
974
974
937
942
936
937
067
040
051
047
00
00
00
00
i = (1 12 2)
101010
303030
301010
302010
975
974
975
976
938
946
943
949
125
075
122
121
00
00
00
00
975
974
976
976
938
946
945
949
125
075
122
121
00
00
00
00
i = (1 1 1)
101010
303030
301010
302010
974
974
976
975
921
931
935
944
095
057
087
077
02
00
00
00
974
974
976
975
921
931
935
944
095
057
087
077
01
00
00
00
220
A
PEacute
ND
ICE
TA
BL
AS
Tabla AI9
Comparacioacuten con la literatura K = 3 confianza=95
Meacutetodo W0 W1 N0
n1n2n3 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
i = (13 13 13)
101010
303030
301010
302010
917
940
916
921
320
717
383
381
027
016
024
022
892
36
962
830
956
952
955
954
883
927
922
914
028
016
025
022
01
00
01
01
953
952
953
953
887
909
897
901
027
016
024
021
55
04
08
03
i = (1 12 12)
101010
303030
301010
302010
904
936
927
930
211
752
388
350
057
034
044
041
983
87
477
323
955
952
954
954
876
922
921
900
058
035
044
041
06
00
01
01
953
952
952
952
886
918
877
902
057
034
044
040
15
01
07
04
i = (1 12 2)
101010
303030
301010
302010
892
932
877
871
195
581
373
307
106
064
097
096
993
217
973
968
954
951
954
953
879
930
894
897
109
065
102
100
14
00
47
82
953
952
953
953
891
911
909
914
105
064
098
096
16
01
08
05
i = (1 1 1)
101010
303030
301010
302010
916
940
916
921
456
687
494
318
082
049
072
064
891
35
960
836
956
952
955
954
900
925
901
907
083
049
073
066
02
00
00
01
953
952
953
953
862
907
893
907
081
049
072
064
54
03
07
03
IN
FE
RE
NC
IAS A
SIN
TOacute
TIC
AS SO
BR
E U
NA
CO
MB
INA
CIOacute
N L
INE
AL
DE
K
221
PR
OPO
RC
ION
ES
IND
EP
EN
DIE
NT
ES
Comparacioacuten con la literatura K = 4 confianza=95
Meacutetodo W0 W1 N0
n1n2n3n4 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93 Rmean Rmin lmean Rlt93
I=(14 14 14 14)
10101010
20202020
20201010
2015105
924
938
927
903
559
665
731
566
024
017
021
023
887
29
720
955
953
951
952
953
929
932
930
857
024
017
021
024
00
00
00
06
952
952
952
952
897
900
909
907
024
017
021
023
49
07
05
10
i = ( -1 1 1 1)
10101010
20202020
20201010
2015105
924
938
927
903
629
870
730
449
095
069
083
094
895
30
716
956
953
951
952
953
930
936
927
913
096
069
084
097
00
00
00
05
952
952
953
952
900
906
908
910
094
069
082
094
48
04
05
11
I=(13 13 13 1)
10101010
20202020
20201010
2015105
899
926
890
801
624
671
501
241
053
039
051
062
987
605
978
987
949
949
948
948
902
923
870
808
055
040
053
069
45
01
138
407
952
952
953
953
893
914
906
912
053
039
051
064
14
01
06
17
i = (-3 -1 1 3)
10101010
20202020
20201010
2015105
911
632
915
857
655
679
536
481
210
153
183
215
985
230
916
949
951
950
950
951
914
929
901
858
214
154
186
229
01
00
06
350
953
952
953
953
902
915
908
907
208
153
182
217
10
01
06
14
222 APEacuteNDICE TABLAS X
AP
EacuteN
DIC
E T
AB
LA
S
Tabla AII1
Incremento de error (primera entrada) y ldquopotenciardquo (segunda entrada) para
todos los meacutetodos sin cpc comparados Los valores en negrita indican que el meacutetodo ldquofallardquo (=5)
n1 n2 ZW0 ZW1 ZW2 ZW3 ZW4 40 40 00 -090 6758 -067 6710 -067 6639 -067 6639 -067 6568
01 -355 6924 -355 6841 -054 6782 -054 6794 -054 6746 02 -453 7198 -338 7115 -017 7067 -017 7067 -017 7032 03 -201 7490 -201 7460 -115 7412 -115 7412 -061 7388 05 -307 8215 -096 8233 -016 8233 -016 8233 -016 8209 07 -359 9012 -104 9060 015 9054 015 9054 067 9030 08 -503 9387 -049 9405 -015 9435 -015 9435 064 9405 09 -426 9691 151 9738 073 9768 080 9756 080 9756 095 -859 9839 358 9869 020 9887 020 9887 020 9887 60 00 -136 7021 -052 6949 -014 6893 -014 6893 -014 6837 01 -355 7165 -355 7093 -051 7049 -051 7049 -036 7013 02 -453 7393 -338 7365 -014 7317 -014 7317 -014 7297 03 -201 7685 -201 7645 -201 7633 -201 7637 -077 7617 05 -307 8385 -099 8381 -096 8393 -096 8389 -025 8369 07 -201 9100 -064 9136 -074 9148 -074 9152 021 9132 08 -453 9444 -012 9468 -012 9500 -012 9496 053 9484 09 -728 9736 106 9760 -067 9792 -067 9792 081 9788 095 -1578 9860 361 9880 203 9904 203 9904 203 9904 100 00 -673 7254 -052 7211 -018 7158 -018 7158 -018 7119 01 -355 7380 -355 7336 -079 7298 -084 7305 -076 7276 02 -453 7607 -117 7575 -047 7544 -047 7544 -042 7530 03 -201 7877 -201 7868 -039 7839 -043 7839 -042 7822 05 -307 8529 -096 8527 -096 8527 -096 8520 -028 8503 07 -232 9193 -088 9208 -076 9225 -076 9227 -031 9213 08 -453 9505 -021 9522 -082 9548 015 9539 065 9524 09 -473 9771 -008 9795 095 9814 098 9812 101 9807 095 -1522 9882 361 9901 209 9918 209 9918 209 9918
60 60 00 -130 7326 -048 7261 -048 7229 -048 7240 -048 7208 01 -184 7428 -087 7385 -087 7358 -087 7364 -036 7347 02 -276 7662 -044 7611 -014 7584 -014 7584 001 7568 03 -074 7904 -061 7898 -167 7869 -167 7874 -089 7863 05 -085 8533 -081 8551 -099 8541 -099 8541 002 8530 07 -106 9210 -157 9215 -043 9256 -037 9250 -037 9239 08 -294 9519 -083 9538 -050 9557 -050 9557 053 9546 09 -147 9772 172 9798 094 9825 094 9825 115 9823 095 -1487 9887 -088 9906 184 9925 184 9925 184 9925 100 00 -232 7583 -034 7547 -024 7509 -024 7509 -024 7486 01 -308 7685 -122 7653 -096 7627 -096 7629 -076 7621 02 -276 7879 -084 7864 -030 7843 -030 7846 -019 7838 03 -090 8116 -104 8114 -050 8107 -050 8107 -015 8098 05 -089 8700 -035 8703 -048 8708 -048 8708 -038 8700 07 -136 9300 -048 9312 -013 9328 -013 9326 -009 9320 08 -276 9576 -033 9593 024 9606 024 9604 028 9597 09 -329 9813 -176 9831 020 9844 020 9843 101 9836 095 -1444 9911 -059 9920 137 9933 203 9932 203 9932
100 100 00 -060 7886 -060 7866 -060 7842 -060 7842 -060 7831 01 -176 7978 -176 7960 -122 7942 -122 7946 -084 7942 02 -169 8148 -082 8127 -082 8123 -082 8123 -011 8119 03 -042 8360 -042 8358 -104 8342 -104 8344 -020 8340 05 -131 8882 -023 8869 -119 8881 -119 8880 -035 8876 07 -070 9396 -014 9402 -045 9424 -051 9428 -051 9424 08 -229 9649 -038 9653 005 9660 005 9660 049 9656 09 -244 9853 030 9859 019 9866 022 9864 096 9860 095 -763 9929 -013 9938 137 9947 137 9947 200 9946
Media global -389 8652 -066 8647 -024 8643 -020 8644 017 8630
INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K 223 PROPORCIONES INDEPENDIENTES
n1 n2 ZN0 ZN1 ZN2 ZN3 ZN4 40 40 00 -067 6686 -067 6639 -067 6591 -067 6591 -067 6544
01 -054 6794 -054 6746 053 6651 053 6663 053 6615 02 -017 7067 -013 7032 009 6972 009 6972 009 6948 03 -020 7412 -119 7442 -022 7383 -022 7383 -022 7359 05 -055 8233 -105 8263 -112 8251 -112 8251 -098 8227 07 -120 9108 -176 9108 -350 9149 -350 9149 -347 9137 08 -145 9494 -524 9530 -507 9542 -507 9542 -504 9536 09 034 9786 -553 9833 -1608 9875 -1608 9875 -1608 9875 095 -004 9911 -906 9941 -2733 9964 -2733 9964 -6759 9982 60 00 -049 6981 006 6885 042 6821 034 6829 034 6781 01 -040 7093 008 7029 026 6957 011 6965 011 6929 02 -030 7333 -013 7297 019 7241 018 7253 018 7233 03 -014 7633 -015 7629 -006 7609 -006 7605 -006 7585 05 -057 8393 -060 8405 -130 8405 -097 8405 -096 8389 07 -048 9172 -128 9192 -386 9228 -313 9220 -309 9204 08 -031 9516 -313 9556 -806 9592 -581 9584 -579 9572 09 -090 9816 -597 9844 -1394 9872 -1394 9872 -1394 9872 095 -333 9928 -1307 9952 -3027 9968 -3027 9968 -5747 9976 100 00 -009 7182 -008 7163 036 7109 036 7109 036 7076 01 -027 7305 -006 7276 024 7242 023 7242 023 7213 02 -024 7546 002 7510 -012 7491 -022 7496 -021 7481 03 -057 7846 -009 7817 -079 7815 -079 7815 -065 7800 05 -030 8532 -052 8541 -213 8551 -213 8556 -201 8541 07 -062 9244 -149 9259 -433 9290 -301 9280 -299 9266 08 -070 9565 -323 9589 -814 9614 -814 9614 -814 9599 09 -122 9833 -627 9858 -1482 9882 -1482 9882 -2786 9884 095 -167 9935 -881 9952 -3340 9969 -3340 9966 -6517 9971
60 60 00 -048 7251 -048 7218 -048 7175 -048 7175 -048 7143 01 -036 7364 -036 7326 030 7283 030 7283 030 7267 02 -018 7579 -014 7573 -004 7530 -004 7530 -004 7519 03 -064 7888 -063 7882 010 7845 007 7845 007 7834 05 -086 8568 -031 8543 -140 8581 -108 8570 -108 8560 07 -072 9253 -130 9274 -377 9315 -377 9315 -377 9304 08 -093 9581 -087 9581 -414 9616 -414 9616 -410 9605 09 094 9825 -286 9852 -974 9879 -974 9879 -974 9879 095 -300 9938 -1268 9954 -2826 9968 -2826 9968 -2826 9968 100 00 -024 7534 008 7492 023 7460 023 7463 023 7440 01 -025 7638 -001 7608 012 7580 012 7580 012 7567 02 -019 7840 -007 7828 006 7807 003 7812 003 7804 03 -014 8103 -015 8093 -012 8083 -011 8083 -011 8073 05 -033 8708 -052 8711 -103 8721 -075 8718 -067 8708 07 -027 9336 -111 9352 -308 9364 -223 9359 -213 9352 08 -049 9617 -194 9636 -498 9656 -484 9654 -478 9648 09 -077 9857 -365 9870 -898 9885 -898 9885 -898 9885 095 -092 9943 -972 9958 -2087 9969 -2057 9968 -3621 9969
100 100 00 -060 7858 -060 7838 -060 7815 -060 7819 -060 7807 01 -047 7946 -018 7928 022 7902 017 7904 017 7900 02 -014 8119 -016 8111 -009 8092 -012 8088 -012 8083 03 -044 8350 -044 8344 -004 8330 -005 8330 -005 8324 05 -019 8875 -053 8882 -071 8882 -071 8879 -071 8875 07 -026 9416 -081 9429 -241 9451 -208 9445 -207 9441 08 -102 9678 -253 9692 -208 9683 -208 9683 -207 9679 09 -034 9876 -305 9888 -803 9900 -803 9898 -799 9895 095 -155 9954 -803 9963 -1845 9971 -1735 9969 -1735 9969
Media global -060 8657 -239 8657 -571 8653 -556 8652 -805 8641
224 APEacuteNDICE TABLAS X
AP
EacuteN
DIC
E T
AB
LA
S
n1 n2 ZCb0 ZCb1 ZCb2 ZCb3 ZCb4 40 40 00 -09 6734 -067 6639 -067 6615 -067 6615 -067 6544
01 -092 6865 -054 6782 053 6698 032 6722 032 6675 02 -063 7103 -017 7079 017 7008 017 7008 032 6984 03 -051 7436 -013 7412 -077 7418 -115 7430 -061 7406 05 -016 8209 -092 8251 -116 8287 -105 8275 -105 8251 07 021 9042 -032 9084 -320 9167 -295 9155 -279 9131 08 126 9411 -060 9477 -526 9554 -526 9554 -504 9536 09 -115 9768 -489 9810 -553 9833 -553 9833 -553 9833 095 122 9887 -801 9929 -2294 9952 -2294 9952 -3613 9958 60 00 -048 6989 -027 6941 042 6853 042 6869 042 6821 01 -136 7121 -108 7061 -097 6997 -097 7001 -092 6969 02 -124 7357 -125 7305 -179 7293 -179 7297 -170 7281 03 -048 7661 -070 7645 -089 7625 -089 7621 -069 7605 05 -043 8393 -104 8409 -141 8421 -135 8409 -122 8397 07 -057 9148 -120 9188 -310 9212 -293 9208 -285 9196 08 -049 9508 -175 9536 -459 9568 -459 9564 -456 9548 09 064 9792 -238 9824 -1218 9864 -1218 9864 -1218 9864 095 16 9904 -620 9936 -1816 9956 -1816 9956 -3591 9960 100 00 -018 7220 015 7172 036 7124 036 7124 036 7085 01 -203 7344 -197 7305 -672 7271 -672 7274 -672 7242 02 -117 7566 -152 7546 -335 7515 -335 7518 -333 7503 03 -093 7856 -133 7841 -300 7834 -304 7834 -295 7819 05 -041 8537 -151 8546 -293 8551 -293 8551 -284 8539 07 -057 9239 -199 9254 -548 9280 -391 9276 -387 9263 08 -037 9556 -230 9577 -660 9602 -662 9604 -659 9587 09 026 9824 -373 9845 -1133 9870 -992 9867 -992 9867 095 133 9923 -632 9944 -1840 9959 -1840 9959 -3621 9961
60 60 00 -048 7283 -048 7240 -048 7186 -048 7197 -048 7175 01 -087 7396 -087 7364 018 7315 018 7315 018 7304 02 -022 7600 001 7584 012 7557 010 7557 010 7546 03 -04 7880 -013 7880 -037 7888 -063 7888 -063 7877 05 -035 8541 -086 8568 -121 8565 -131 8570 -109 8560 07 -037 9234 -077 9264 -231 9280 -232 9280 -200 9269 08 042 9546 -087 9581 -414 9616 -368 9605 -363 9600 09 -038 9820 -307 9850 -972 9874 -669 9863 -669 9863 095 187 9919 -300 9938 -1326 9960 -1326 9960 -1326 9960 100 00 -006 7541 -002 7512 023 7473 021 7476 021 7450 01 -176 7659 -085 7634 -079 7599 -085 7601 -076 7590 02 -098 7859 -121 7838 -094 7827 -094 7827 -072 7819 03 -075 8116 -075 8101 -117 8086 -081 8086 -068 8080 05 -035 8711 -075 8713 -179 8719 -142 8716 -128 8710 07 -013 9326 -082 9344 -285 9359 -240 9357 -220 9351 08 -051 9612 -143 9627 -329 9641 -313 9641 -301 9635 09 -018 9846 -165 9859 -743 9878 -582 9875 -581 9873 095 124 9933 -312 9948 -1011 9959 -1011 9959 -1011 9959
100 100 00 -06 7874 -060 7846 -060 7827 -060 7831 -060 7819 01 -064 7958 -047 7946 010 7922 010 7926 010 7922 02 -029 8129 -011 8121 000 8100 -002 8102 -002 8098 03 -043 8348 -044 8356 -044 8348 -044 8348 -044 8344 05 -077 8895 -036 8877 -078 8884 -078 8884 -056 8881 07 -09 9423 -055 9426 -139 9435 -145 9435 -131 9431 08 028 9656 -015 9667 -253 9694 -253 9694 -253 9690 09 056 9866 -034 9876 -305 9888 -305 9888 -291 9883 095 137 9945 -155 9954 -807 9965 -803 9963 -803 9963
Media global -025 8657 -151 8658 -421 8659 -404 8659 -491 8648
INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K 225 PROPORCIONES INDEPENDIENTES
n1 n2 ZE0 ZE1 ZE2 ZE3 ZE4 40 40 00 -09 6734 -067 6639 -067 6615 -067 6615 -067 6520
01 -104 6829 -054 6770 032 6698 032 6698 032 6615 02 -217 7091 -017 7055 036 6972 036 6972 036 6924 03 -077 7412 -001 7400 -032 7383 -032 7383 -032 7347 05 -016 8209 -033 8215 -105 8263 -105 8263 -105 8239 07 -069 9054 -060 9096 -320 9167 -269 9143 -239 9108 08 -217 9435 -060 9477 -526 9554 -526 9554 -504 9536 09 -131 9792 -553 9833 -553 9833 -553 9833 -553 9833 095 -004 9911 -906 9941 -2733 9964 -2733 9964 -4052 9970 60 00 -048 6989 -027 6941 042 6853 042 6869 042 6797 01 -067 7113 009 7033 011 6997 011 7009 011 6949 02 -217 7309 -009 7293 032 7257 018 7265 018 7237 03 -157 7649 005 7613 005 7601 009 7597 009 7561 05 -043 8389 -096 8393 -044 8401 -060 8397 -055 8377 07 -157 9152 -058 9180 -221 9212 -219 9208 -166 9180 08 -217 9508 -123 9540 -390 9560 -390 9560 -375 9540 09 -067 9800 -251 9828 -916 9860 -916 9860 -916 9860 095 -02 9920 -881 9940 -1816 9956 -1816 9956 -1816 9956 100 00 -018 7220 015 7172 036 7124 036 7124 036 7071 01 -067 7319 011 7276 027 7249 019 7257 019 7216 02 -217 7554 005 7520 -024 7501 005 7503 010 7479 03 -057 7839 -057 7827 -057 7812 -057 7810 -011 7788 05 -085 8522 -017 8522 -096 8532 -096 8534 -027 8512 07 -057 9237 -088 9256 -304 9273 -304 9278 -299 9256 08 -217 9560 -085 9577 -375 9592 -376 9594 -375 9570 09 -067 9831 -232 9845 -739 9865 -739 9865 -739 9865 095 02 9928 -780 9944 -1840 9961 -1840 9961 -1840 9961
60 60 00 -048 7283 -048 7240 -048 7186 -048 7197 -048 7165 01 -057 7385 -036 7353 018 7304 018 7304 018 7272 02 -015 7584 001 7573 014 7530 010 7536 010 7514 03 -157 7874 -015 7869 -037 7866 -063 7877 -063 7861 05 -03 8535 -086 8568 -041 8549 -030 8543 -007 8527 07 -157 9245 -070 9264 -208 9274 -194 9269 -143 9253 08 042 9546 -087 9581 -414 9616 -383 9616 -364 9605 09 -04 9831 -308 9855 -974 9879 -922 9868 -922 9868 095 184 9925 -314 9944 -1326 9960 -1326 9960 -1326 9960 100 00 -006 7541 -002 7512 023 7473 021 7476 021 7440 01 -067 7648 -006 7621 009 7582 006 7585 006 7567 02 -095 7840 000 7823 016 7802 005 7804 005 7788 03 -157 8109 004 8086 006 8078 003 8081 005 8072 05 -069 8706 -004 8702 -026 8711 -025 8708 -016 8697 07 -157 9335 -028 9339 -117 9351 -140 9352 -095 9341 08 -095 9612 -115 9627 -383 9641 -383 9638 -375 9628 09 001 9849 -249 9865 -739 9880 -739 9880 -739 9878 095 066 9940 -366 9951 -1840 9963 -1303 9961 -1303 9961
100 100 00 -06 7874 -060 7846 -060 7827 -060 7831 -060 7815 01 -136 7958 -047 7942 011 7910 011 7912 011 7902 02 -095 8121 -011 8111 000 8096 -003 8098 -003 8090 03 -128 8344 -044 8348 -044 8344 -044 8342 -044 8336 05 -07 8885 -021 8875 -053 8875 -049 8873 -049 8867 07 -128 9427 -034 9424 -142 9435 -130 9433 -081 9428 08 -095 9658 -016 9671 -253 9694 -253 9694 -252 9688 09 -136 9870 -034 9876 -305 9888 -305 9888 -281 9882 095 137 9947 -156 9956 -807 9965 -807 9965 -807 9965
Media global -081 8654 -127 8652 -365 8651 -353 8651 -369 8632
226 APEacuteNDICE TABLAS X
AP
EacuteN
DIC
E T
AB
LA
S
n1 n2 ZPa0 ZPa1 ZPa2 ZPa3 ZPa4 40 40 00 -067 6282 -067 6282 -067 6282 -067 6282 -067 6234
01 -054 6377 -054 6377 062 6211 062 6211 062 6175 02 -016 6663 -016 6663 092 6520 092 6520 092 6496 03 045 7067 045 7067 -021 7168 -021 7168 -021 7156 05 -016 8126 099 8049 -105 8215 -105 8215 -105 8192 07 101 8995 -027 9072 -027 9072 -027 9072 -020 9048 08 126 9411 -060 9477 -526 9554 -526 9554 -504 9536 09 -131 9792 -553 9833 -553 9833 -553 9833 -553 9833 095 -004 9911 -906 9941 -2733 9964 -2733 9964 -4052 9970 60 00 048 6397 048 6429 048 6413 048 6413 048 6389 01 -036 6629 012 6541 019 6517 019 6517 019 6493 02 -001 6917 044 6885 052 6881 036 6885 036 6857 03 -043 7405 007 7353 023 7345 015 7349 015 7337 05 -043 8293 -011 8277 -035 8293 -009 8297 -009 8281 07 -057 9104 -038 9140 -159 9168 -159 9160 -139 9148 08 -217 9488 -041 9504 -390 9540 -390 9540 -375 9524 09 -067 9780 -053 9808 -603 9848 -560 9840 -560 9840 095 020 9904 -148 9924 -979 9944 -979 9944 -979 9944 100 00 -008 6733 040 6699 052 6675 052 6680 052 6655 01 001 6829 029 6808 045 6791 036 6795 036 6776 02 030 7117 012 7146 034 7138 034 7138 034 7121 03 016 7539 014 7554 039 7554 039 7554 039 7544 05 -011 8375 013 8382 017 8397 010 8401 010 8392 07 -057 9126 -010 9160 -057 9186 -057 9186 -054 9174 08 107 9464 -012 9500 -095 9532 -103 9532 -101 9522 09 303 9756 081 9790 -067 9819 -067 9816 -067 9816 095 361 9877 304 9899 020 9920 020 9918 020 9918
60 60 00 -048 6853 -048 6853 -048 6853 -048 6853 -048 6831 01 -036 6950 -036 6950 060 6831 060 6831 060 6815 02 001 7235 001 7235 091 7132 091 7132 091 7127 03 061 7573 061 7573 017 7630 -063 7716 -063 7705 05 056 8417 -086 8525 000 8468 000 8468 000 8457 07 -037 9234 078 9205 -071 9248 -071 9248 -071 9242 08 042 9546 -087 9581 -414 9616 -047 9567 -044 9562 09 -040 9831 -308 9855 -974 9879 -286 9852 -286 9852 095 184 9925 -314 9944 -1326 9960 -1326 9960 -1326 9960 100 00 024 7064 024 7074 027 7054 025 7057 025 7044 01 -012 7216 011 7186 029 7173 029 7174 029 7161 02 021 7492 018 7505 037 7499 037 7499 037 7492 03 -020 7892 025 7872 021 7870 020 7870 020 7864 05 029 8583 017 8611 -010 8620 -010 8622 -010 8615 07 017 9278 -019 9300 -066 9317 -082 9317 -081 9310 08 028 9576 -076 9597 -312 9619 -160 9617 -156 9612 09 020 9828 022 9843 -296 9862 -296 9862 -296 9862 095 203 9924 076 9937 -366 9950 -366 9950 -366 9950
100 100 00 -060 7505 -060 7505 -060 7505 -060 7505 -060 7497 01 -047 7603 -047 7603 031 7528 031 7528 031 7522 02 -011 7856 -011 7856 064 7790 064 7790 064 7788 03 050 8121 -044 8203 -044 8203 -044 8203 -044 8199 05 092 8750 -006 8812 060 8775 060 8775 060 8773 07 -090 9423 016 9402 -081 9422 -081 9422 -081 9418 08 061 9650 -015 9667 -253 9694 -253 9694 -253 9690 09 172 9860 -034 9876 -305 9888 -305 9888 -291 9883 095 137 9947 -156 9956 -807 9965 -807 9965 -807 9965
Media global 023 8472 -043 8484 -213 8485 -191 8485 -215 8475
INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K 227 PROPORCIONES INDEPENDIENTES
n1 n2 ZPb0 ZPb1 ZPb2 ZPb3 ZPb4 40 40 00 -067 6282 -067 6282 -067 6282 -067 6282 -067 6234
01 -054 6377 -054 6377 062 6211 062 6211 062 6175 02 -016 6663 -016 6663 092 6520 092 6520 092 6496 03 045 7067 045 7067 -021 7168 -021 7168 -021 7156 05 -016 8126 099 8049 -105 8215 -105 8215 -105 8192 07 101 8995 -027 9072 -027 9072 -027 9072 -020 9048 08 126 9411 -060 9477 -526 9554 -526 9554 -504 9536 09 -131 9792 -553 9833 -553 9833 -553 9833 -553 9833 095 -004 9911 -906 9941 -2733 9964 -2733 9964 -4052 9970 60 00 048 6397 048 6429 048 6413 048 6413 048 6389 01 -036 6629 012 6541 019 6517 019 6517 019 6493 02 -001 6917 044 6885 052 6881 036 6885 036 6857 03 -043 7405 007 7353 023 7345 015 7349 015 7337 05 -043 8293 -011 8277 -035 8293 -009 8297 -009 8281 07 -057 9104 -038 9140 -159 9168 -159 9160 -139 9148 08 -217 9488 -041 9504 -390 9540 -390 9540 -375 9524 09 -067 9780 -053 9808 -603 9848 -560 9840 -560 9840 095 020 9904 -148 9924 -979 9944 -979 9944 -979 9944 100 00 -008 6733 040 6699 052 6675 052 6680 052 6655 01 001 6829 029 6808 045 6791 036 6795 036 6776 02 030 7117 012 7146 034 7138 034 7138 034 7121 03 016 7539 014 7554 039 7554 039 7554 039 7544 05 -011 8375 013 8382 017 8397 010 8401 010 8392 07 -057 9126 -010 9160 -057 9186 -057 9186 -054 9174 08 107 9464 -012 9500 -095 9532 -103 9532 -101 9522 09 303 9756 081 9790 -067 9819 -067 9816 -067 9816 095 361 9877 304 9899 020 9920 020 9918 020 9918
60 60 00 -048 6853 -048 6853 -048 6853 -048 6853 -048 6831 01 -036 6950 -036 6950 060 6831 060 6831 060 6815 02 001 7235 001 7235 091 7132 091 7132 091 7127 03 061 7573 061 7573 017 7630 -063 7716 -063 7705 05 056 8417 -086 8525 000 8468 000 8468 000 8457 07 -037 9234 078 9205 -071 9248 -071 9248 -071 9242 08 042 9546 -087 9581 -414 9616 -047 9567 -044 9562 09 -040 9831 -308 9855 -974 9879 -286 9852 -286 9852 095 184 9925 -314 9944 -1326 9960 -1326 9960 -1326 9960 100 00 024 7064 024 7074 027 7054 025 7057 025 7044 01 -012 7216 011 7186 029 7173 029 7174 029 7161 02 021 7492 018 7505 037 7499 037 7499 037 7492 03 -020 7892 025 7872 021 7870 020 7870 020 7864 05 029 8583 017 8611 -010 8620 -010 8622 -010 8615 07 017 9278 -019 9300 -066 9317 -082 9317 -081 9310 08 028 9576 -076 9597 -312 9619 -160 9617 -156 9612 09 020 9828 022 9843 -296 9862 -296 9862 -296 9862 095 203 9924 076 9937 -366 9950 -366 9950 -366 9950
100 100 00 -060 7505 -060 7505 -060 7505 -060 7505 -060 7497 01 -047 7603 -047 7603 031 7528 031 7528 031 7522 02 -011 7856 -011 7856 064 7790 064 7790 064 7788 03 050 8121 -044 8203 -044 8203 -044 8203 -044 8199 05 092 8750 -006 8812 060 8775 060 8775 060 8773 07 -090 9423 016 9402 -081 9422 -081 9422 -081 9418 08 061 9650 -015 9667 -253 9694 -253 9694 -253 9690 09 172 9860 -034 9876 -305 9888 -305 9888 -291 9883 095 137 9947 -156 9956 -807 9965 -807 9965 -807 9965
Media global 023 8472 -043 8484 -213 8485 -191 8485 -215 8475
228 APEacuteNDICE TABLAS X
AP
EacuteN
DIC
E T
AB
LA
S
n1 n2 XCb0 XCb1 XCb2 XCb3 XC4 40 40 00 -090 6734 -067 6639 -067 6615 -067 6615 -067 6544
01 -1186 6924 -3782 6913 -1743 6794 -1743 6805 -1729 6782 02 -1619 7246 -3951 7258 -2438 7174 -2438 7174 -2362 7139 03 -1840 7603 -4054 7674 -2650 7609 -2650 7609 -2596 7585 05 -1935 8424 -4066 8513 -3956 8513 -3956 8525 -3884 8501 07 -1641 9149 -3814 9286 -3754 9310 -3754 9298 -3729 9274 08 -1391 9482 -3648 9619 -3583 9637 -3583 9637 -3569 9619 09 -864 9744 -3210 9869 -3210 9893 -3210 9881 -3210 9881 095 -432 9839 -2733 9952 -2733 9964 -2733 9964 -4052 9970 60 00 -048 6989 -027 6941 042 6853 042 6869 042 6821 01 -1207 7161 -3892 7141 -2216 7085 -2216 7085 -2210 7061 02 -1747 7469 -4066 7477 -2754 7429 -2754 7433 -2735 7413 03 -1931 7813 -4226 7857 -4062 7841 -4062 7845 -4016 7821 05 -2055 8541 -4277 8633 -4066 8617 -4066 8625 -3989 8601 07 -1828 9220 -3966 9348 -3890 9348 -3890 9348 -3868 9332 08 -1370 9524 -3746 9636 -3738 9656 -3738 9656 -3736 9636 09 -1126 9776 -3435 9876 -3435 9892 -3435 9892 -3435 9892 095 -553 9868 -3027 9956 -3027 9968 -3027 9964 -5286 9968 100 00 -018 7220 015 7172 036 7124 036 7124 036 7085 01 -1604 7380 -4150 7375 -2709 7324 -2709 7324 -2709 7307 02 -2286 7655 -4304 7684 -4105 7643 -4105 7645 -4102 7631 03 -2486 7976 -4539 8025 -4134 7996 -4134 7993 -4123 7974 05 -2486 8645 -4642 8730 -4277 8723 -4277 8727 -4102 8710 07 -2419 9285 -4281 9382 -4013 9394 -4013 9387 -4009 9372 08 -1920 9553 -3908 9662 -3906 9679 -3906 9679 -3905 9667 09 -1134 9783 -3669 9889 -3668 9894 -3668 9894 -4973 9896 095 -541 9872 -3340 9964 -3340 9966 -3340 9966 -5121 9969
60 60 00 -048 7283 -048 7240 -048 7186 -048 7197 -048 7175 01 -1515 7439 -3928 7439 -2266 7390 -2266 7396 -2212 7380 02 -2056 7729 -4207 7734 -2841 7697 -2841 7702 -2754 7691 03 -2138 8030 -4377 8095 -3118 8060 -3118 8065 -2944 8049 05 -2246 8702 -4247 8788 -4124 8753 -4124 8753 -4018 8742 07 -2103 9336 -4006 9409 -3926 9403 -3926 9398 -3875 9387 08 -1686 9594 -3857 9672 -3775 9680 -3775 9680 -3738 9669 09 -1123 9820 -3453 9887 -3435 9901 -3435 9901 -3435 9901 095 -544 9903 -3027 9960 -3027 9970 -3027 9970 -3027 9970 100 00 -006 7541 -002 7512 023 7473 021 7476 021 7450 01 -1658 7705 -4214 7710 -2717 7664 -2717 7672 -2709 7663 02 -2191 7953 -4413 7969 -3181 7942 -3181 7942 -3122 7931 03 -2514 8242 -4647 8270 -4195 8257 -4195 8257 -4129 8247 05 -2682 8839 -4762 8890 -4449 8883 -4449 8882 -4124 8872 07 -2323 9401 -4435 9461 -4162 9469 -4162 9469 -4010 9460 08 -2014 9648 -4044 9705 -3914 9708 -3914 9708 -3906 9701 09 -1445 9843 -3672 9899 -3669 9904 -3669 9904 -3668 9903 095 -997 9920 -3340 9966 -3340 9971 -3340 9969 -3340 9969
100 100 00 -060 7874 -060 7846 -060 7827 -060 7831 -060 7819 01 -1990 8017 -4219 8009 -2809 7975 -2809 7977 -2717 7971 02 -2460 8233 -4443 8234 -3462 8214 -3462 8214 -3181 8208 03 -2759 8480 -4654 8505 -3608 8489 -3608 8487 -3340 8482 05 -2917 9019 -4768 9037 -4545 9033 -4545 9031 -4207 9026 07 -2581 9501 -4487 9533 -4297 9531 -4297 9533 -4054 9527 08 -2172 9707 -4159 9741 -4031 9747 -4031 9747 -3914 9741 09 -1591 9881 -3747 9910 -3688 9914 -3688 9914 -3668 9909 095 -921 9943 -3340 9968 -3340 9975 -3340 9975 -3340 9975
Media global -1654 8718 -3750 8768 -3282 8753 -3282 8754 -3351 8742
INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K 229 PROPORCIONES INDEPENDIENTES
n1 n2 XPb0 XPb1 XPb2 XPb3 XPb4 40 40 00 -8461 9090 -8461 9090 -8457 9042 -8457 9042 -8457 9042
01 -8455 9114 -8455 9114 -8453 9078 -8453 9078 -8453 9078 02 -8442 9185 -8440 9161 -8437 9126 -8437 9126 -8437 9126 03 -8415 9233 -8412 9209 -8412 9191 -8412 9191 -8412 9191 05 -8326 9387 -8321 9358 -8321 9393 -8321 9393 -8321 9393 07 -8136 9601 -8135 9595 -8134 9584 -8134 9584 -6448 9500 08 -7940 9709 -7260 9691 -6342 9709 -6342 9709 -3569 9667 09 -3358 9863 -3210 9869 -3210 9893 -3210 9893 -3210 9893 095 -2733 9946 -2733 9952 -2733 9964 -2733 9964 -6759 9982 60 00 -9124 9340 -9124 9324 -9124 9324 -9124 9324 -9124 9324 01 -9125 9364 -9125 9352 -9124 9336 -9124 9340 -9124 9340 02 -9120 9376 -9120 9372 -9120 9372 -9120 9372 -9120 9372 03 -9114 9420 -9114 9400 -9114 9384 -9114 9384 -9114 9384 05 -9106 9540 -9103 9532 -9099 9504 -9099 9504 -9099 9504 07 -8987 9716 -8987 9708 -8987 9696 -8987 9696 -8987 9672 08 -8912 9864 -8915 9876 -8913 9876 -8913 9872 -8909 9888 09 -8697 9960 -8843 9988 -8843 9988 -8843 9988 -8843 9988 095 -7923 9964 -8636 9992 -8636 9992 -8636 9992 -8636 9992 100 00 -9262 9495 -9262 9495 -9262 9476 -9262 9476 -9262 9476 01 -9263 9505 -9263 9500 -9263 9488 -9263 9488 -9263 9488 02 -9298 9524 -9298 9519 -9298 9510 -9298 9512 -9298 9512 03 -9317 9558 -9317 9556 -9317 9548 -9317 9551 -9317 9551 05 -9316 9669 -9316 9669 -9309 9660 -9309 9660 -9309 9660 07 -9222 9959 -9222 9959 -9222 9961 -9222 9961 -9224 9973 08 -9166 9964 -9280 9988 -9280 9988 -9280 9988 -9280 9988 09 -9108 9966 -9211 9993 -9211 9993 -9211 9993 -9211 9993 095 -9105 9969 -9126 9995 -9126 9995 -9126 9995 -9126 9995
60 60 00 -8688 9390 -8686 9368 -8686 9368 -8686 9368 -8686 9368 01 -8683 9406 -8682 9395 -8682 9385 -8682 9390 -8682 9390 02 -8671 9422 -8671 9417 -8669 9406 -8669 9406 -8669 9406 03 -8649 9460 -8648 9454 -8648 9457 -8648 9457 -8648 9457 05 -8571 9573 -8569 9573 -8567 9543 -8568 9554 -8568 9554 07 -8397 9707 -8397 9721 -8394 9710 -8394 9710 -8394 9710 08 -8222 9798 -8222 9812 -8222 9804 -8222 9804 -6233 9766 09 -5235 9895 -5116 9909 -5098 9911 -5098 9911 -3435 9906 095 -3027 9957 -3027 9960 -3027 9970 -3027 9970 -6741 9981 100 00 -9320 9586 -9320 9586 -9320 9580 -9320 9580 -9320 9580 01 -9320 9597 -9320 9594 -9319 9584 -9319 9586 -9319 9586 02 -9340 9628 -9340 9614 -9340 9606 -9340 9607 -9340 9607 03 -9354 9636 -9354 9633 -9354 9628 -9354 9628 -9354 9628 05 -9362 9714 -9362 9701 -9362 9708 -9362 9706 -9362 9706 07 -9258 9838 -9258 9834 -9258 9826 -9258 9828 -9258 9815 08 -9241 9972 -9242 9977 -9242 9981 -9242 9981 -9246 9987 09 -9179 9979 -9282 9995 -9282 9995 -9282 9995 -9282 9995 095 -9205 9981 -9260 9997 -9260 9997 -9260 9997 -9260 9997
100 100 00 -8894 9627 -8893 9619 -8893 9619 -8893 9619 -8893 9619 01 -8891 9636 -8891 9634 -8891 9631 -8891 9631 -8891 9631 02 -8881 9646 -8881 9646 -8881 9647 -8881 9647 -8881 9647 03 -8865 9672 -8865 9668 -8865 9670 -8865 9670 -8865 9670 05 -8804 9742 -8804 9739 -8803 9735 -8803 9735 -8803 9735 07 -8664 9836 -8663 9827 -8662 9827 -8662 9827 -8662 9827 08 -8516 9881 -8514 9876 -8513 9878 -8513 9878 -8513 9878 09 -8181 9936 -8181 9941 -7625 9935 -7625 9933 -4079 9921 095 -3399 9967 -3340 9972 -3340 9975 -3340 9975 -3340 9975
Media global -8341 9676 -8345 9676 -8315 9671 -8315 9672 -8239 9669
230 APEacuteNDICE TABLAS X
AP
EacuteN
DIC
E T
AB
LA
S
n1 n2 ACb0 ACb1 ACb2 ACb3 ACb4 40 40 00 -1515 6805 -090 6734 -067 6615 -067 6639 -067 6568
01 -1158 6960 -451 6889 -355 6817 -355 6817 -158 6770 02 -1430 7234 -1006 7198 -517 7174 -517 7174 -337 7139 03 -1531 7579 -953 7543 -795 7567 -952 7567 -678 7531 05 -1736 8346 -1252 8400 -1369 8406 -1196 8394 -1062 8358 07 -1573 9060 -959 9149 -1062 9203 -1062 9203 -990 9179 08 -1192 9363 -722 9482 -1124 9548 -777 9548 -700 9518 09 -677 9619 -269 9768 -1563 9857 -1563 9857 -1563 9857 095 -1086 9738 -432 9887 -2733 9952 -2733 9952 -2733 9952 60 00 -876 7069 -014 6957 013 6885 013 6885 013 6837 01 -1629 7197 -629 7149 -894 7097 -894 7097 -874 7069 02 -1477 7461 -1057 7413 -875 7393 -773 7389 -506 7365 03 -1542 7769 -1274 7769 -1028 7765 -957 7769 -771 7741 05 -1769 8469 -1433 8521 -1399 8553 -1399 8545 -1221 8521 07 -1491 9128 -1446 9236 -1386 9280 -1386 9276 -1259 9256 08 -1740 9436 -940 9536 -1252 9596 -1038 9592 -993 9572 09 -1728 9684 -673 9800 -1984 9864 -1203 9856 -1203 9856 095 -950 9776 -554 9904 -3027 9956 -1303 9948 -1303 9948 100 00 -848 7259 -045 7225 015 7167 015 7163 015 7124 01 -1496 7409 -689 7348 -724 7319 -724 7329 -672 7298 02 -1545 7643 -1095 7624 -1024 7609 -1024 7614 -920 7597 03 -1711 7938 -1375 7947 -1201 7943 -1201 7945 -1037 7923 05 -1802 8573 -1361 8628 -1814 8657 -1814 8657 -1579 8636 07 -1491 9201 -1057 9280 -1608 9336 -1608 9333 -1360 9314 08 -1705 9474 -1391 9573 -1330 9631 -1330 9628 -1246 9614 09 -1729 9691 -640 9812 -1482 9867 -976 9865 -975 9862 095 -1219 9778 -242 9899 -3340 9957 -1840 9954 -1840 9954
60 60 00 -1527 7337 -048 7272 -048 7240 -048 7240 -048 7208 01 -1247 7471 -714 7428 -274 7385 -293 7390 -146 7374 02 -1711 7718 -1115 7681 -737 7659 -737 7659 -580 7643 03 -1889 8033 -1435 7992 -1138 7998 -1138 8003 -917 7987 05 -2095 8659 -1617 8686 -1699 8718 -1565 8713 -1340 8697 07 -1938 9269 -1467 9331 -1457 9360 -1457 9350 -1276 9334 08 -1632 9527 -1032 9605 -1202 9635 -1202 9635 -1109 9624 09 -1022 9753 -469 9831 -1333 9876 -1333 9876 -1314 9874 095 -1674 9841 -544 9925 -1304 9954 -1304 9954 -1304 9954 100 00 -1020 7583 -006 7538 004 7502 004 7512 004 7483 01 -1367 7715 -1084 7692 -717 7658 -717 7659 -672 7648 02 -1745 7937 -1302 7921 -1281 7914 -1281 7914 -963 7901 03 -1917 8211 -1620 8215 -1586 8210 -1486 8213 -1330 8200 05 -2095 8789 -1793 8822 -1912 8841 -1912 8836 -1694 8825 07 -1938 9346 -1476 9403 -1676 9422 -1693 9421 -1477 9409 08 -1661 9589 -1549 9648 -1607 9679 -1474 9677 -1352 9667 09 -1029 9787 -1004 9856 -1196 9885 -1196 9885 -1191 9880 095 -1484 9870 -506 9933 -1840 9963 -1434 9959 -1434 9959
100 100 00 -1536 7893 -060 7866 -060 7846 -060 7846 -060 7831 01 -1642 8013 -1065 7991 -916 7978 -800 7978 -508 7970 02 -2111 8211 -1814 8203 -1428 8197 -1428 8195 -1155 8187 03 -2393 8454 -2082 8454 -1728 8460 -1728 8456 -1426 8448 05 -2111 8961 -2132 8991 -2083 8992 -2010 8990 -1798 8984 07 -2464 9455 -1946 9495 -1999 9504 -1922 9500 -1747 9494 08 -2212 9669 -1712 9705 -1539 9718 -1539 9718 -1408 9712 09 -1561 9851 -938 9883 -1494 9902 -1494 9900 -1430 9895 095 -958 9917 -746 9951 -1168 9964 -1168 9964 -1168 9964
Media global -1588 8677 -1043 8710 -1319 8722 -1196 8722 -1074 8706
INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K 231 PROPORCIONES INDEPENDIENTES
n1 n2 AE0 AE1 AE2 AE3 AE4 40 40 00 -1515 6805 -090 6734 -067 6615 -067 6639 -067 6568
01 -071 6877 -054 6805 -054 6758 -054 6770 -054 6698 02 -036 7055 -017 7020 -017 6996 -017 6996 -017 6960 03 -083 7365 011 7341 011 7341 011 7341 011 7317 05 -082 8132 -016 8126 040 8168 012 8180 026 8156 07 -093 8965 101 8995 -027 9060 -027 9060 -023 9048 08 -007 9340 126 9399 -060 9465 -060 9465 -038 9447 09 154 9703 -115 9768 -300 9798 034 9786 034 9786 095 -968 9857 016 9899 -801 9929 -801 9929 -801 9929 60 00 -876 7069 -014 6957 013 6885 013 6885 013 6837 01 -176 7109 -040 7081 008 7009 008 7017 008 6973 02 -055 7325 -003 7277 010 7245 010 7249 010 7229 03 -050 7585 -023 7589 019 7565 005 7569 005 7553 05 -051 8297 -005 8317 -011 8345 000 8333 000 8321 07 -044 9056 021 9108 -021 9144 -021 9144 -017 9132 08 -001 9420 006 9480 -062 9508 -062 9508 -041 9492 09 -230 9744 067 9788 -195 9820 -195 9820 -195 9820 095 -819 9872 160 9904 -620 9936 -343 9932 -343 9932 100 00 -848 7259 -045 7225 015 7167 015 7163 015 7124 01 -337 7348 -001 7288 011 7259 007 7262 007 7230 02 -072 7527 001 7501 020 7486 007 7489 007 7472 03 -039 7793 -002 7788 012 7773 009 7773 009 7757 05 -074 8452 -006 8469 011 8479 001 8474 001 8459 07 -028 9157 -004 9193 -003 9215 -003 9215 012 9201 08 -113 9490 011 9524 -046 9553 -027 9546 022 9532 09 -510 9778 109 9807 -188 9836 -159 9833 -159 9833 095 -1038 9894 133 9923 -190 9940 -190 9940 -190 9940
60 60 00 -1527 7337 -048 7272 -048 7240 -048 7240 -048 7208 01 -054 7401 -036 7358 -036 7326 -036 7326 -036 7304 02 -031 7562 001 7546 001 7536 001 7536 001 7519 03 -061 7823 -001 7810 -001 7820 -001 7820 -001 7810 05 -081 8460 056 8476 -086 8525 -086 8525 -086 8514 07 -105 9167 -037 9218 078 9205 078 9205 079 9194 08 -028 9489 042 9535 -087 9570 -087 9565 -082 9559 09 -040 9785 -038 9820 -301 9844 -270 9839 -248 9836 095 -087 9895 187 9919 -314 9944 -314 9944 -314 9944 100 00 -1020 7583 -006 7538 004 7502 004 7512 004 7483 01 -074 7651 -016 7627 -004 7603 -004 7603 -004 7591 02 -032 7825 -010 7814 015 7789 013 7791 013 7783 03 -050 8057 -010 8054 013 8044 012 8046 012 8039 05 -027 8632 -004 8653 003 8663 005 8661 005 8654 07 -050 9263 -003 9291 -019 9312 -011 9310 -011 9304 08 -050 9562 -007 9588 007 9604 -026 9607 -020 9602 09 -041 9817 073 9838 -166 9856 -032 9852 -015 9849 095 -300 9917 120 9935 -312 9948 -262 9945 -262 9945
100 100 00 -1536 7893 -060 7866 -060 7846 -060 7846 -060 7831 01 -047 7952 -047 7938 -047 7925 -047 7927 -047 7921 02 -011 8089 -011 8093 -011 8082 -011 8080 -011 8076 03 -042 8309 -013 8295 -044 8307 -011 8301 -011 8297 05 -001 8814 -036 8834 -006 8830 -006 8828 -006 8826 07 025 9367 -090 9399 016 9398 016 9396 016 9394 08 016 9622 061 9640 -015 9661 -015 9659 -015 9655 09 033 9847 172 9858 033 9871 -018 9873 -008 9870 095 311 9932 137 9945 -155 9954 -155 9954 -155 9954
Media global -183 8615 016 8621 -078 8625 -063 8625 -059 8611
232 APEacuteNDICE TABLAS X
AP
EacuteN
DIC
E T
AB
LA
S
n1 n2 APb0 APb1 APb2 APb3 APb4 40 40 00 -1515 6805 -090 6734 -067 6615 -067 6639 -067 6568
01 -3210 6865 -503 6746 -077 6710 -077 6710 -054 6639 02 -5081 7008 -2182 6913 -375 6853 -375 6853 -038 6805 03 -5047 7269 -2468 7186 -652 7127 -652 7151 -020 7091 05 -5067 7894 -1648 7936 -270 7918 -270 7954 038 7906 07 -3906 8786 -053 8840 -052 8917 -026 8894 -011 8858 08 -2359 9209 072 9304 -084 9393 -084 9393 -020 9363 09 -1728 9643 -053 9720 -298 9774 036 9762 036 9762 095 -949 9810 125 9875 -801 9929 -351 9917 -351 9917 60 00 -876 7069 -014 6957 013 6885 013 6885 013 6837 01 -3435 7097 -1563 7017 -525 6973 -525 6973 -197 6925 02 -6090 7265 -3569 7169 -2182 7133 -2182 7141 -471 7093 03 -6761 7473 -3728 7421 -2468 7389 -2468 7401 -655 7361 05 -6643 8121 -2679 8125 -1648 8149 -1648 8149 -197 8109 07 -4014 8968 -611 9008 -155 9068 -154 9056 -148 9028 08 -1114 9464 -502 9496 -1001 9560 -1001 9560 -992 9544 09 -561 9764 -903 9832 -1747 9872 -1747 9872 -2245 9876 095 -1575 9800 378 9864 160 9904 161 9900 161 9900 100 00 -848 7259 -045 7225 015 7167 015 7163 015 7124 01 -6121 7312 -3210 7262 -3210 7218 -3210 7220 -1247 7182 02 -7703 7443 -3569 7394 -3569 7370 -3569 7375 -1969 7339 03 -8154 7645 -3803 7626 -3728 7607 -3728 7612 -2218 7583 05 -7348 8305 -3873 8329 -2679 8329 -2679 8331 -711 8300 07 -5265 9500 -4188 9471 -4389 9478 -4389 9478 -4389 9464 08 -1142 9573 -1617 9623 -2353 9669 -2353 9669 -2354 9660 09 -4013 9623 -1728 9681 -309 9730 -306 9722 420 9713 095 -7418 9650 -3491 9710 -956 9754 -956 9749 499 9744
60 60 00 -1527 7337 -048 7272 -048 7240 -048 7240 -048 7208 01 -5098 7369 -1984 7315 -916 7272 -916 7278 -117 7245 02 -6954 7503 -3736 7460 -2556 7439 -2556 7439 -598 7407 03 -7814 7710 -3868 7665 -2808 7648 -2808 7648 -708 7622 05 -7249 8293 -3987 8299 -2095 8326 -2095 8315 -257 8288 07 -6004 9033 -1121 9078 -068 9097 -068 9092 068 9070 08 -3986 9398 -170 9454 -046 9479 -083 9484 -066 9468 09 -2210 9737 004 9777 -176 9812 -176 9812 -155 9809 095 -1557 9874 208 9909 -300 9938 -297 9933 -297 9933 100 00 -1020 7583 -006 7538 004 7502 004 7512 004 7483 01 -7010 7632 -3435 7582 -3435 7554 -3435 7554 -1128 7530 02 -8254 7747 -4988 7707 -3736 7689 -3736 7695 -2519 7677 03 -8468 7929 -5944 7914 -4960 7903 -4960 7901 -3467 7885 05 -8420 8492 -4980 8497 -3987 8513 -3987 8508 -1602 8489 07 -5739 9216 -1938 9247 -500 9268 -500 9266 -355 9252 08 -4890 9753 -4196 9747 -4405 9753 -4405 9752 -4404 9745 09 -874 9812 -317 9841 -1013 9870 -1013 9870 -1010 9869 095 -3860 9831 -168 9867 038 9891 038 9891 451 9890
100 100 00 -1536 7893 -060 7866 -060 7846 -060 7846 -060 7831 01 -7606 7933 -4973 7905 -3668 7886 -3668 7886 -1442 7872 02 -8381 8029 -7222 8009 -5795 7999 -5795 7999 -4000 7993 03 -8587 8197 -7877 8172 -6388 8168 -7001 8170 -5385 8166 05 -8644 8673 -7348 8674 -5618 8690 -5618 8686 -3145 8679 07 -8102 9261 -4123 9279 -2464 9296 -2464 9298 -447 9286 08 -6616 9551 -2212 9576 -304 9594 -785 9598 -042 9588 09 -4013 9812 -076 9832 -030 9851 -020 9849 006 9844 095 -2078 9917 155 9933 -143 9948 -095 9946 -095 9946
Media global -4917 8552 -2349 8551 -1741 8556 -1746 8556 -940 8534
INFERENCIAS ASINTOacuteTICAS SOBRE UNA COMBINACIOacuteN LINEAL DE K 233 PROPORCIONES INDEPENDIENTES
n1 n2 L0 L1 L2 L3 L4 40 40 00 -4504 6901 -410 6686 -088 6591 -090 6615 -015 6520
01 -431 6913 -059 6805 013 6746 013 6746 024 6686 02 -060 7079 -023 7032 063 6972 063 6972 071 6936 03 -077 7388 035 7377 066 7317 049 7329 049 7305 05 -016 8209 012 8180 -105 8251 -105 8239 -105 8215 07 -057 9018 -032 9084 -211 9120 -184 9108 -160 9084 08 126 9411 -060 9477 -507 9542 -507 9542 -504 9536 09 -131 9792 034 9786 -553 9833 -553 9833 -553 9833 095 -004 9911 -906 9941 -2733 9964 -906 9941 -2225 9946 60 00 -4607 7061 -281 6981 -048 6901 -048 6909 -025 6853 01 -492 7113 -119 7057 -074 7005 -074 7001 -048 6961 02 -126 7309 -008 7273 040 7237 040 7241 042 7217 03 -057 7613 -013 7593 -045 7585 -045 7585 -006 7565 05 -029 8345 008 8357 -038 8361 -029 8357 -004 8341 07 -057 9136 -017 9160 -196 9188 -154 9184 -133 9168 08 010 9492 -100 9532 -299 9552 -299 9552 -295 9536 09 -118 9804 -251 9828 -916 9860 -916 9852 -916 9852 095 020 9912 -620 9936 -1816 9956 -1816 9956 -1816 9956 100 00 -5023 7264 -751 7196 -053 7134 -053 7134 005 7085 01 -658 7322 -242 7274 -203 7245 -203 7249 -194 7213 02 -315 7532 -103 7498 -117 7474 -117 7474 -078 7457 03 -123 7807 -064 7793 -114 7783 -068 7776 -032 7759 05 -164 8510 -062 8500 -198 8512 -186 8505 -168 8491 07 -119 9227 -129 9249 -304 9261 -310 9266 -299 9249 08 -204 9553 -117 9573 -376 9589 -376 9589 -375 9575 09 -485 9838 -232 9845 -739 9865 -739 9865 -739 9865 095 020 9928 -780 9947 -1840 9961 -1840 9961 -3621 9964
60 60 00 -4505 7369 -430 7304 -126 7218 -126 7229 -030 7186 01 -238 7417 -046 7364 006 7321 006 7321 019 7304 02 -083 7589 001 7573 033 7530 019 7536 027 7519 03 -009 7847 010 7847 015 7845 007 7850 007 7839 05 -019 8519 -024 8543 -005 8533 -001 8533 -001 8522 07 -037 9234 -012 9242 -191 9258 -071 9253 -071 9242 08 042 9546 -087 9581 -323 9594 -307 9589 -300 9583 09 -040 9831 -308 9855 -916 9858 -286 9852 -286 9852 095 184 9925 -314 9944 -1326 9960 -1326 9960 -1326 9960 100 00 -4721 7603 -356 7557 -173 7515 -173 7515 -123 7489 01 -446 7664 -223 7630 -145 7606 -145 7608 -076 7596 02 -125 7838 -016 7817 002 7799 002 7797 007 7788 03 -074 8085 -019 8072 -015 8065 -021 8065 000 8056 05 -069 8692 -008 8690 -025 8692 -038 8697 -027 8689 07 -051 9322 -047 9331 -140 9346 -140 9344 -097 9336 08 -095 9607 -115 9620 -383 9635 -202 9635 -178 9627 09 -136 9847 -245 9862 -739 9878 -739 9877 -739 9875 095 097 9938 -366 9951 -1840 9963 -1303 9961 -1303 9961
100 100 00 -4505 7921 -447 7868 -158 7844 -158 7844 -073 7829 01 -174 7972 -047 7947 001 7922 001 7926 001 7920 02 -095 8127 -011 8113 020 8092 020 8092 020 8086 03 -009 8331 002 8329 001 8332 -007 8332 -007 8328 05 -069 8862 -006 8869 -019 8863 -015 8863 -015 8859 07 -090 9423 -013 9420 -121 9429 -119 9428 -081 9424 08 -095 9654 -015 9669 -212 9689 -223 9691 -222 9687 09 -136 9864 016 9875 -305 9888 -305 9888 -291 9883 095 137 9947 -156 9956 -807 9965 -807 9965 -807 9965
Media global -375 8653 -142 8647 -372 8644 -306 8643 -352 8629
234 APEacuteNDICE TABLAS X
AP
EacuteN
DIC
E T
AB
LA
S
Tabla AII2
Nuacutemero de fallos (F) error medio ( α ) y potencia media (θ ) para los meacutetodos basados en los estadiacutesticos Z X A y L (=5)
Meacutetodo F α θ
ZW4 0 017 8630
ZPa0 0 023 8472
ZPb0 0 057 8466
ZW3 2 -020 8644
ZW2 2 -024 8643
ZCb0 2 -025 8657
ZN0 4 -060 8657
ZPb1 8 -011 8478
ZPa1 8 -043 8484
ZE0 12 -081 8654
ZW1 16 -066 8647
ZE1 20 -127 8652
ZPb3 20 -133 8481
ZCb1 20 -151 8658
ZPb4 20 -157 8470
ZPb2 24 -157 8480
ZPa3 26 -191 8485
ZPa4 26 -215 8475
ZPa2 30 -213 8485
ZN1 32 -239 8657
ZE4 40 -369 8632
ZE3 42 -353 8651
ZE2 44 -365 8651
ZN3 50 -556 8652
ZN2 50 -571 8653
ZN4 50 -805 8641
ZCb3 54 -404 8659
ZCb2 54 -421 8659
ZCb4 54 -491 8648
ZW0 72 -389 8652
Meacutetodo F α θ
XCb0 96 -1654 8718
XCb3 96 -3282 8754
XCb2 96 -3282 8753
XCb4 96 -3351 8742
XCb1 96 -3750 8768
XPb4 102 -8239 9669
XPb3 102 -8315 9672
XPb2 102 -8315 9671
XPb0 102 -8341 9676
XPb1 102 -8345 9676
Meacutetodo F α θ
AE1 0 016 8621
AE4 10 -059 8611
AE3 10 -063 8625
AE2 12 -078 8625
AE0 20 -183 8615
APb4 54 -940 8534
APb3 72 -1746 8556
APb2 74 -1741 8556
APb1 74 -2349 8551
ACb1 96 -1043 8710
ACb4 96 -1074 8706
ACb3 96 -1196 8722
ACb2 96 -1319 8722
ACb0 102 -1588 8677
APb0 102 -4917 8552
Meacutetodo F α θ
L0 22 -375 8653
L1 28 -142 8647
L4 36 -352 8629
L3 40 -306 8643
L2 42 -372 8644