analisis y diseÑo de experimentos-cap. 1y2

64

Upload: gadiel-romero-diaz

Post on 13-Aug-2015

3.807 views

Category:

Documents


10 download

TRANSCRIPT

oB42tAnálisis y diseñode experimentos

-,: '".-'\'t'qFrt'

. -, ."'o^,, *a]h;'\it""'i'...+,¡-** a\'"

rl

t,i-toIf\¡

'ñrcr, \

ü*"(

Análisis y diseñode experimentos

Segunda edición

Humberto Gutiérrez PulidoCenfro Universitaria de Ciencfcs Fxccfas e lngeniería

U niversided de GuadaÍeiara

Román de la Vara SalazarCenfro de fnvestigeción de Msferneif¡ccs

Guaneiueta, Méxiea

Revisión técnica:

Adolfo Cano CarrascoDep*rtarnento de lngeniería tndustri al

,nst¡tüfo Tecnatógico de Sanara

Mucio Osorie SánchezDepa rta rne nta de Ma te m ó t i c a s

lnsf¡füfo Tecnológico de Sonara

VÉXICO . BOGOTÁ. BUENOS AIRES . CARACAS . GUATEMALALISBOA. MADRID . NUEVA YORK. SAN JUAN . SANTIAGO

AUCKLAND. LONDRES. VILÁN . MONTREAL. NUEVA DELHISAN FRANCISCO. SINGAPUR. SAN LUIS. SIDNEY. TORONTO

-' l¿'-t¿_t L-'/

,--,*==#É

Contenido

.lcer.ca de los autores¡€:¿decimientos¡-eiacio.

c¡pin¡ro I lntroducción al diseño de experimentos.Ei diseño de experimentos hoy.

Definiciones básicas en el diseño de experimentos . .

Etapas en el diseño de experimentos . .

Consideraciones prácticas sobre el uso de métodos estadísticos

Principios básicos.

Clasificación y selección de los diseños experimentales. . . .

CIPíTULO 2 Elementos de inferencia estadística: experimentoscon uno y dos tratamientos . . . .

Población y muestra, parámetros y estadísticos. . . . .

Distribuciones de probabilidad e inferencia.

Estimación puntual y por intervalo . .

Conceptos básicos de prueba de hipótesis

Planteamiento de una hipótesis estadística

Prueba parula media

Prueba para la varianzaTres criterios de rechazo o aceptación equivalentes

Hipótesis para dos medias: comparación de dos tratamientos

Prueba para la igualdad de varianzas

Poblaciones pareadas (comparación de dos medias con muestras

dependientes).... 44

Resumen de fórmulas para procedimientos de prueba de hipótesis. . . . 49

Uso de un software estadístico. 49

(ÁPíTULO 5 Experimentos con un solo factor(análisis de varianza). . . . .

Diseño completamente al azar y ANOVAComparaciones o pruebas de rango múltiplesVerificación de los supuestos del modeloElección del tamaño de la muestra. . . . .

uso de software computacional . . .

XI

xillXV

2

4

6

10

IZI2l4

t820.I23

29

30

34

36

5t39

43

606l

s;89

91

CAPÍruLO 4 Diseños de bloques l ooDiseño de bloques completos al azar l0ZDiseño en cuadro latino . 109

Csr¡n¡¿fo

Diseño en cuadro grecolatino. 115

Uso de software 116

cAPíTUto 5 Diseños factoriales. 126

Conceptos básicos en diseños factoriales. I28Experimentación factorial vs. mover un factor alavez 132

Diseños factoriales con dos factores I34Diseños factoriales con tres factores 143

Transformaciones para estabilizar varianza I49

Diseño factorial general 150

Modelos de efectos aleatorios 153

Cómohacerloconsoftware.... l5'l

CAPÍTULO 6 Diseños factoriales 2k r66

Diseñofactorial 22... 168

Experimento 22: ejemplo integrador 173

Diseño factorial 23 . . . 183

185

r9219:

t9s20Í2lt2l(22(

23(231

24',

25(

25t26

26:

26:26t

26.

27.

CAPÍTUIO 7 Diseños factoriales 3k y factoriales mixtos,

Experimento 21a: ejemplo integrador 27t

Tópicos adicionales sobre factoriales fraccionados. 27'

Uso de software 28.

Experimento 23: ejemplo integrador

Diseño factorial general 2k . . . .

Diseño factorial 2r no replicado. . .

Experimento 25 no replicado: ejemplo integrador

Cuando la significancia de los efectos es menos clara: un ejemplo. . ' .

Factoriales 2k con punto al centro

Factoriales 2k en bloques . . . .

Uso de software estadístico

Diseños factoriales 3k. . . .

Factoriales mixtosUso de software estadístico

CAPÍTULO I Diseños factoriales fraccionados 2k-p.

Diseño factorial fraccionado zk-t . .

El concepto de resolución . . . .

Construcción de fracciones 2k-1

Experiment o 2s-r : ejemplo integradorDiseños factoriales fraccionados 2r-2

Diseño factorial fraccionado 2k-p

f¡PiTULO 9 lntroducción al diseño robusto (Taguchi)F-- : =:,:í¿ Taguchi

= : ---:::t.. le robustez

:-:c::r":: - ::::¡1. de rurdO y de Señal

29,29,

29

29

30

qr

*s

Contenido ffi

Diseño con arreglo interno y externo (diseño de parámetros) . . . . . . . .

Razón señaVruido.Uso de software

CAF*,Y{.Ef;"S x* planeación de un exper¡mento

Regresión lineal simple . . . .

Pruebas de hipótesis en la regresión linea] simpleCalidad del ajuste en regresión lineal simple. . . . .

Estimación y predicción por intervalo en regresión simpleRegresión lineal múltiple. . . .

Pruebas de hipótesis en regresión lineal múltiple . . .

Intervalos de confianza y predicción en regresión múltiple.Uso de un software estadístico.

CAF$?$JL& ?P Optimización de procesos con metodologíade superfície de respuesta

Introducción a la metodología de superficie de respuestaTécnicas de optimización.Diseños de superficie de respuesta. . . .

Uso de software estadístico

CAPÍY'&$L# *3 Optimización simultánea de varias respuestas. .

Optimización simultáneaMétodo gráfico.Método de la función de deseabilidadTrabaio con un software estadístico.

CAPITl¡{-* g4 Díseños anidados y diseños

307

307

312

318Experimentación: una estrategiapara probar conjeturas y generar

aprendizaje 320El diseño de experimentos y el ciclo de Deming 3ZzEtapas y actividades de la planeación y análisis de un experimento . . . 323Control de factores de bloque y de ruido 330

Qué sigue después del primer experimento 33IQué hacer cuando ningún efecto es significativo. . . 334

cAp$?.r,rE"ff ! E Análisis de regresión 338340346351

351

360

365

37r-)t-)

384386

393413

420

432434

436

441

446

Diseños anidadosen parcelas divididas. . . 452

,<

Modelo y análisis estadístico del diseño anidadoDiseños en parcelas divididas\{odelo y análisis estadístico de los diseños en parcelas divididasCómo hacer los cálculos usando software

C.APlTLJt& 3E Diseño de experimentos con mezclas. . . . .

El problema del diseño de experimentos con mezclas,{lgunos diseños de mezclas y sus modelos estadísticos . . . .

--<.<

-f -,

+6,i111

480482486

Contenidox

Ajuste del modelo y caracteizacltii:.l1:5.f":I *:::::-i:#;;;t "t

r"- componentes de una mezcla

Uso de software estadístico

APÉNDTCE A TAbIAS

490

494

500

509

521<a1

<.r,1

526

528

529

533

537

APÉNDIGE B Uso de sistemas comp-utacionales'-- -

Etapas al planear y analizar un experimento en un paquete estadístico

Sistema StatgraPhics

Sistema Minitab

SistemaJMP" """."^;i;" de exPerimentos usando sPss ' '

REFERENCIAS Y BIBTIOGRATiA

fnolcr ANALiúco

#mpítulo 1

htroducción al diseño

de experimentos

$xxsmmrá*

*? El diseño de exPerimentos hoY

r.€ Definiciones básicas en el diseño de experimentos

tF Etapas en el diseño de experimentos

:;: consideraciones prácticas sobre el uso de métodos estadísticos

i* PrinciPios básicos

....Clasificaciónyseleccióndelosdiseñosexperimentales

ffimtiv*sdm ffiffs-*sldámffijt

ffi Conocer el papel fund¿mental que juega el diseño de

experimentos en el meioramiento de Procesos y en la

investlgaciÓn'

I ldentificar los principios básicos y la terminología

adecuada en el diseño de experimentos'

IDescribirlasetapasmásimportantesenlainvestigaciÓnexperimental.

ffiHmpa tronceptual

Diseño deexperimentos

4fl&pgYCJt$ I í',.{ i : {r:!i.}l'i ¿i rj ts'*!"i * ** *xpeli ment*s'

l.Compararadosomásmaterialesconelfindeelegiralquemejorcumple

(¡*e¡*:*$'1r¡'$ eEag*

" Aleatorización- Bloqueo- Diseño de exPerimentos

,.Enor aleatorio

" Enor exPerimental

. ExPerimento

. Factores controlables

- Factores estudiados

. Factores no controlabie:

. Matriz de diseño

. Niveles

'' Planeación

Proces- --::=----Dr- -:<^ --a - :-:-- -'

. ,. ¿i-,aoie de respu:sia

ffi& Siseñs de *xpffie-&wxffiffi&ws &xmy

Enelcampo.leiarndustnaesfrecuentehacerexperimentosopruebasconlainten-cióndereS,]1.,'-r,on,oo*uocomprobar,,nui¿.u(conjetura,hipótesis);poreJem.p1o. ha:e : :'-=:::: t*]ii;;-' t; io' tnut"'i¿";;;;t o condiciones de operación

d¡ u n r :r, : ¡' : . :' -

l- T ::' ff:':'Hn fl l*ruttll'H"'"Jffi#';:':T" :

los requerimientos' i trabajan con la

2. Comparar uu'io' i"tt'omentos de medición para verificar s

I ;:X-*ti:"Jril:[:t'ül- . 1,,"1",) de un proceso que tienen impacto

sobre una o *a' "u'utterísticas

del producto final'

4. Encontrar las condiciones de "nt'"tt;;i;;*lp"tu'o'u' velocidad' humedad'

porejemplo)d;;;;"dozcanlosdefectosáselogreunmejordesempenodel Proceso'

:. l:::ru ;l:'JJllff[i: 3::fiff ::scilaciones de variables ambientares

7. Apoyar "t ¿i'"¡o o rediseño de nuevos productos o procesos'

8. Ayudar u "onot"" caracter\zar nuevos materiales'

En general, cuando se quiere mejorar'un procesoexisten dos manetas bástcas

de obtener ta inrormaJá, ,"."r*t^ para ello: unu ", observar o monitorear r'ía he-

rramientas estadísticai,l"r," "o*"". ,.n"r.i,iiii"' qo" permitan mejorarlo: se dice

que ésta es una estrategia pasiva'-La oY manera consiste en experimentar' es decir'

hacer cambios estratélico' y U"1t*"1-1a1 proceso para provocar dichas señales

útiles. Al analizar los r-esultado, O"t "tp".ii"ito '" oUti""en las pautas a seguir' que

- -, -:-: ,.3Je S se concretan en mejoras sustanciales del proceso. En este :-.--.:-

: r":-.r--l:ttár es mejor que sentarse a esperar a que el proceso nos indiqul:-: ':.:-,r mejorarlo. El diseño de experimenlos (DDE) es un conjunto de técnr;"s

-, ', :-:. =r e1 sentido de que no esperan que el pfoceso mande las señales útiles' sina

. -: ., i .j "manipula" paraque proporcione la información que se requiere para su

:: ,,ber diseño de experimentos y offas técnicas estadísticas, en combinación con

,- --3nros del proceso, sitúan al responsable del mismo como un obseruador per-

_ , , proactivo que es capazde pfoponer mejoras y de observar algo interesante

-**Jadesdemejora)enelprocesoyenlosdatosdondeotrapersonanoVenada.

!i;,0 d* *npcrirn*rlt*s* *n {m i*vestüg*c!*e"l

_ _ _; ¡: ha dicho hasta el momento también es válido en el campo de la investiga-

. - : _.:¡íilca o aplicada, ya que a fin de cuentas, el objetivo es generar nuevas ideas

- : , :: s respuestas a las interrogantes del investigador sobre el objeto de estudio'

- - bjetivo cle los métoclos estadísticos'es lograr que el proceso de generar co-

I - -_:--,io y aprendizaje sea lo más eficiente posible. En este proceso, que ha de-

ii ":.:: ser secuencial, interactúan dos polos (véase figura 1'1)' por un lado están

,. : :_:. los modelos, las hipótesis, las conjeturas y los supuestos; por el otro, es-

-- . ::¿lidad, los hechos, los fenómenos, |a evidencia y los datos. Así, como se

* .:..: en Box et at. (1918I una hipótesis inicial lleva a trn proceso de deducción

: - : -. *i las consecuencias derivadas de ia hipótesis pueden ser comparadas con los

;,: . : ,l lando las consecuencias y los datos no coffesponden, entonces la discrepan-

- : -, r-- llevar a tn proceso de inducción, en el cual se modifica la hipótesis origi-

- - ; ssta manera inicia un segundo ciclo de la interacción de teoría y datos, en el

. -* ,:: :onsecuencias de la hipótesis modificada son comparadas con los datos (|os

: : ios que se obtengan en este nuevo ciclo); esto puede llevar a futuras modifi-

";- *-: r'a la obtención de conocimiento.

:.le proceso interactivo de aprendizaje puede visualizarse como un ciclo de

.: -- . ,trrÉntación (figural.)),en el cual las discrepancias entre los datos y las con-

": - _-:: -is de la hipótesis fy'1, llevan a una hipótesis modificada H2, y de la verifica-

- -:-:.¡a.ademásdeconocimiento,seproduceunamodificacióndelamodificación' :,- -.lis H.) y así sucesivamente.

l"= " e hist*rle d*ñ qfü*eft* d* üKpffiritYl*ntüs:' -.:i r, estadístico de experimentos, desde su introducción por RonaldA. Fisher en la

* -::: nitad del siglo xx en Inglaterra, se ha utilizado para conseguir un aprendizaje

-- : :::r.¡. El trabaio de Fisher a través de su libro The Design of Experiments (1935),

Teoria, modelos, hipótesis, supuestos

Realidad, hechos, fenómenos, datos

Figura l.l Proceso interactivo de la experimentación

Tt,..

l

I

S.

t-

!-

lri-

of

rS.

de

SC

tes

\'er

lon

$ts{¡{:¿:¡-e,* rls'dq¡c$ alst*c}f'}

[: c¡¡ndc las consecue¡rcias

derivada: cie ia hiPótesi:

pueden ser compar;dar con

los da{os.

Fsotes* dq inxj$a:q*dlr*

Es cu¡nCc las consecuenci¿s

<1e la hipótesis original '¡ ios cia-

lcs nc están de acuerdo, Por lo

que se inicia este Prü[eso Pare

cambiar tal nipótesis.

rpie

nla

acto

dad,

peño

{es.

i.lCaS

ía he-

e dice

decir,

eñales

ir. que

CepíT{.¡tS I intrr:di-¡ccíún a!'-lis*ño de exp*rinrentr:s

6

lnducción *--+ HiPÓtesismodificada H,

Hipótesis H' DeducciÓn----J>

-,-a=-)zzaaH,

I

:.-l -, . ,, .: ::,-:,-:-,:-' ' -:- .: -:"' :'tisación agrícola'.t" o*:ni:ó métodos (ahora

-:;--: :: : ':- ' - - t'-tt' = .:- tot "titados de exPerimentos con muestras

- ' = | -: :l' ::;:: :-:> :¡ Fi:her radica en que este investigador se dio

:":: -::- " -: : -tr' : *: : --'' " -'- t¿¡'"f t'i*tntos obstaculizaba el anáiisis

,-..r, :: :,-= -': -- -:r -t ,-t.- -_-.,=:=",ipr"pot.ionó métodos para diseñar

;: .¡. :-r*-,¿:-; ;1:';::-;:--:_-_ _-_' .=- - -..ara in-rulranea de varios factores.

i)ip€iiIl,illi'-: ;'Sil:'::-! : -i-''-':-:: t . -= --:- ."O-.,',antOS fUerOn enCabeZadOS- '" -

,o, ,1esarr.',l1os pc's:ali'];;s -:- ll'-:- - o años en la indus-

nor George E' P' eor' quien tlaba¡ó t'::]'' "ttit'ir;'-' :urante och

iria química.n r'grurJlu 1, desanoll.ila m¿t¡,j..i¡s,'. "i: s'u¡e, cie de respuestas

ü;;;;,,."r::*?j;¿* jn1':;ffi ;{U**:fi iX:';'Ti:ilt,tegia Para la exPerrm

ei diseño o. "^p".r-"ni", se convirtió "n

uá n".'u*'enta de aplicación frecuente'

pero sólo "n

tu, ar"uJ¿"-i*"riigu"iOn V ¿"r"t"if"' Hasta la ¿¿ca¿a de 1970' 'a

apli-

caciónanivelptuntuopfocesosdemanufacturanoestabageneralizada,debidoalafaltadefecufsoscomputacionales.yaquelosingenierosyespecialistasenmanufac-ilf; ffi i* *:::*;t? "j,T:X :l;i.lff fi, i :".l1"tTen,o

y, a apli c ac i ón

del diseño o' "'p"'il*os debido "l

é;;;;;1J;i:":jndustria japonesa' El

movimiento por la calidad' "n:19"1d: f:t "t gurúes

?"rnt"9 : Ishikawa' promovlo

el uso de la estadír;i;;.; calidad, donde el Jiseño de experimentos demostró su

utilidad ranto para;;il problemas d.;;;;" como para diseñar mejor los produc-

tos y los procesos.;;;;;; desmca "t,r"O"r" U" Genichi Taguchi' cuyos conceptos

sobre diseño 'ouu'á tu,,'ui¿n tuvieron;#;;" significativo en la academia en el

mundo occidental. óo*o ,"rprr"rr" "l *;;iJi"tt" pJt la calidad y la mejora de pro-

cesos,iasindustriasempezafonaentrenarasusingeniefosenlaaplicacióndeldise-ño de experr-"rr"r.

jL "ontir,,iu

* ü "*ttoio;.rnctuso' en los últimos veinte

años, 1as oniu""liluJ"' t'un "t"o'porado

el diseño de experimentos como materla

obligatoria u on"'i'*u en la mayoría de las ingenierías'

Se$Ém*eáss?es b¡*¡süea$ effi eü

diseño de exPerürsqentms

EIdiseñodeexperüne,l/oseslaaplicacióndelmétodocientíficopafagenerarcono-cimientoacercadeunsistemaopfoceso'n",'.'"u'"depruebasplaneadasadecua-damente.Estametodoioglu,"t'al¿oconsolidandocomounconjuntodetécnicas

-4

ffi

t-

.a

)n

E1

ióSU

lc-

:OS

e1

ro-

se-

nte

:ria

Definiciones básicas en el diseño de experl-:-::¡

:: .' - :r-,'ilS ¡' de ingenieúa, que permiten entender mejor situaciones compiejas at-: --.- r causa-efecto.

ir:erimento-- - . t.:€ritnento es Ltn cambio en las condiciones de operación de un sistema o pro-

-: !.. que se hace con el ob.jetivo de medir el efecto del cambio sobre una o varias

:: :-:dades del producto o resultado. Asimismo, el experimento permite aumentar

. :::ocimiento acerca del sistema. Por ejemplo, en un proceso químico se pueden

:: . ::i diferentes temperaturas y presiones, y medir el cambio observado en el rendi-

-: -:¡,r (.vield, ppm, defectivo) del proceso. Al analizar los efectos (datos) se obtiene

-. -:¡imiento acerca del proceso químico, lo cual permite mejorar su desempeño.

- nidad exp*r¡rfiental" * .n,idad experimental es la pieza(s) o muestra(s) que se úiliza para generar un: :,r que sea representativo del resultado del experimento o prueba. En cada diseño

:. :rperimentos es importante definir de manera cuidadosa la unidad experimental,

; !ü3 ésta puede ser una pieza o muestra de una sustancia o un conjunto de piezas

:::,.Jucidas, dependiendo del proceso que se estudia. Por ejemplo, si se quiere inves-

,.:r alternativas para reducir el porcentaje de piezas defectuosas, en un proceso que

::-'duce muchas piezas en un lapso corto de tiempo, es claro que no sería muy con-

.."rle que la unidad experimental fuera una sola pieza, en la cual se vea si en una

- - r,lición experimental estaba defectuosa o no. Aquí, la unidad experimental será

- ::ta cantidad de piezas que se producen en las mismas condiciones experimentales,

.l irnal se analizarácuántas de ellas están defectuosas y cuántas no.

, ariabNes, fadores y niveles:: to'lo proceso intervienen distintos tipos de variables o factores como los que se

:-- i.slran en la figura I .3, donde también se aprecian algunas interrogantes al planear

:, erperimento.

Variable(s) de respuesta. A través de esta(s) variable(s) se conoce el efecto o los

::sultados de cada prueba experimental (véase figura 1.3), por 1o que pueden ser

-.:acterísticas de la calidad de un producto y/o variables que miden el desempeño de

Entrada

Factores ***'*_r>conlTotaDtes

Factores no-*_-*---¡tscontrolables

\,du5d5 _----_--}}

Salida

Característicasde calioaci o

Proceso variables deresPUesta

-f -*_--_-+b tteCLOs

iCuáles características de calidad se van a medir?

iCuáles factores controlables deben incluirse en el experimento?

ZQué niveles debe utilizar cada factor?

iCuál diseño experimental es el adecuado?

Figura 1.5 Variables de un proceso y preguntas a responder al diseñar un experimento.

lrExperimer::fJ u ,a - -né< a: - _:_: - _

l1l3 O Di..l l=: , - -: :

ei a!:jetirio a= '' - : :

l- -__-,1-:^ ^_a ti' : d: ! ii-'i( ) -

propieclade: de :--:,sr-rlt¡cic.

ffim[Jnldad experinrentalPiezals) l nruesire(s) que se

ulrltza S:ara gene r¡r un v¡lorqr* sra repres*ntativo rlel re-

:ulteda de !a prlleba.

Variable de resp*estaA lravés de esta{s) varirble(s)!s cüilüre el efecio t: lr:: resu

iaias dc c;Ca pruel:; exper-

rne nt¿1"

lno-cua-

úcas

rI CAPíTULO I lntroducción al diseño de experimentos

un proceso. El objetivo de muchos estudios experimentales es encontrar ia forma de

mejorar lar s I variable(s) de respuesta. Por lo general. estas \ ariables se denotan conla letra 1.

Faúres cot¡t¡olables. Son variables de proceso o característica: de 1os materialeserp'enmentde> que se pueden fijar en un nivel dado. Algunos de éstos son 1os que

usu¿l-filene :e ;ontrolan durante la operación normal del proceso rr'éase frgura 1.3),

¡ :e üsnrgeri Frrque. para cada uno de ellos, existe la manera o el men--anismo para

crrntii¡i"¡ :r;ry;lo¡ su nir el de operación. Esto último es lo que hace posible que se

pueda erFer-:rÉri¿: can ¿l1as. Por ejemplo, si en el proceso se usa agua a 60"C en-

tonces detre ¿¡-rs¡:;i n¿c¿nismo que permita fijar la temperarura del asua dentro de

un rango Jr ';5:mr*--.i1. -{lgunos f'actores o características que generelrnente se con-

trolan :*--o'n" =rF¿i";rrrr- riempn de residencia, cantidad de cierto reactir-o. tipo de

reactil-1f,- r:¡tri\i¡ fo "r¡gr:.Jión. r-elocidad, presión, etc. A los factc'res '-ontrolablestarnt'iÉu:e h -''tr.¡ ',r;ri¿ihles de entrada, condiciones de proceso-variables de di-

-iú¡rr- -:a;r;F/¿Tq1-. ;¿.- ¡mr-eso. las ,r de un proceso o simplemente"foc¡or¿i.

Fad¡rc¡ n crlrolótes o de ruido. Son variables o caracteística-i de materiales

1 n:*"trx {t".rÉ rhl :e pueden controlar durante el experimento o la operación normal,:*- ¡r-.-ceo. Por e_jemplo. algunos factores que suelen ser no controlables son las""'e:-¡L"l* :rmtlirnrales (luz, humedad, temperatura, partículas. ruido. etc. l. el animofu l':nr'

""pteraJores. la calidad del material que se recibe del proleedor t interno o ex-

tüÍl: . Ln factor que ahora es no controlable puede convertirse en controloble ctan-a¡ ¡e ,-r¡enta con el mecanismo o la tecnología para ello.

Fadures esü¡diados. Son las variables que se investigan en el experimento, res-

Fwtrl de cómo influyen o afectan a la(s) variable(s) de respuesta. Los factores estu-

diair--'s pueden ser controlables o no controlables, a estos últimos quizá fue posible yde i¡terés controlarlos durante el experimento. Para que un factor pueda ser estudia-do es necesario que durante el experimento se haya probado en, al menos, dos nive-les o condiciones.

En principio, cualquier factor, sea controlable o no, puede tener alguna influen-cia en la variable de respuesta que se refleja en su media o en su variabilidad. Parafines de un diseño de experimentos deben seleccionarse los factores que se conside-ra. por conocimiento del objeto de estudio, que pueden tener efecto sobre la respues-ta de interés. Obviamente, si se decide o interesa estudiar el efecto de un factor nocontrolable, parte de la problemática a superar durante el diseño es ver la manera enque se controlará durante el experimento tal factor.

Niveles y tratamientos. Los diferentes valores que se asignan a cada factor estu-diado en un diseño experimental se llaman niveles. Una combinación de niveles detodos los factores estudiados se llama tratamiento o punto de díseñ.o. Por ejemplo, sien un erperimento se estudia la influencia de la velocidad y la temperatura, y se de-.::i¿ :robar cada una en dos niveles, entonces cada combinación de niveles (veloci--.'.r" ::::Fr¿rurar es un tratamiento. En este caso habría cuatro tratamientos, como:€ :L"Éf: ¿r .. -b1r 1.1. Es necesario probar cada tratamiento y obtener el corres-¡;mUi¡n¡r''rie ", 1;{lf ;¡ -,

Fa€tores controlables>On .¿':: =: -::--:=i- :Caf Af.:--i -:-- l= l: -:.:-: i:y n: r=-^-^: :t^:a-:--j :-

que se Pueten njar er u. - . -dado.

I*Factores no controlablesSon variables que nc Si I --den con'.rolar C¡.a..: : =,-:'

: . ^^ -, - - ; - , - -rrLg"LUUicl-=4" - :

aot ñrla:a'

Definiciones bésicas en el diseñc de exDerinrenr,:,.

Tabla l.l Puntos de diseño o tratamientos.

l: "cuerdo con estas definiciones, en el caso de experimentar con un solo fac-" .,: : ':: nir.e1 es un tratamiento.

E*rw aleatorio y erfor experimental, Siempre que se realiza un estudio experi-

t*,rr -'-. :arte de la variabilidad observada en la respuesta no se podrá explicar por los'i.r.-. - :-! esrudiados. Esto es, siempre habrá un remanente de variabilidad que se debe

r -r ::i comunes o aleatorias, que generan la variabilidad natural del proceso. Esta

.¡.:-,idad constituye el llamado error aleatorio. Por ejemplo, será parte de este

:'- - ''-atorio el pequeño efecto que tienen los factores que no se estudiaron, siem-

:r: , ::ando se mantenga pequeño o despreciable, así como la variabilidad de las

:':-;-rnes hechas bajo las mismas condiciones. Sin embargo, el emor aleatorio

ü--:.:r absorberá todos los errores que el experimentador comete durante los expe-* -:.:. -',:. y si éstos son graves, más que error aleatorio hablaremos de error experi-ii,ir - --, . De predominar éste, la detección de cuáles de 1os factores estudiados tienen

r.i ---;:o real sobre la respuesta será difícil, si no es que imposible.,Juando se corre un diseño experimental es importante que la variabilidad ob-

u* -; de la respuesta se deba principalmente a los factores estudiados y en menor

nÉ--i al eror aleatorio, y además que este enor sea efectivamente aleatorio. Cuan-

-¡ , :,J.\'or parte de la variabilidad observada se debe a factores no estudiados o ar.n -:rlr no aleatorio, no se podrá distinguir cuál es el verdadero efecto que tienen los

9

ffi

i-

e

:S

t-

ES

ral

las

no3\-an-

Frrsr atr*ntorio[s la v¡ri¡biliCaei obsen¡aile

que nc :e pueCe expiicar por

los f¡ctores estL.:diadas; resrlta.lpl r)or:,, , 'r cla,l,- r:^ In. ,¡¡.

^-, .)t--^.-.. )-íto:.ei :rü ejt.i L:üos y' üc ar"li-

expenmenial.

ffifr_a$3 ,.

Error experirnentañf, ',.'r;, r' r,:,r,1,.1 'rr,,r:rl¡-:l,rr.n\L"PUrCrr!Ur. art,Jr': (I ¡,,

:U': :ellc¡i, lr..'.. :fít.r'?> l¡l gvPt'

rin*nf¡ccr en la p!*neación y

ejecL:ción del experiment¡

res-

stu-

rie y

.dia-

úr'e-

uen-

Para

side-

pues-

or no

:ra en

: estu-

:les de

Lplo, si

se de-

veloci-

. como

COITES.

Factores de diseño (fáciles de controlar):Tiempo de ciclo, presión del molde, velocidad de tornillo,temperatura, tiempo de curado, contenido de humedad

Yt Y2 Yk

','.ieria prima ProcesoCaracterísticas de calidad:encogimiento, dureza, color,

+ + f costoltextura

), ),...)oFactores de ruido (difíciles de controlar):. Parámetros de calidad del proveedor. Química del plástico. Otras variables del proceso. Variables ambientales

Figura 1.4 Factores y variables en la fabricación de un envase de plástico.

x1 x2... xktttsf v

/

t0 eApiTUf,-ü 3 lntrndu*ción ni *iiseño *l* *xperim*ntr:s

factores estudiados, con 1o que el experimento no alcanzaría su objetivo principal.De aquí la importancia de no dejar variar libremente a ningún factor que pueda in-fluir de manera significativa sobre el comportamiento de la respuesra (principio debloqueo).

Kjemp$m, ü.!En la figura 1.4 se muestran algunas de las variables que intervienen en e1 procesode fabricación de un envase de plástico. El problema general es encontrar 1as con-diciones de operación de los factores controlables, que dan por resultado valoresóptimos de 1as características de calidad ahí listadas. También podría se r de interésinvestigar el efecto de factores no controlables, buscando lograr un proceso insen-sible (robusto) a su posible efecto. Supongamos que sólo intereie 1¡ dureza de lapieza de plástico resultante. Algunas preguntas que se pueden resprlder con undiseño experimental son: ¿cuáles factores afectan la dureza de1 p1ásrr,-rl. ¿cómoes que la afectan?, o bien, ¿qué relación hay entre los factores c¡nrr,t,ltbles y ladrreza?; ¿existen otras condiciones de operación, distintas a 1as ¿¡r¡;,¡s que me-joran la durezaf Estas preguntas se responden probando diferentes .-,:,n,L,inacionesen ios niveles de los factores controlables, seleccionadas de nlün-:; :.decuada.Esto último significa escoger el diseño experimental más adecuad.. ¡l problema,que en este caso parece ser un diseño factorial completo o fraccion:¡,- ,-apítulos5,6y8).

HÉapms €ss eN dtsmffi* d* *xBwrümentosUn aspecto fundamental del diseño de experimentos es decidir;u.i:. ¡:,-i:bas o tra-tamientos se van arealizat y cuántas repeticiones de cada uno !- i.i-::;r-r. de ma-nera que se obtenga la máxima información al mínimo costc r,¡sibte. El arregloformado por los diferentes tratamientos que serán corridos, inclu,. endo las repeticio-nes, recibe el nombre de matriz de diseño o sólo diseño.

Para que un estudio experimental sea exitoso es necesario re:hzar. por etapas,diferentes actividades. En este sentido, la etapa más impor-tante \ : ia que se le debededicar mayor tiempo esla planeación (véase capítulo 10). A c.rr:rnu¡ción se descri-ben de manera breve las etapas del diseño de experimentos con obiero de dar unavisión global de lo que implica su correcta aplicación. Vanos J{,rt-rcepros que se men-cionan en estas etapas se definen con detalle en los siguientes rapirulos,

Planesei*n y remñiuae[ór't

1. Entender y delimitar el problema u obieto de estudio. En la etapa deplaneación se deben hacer investigaciones preliminares que conduzcan aentender y delimitar el problema u objeto de estudio. de tal forma que quedeclaro qué se va a estudiar, por qué es importante r. si es un probrema, cuáles la magnitud del mismo.

2. Elegir la(s) variable(s) de respuesta que será medida en cada puntodel diseño y verificar que se mide de manera confiable. La elecciónde esta(s) variable(es) es vital, ya que en ella se refleja el resultado de Iaspruebas. Por ello, se deben elegir aquellas que mejor reflejen el problema oque caractericen al objeto de estudio. Además, se debe tener confianza en

IMatriz Ce diseñ*:, - . -'-. ':'.':¿ir,; pr¡¡ ic:.-:-:-- : . : -,:.eránlcrriljo:,

Planeacién3,:l aCilt',:" --. =-:.'l if¡de : a

: ri llu:' C= '' - , ?'c

. 'l--C o:'-

-,:i \-,¿rt¡bles de --.-: _:. ¡ ,,t

-:. r)r1( L .. - :- -a:icn dr lc: tral¿- ----.i: :

,rnr¿Cj.,_-..,-'.:...,) expetimentai.

Etapas en el dise=c := :'::- -:-'::

;ue 1as mediciones que se obtengan sobre esas variables sean cont-iables. E:'ruas palabras. se debe garanlizar que los instrumentos y/o métodos de m¿-iición son capaces de repetir y reproducir una medición, que tienen la pre-

"'rsión (error) y exactitud (calibración) necesaria. Recordemos que los siste-;nas de medición son la forma en la que percibimos la realidad, por lo que siéstos son deficientes, las decisiones que se tomen con base en ellos pueden

ser inadecuadas.

-: Determinar cuáles factores deben estudiarse o investigarse, de acuer-do a la supuesta influencia que tienen sobre la respuesta. No se tratade que el experimentador tenga que saber a priori cuáles factores influyen,puesto que precisamente para eso es el experimento, pero sí de que utilice todala información disponible para incluir aquellos que se considera que tienen unmayor efecto.

: Seleccionar los niveles de cada factor, así como el diseño experimen-tal adecuado a los factores que se tienen y al objetivo del experi-mento. Este paso también implica determinar cuántas repeticiones se ha-

rán para cada tratamiento, tomando'en cuenta el tiempo, el costo y laprecisión deseada.

j Planear y organizar el trabajo experimental. Con base en el diseñoseleccionado, organizar y planear con detalle el trabajo experimental, porejemplo, las personas que van a intervenir, la forma operativa en que se ha-

rán las cosas, etc. (véase capítulo 10).

: Realizar el experimento. Seguir al pie de la letra el plan previsto en laetapa anterior, y en caso de algún imprevisto, determinar a qué persona se lereportaría y lo que se haría.

\-¡lisis:-: :

' -: etapa no se debe perder de vista que los resultados experimentales son obser-- ',. ¿,i ntuestrales, no poblacionales. Por ello, se debe recurir a métodos estadís-:; , :iferenciales para ver si las diferencias o efectos muestrales (experimentales)

- -ruficientemente grandes para que garanticen diferencias poblacionales (o a1 :. :ioceso). La técnica estadística central en el análisis de los experimentos es el;-.:i"r análisis de varianzaANOVA (acrónimo en inglés).

-:erPretaclónr---. Jon el respaldo del análisis estadístico formal, se debe analizar con detalle lo-i-: :.: pasado en el experimento, desde contrastar las conjeturas iniciales con 1os.: ,-,:.ios del experimento, hasta observar los nuevos aprendizajes que sobre e 1 pr.r-,.: , :3 lo_eraron, verificar supuestos y elegir el tratamiento _uanador. siernpr::..n;' - : de las pruebas estadísticas.

l¡ntrol y e$nc$ilsÉsnes finnles:r-. :¡ncluir e1 estudio experimental se recomienda decidir qué medidas implemen-.r.: ::::1 generalizar el resultado del estudio y para garantizar que las mejoras se

: ;:.-::gan. Además. es preciso organizar una presentación para difundir los logros.

tt

de

lt d

ede

:uá1

into:rón

: las

naoaen

l2 CAPiTULü t li:tir:¡Ju¿ciÓn al ijiseñe¡ t** experimentr'i:;

tmnsideracioüles Ptrl&$A&&$ Pwbsm

el uso de mr&t*dms estmdístñems

Enadiciónalodichoenlasecciónanteriot,esimportantetomalencuentaqueaun-que el uso de metodologías estadística' po' 1o.genl*t "tt1i^11::er

más eficiente el

pfoceso de investtgacñ y o" sotución de problemas, es necesario reconocer que las

rnetodologías estadísticas por sí solas no garant\zaninvestigaciones exitosas' por ello

es irñ\portante considetar \os sigürentes punttls"

El conocimiento no estadístico es vital. Para utilizar los métodos estadísticos en

general y los diseños de experimentos en particulat, en primer lugar se requiere que

el experimentador r"ngu un buen nivel de conocimiento técnico y práctico sobre el

fenómeno o proceso q*ue estudia, de tal for:rna que pueda vislumbrar con cierta faci-

lidad cuáles son los urp.oro* clave del fenómeno y seacapaz de plantear conjeturas

precisas, vislumbrar'eitipo de relaciones entre las variables de respuesta y los posi-

bles factores a estudiar. Todo esto ayudará a seleccionar mejor los factores y sus ni-

veles, así como el diseño que es mejor aplicar. Además' ese conocimiento permitirá

sacaile un provecho real al análisis estadístico de los resultados y obtener conclusio-

nes que generen aprendizaje y soluciones'

Reconocer la diferencia entre significancia estadística e impoÉancia prác'

tica. En ocasiones, un experimentador puede concluir que dos tratamientos son di-

ferentes estadísticamente, pero que tales diferencias, aunque sean significativas' no

necesariamente representan una diferencia que en la práctica sea importante'

Apostarle más a la experimentación secuencial que a un experimento único

y definitivo. En ocasiánes, los experimentadores novatos pretenden en una sola

fase de experimentación contestar todas sus interrogantes sobre un proceso o fenó-

meno en particular. Sin embargo, esto puede llevar a experimentos muy extensos que

consuman demasiados recufsos y que retarden la generación de resultados' Por ello

es importante considerar como alternativas a diferentes fases de experimentación en

forma secuencial, en las cuales se alcance paulatinamente una mayor precisión en los

conocimientos Y soluciones'

Es importante no confundir la experimentación secuencial con la experimenta-

ción a prueba y effof (véase sección "Experimentación factorial frente a mover un

factor a lavez" del capítulo 5).La experimentación secuencial en cada fase sigue una

estrategia bien definiáa y pensada; por 1o tanto, en cada fase se obtienen resultados y

conclusiones importantes que permiten generar soluciones y conocimiento más refi-

nadoparaplanteardemejormanelalasiguientefasedeexperimentación.

Frincipios básieos

El diseño de experimentos trata de fenómenos que son observables y repetibles' Por

lo tanto, sin el pensamiento estadístico, los conceptos de observabilidad y repetibili-

dad son inherentemente contradictorios. cualquier cosa observada se aprecia con

variabilidad; nada ocune exactamente de la misma forma dos veces, incluso las me-

t5

., ni -: :-:rrrrl e\ento varían. Entonces, ¿qué se quiere deci¡ cuandcr ,; a-:..: -!r' 'r -*r -J - -: *:: observación sea repetible?, ¿qué repetición es realmente un¿ :i:'--

" -:: - - 'r resuitado es el mismo o difiere, ¿es confirmación o contradiccrón .

: n., pueden ser contestadas de manera coherente sin el pensamientc,

eun-

ite el

ie 1as

r ello

)os en

:e que

bre el

¡ faci-eturas

' posi-

sus ni-rmitiráclusio-

I Pfác-son di-

.\'as, no

s únicorna sola

o fenó-

lsos que

Por ello

eción en

ón en los

:rimenta-

rlover un

'igue una

ultados Ymás refi-

úbles. Por

repetibili-¡¡ecia con

iso las me-

: : :1ernplo, alguien da una nueva receta de chocolate, dice que no falla.

-: r: ,, no sale, mientras que el segundo y tercer intento sí funcionan. ¿La

- :,:robada completamente? (Los chocolates tienen más de 800 ingre-

-: -rles que pueden ser separados.)

- : ,--;:.ir con lo anterior, se debe ser muy cuidadoso en la planeación y el

-. - . : r¡erimento. El punto de partida para una correcta planeación es apli-: - - :r,-,:s básicos del diseño de experimentos: aleatoización, repetición y

; : : l:.les tienen que ver directamente con que los datos obtenidos sean

: , , ..::nder a las preguntas planteadas, es decir, la validez del análisis de los

: :r '.: .n estos principios.

ftffih¡ción. Consiste en hacer las corridas experimentales en orden aleatorio

. -. ^ : :, material también seleccionado aleatoriamente. Este principio aumen-

- . :',:.-.,jad de que el supuesto de independencia de los errores se cumpla, lo.., r -- ,-:-uisito parala validez de las pruebas de estadísticas que se realizan.

.r' :- :: -rii manera de asegurar que las pequeñas diferencias provocadas por

". r'* -- : r ;J.]lpo 1, todos los factores no controlados, se repartan de manera homo-'l;. :- . :,-,s 1os tratamientos. Por ejemplo, una evidencia de incumplimiento o

. . -: :ste principio se manifiesta cuando el resultado obtenido en una prueba

-,-,::nciado por la prueba inmediata anterior.

nwrd[cüsrt Es coner más de una vez un tratamiento o una combinación de factores.

I :*'- '.. .. -, .-onfundir este principio con medir varias veces e1 mismo resultado expe-

ffi,i1 ! c:et* r ¿;r,: r {:-ul:

Cclsistr: en h¡cer r¡¡rl'l¡s Ex-

,1ñ/,i ñ. .n1 'it,.- arr nr,icr : -:¡/.:.l rrt.¡'1..¡ lC r i'l¡¡¡ ':-_C !)-

rir: {al ezi'r); esle princrpil:. . I ian r: r.: -:, 'i5,,rJ. .1.- , 1,,c

el c,UpJi\ir. j: in,.lq .r, .,lt ,,. c:- i--- -.,.rr'. 't)\ it;ii'r!\ .-t ,-,_I.tll'j.

1!:.i,1 i: *-* r.:. i'. : t'-.-,-, - l-r lrl,', nr)\llPr';.r1F !l!_

;:.ll-.ic'.i:C o t.c.':l-'.f :,i,1 . :

ffi

! =::tr es volver a realizar un tratamiento, pero no inmediatamente después

.::-do ei mismo tratamiento, sino cuando corresponda de acuerdo con la alea-

-- . i repeticiones permiten distinguir mejor qué parle de 1a variabilidad total,r *-, - . .; debe al eror aleatorio y cuál a los factores. Cuando no se hacen repeti-

' : - .r:'" rrsflera de estimar la variabilidad natural o el enor aleatorio, y esto difi-- - :..-rucción de estadísticas realistas en el análisis de los datos.

Mlrryceo. J,:,nsiste en nulificar o tomar en cuenta, en forma adecuada, todos los fac- i,3ir.,,r;,,:,::,

: - -: :*¡dan afectar la respuesta observada. Al bloquear, se supone que el sub- l*;,'r'riif: .

r - -'. :: Jatos que se obtengan dentro de cada bloque (nivel particular del factor ...'-" " -:-- . lebe resultar más homogéneo que el conjunto total de datos. Por ejem- ,.rr =.

.

l ,: ---.,erert comparar cuatro máquinas, es importante tomar en cuenta ai ope-

,.,- - ,: '. :rráquinas. en especial si se cree que la habilidad y los conocimientos de1

r r -, : : *¡ien influir en el resultado. IJna posible estrategia de bloqueo del fac-r,:--:r-:. sería que un mismo operador rcalizata todas las pruebas del experi-

r- :: - - :. posible estrategia de bloqueo sería experimentar con cuatro operadores

, -r,.: :.-.J-,*¿s). donde cada uno de ellos prueba en orden aleatorio las cuatro má-

,,. --' .,. ,'si- segundo caso, la comparación de las máquinas quizás es más real.

.* :.-'j,-,r es un bloque porque se espera que las mediciones del mrsmo ope-

...- ".:: :-,"> parecidas entre sí que las mediciones de varios operadores.

w

l4 CAPiTI",LS I tntroduerión *l diseñ* ri* *x¡:erimentr-:s

Los principios básicos se entenderán mejor en la medida en que se estudien losejemplos de los capítulos siguientes. En particular, en la sección "Poblaciones parea-das" del capítulo 2, se presentan los experimentos más simples donde la aplicaciónde estos principios es evidente.

C$mmüftemsfiónn y $*ñ*ce*óm deñss dñseffims *xp*trfiffiem*mHes

Existen muchos diseños experimentales para estudiar la gran diversidad de proble-mas o situaciones que ocurren en la práctica. Esta cantidad de diseños hace nece-sario saber cómo elegir el más adecuado para una situación dada y, por ende, espreciso conocer cómo es que se clasifican los diseños de acuerdo con su objetivo ysu alcance.

Los cinco aspectos que más influyen en la selección de un diseño experimen-tal, en el sentido de que cuando cambian por 1o general nos llevan a cambtar de di-seño, son:

1. El objetivo del experimento.2. El número de factores a estudiar.

3. El número de niveles que se prueban en cada factor.4. Los efectos que interesa investigar (relación factores-respuesta).5. El costo dei experimento, tiempo y precisión deseada.

Estos cinco puntos no son independientes entre sí, pero es importante señalar-los de manera separada, ya que al cambiar cualquiera de ellos generalmente cambiael diseño experimental a utilizar (véase capítulo 10). Con base en algunos de estoscinco puntos es posible clasificar los diseños como lo hacemos a continuación,

El objetivo del experimento se utiliza como un criterio general de clasllicaciónde los diseños experimentales, mientras que los otros cuatro puntos son útiles parasubclasificarlos. En este sentido, de acuerdo con su objetivo y sin pretender ser ex-haustivos, los diseños se pueden clasificar como:

1. Diseños para comparar dos o más tratamientos.2. Diseños para estudiar el efecto de varios factores sobre la(s ) respuesta(s).3. Diseños para determinar el punto óptimo de operación del proceso.4. Diseños para la optimización de una mezcla.5. Diseños para hacer el producto o proceso insensible a factores no contro-

lables.

En la figura 1.5 se muestra la clasificación general de los diseños experimenta-les de acuerdo con su objetivo. Dentro de cada rama se pueden clasihcar de acuerdoal número de factores, al tipo de efectos que se pretende estudiar y según las restric-ciones existentes. En la misma figura se listan los diseños particulares más represen-tativos de cada rama.

Nótese que los diseños factoriales completos y fraccionados ocupan más de unlugar en la figura 1.5; la razón es que estos diseños son eficaces en diversas situacio-

Preguntas y ejercicrcs t5

l. Diseños para comparar doso más tratamientos

2. Diseños para estudiar elefecto de varios factoressobre una o más variablesde respuesta

4. Diseños robustos

5. Diseños de mezclas

Diseño completamente al azarDiseño de bloques completos al azarDiseño de cuadros latino y grecolatino

Diseños factoriales 2kDiseños factoriales 3kDiseños factoriales fraccionados 2k -p

3. Diseños para la optimizaciónde procesos

Diseños para el modelode primer orden

Diseños para el modelode segundo orden

I Oisenos factoriales 2k y 2k p

{ Oiseno de Plakett-Burman

I Diseño simplex

I uiseno de composición centralI Diseño de Box-Behnken

I Oisenos factoriales 3k y 3k - p

j Rrreglos orlogonales (diseños factoriales)

I Diseño con arreglos interno y ederno

l' liseno simplex-reticular

J Diseño simplex con centroideI Diseño con restriccionest^.L Urseno axral

1.

Figura 1,5 Clasificación de los diseños experimentales.

nes prácticas. De hecho, varios de los otros diseños que se mencionan en esta figurason casos particulares o generalizaciones de los diseños factoriales. En los siguientescapítulos se verán con detalle prácticamente todos estos diseños.

Explique las ventajas que tiene el diseño de experimentos sobre una estrategia de prue-ba y error.

ZQué es un experimento y qué es diseñar un experimento?

En el contexto de un diseño de experimentos, iqué es una variable de respuesta?, iquées un factor estudiado? y zqué relación se esperaría que haya entre la variable y losfactores?

tEn un experimento sólo es posible estudiar los factores que actualmente se controlanen la operación normal del proceso?

iEs posible estudiar cómo influye un factor sobre la varíable de respuesta, si el factor se

mantiene fijo en todas las corridas o pruebas experimentales? Explique.

Se tiene un experimento en el que los factores a estudiar y sus niveles son los siguien-tes: temperatura (10, 20 y 30"C); tiempo (60 y 90 minutos). Elabore una lista de todoslos posibles tratamientos de este diseño.

iQué es el error aleatorio y qué es el error experimental?

iPor qué es importante aleatorizar el orden en que se corren los diferentes tratamientosen un diseño de experimentos?

Señale las etapas en el diseño de un experimento, así como algunos aspectos clave decada una de bllas.

2.

3.

a-

1o

L-

rfl-

7.

8.

un

io-

rt6 CAPíTULO I lntroducción al diseño de experimentos

cPor qué se considera la planeación del experimento como la etapa más importante?

Describa cinco actividades que se realizan en esta etapa.

Describa de manera breve los tres principios básicos del diseño de experimentos.

Explique la diferencia entre significancia práctica y significancia estadística. Proponga un

ejemplo donde se tenga Ia segunda pero no la primera.

Describa cinco aspectos que son relevantes al momento de seleccionar el diseño expe-

rimental.

Mencione dos problemas en su área de trabajo que pudieran abordarse con el diseño

de experimentos. Para cada problema enliste algunos factores de control y al menos

una variable de respuesta.

Suponga que se quiere estudiar el desempeño de un automóvil, y lo que se desea es

encontrar los factores que más influyen en su rendimiento. iCuáles podrían ser las va-

riables de respuesta?, icuáles los factores a estudiar?, Zcuáles los factores no controla-

bles o de ruido?

Se quiere comparar el desgaste de dos marcas de llantas A y B, para lo cual se eligen al

azar I 0 conductores particulares de cierta ciudad. A cinco de ellos, seleccionado s al azar,

se les instalan gratis las llantas marca A y a los cinco restantes la marca B, con el com-

promiso por escrito de permitir la verificación del desgaste cada seis meses.

o) ZCree que este experimento permita una comparación justa del ciesgaste de las dos

marcas de llantas?

b) iQué consideraciones se debieron hacer para lograr una comparación más justa?

c) Proponga al menos un cambio al experimento que usted considera que mejoraría

la comparación.

Una compañía farmacéutica realizó un experimento para comprobar los tiempos pro-

medio (en días), que son necesarios para que una persona se recupere de los efectos

y las complicaciones que siguen a un resfriado común. En este experimento se compa-

raron a personas que tomaron distintas dosis diarias de vitamina C. Para hacer el expe-

rimento se contactó a un número determinado de personas, que en cuanto les daba el

resfriado empezaban a recibir algún tipo de dosis. Si la edad de las personas es una

posible fuente de variabilidad, explique con detalle cómo aplicaría la idea de bloqueo

para controlar tal fuente de variabilidad.

En el caso anterior, cqué podría pasar si no se controla la posible fuente de variación

que es la edad?

Un grupo de investigadores trabaja para industrializar la mermelada de tuna; para ello,

realizan mermeladas considerando los siguientes factores: o) variedad de tuna: tres

tipos, ó) con cáscara o sin cáscara, c) completa o la pura pulpa. Por lo tanto, se tienen

l2 posibles formas (tratamientos) de producir mermelada.

La pregunta central que se plantean es si influyen en el sabor los factores consi-

derados, y quisieran encontrar cuál es la mejor combinación de mermelada (tratamien-

to ganador). Para responder hicieron las 12 combinaciones y pusieron cada una en un

recipiente numerado. Enseguida se trasladaban a lugares concurridos donde acomoda-

ban los recipientes ordenados del 1 al 12, y a personas del público les entregaban una

hoja de registro y la invitaban a que en el orden dado probaran en pequeñas porciones

las mermeladas y anotaran qué tan buena les parecía la mermelada (en una calificación

entre 0 a I 0). Al final se tuvo la respuesta de 42o personas, donde cada una daba I 2

calificaciones (una para cada mermelada). iHay algo que desde su punto de vista inva-

lide los resultados obtenidos? Utilice el sentido común y argumente su respuesta.

10.

I t.

12.

13.

14.

15.

16.

17.

t8.

r9.

ffmffig€*¡ñs reffi$mm*m€*s ** áKefuffim*áa

ms€ad{sgásm : ffiKp*rámmse*m E

##s? asrkffi y d*s ffimKmmá*sltcs

f"r, e ,

3t.lgt3ffi3T#, Población y muestra, parámetros y estadísticos l¡¡ Hipótesis para dos medias: comparación de dos

...' Distribuciones de probabilidad e inferencia tratamientos

,r,::. Estimación puntuai y por intervalo Prueba para la igualdad de varianzas

Conceptos básicos de prueba de hipótesis P"bh.b*r fr"adas (comparación de dos.rii: Planteamiento de una hipótesis estadísticu medias con muestras dependientes)

:l:: Prueba_para la media

Prueba para la varianza

t¡i Resumen de fórmulas para procedimientos deprueba de hipótesis

:rr Tres criterios de rechazo o aceptación equivalentes . Uso de un software estadístico

ffihj m€áv*E d* ffiptr*Kadáxmj *ffi ldentificar los elementos de la inferencia estadística y su

importancia en los diseños experinnentales.

ffi Explicar el papel de las distribuciones de probabilidad enla inferencia estadística, asícomo la estimación puntual ypor interualo.

ffi Describir las pruebas para la media y la varianza, así

como los conceptos básicos de prueba de hipótesis"

ffi ldentificar las pruebas para la igualdad de varianzas.

ffi Distinguir las pruebas para comparar medias con

muestras independientes y muestras pareadas.

Mapa conceptual ¡\

Elementosde inferenciaestadística

r20 fiAPfTeJg"# ? fil*n:*nt*s rI* inf*r*ne!¿ estadístiia

ffimb$meñ*xa y Kffi e$*stre, pevá*??etrss

y *$*ed$s*ücms

Una población o universo es una colección o totalidad de posibles indirr::,is. es-

pecímenes, objetos o medidas de interés sobre los que se hace un estudiu- as po-

blaciones pueden ser finitas o infinitas. Siesfinita y pequeña se pueden rni;-¡ todos

los individuos para tener un conocimiento "exacto" de las características : -;ráme-

tros) de esa población. Por ejemplo, un parámetro que podría ser de int;::. es la

proporción p de productos defectuosos, o la media, ¡2, de alguna variable ::-:dida a

los productos. Si la población es infinita o grande es imposible e incosteab,; medir

a todos los individuos, en este caso se tendrá que sacar una muesÍra repre ,.-.:ativa

de dicha población, y con base en las características medidas en la mues';: esto-

dísticos) se podrán hacer afirmaciones acerca de los parámetros de la p.,:irción(figura 2.1).

Con frecuencia, las poblaciones de interés son los materiales, los pr:drctos

terminados, partes o componentes, o algunos de los procesos. En muchos ca-'.-'s estas

poblaciones se pueden suponer infinitas o grandes. Por ejemplo, en emprs>¿s con

producción en masa no siempre es posible medir cadapieza de material qu: iiega o

las propiedades de cada producto terminado. Incluso, si la producción no es :iasiva,

conviene imaginar al proceso como una población infinita o muy grande. i¡bido a

que el flujo del proceso no se detiene, es decir, no existe el último artículo prñucidomientras la empresa siga operando. En estos casos los procesos (poblaciones I se es-

tudian mediante muestras de artículos extraídas en algún punto del proceso

Un asunto importante será lograr que las muestras sean representatilas. en el

sentido de que tengan los aspectos clave que se desean analizar en la población. Una

forma de lograr esa representatividad es diseñar de manera adecuada un rnuestreo

aleatorio (azar), donde la selección no se haga con algún sesgo en una dirección que

favorezca la inclusión de ciertos elementos en particular, sino que todos los etremen-

tos de la población tengan las mismas oportunidades de ser incluidos en 1a muestra.

Existen varios métodos de muestreo aleatorio, por ejemplo: el simple, el estratifica-

do, el muestreo sistemático y por conglomerados; cada uno de ellos logra rnuestras

representativas en función de los objetivos del estudio y de ciertas circunstancias ycaracterísticas particulares de la población (véase Gutiérrez Pulido, 200,5 r.

$ mfes'eneia estad ístiea

El objetivo de la inferencia estadística es hacer afirmaciones válidas acerca de lapoblación o proceso con base en la información contenida en una muestra. Estas

afirmaciones tienen por objetivo coadyuvar en la toma de decisiones. La inferenciaestadística por lo general se divide en estimctción y prueba de hipótesis. \ se apoya

en cantidades o datos estadísticos calculados a parlir de las observaciones en lamuestra. Un estadístico se define como cualquier función de los datos muestrales

que no contiene parámetros desconocidos. Un ejemplo de estadístico es la media

muestral i con la cual se tratan de hacer afirmaciones sobre ia media.,u, que es un

parámetro poblacional.Un aspecto clave en la interpretación y utilización de cualquier estadístico es

que se trata de una variable aleatoria, ya que su valor depende de los elementos que

ffi

{o*eepteis e*ave

" trror trpo I

' Enor tipo ll. Estadístico. Estadístico de prueba

" Estimador puntual

'Crados de libertad

' Hipótesis estadística

" lnferencia estadística

'lnterualo de confianza. Muestras pareadas

'Orden completamente al azar. Potencia de la prueba

" Región de aceptación, Región de rechazo, Significancia obseruada

" Significancia predefinida

P*futn{ic}m tü$ltn

Es aquella en la que se pueden

medir"todos ics individuos para

iener un cor'ucin ientn ex¿fode sus c¡racletísticas.

ffi.Flar*$Tetr$s

Car¡cLeristic¡E que, mediante

su r;alor nr-lrnérico, describen a

- -, ^;.,-+- .l^ ^1,,.-.,^r..a,"ljul'C CF Clirir:{rrl;(1r O

r-iti¡idltoc.

? :b¡e¡.:i** ñr¡f*r*it*r: .::cila L.n i.: (lL¡9 la pnbla

c :- e s 3r¿ri¿js y cs impcsibie ei-'t:,',:oble rrtedt, u Lodos io,tndi,,,ra,.¡cs.

cE_ffi

ldi¡¡estra rcpresentativaLs una pafe <1e L:na pcblacién,.eiecc ion¿, l¡ o,ler'..r¿d¿men;e,

que cünsÉlva los aspeclos cla-

ve de la población"

i ;tfeie r¡.:i.; i:€i,asiís{úqe

Son l¿s afir¡n¿cisr¡e: válidas

:cerca Ce la población o proce--: b¿:e<i¿s en la infom¿cién-----, :, -- l- ,, ---! --J -' i Ua ei I ll ! ; ltlcitl.l.

re

ffi

I

trc

f

li

fn

a

z

vE

LIt

l!

Población (toda laproducción del mes)

¡t:? o:? PARAMETROS

(siempre desconocidos)

ESTADíSTICOS(conocidos)

lnferencia

Figura2.lRelaciónentrepoblaciÓnymuestra,parámetrosyestadísticos.

son seleccionados en la muestra y, por lo tanto, varía de una muestra a otra. La forma

de tonnar en cuenta este hecho es conocer la distribución de probabilidad de cada

estadístico. Como se verá más adelante, al conocer la distribución de probabilidad

del estadístico se podrán hacer estimaciones acerca de cuál es el valor del parámetro

poblacional, y también será posible probar o verificar la validez de hipótesis o con-

jeturas que se tengan sobre la población o proceso. Por ejemplo, un proveedor puede

afirm¿nqueelporcentajedesuproductoquenocumpleconespecificacionesesde 0.7Vo,por lo que interesaría investigar, con base en una muestra, si esta afirmación

se puede tomar como verdadera'

Distr*huetoffies de Probabllidade *mf*rem**e

La distribución de probabilidad o distribwción de una variable aleatoria X relaciona

el conjunto de valores posibles de X (rango de !, con la probabilidad asociada a cada

uno de estos valore, y io, representa a través de una tabla o por medio de una función

planteada como una fórmuia. Por ejemplo, sea la variabie aleatoria dada por el esta-

áístico media muestral, i, entonces al conocer su distribución de probabilidad podre-

mos saber cuáles son los valores que puede tomar i y cuáles son más probables'

En otras palabras, la distribución de probabilidad de la media muestral X seña-

la qué valores se espefa que tome Í, de acuerdo con los supuestos asumidos. De esta

forma, la distribución de probabilidad hace que lo aleatorio no sea un capricho, y

modela (describe, acota) los posibles valores de un estadístico muestral, con 1o que

al observar una realización específica de un estadístico se pueden corroborar o recha-

zaf supuestos (prueba de hipótesis), o bien, hacer estimaciones poblacionales.

Las distribuciones de probabilidad que más se usan en intervalos de confianza

y pruebas de hipótesis son las distribucion es'. normal, T de student, ji-cuadrada y F '

En la figura 2.2 se representan las formas típicas de estas cuatro distribuciones'

La distribución nornral está completamente definida por sus parámetros, que son

la media, lt, y ladesviación estándar' d' Por ejemplo' en la figura 2'2 se muestra la

Estnd{**Éeo

Cualquier función de los datos

muestr¡les que no ccntiene

pc:'án' .trn: Cesct,no-ldos.

E!$s*rÉbueáóm deprababüülded ele X

Relaciona el canjunto d* ';alo-

reE de X ctn la Probabilidad

¡soci¡d¡ can cada unc de e:-

tos veiores.

22 CAPíTUIO 2 Efementos de inferencia estadística

distribución normal con lr - 0 y o = 1 , que se simboliza con N(0, 1) y se conoce comola distribución normal estándar.

En la figura 2.2 también se observa que, tanto la distribución normal estándarcomo la f de Student son simétricas y centradas en cero, mientras que las distribucio-m ji-cradrada 1- F son sesgadas y sólo toman valores positivos. Las cuatro distribu-cir'rrs €snn rehimadas entre sí ya que las distribuciones Z de Student, ii-cuadradaI f sc dFfiE cu ¡Érrni¡rm de la distribución normal estiándar. Los parámeffos que& p oo¡do b disribr¡ciffi r & Snrdenr ji-cuadrada y F, reciben elú& gtú4- W.que tiemr e|trc rs con los t:¡maños muestrales invo-br¡fte k cj..!¡o,' ¡i s ri* ñ..Fstür de r¡m*¡ro 20- seá de inferés unaesrri[nciin f & Studer m 19 gr.d6 & übertad para hacer inferencia sobre lamedia poblacimal; o rrq ji-cuadrada m 19 gradm de libertad para hacer inferen-cias sobre la varianza poblacional.

La distribución Zde Student tiende a la distribución normal est.ándar cuando eltamaño de muestra crece, y prácticamente es la misma distribución pma n > 45. Ladiferencia básica entre las dos distribuciones es que la T de Student es más ancha(respecto del eje horizontal) en las colas (véase figura 2.2).Ladistribución normalestándar es una curva única, por ello existen tablas que proporcionan cualquier iíreao probabilidad de interés bajo esta curva. No pasa lo mismo con las otras distribucio-

Normal estándar f de Student 5 g.l.

Ji-cuadrada, 10 g.l. 4 (s, t0)

ItGrados de bert¡dSon panfur:ex ryp,€renlas di*ih¡rcres : *s.shrtrya"/se úryTEr ap¿rtr&los

=r:-nñcs ¡-t¡e**:s i'¡.d¡-

trdcr

o.40

030

o.20

o.l0

0.20

0.1o

Figura 2.2 Muestra de las distribuciones de probabilidad de mayor uso en inferencia.

Hstimacíén puntualy por intervaio

nes a las que hemos hecho referencia, ya que pata cada tamaño muestral es una

cun"a diferente. Por eso, las tablas de estas distribuciones sólo reportan los valores

que separan las áreas de mayor uso en inferencia estadística (ver apéndice 2)' En la

acrualidad es mejor utilizar un paquete estadístico para encontrar cualquier átea o

percentil que se quiera de cada distribución.

Como se muestra más adelante, las distribuciones normal y Zde Student sirven

para hacer inferencias sobre las medias; mientras que la distribución ji-cuadrada será

Je utilidad para hacer inferencias sobre varianzas y la distribución F se empleará

para comparar varianzas. Es por esto que la distribución F es la de mayor relevancia

en diseño de experimentos, dado que el análisis de la variabiiidad que se observó en

rn experimento se hace comparando varianzas'

Uso de f;xee$

>: puede utilizar la hoja de cálculo de Excel (o algo equivalente) para calcular las

:rotabilidades con la distribución normal. Para ello se utiliza la siguiente función:

D I STR' N O RM(x, media, de sv -e

stándar, acum)

::rde en la celda x se da el valor de referenciapafa el cálcuio de probabilidades

PrX < x)), en meclía se da el valor de la media, ¡t, dela distribución normal con la

,que se quiere obtener probabilidades, y en clesv-estándar se declara el valor de

la desviación estándar, O, de la distribución normal. Por último, ocum es un valor

iógico que determina la forma de la función, si el argumento acum eIVERDADERO

ise da un 1), la funció n DISTR.NORM devuelve la función de distribución acumula-

tJa (P(X < x)); si es FALSO (se da un 0), devuelve la función de densidad de proba-

bilidad, es decir, daf(x).

Es*Emasfr&s* paxmtwm$

y p#tr üm*srvm8*

Las distribuciones de probabilidad que tienen una variable que representa cierta ca-

racterística de una población se definen completamente cuando se conocen sus pará-

metros, pero cuando éstos no Se conocen, será necesario estimarlos con base en los

datos muestrales para hacer inferencias sobre la población. Por ejemplo, los paráme-

tros de una distribución normal son la media, P, y la desviación estándar, O, que en

caso de desconocerse será necesario estimarlos a partir de los datos en la muestra.

Hay dos tipos de estimación: puntual y por intervalo.

Hstir:'laei*n pu*"ltu:a}

IJn estimador pwntual de un parámetro desconocido es un estadístico que genera un

valor numérico simple, que se utll\za para hacer una estimación del valor del pará-

metro desconocido; por ejemplo, tres parámetros sobre los que con frecuencia se

desea hacer inferencia son:

IT

I COmO

;tándar

bucio-

stribu-

adrada

os que

ben el

; invo-

ís una

rbre laferen-

,ndo el-15. Laancha

rormal

* área

bucio-

6

-4

Esti¡'¡adq¡ Puntual:.::: 41 :: qu: eStima un valOi

esle:ií,co de un Par'ámetro

7-24 tiiFÉ"f, tj L* ? f; { s n'¡ent*ls cia i *f *:re¡r*ie est¡:d istir:c

Lamedia ¡t del proceso (población).

Lavananzaoz ola desviación estándar o dei proceso.

La proporciónp de artículos defectuosos.

Los estimadores puntuales (estadísticos) más recomendados para estimar estos

p.ri-r,:ri: :,1:"1. r-ipcctivamente :

' L; :.:.1:" :-'jji:rl ¿i =.t.' La l'ane¡¡é r'i-s::J ól = 51.

. La propr,rrciór i¿ ü:::::i,:rsLls en Ia muestra, f = xln, donde x es el número

de artículos dele¡r¿;.:. :- *l:::l-lsstra de tamaño t?.

Por ejemplo, para estimar ei *=l¡,:: ::::::ii'¡ de loi discos producidos por un

prOCeSO, durante Una Semana Se torna una i:i:s:: j: ': = I l5 ¿tscOS. r' Se obtiene qUe

lamedia muestral esi= 1.179. Este ralcr:*:-: -::l:= -t'l-rJ ull& estimación pun-

fial de ¡t (la media del Proceso).Colocar un gofro (sím6olo ^) sobre un parárnerrL-r .s ;lne manera general de

denotar un estimador puntual del correspondiente parámerrc,. pue>to que los estima-

dores no son únicos. Por ejemplo, la estimación de 1a media. ri. podna hacerse con el

uso de la media muestral X, la medianaX, olamoda, dado que las res son diferentes

medidas de la tendencia central de unos datos'

Estimación por intervalo

La estimación puntual de un parámetro se genera a través de un estadístico. 1' como

el valor de éste es aleatorio porque depende de los elementos que fueron selecciona-

dos en la muestra, entonces la estimación que se hace sobre el parámetro dependerá

y variará de una muesÍa a offa. De esta forma, cuando se quiere tener mayor certi-

dumbre sobre el verdadero valor del parámetro poblacional, será necesario obtener

la información sobre qué tan precisa es la estimación puntual. Así, la estimación

puntual dirá poco sobre el parámetro cuando la variación entre una estimación v otra

es muy grande. Una forma de saber qué tan variable es el estimador, consiste en cal-

cular la desviación estándar o error estóndar del estadístico, visto como una variable

aleatoria. Por ejemplo, consideremos la desviación estándar S y la media Í de un^

muestra de tamaño n. Puesto que X es una variable aleatoria, ésta tiene su propia

desviación o effor estándar, que se puede estimar mediante 6 x = S l^,17 .

Una forma operativa de saber qué tan precisa es la estimación consiste en calcu-

lar tn intervalo de confianza que indique un rango "donde puede estar e1 parámetro"

con cierto nivel de seguridad o confianza. Construir un inten-aio al 100(1 - a)Va

de confianza para un parámetro desconocido 0, consiste en estimar dos números

(estadísticos) L y U, de manera que la probabilidad de que 0 se encuentre entre ellos

sea 1 - a, es decir,

P\L=0=US=l-u (2.r)

donde Ly U forman el intervalo de confianza buscado [L, U].Laconecfa interpreta-

ción de un intervalo de confianza es como sigue: si se obtuvieran 100 muestras inde-

üsiimeeión puntual y por intervalo

pendientes de la" misma población o proceso, cada una de tamaño n y para cada

muestra se calculará el intervalo de confianza a95Va para el mismo parámetro, en-

tonces se espera que 95 de los 100 intervalos contengan el verdadero valor de dicho

parámetro. En la práctica se obtiene sólo un intervalo y se dice que el intervalo [], L/]

tiene una conftanza de 100(1 - a)Va; esto tiene una interpretación constante, en el

sentido de que el parámetro estará en el intervalo 100(1 - a)Vo de las veces que apli-

quemos el procedimiento.

La longitud del intervalo de confianza es una medida de la precisión de la esti-

mación. De aquí que es deseable que la longitud de los intervalos sea pequeña y con

alto nivel de confianza. El ancho de los intervalos es mayor a medida que sea mayor

lavaianzade la población y el nivel de confianza exigido. El ancho del intervalo es

menor si se incrementa el tamaño de la muestra.

lntervaln de ennfiafira para ufia rnedie

Por definici6n de intervalo de confianza se trata de encontrar dos números L y U,

tales que el parámetro p¿ se encuentre entre ellos con una probabilidad de 1 - a.

Esto es,

P(L<l'I=L)=l-&

Sea X1, X2, . . ., X,una muestra aleatoria de tamaño n de una población, con una

distribución normal con media¡z y varianzad, ambas desconocidas. El procedimien-

to general para deducir el intervalo consiste en partir de un estadístico que involucra

al parámetro de interés y que tiene una distribución conocida, Tal estadístico es

el cual sigue una distribución Z de Student con n - 1 grados de libertad. Por lo tanto,

en la tabla de esta distribución o en su gráfica se pueden ubicar dos valores críticos

totzy - /o72, tales que:

25

ffilntervalc ele eo¡dianea

Rangc donde se estima que

esté el valor de un parámetrct

iroblacional.

:1

IS

lo,a-

:rá

ti-ler

ón

rUa

:al-

ble

úna

rpia

,(-,",, l-a

lcu-

[ro"zlTo

efos

:llos

t2.1)

reta-

inde-

De aquí, despejando hasta dejar sólo en medio de las desigualdades al paráme-

tro de interés, se llega a que

l-a t2.2t

Eneste sentido, L=X-t",rl, y IJ =X+t",.)t sonlos númerosbuscados que

definen un intervalo al 100( 1 - a)Va para la media desconocida P . En la tabla de la

distribución Z de Student se observa que para una muestra mayol o igual a 30, el

intervalo al 100(1 - a)Vo para la mediapl es aproximadamente XtZ¡. o sea, la

media más menos 2 veces su effor estándar.

i-u )< ---= 1t.,^ l=

S lJn "'' )

"(o -,,,,1, < ¡t < x*,", ;|) =

x-t,

726 CAPíT[JtCI 2 Elementos de inferencia estadistica

Elemplo ?"IEn un proceso de inyección de plástico una característica de calidad del producto(disco) es su grosor, el cual debe ser de 1.20 mm con una tolerancia de +0.10 mm.Así, el grosor del disco debe estar dentro de la especificación inferior, EI = 1.10, y lasuperior. ES = 1.30. para considerar que el proceso de inyección fue satisfactorio.Para evaluar esta característica de calidad. durante una semana se hace un muestreosistemático en una línea de producción. 1' se obtienen 25 muestras de tamaño 5 cada

una. Por lo tanto, al final se tiene una muestra de il = 125 -v"

se obtiene la media mues-

tral, X = 7.779 mm y lavattanza, Sr = 0.00071. por lo que ia estimación del errorestándar de la media es

*0'0266 =o.oo241 1.18

Cuando ¡¡ > -15. la distnbución f de Student es prácticamente igual a la distribuciónnorrnal estándar. por lo tanio. de la tabla de la distribución normal se obtiene que

I¿,: 3i..:= i.96 paraG = 0.0,5. De aquí que el inten'alo al 100(1 -a)Vc de confianzapara la mediap del grosor de los discos está dado por

x tto,,ft=t.ror 1 e6(T#)= t.trn r 0.00466

Se puede afirmar entonces que con una confianza de 95Va,la media ¡z de grosor delos discos se encuentra en el intervalo [I.I74,1.184]. En el cálculo anterior al valorde 0.00466 se le conoce como effor de estimación, porque hasta en 0.00466 puede

diferir el estimador puntual X del parámetro poblaci onaT pt.

Tamaño de la muestra, En ocasiones es necesario calcular el tamaño de muestra ¡rpara lograr que la estimación de una media poblacional lr tenga como error máximoa un número E. En este caso, como el error de estimación está dado por E -t(n/2. n \Sl\/ n , entonces despejando n obtenemos que

Ccm.. ,- : r : - depende de ¡r r' ésta es la incó-enita, entonces para propósitos prácticosv con temarios d¿ muestra ma\'ores que .'30. el I'alor de l¡,p.,,_,, puede tomarse comol. De esta manere,

.1S_tt =-'E)

donde $ es un estimador de la varianza. Por ejemplo, si en el caso del grosor me-dio de los discos se quisiera un effor máximo de 0.004 = E, entonces se requiere,

Ji

t,2otz. u-lrS2tt

- E'

4(0.00071)n=-4=1.77.5 = l7B.(0.004)'

Hstirnación puntual y por inten'aLo

lntervalo pars ta vanüanam

De manera similar a como se obtiene el intervalo para la media, es posible deducirintervalos de confianza para cualquier parámetro. En particular, para construir un in-tervalo de confianza parula vaúanza o2, la distribución de referencia es una ji-cua-drada con n - 1 grados de libertad, ya que bajo el supuesto de que la variable deinterés tiene una distribución normal con media y varianza desconocidas, el estadís-tico(n -l)Szld sigueladistribuciónji-cuadrada conn* l gradosdelibertad.Deestamanera, con un poco de álgebra, se llega a que el intervalo de confianza para la va-rianza está dado por

27

(n - l)S2 (n - l)S'z1¡- I)

Xn,z. r-t Xt-qn,,. t

donde Xto,r,,-, Y X?-otz,,-t son puntos críticos de la distribución ji-cuadrada conn - 1 grados de libertad y se leen en la tabla de esta distribución para el valor de adado. Es decir, P(X> X|,r,,_r)=a12.

*$empñm 2.?En el proceso de fabricación de discos para computadoras, una de las variables críti-cas es el rendimiento de formato. Se toma una muestra aleatoria de n = 10 discos dela producción del turno de la mañana. Se formatean y se reporta el rendimientodecada disco. Los datos obtenidos son: 96.II,91.06,93.38,88.52, 89.5i,92.63,85.20,9I.41,89.79,92.62. Con base en estos datos interesa estimar puntualmente ypor intervalo la media y la desviación estándar para la población de discos de dichoturno.

Los estimadores puntuales para la media y la desviación estándar resultan ser

(2.3)

sl0)x,X:-'=t '

=91.03 v S=10

= 2.99

Suponiendo distribución normal, el intervalo al 95Va de confianz a para la media pestá dado por

tl* -,.,, rt,x *,

",, +f= [n r.o, * 2.26#,e 1.03 + r ru#f= r88.8e, e3.ri]

donde el valor del punto crítico ta/z= t0.025 = 2.26 se lee en las tablas para la distribu-ci6nT de Student con 9 grados de libertad que se localiza en el apéndice. Con unaconfianza de 95Va se espera que el rendimiento promedio de los discos producidosdurante ese turno esté entre 88.89 y 93.17. El correspondiente intervalo para 1a des-viación estándar o se obtiene sacando la raiz cuadrada al intervalo paralavarianzao2 dado en la relación (2.3).Así, el intervalo parao está clado por

(e)(2.er'z

19.02

,9),zeet' l2.70 | '

l-ñr)YllE; s.461

28 CAPÍTEJLS 2 fterr¡entas de inferencia estadística

donde los valores críticos X'o,r, ,-, = X3.orr.g = 19.02 y X?_",r, ,_, = X\.n r,n = 270 se

obtienen de la tabla de la distribución ji-cuadrada, que está en el apéndice, o tambiénse pueden consultar usando un software. Así, con una confianza de 957o se espera

que la desviación estándar del rendimiento de los discos producidos durante ese tur-no esté entre 2.05 y 5.46.

Cuando no se está satisfecho con la amplirud del rnten'a1o. entonces será nece-

sario incrementa¡ 1a precisión de 1a e:tirnación. ¡ esto se hace aumentando el tamañode nues-'::.

lnter"--alo para la prcporciónB¿j,- el supuesto de que el número de artículos defectuosos en una muestra sigue una

,listribución binomial, y suponiendo que se inspecciona una cantidad grande de n

artículos )' se encuentra una proporción f de defectuosos, se puede construir un in-ten'alo de conhanzapara la proporción poblacional p, apoyándose en la aproxima-ción de la distribución binomial por la normal. En estas condiciones se puede afirmarque la proporción muestralp sigue una distribución normal con mediap y varianza

*? Con el uso de la misma argumentación que en el intervalo para la media,

se deduce que el intervalo de confianza para la proporción es de la forma

P - Zo,,

donde Zo¡2es un percentil de

apéndice.

tabla de la distribución normal estándar que está en el

Tabla 2.1 Resumen de fórmulas para intervalos de confianza.

_sx-to,rí\ln

(n'-i)S'l),. ,,,

-,sX+to,, -1n

(X, -i;¡,;rU*ln,_rs¡

? + to,,

si oSl'"rt' ¿' I nt-1

tlti-+-Vq n2

Ft Fz

o;d:1,

sl .5t 't-alz. n,

P< p<f¡*,o,,

h{l - t)n

-:1)5?+(n,-1)S1nr* nr-2

b$- b) + ?t2{1- t'2) b,ft- i,t , b,Q- b,){i,- b)- 2."', (itr- b) + 2",,

Conceptos básicos de prueba de hipótesis

Eiemplo 2.5Se quiere estimar la proporción p de artículos defectuosos en un lote de 2 000 (pobla-ción). Para ello, se toma una muestra aleatoria de n = 100 artículos y se encuentraque de éstos, x = 5, son defectuosos. Por lo tanto, un estimador puntual de p es fi =5/100 = 0.050. Si se quiere estimarp por intervalo, entonces de acuerdo con 1o expli-cado antes, un intervalo al95Vo de confianza está dado por

0.050 t 1.960.0s(1- o.o5)

= 0.050 t 0.043100

de aquí que, con una confianza de 95Vo, p está entre 0.007 y 0.093, en términos por-

centuales entre 0.77a y 9.3Vo. En el cálculo anterior, al valor de 0.043 se le conoce

como error de estimaciói'?, porque hasta en ese valor puede diferir fi de p.

Tamaño de muestra. Si se quiere estimar el tamaño de la muestra n, qlJe es nece-

sario para estimarp con un error máximo de E,entonces dado que E = Zo,rrffi¡1* p¡ln;si despejamos de aquí a n obtenemos que

'^ - z'"''itQ- ilrr- pz

donde f es una estimación del valor de p. Por ejemplo, si en el problema anterior se

quisiera un effor máximo de E = 0.03, con una confi.anzade957o, entonces se requie-

re que n = (I.96)2 (0.05X1 - 0.05)/(0.03)2 = 203. En ocasiones, cuando no se sabe

nada de p en la fórmula anterior, se supone f = 0.J.

Resur¡ren de fórmulas para inrterualos de csnfianzaEn la tabla 2.1 se muestran las fórmulas para calcular los intervalos de confianzamásusuales. Además de los intervalos para un parámetro ya presentados, en la tabla se

incluyen las fórmulas correspondientes para intervalos de confianza que involucrana dos parámetros, como son: diferencias de medias, diferencias de proporciones ycocientes de varianzas. Estos intervalos proveen información sobre la igualdad esta-

dística de los parámetros conespondientes a las dos poblaciones de interés. Note que

los cálculos involucran a los estimadores puntuales obtenidos con cada muestra. Enlatabla, lanotación z1-s12,t;¿¡2,X?-",r,n-ry Fr-otr,n2-r,nr-t)serefiereapuntoscríti-cos de la correspondiente distribución. Estos valores se determinan fácilmente con el

uso de un software estadístico o de las tablas dadas en el apéndice.

eonceptss bitsñcos de Brueba d* hñpóteslx

Un estudio experimental o una investigación, por lo general tiene como último ob-jetivo, responder en forma segura ciertas preguntas y/o tomar decisiones. En este

contexto, el experimentador tiene a priori ciertas creencias o hipótesis que desea

comprobar. Por ejemplo:

' Los tres proveedores del material;r tienen el mismo nivel de calidad.- El porcentaje de este ingrediente afecta el resultado de la mezcla.

29

Ás4'r - LU

K

. El tiempo de espera d¿ esi¡ operacicn 3s l::;' .-.:-' :- -- redio.

' Si aumentamos la cantidad de reaclirtr r¿ ¡'-::---,' -- :-.:-=:-*.

A continuación se describen 1os conceptos bási;':.:-::--:::: hipótesis, es

decir, los pasos fundamentales de cualquier procedtn:.;:-:- l: :r*::i de hipótesis,

como son: planteamiento de la hipótesis, estadístico d¿ ¡:*;:'-, ::-i;it-' de rechazo.

FE*ffit*errx$*ss€w dw wrem fuEpótesis estadístiem-n3

,i1¡¡,-í¡r'-s¿ s estadística es una afirmación sobre 1os \;"lL-:-! :: i,:'. parámetros de

r" :..11*:ión o proceso, que es Susceptible de probarse ¿ :iail i: 1a inlormación

-,:..-:-:-1 -n una muestra rep-resentativa que es obtenida,le 1: :,-:,:'-ión. Por ejem-

,',:::"ción "este proceso produce menos de 8'r de ::i:-:¡,:'ios se puede

=.:::ísticamente, en términos de la proporción p c¡.;¡'1,--;ida de artículos

> J-;e genera el proceso, como se hace a continu:--.,j1-

H¡ 1 p = 0.08 (la proporción de defectuosor e' 1-r t,-lS I

(2.4)

Ht: p < 0.08 (la proporción es menor a 0.081

;ir¡¡sión Ho: p = 0.08 se le conoce como hipótesis nulaY H,,,: p < 0.08

, : ',-, j.-ri¿-r alternativa. EI nombre de hipótesis nula se deriva del hecho de

- --;:,:: re piantea como una igualdad, 1o cual facilita el fener una distribu-

-::,-:¡d de referencia específica. En general, la estrategia a seguir para

:i- : - - --,-:"- :;sls e s suponer que la hipótesis nula es verdadera, y que en caso de

.: - r: - - ,-.1: :or la evidencia que aportan los datos, se estará aceptando la hipótesis: :- -' . .r.í. en el caso de las proporciones, la afirmación que se desea probar se

r.-: r.:r, : :-: ;ierta. sólo en caso de rechazat la hipótesis nula.

-r, r-::r--,r,S ahora que la afirmación a probar es "este proceso produce 8 '4o de

- " : rl:¡en'e que la afirmación señala que su falsedad se da, tanto si se

L

:

rj i r-

. "1 -ri lrl

::rr-J,r. el planteamiento estadístico debe ser:

: rr = 0.08 (la proporción de defectuosos es 0.08)

H. '. it * 0.08 (la proporción es diferente a 0.08)

(2"s)

::- - - ' . :;: se desea concluir es la hipótesis nula. Nótese la diferencia entre

,-i ::'-:;.-. .-,.-,¡¡ir as en las expresiones (.2.4) y (2.5). En (2.4) HA se conoce como

,'i¡¡.;:;i:,, -- "..' '-; -;. "'. ¡ de rn solo lcLdo (unilateral), ya que la única manera de rechazar

H es :::,.::.r- '. - ,r'le: de 1a proporción muestralp significativamente más pequeños

que [] i-lS. -{.:r:-:::r,r. en tl.5)11, se llama lüpótesis alternativa de dos lados (bilate-

rct[1. -t'e que ," ¿',;i;n¡ia en contra de 110 se obtiene con valores pequeños o grandes

de la propor;r.in nu¿stral p. Así. la elección de 1a hipótesis alternativa en cuanto a

si debe ser unilateral o bilateral depende de la afimación que se quiera probar.I

t

Fianteamientr: ei* un* ll¡ró**sis estadística

Otro aspecto importante es la selección del valor del parámetro que especifica

la hipótesis nula, esto es, ¿por qué 0.08 en las hipótesis de las expresiones (.2.$ y(2.5)? Este valor se elige de manera que separe dos situaciones que ilevan a tomardiferentes acciones. Por ejemplo, en la hipótesis dada en (2.,1) se eligió 0.08. porque

ésta es la proporción de defectuosos reportada el mes anterior. ¡ después de imple-mentff un programa de rnejora se quiere r,er si dio el resultado esperado. En caso de

no rechazar É10 se concluiría que el programa no funcionó y que se deben tomar me-

didas adicionales para bajar la proporción de defectuosos.

Estmdistie* d* pruebaProbar una hipótesis consiste en investigar si 1o afirmado por la hipótesis nula es

verdad o no. La estrategia de prueba parte del supuesto de que 116 es verdadera, y

si ios resultados de la investigación contradicen en forma suficiente dicho supues-

to. entonces se rechaza I1o y se acepta la hipótesis alternativa. En caso de que los

resultados de la investigación no demuestren claramente la falsedad de Ho, ésta no

se rechaza. Es decir, la hipótesis nula es verdadera mientras no se demuestre lo

contrario.Unavez planteada la hipótesis, se toma una muestra aleatoria de la población

de estudio o se obtienen datos mediante un experimento planeado de acuerdo con

la hipótesis. El estadístico de prueba es un número calculado a partir de los datos

r la hipótesis nula, cuya magnitud permite discernir si se rechaza o no la hipótesis

nula f16. Al conjunto de posibles valores del estadístico de prueba que lievan a recha-

zar Hs, se le llama región o intervalo de rechctzo para la prueba, y a los posibles va-

lores donde no se rechaza H¡ se les llama región o intervalo de aceptación. Porejemplo, para las hipótesis planteadas en (2.4) y (2.5), el estadístico de prueba está

dado por

5l

?f,' gn- -\s{. t'

.- ":;"1 g,,t;f

," "Y: -?

:j:1ll

' '..¡ _J{i''- _

l. '- '' .:r..

:1 -:

ta'

i.',.¡'ir i. :t. '

"l'r: ". ;

'.'L]'

,¡\.'

.i;,.

a

e

b

E

I

III

kr

¡e

¡e

tr

_ _ p-0.08'o - .uñJg(l- o.ogy,

l,: el ccnjurtc rle polibier v;:io---- i I ----:r,--- i-,-

Q.O i(': rr.'] .'- i;'r;;irc,.i.r

qi, ,lP\ ir', I ':...¡i.,..J ,.ltl:lÓ1.'

sir rl.rla.

ffi;ffistadistiee de prueb;*

i\únrero c¿lcr,il¡cl* r partir de

lrcrl¿tl,,r 11,',¡.r .\,, :a,rr1,

tiul p*rmite cji-ccerrril gi se i*-.1,,,, ^ -, l, i,,."..,,.,,,.L. 16, d I .¡ ic I ijl ' :l' I rl..l..'

ffi:ffi*gi$nr de reel¡au*

fe

Ph'F

I

Jonde f es la proporción de defectuosos que se encontró en Llna muestra de n artícu-

los inspeccionados. Si /1e es verdad, el estadístico ¿e sigue aproximadamente la dis-:nbución normal estándar; la aproximación es mejor mientras más grande es el valorle ¡2. En general, se requiere np > I0 para una buena aproximación; en este caso, con

'tp > 120 unidades inspeccionadas sería suficiente.Por ejemplo, supongamos que se toma una muestra de n = 150 piezas y de ellas

t = 2A son defectuosas, entonces el valor de la proporción es i = .rln = 0. 1 3. Vamos

a ver si esto implica una diferencia suficiente p¿ua rechazar que p = 0.08. Por iopronto, el valor estadístico es z0 = 2.41 .

Criteri* de reehexoEl estadístico de prueba, construido bajo e1 supuesto de que Hu es r-erdad. es una

variable aleatoria con distribución conocida. Si efectivamente 110 es verdad, el valordei estadístico de prueba debería caer dentro del rango de valores más probables de

su distribución asociada, el cual se conoce como región de aceptación. Si cae en una

de las colas de sri distribución asociada, fuera del rango de valores más probables (en

-

t2 {AFiT{JL* ? [ler¡-rentns de inferenci* esiac{ístic*

la región de rechaTo), es evidencia en contra de que este valor pertenece a dicha dis-tribución (véase figura 2.3).De aquí se deduce que debe estar mal el supuesto bajoel cual se construyó, es decir, 110 debe ser falsa.

Pruebas de una y dos colas (unilaterales y bilaterales). La ubicación de la re-gión o inten'alo de rechazo depende de si la hipótesis es bilateral o unilateraL Comose .u'lo en el caso de las proporciones, una hipótesis es bilateral cuando la hipótesis

'llemlti'i'a f1..r e S de1 tipo "no es igual" (.1);y es unilateral cuando la alternativa es

dei :r:',,- "'ll'" ari i-'ie r> ) o "menor que" (<). Cuando es bilateral, como en la expre-sid,r 1.5 . -. ::_:::: i; rechazo está repartida de manera equitativa entre ambas colas

de la ;r-.:::-:- - ::, :¡-iis¡ico de prueba. Pero si 1a hipótesis es unilateral, como en

1a erpre st,t: l.:. . ,. :-, ::i:.-ti el Jontra de 1a hipótesrs nuia se ubica en un solo ladode 1a disi'¡:;r -:- :t: - =;. -. :=_.: - : ;= r:.-hazo sólo se concentra en una de las colas.

En le e¡::;.-::- l - -.::----: :- :-J:-.7,r s¿ Joncentra en e1 lado izquierdo de ladisuib:;,:: :t- :r:-::i:: - '-: - :',: I 5 -r é::¡ llsura 1.3 ).

P-"::::.:i -: --:. :-:!: !- ttc -t ::,::.¡,:¿;"in se caicula el estadístico de prueba

:, :; -.::--;:--: l: -. rc -,::-t:":- J;; 3n l" l¿:r,,in de ¡echazO O aCeptaCión. POf

:'=:.:-: . =- -'. :-:.:'::S:;:-'-:=."i=- :-'L -'. SltF:¿i:fl-.3:,].-l'Se feehaZaHg Si ¡g <-¿o:!. ,-; :-:':iii:s -s:.r C¡¿:s :.lr .¿-. reréJi¡,nes ,'.,i I se rechaza 11n si :s ( -ío¡z O Si

.- ) i;.1. ; srn:prenenre. si :. ):,:. En la ñgura 1.3 esto equivale a Que is caiga en;r :"igo de i;r.-s á¡ea: sombreadas. de acuerdo con la hapótesis de que se trate.

Si queremos probar 1a hipótesis bilateral con una confianza de 95Vc. entonces

rc.:= 1.96; además, como p =A.n Y io = 2.4I, entonc.s Z0 > i.96; por lo tanto, se

rechaza Ho : p = 0.08. De alguna forma, esto ya se intuía, puesto que la proporciónmuestral había sido i = 0.13.

Si en lugar de tener x = 20 defectos, se tuvieran x = 15, entonces É = 0.10. A1sustituir esto en (2.6) con n = 150, se obtiene Que Z¡ = 0.90 que no es mayor queZat2 = 1.96. De aquí que no se rechace Hs: p = 0.08. Es decir, en este caso f = 0.10no es evidencia suficiente contra É10 : p = 0.08.

t t , /' - w.Ja

H. :p ( C.CE

.,i i-a ,./\/\\

' r P r L.uo

Q ¡ciÁ¡

c r.:r,,'aio -f ,,de rechazo)/

Regióno intervalode rechazo

\-u

-- (1

, Región o intervalode aceptación

-Zal2 ZalL, lntervalo deLJ

' aceptación I

i\I -d ,,. ¡ Región'',

I o intervalo.l-de rechazo

, \-***

Figura 2.5 Hipótesis unilateraly bilateral, regiones de aceptación y rechazo.

Planteamlentc de una hipótesrs estacis: ::

El riesgo de una decisión equliv*eada:errores tipa i y tlpo $$

*-'rar una hipótesis estadística es una decisión probabilística, por 1o que existe elr, i > itr de cometer un error tipo I o \n error tipo II . El primero ocuffe cuando se re-::.:ai H¡ cuando ésta es verdadera, y el error tipo II es cuando se acepta 11¡ y ésta es

: s". En toda prueba de hipótesis cada tipo de error tiene una probabilidad de ocu-

::"¡ Con ct y B se denotan las probabilidades de los errores tipo I y II, respectivamen-

c,: = P {error tipo I } = probabilidad de rechazar I1e siendo verdadera

,J = P{enor tipo II} = probabilidad de aceptar 110 siendo falsa

A 1 - P se le llama p otencia de la prueba, y es la probabilidad de rechazar Hs

::.ndo es falsa. A a lambién se le conoce como la significancia dada de la prueba; ¡s la probabilidad de la región o intervalo de rechazo; su valor se especifica por:=e del investigador desde que planea el estudio. Por lo general se utilizan los va-

. :'r¿s a = 0.05 o 0.01, dependiendo dcl riesgo que se quiera admitir en la conclusión.

\I,¿ntras más pequeño es el valor de a se requiere más evidencia en los datos para

:::hazar 11s. Por ejemplo, si la acción a tomar después de rechazar É10 implica una

.---. ersión fuerte de recursos, se recomienda utilizar a = 0.01 para tener mayor con-

:::za de que la decisión será la adecuada. Si la decisión no implica una inversión:-:fe. es suficiente trabajar con c( = 0.05, que es el valor más utilizado para este

:,::So. Esto es. un valor más pequeño que a no necesariamente será mejor, ya que si

."; "dmite poco riesgo (a < 0.01) se .^tá truncando la posibilidad de muchos cam-:.,'s que serían positivos para la empresa. Utilizara = 0.05 significa que por cada

- ,,,t r-eces independientes que se aplica el procedimiento y se rechaza 110, se espera

,- -- en un promedio de 95 veces, tal decisión sea la correcta.Por lo general, en las pruebas de hipótesis se especifica el valor de a y se dise-

:-: ia prueba de tal forma que el valor de B sea pequeño. E,sto es, la probabilidad del. * ' r ripo 1 se controla directamente, mientras que la probabilidad de error tipo II se

: -:irola de manera indirecta con el tamaño de la muestra, ya que a más datos B será

:-3nor. En otras palabras, con una muest^a grande es mayor \a potencia de la prue---;.: es decir, se incrementa la probabilidad de rechazar 110 si ésta es falsa.

En la práctica suele ser más delicado cometer el enor tipo I que el enor tipo II,::brdo a que en la mayoría de las hipótesis el rechazar 110 implica objetar algo que

:- acepta de manera convencional. No rechazar 110 implica, en muchos casos, seguir:Lrmo hasta ahora. Por lo anterior, es común que se controle sólo ei error tipo I. mren-:ras que el error tipo II se deja libre como si su magnitud no importara.

Lo cierto es que el error tipo II también importa;, la magnitud de su probabili-dad debe ser pequeña (se recomienda B = 0.10). El problema es que ccntroiar a B

I Es posible afirmar que, en general, es deseable que una prueba estadística sea potente. Sin em-

bargo, cuando e1 tamaño de la muestra se incrementa en exceso (a tamaños en cientos) se llega a tener

una potencia excesiva, que lleva al extremo de rechazar 110 cuando es verdadera desde el punto de vistapráctico.

5t

il-Hrr*r tiBo I

Es cuando se rec::::-. .^ ^- ",^ -J--)^--( ;l ia- -lr \/all idt l-ló

ffi=f;rror Éipo *E

f : cu¿ndo se dc.;)l¿ und rY.

qu* es falsa.

Foter¡cia de !a prarebe

ls ,r lir-'h¿l",,lrl¡c jt :" i ¡z':rH,, iu¿[iCü es i¡ls¿.

ffi

r

54 €ABíYUg"ü ? E!emeritos de inferencia estadístie*

tiene varios problemas; por ejemplo, muchas veces se requieren grandes tamañosmuestrales o se deben reaTizar muchas repeticiones en el experimento. Por ello, eneste libro no enfatizamos el control del error tipo II, pero damos 1as recomendacionesdei número de repeticiones que deben obtenerse en cada experimento para tener unvalor pequeño de B.

Frueba para la media

C::::,--!:::l-1,:;-:,::,:-t:-i:ta:: :--:-::-.-;:-,::-¡:,-'i]]enOsUelenintefesar:-II-;i-:-. -,::-,--;: - J;:,-¿-,-1,::- l---*- E--:.::";--":..,¿.fUdiaf lamedia,fZ,eSi; .-.-:l=:::rJ-:-':-; -' :i'-'=: ._i-'.:::..: - ::::.1: --ill'-..,Ulrlf 11,.. dOnde¡/g;: -: rirr.É:¡' ;,:'1,-';i,l-.- P,:; ¡-'¡::-.:,. :-:j: :¡: j: -:,:¿:¿s ::.i tsilsar si el rendimien-¡.-. prcrrnedio,lel prxeso dur¿nte -si; laiaer¿ ¿-. l.u¿.. rTl.tl trr rr rüeflof que el de lasemana anterior ¡ro. Cualquiera de es¡as res presuntas se responde n planteando unahipótesis estadística adecuada.

Las hipótesis se pueden probar suponiendo la varianza poblacionai ol conocidao desconocida. Sin embargo, como en la mayoía de los problemas es irreal suponerde antemano que se conoce lavarianza, nos limitamos a describir el caso cuando o2no se conoce.

Prr¡eba para la media con varianza desccnocidasea X una variable aleatoria con distribución normal con media4 y varianzaoz, am-bas desconocidas. Se quiere probar la hipótesis de que la media es igual a cierto valorlo. Es decir. la hipótesis a probar es

Ho: lr = &o(2.7)

H¿: pt * ¡to

Para probar esta hipótesis se toma una muestra aleatoria de tamaño n de losposibles valores de la variable X y se calcula el estadístico de prueba:

X-u^,U" slJn

l.'nde 5 es la desviación estándar de los datos. Bajo el supuesto de que I1o es verda-:::¿. ¡sre estadístico se distribuye Zde Studentconn- 1 grados de libertad. Se re-;i..¿: H si el valor absoluto del estadístico de prueba es mayor que el valor crítico¡; -. :r::nbución. es deci¡ se rechaza É10 si I tol ) ton.Recordemos que /.,,, es elp:r.:: .:,:-:'-' ,Je la distribución zde Student, tal que P(t > t,lz) = al2) o sea, las áreas'n::-- ., ;*:-.': ; la derecha del punto ta/zy & la izquierda de -to¡2 son iguales a a/2-.:-.: ll.-.r" l.-ll. Estos valores críticos se obtienen de la tabla de la distribución Z

de S:;¿el: i;da en e1 apéndice.

Lnt brere justificación del criterio de rechazo para la prueba anterior es la si-guiente. p.-r reoría estadística se sabe que bajo el supuesto de que Ho : fl - lo esr erdadera- el estadístico de prueba r¡ se distribuye z de Student con n - I grados deLitrertad \-. en consecuencia. hav una probabilidad de 100(l - a)Vc de que el valor

(2.8)

Prueba para la media

-t ar2 o 'olz

Región de -

Región de ____, Región deréchazo -aceptación - rechazo

Égura 2.4 Regiones de rechazo y de aceptación para hipótesis (2.7).

üe r¡ caiga entre -to¡2y top.De aquí que, si la muestra produce un valor de /6 fuera de

gsole límites, entonces tal valor de /6 es evidencia de que F/s es falsa. Por el contrario,

ri re cae entre -to12y tanes evidencia a favor de la veracidad de 110 ya que no existe

inguna contradicción. Obsérvese que la región de rechazo dada por la unión de in-

:rralos (-cr , -totz) lJ (-ton oo) está determinada por la probabilidad a del error ti-po I (véase figura2.4).

En aquellas situaciones en que se desea rechazar Ho : l"t - ¡zo sólo ctando ¡'t >

6.la hipótesis alternativa es unilateral:

Ho: Lt = [to

Ht: & ) lto

(2.e)

En este caso se rechaza Ilo si lo > to. Por otra parte, si 1o que interesa es rechazar

Ht: l¿ =¡,ls sólo cuando & < l¿0, entonces ahora, la hipótesis unilateral se plantea de

la forma:

Ho: lt = &o

H¡: ¡t 1 ¡to

(2.10)

y se rechaza H, si to < -to.

Eiemplo 2.4Peso de costales. Un fabricante de dulces compra costales de azicar a cierto inge-

nio. Según los vendedores, los costales tienen un peso medio de 50.1 kg, con una

varianza de (oz = 0.5). El comprador sospecha que el peso medio es menor. Para

confi.rmar su sospecha decide contrastar las hipótesis:

Ho: l"t = 50.1

Ht: & < 50.1

55

(2.11)

[56

I

{epiTULü R Elementos de inie renei¿ esiae ist;re

con un nivel de significancia de 5 -r r c: = fl.{-l-i L Pa¡a eilo, selecciona de manera alea_toria tres bultos de cada uno de 1os sis:ieni¡s ci¡tco pedidos. Pesa los 15 bultos yobtiene quex = 49.4y s2 = 1.2. De .riu rn.n.o.. :1 estadístico de prueba calculadode acuerdo con la expresión (2.8). está dad¡ ¡1,r.

.,T'-i - r.h=- s = I A1

r 1.1

De las tablas de la distribución rde Sruie:r J¡l ¡: - I = 1-l _erados de libertad, paraa = 0.05, se lee el valor crítico /00.. _. = j.-6. C,tr:o :. = -).1j <-1.76 = -/¡.s5, 14, Se

rcchaza la hipótesis É16 (figura 2.5). Es deci¡. s¿ re;haza la atlnnación del vendedorde que los bultos tienen un peso medio de 50.1. r'adernis l: e.,-idencia señala quedicho peso es menor que el declarado.

Prueba para la r¡arianza

En el ejemplo 2.4 sobre el peso de cosiales, a simple vista se puede norar que la va-nanza ol = 0.5. declarada por el r,endedor. es bastanfe diferente que 1a vananzamuestral I = l.2,lo cual lleva a sospechar que su ahrmación sob¡e tra varianza delproceso es falsa. El hecho de que los dos números sean distintos no srgnifica quesean estadísticamente diferentes, de aquí ia necesidad de contrastar o probar las hi-pótesis:

Ho: oz = 0.5

Ho: o2 > 0.5

y de esta manera comprobar si esa diferencia es estadísticamente significativa. Estahipótesis es un caso particular de la siguiente:

Hs: o2 = of;Ho:d>of;

donde ofr es un valor conocido (0.5 en el ejemplo). para probar esta hipótesis y bajoel supuesto de distribución normal, se utiliza el siguiente estadístico de prueba

-.2 tn -lSS2z;= oidonde n es el tamaño de la muestra. Si 110 es verdaderaT6 si-eue una distribución ji-cuadrada eon n - 1 grados de libertad. por elro. se rechaza Ho si yl > y2*, d"ond,e yl esun punto crítico que se obtiene de la tabla de distribución ji-cuadrada. Si aplicamoslo anterior al caso de la varianza del peso de ios costales, obtenemos que

, (r¡ - l)Sr 14x1.2,-= d = oi =33'6

el cual, bajo el sllpuesto de normalidad, sigue una distribución ji-cuadrada con 14grados de libertad cuando Flo es verdadera. En la tabla de clistribuciónji-cuadrada selee que yl, con c(, = 0.05 y 14 grados de libertad es igual a23.6g. Como yf,= 33.6 >

\

fde Student

,"/ con 14 g.l.

Tres eriterios de rechazo o aceptacióñ equivalentes

La:-t'to

ll-4

Región de ,

- rechazo

Figura 2.5 Resultados de las hipótesis para la media y para la varianza

del peso de costales con o : 0,05.

23.68 = Xz"se rechaza É10 y se acepta ta hipOtesls unilateral 11o (véase figura 2.5). Es

decir, la vartanzareportada por el vendedor para el peso de los costales es falsa y, en

realidad, la variabilidad del peso de los costales es mayor.

Tanto el estadístico /¡ de la hipótesis sobre la media, como el estadístico 1fr de

la hipótesis sobre la varianza, cayeron en las respectivas regiones de rechazo, lo cual

se representa en la figura 2.5.

Si la hipótesis alternativa parala vaianza es bilateral, entonces se rcchaza Ho

ti Xl > XZ," o si yl < X? - on.

Tres eriteriCIs de reef!á!u$ o &cep*acióm

equivailentes

Al menos en las hipótesis más usuales, existen tres criterios equivalentes para decidir

cuándo rechazar la hipótesis nula y, en consecuencia, aceptar la hipótests alternatir-a.

La equivalencia es en el sentido de que los tres llevan invariablemente a la misma

decisión en términos de rechazar o no a É1s. Sin embargo, algunos de estos métodos

proporcionan información adicional sobre la decisión que se está tomando, por loque en algunas situaciones puede resultar ventajoso usar un criteno \ no otro.

Estadístics de Brueba frente a va¡ür crítico:-Este es el criterio que utilizamos en el ejemplo previo y es el que tradicionalmente se

empleaba antes de las facilidades que ahora provee la computación; por ello, es el

que se explica en muchos libros de texto. Este método consiste en rechazar Hs si

el estadístico de prueba cae en la región de rechazo que está delimitada por el valorcrítico. Debe tenerse cuidado de comparar los valores adecuados, dependiendo de la

hrpótesis alternativa de que se trata. Cuando los cálculos se hacen de forma manual,

este criterio es el único que comúnmente se usa. No obstante, este método tradicio-

nal es el que da menos información adicional acerca de la decisión tomada.

t7

2

7

AI

-2.4

I

ir

'a-

ZA

le1

rue

hi-

:sta

balo

ón ji-

7;es:alnos

:on 14

:ada se

_13.6 >

38

K

I

Sigr:lficancia predefinida| '. ,'l rr95g9 m,ixrrnn q:ri ci e^-

perim*ntadtr estd di:puesto a

aürier con resp*ckl ¡l errorilp'-r 1,

{AP$TUL$ ? Flementas d* infereneia estadística

$ignifieancia obseruada frente a significanc¡apredefinidaLa signfficancia predefinida que se denota con (t, es el riesgo máximo que el experi-mentador está dispuesto a correr por rechazar rgs indebidamente (error tipo I). Mien-tras que la signfficancia observada o calculada, también conocida como p-value ovalor-p, es ei área bajo la distribución de referencia más allá de1 valor del estadísticode prueba. La erpresión "más allá del estadístico de prueba" significa, por ejemploen 1a prueba rbllateral. el area bajo 1a curva fuera del intervalo l-to, to], es decir:

-P(T>+/o)

j,:,:J.e I:s :n¡'!;::;:-¿ J j::r:it3 i:. Jt¡trjbuclón f de Student con r?- 1 grados deirL'enad. Si il prueba e s 'nll:tera ,f¡ : ¡,1¿ ¡e :e¡ha r lzquierda r. 1a si-enificancia obser-vada es el área bajo Ia cun'a,je 1a di>inl'u¡ión a la derecha {izquierda) de rs. De loanterior se desprende que fl, se rechaza si la sle¡¡iri.'anric ctbsert'ado es merlor quela significancia dada, o seá, si valor-p < c.

Este criterio es mejor que e1 anterior porque la sigaihcancia obsen,ada se puedever como la probabilidad o evidencia a favor de Hr. por lo tanto. representa una me-dida de la contundencia con la que se rechaza o no ia hipótesis nula. por ejemplo, sila significancia observada o valor-p es igual a 0.0001, entonces só1o hay una proba-bilidad a favor de I1e de 0.0001, por lo que se rechazaría la hipótesis nula con unriesgo tipo I de 0.0001, que es menor del que se está dispuesto a admitir, típicamen-te a = 0.05. En otras palabras, un valor-p = 0.0001 nos señala que el valor observadodel estadístico de prueba prácticamente no tenía ninguna posibilidad de ocurrir si lahipótesis nula fuera verdadera, 1o que lleva a concluir de manera contundente quela hipótesis nula debe rechazarse.

En la figura 2.6 se muestra, utilizando una hipótesis bilateral, que cuando ocu-ne el evento ltol ato,rnecesariamente sucede que valor-p > d,y viceversa. En elcaso representado en la f,rgura citada no se rechaza I1o con cualquiera de los dos cri-terios. La comparación de ¡0 frente a /"r, consiste en contrastar simples números,mientras que comparar las significancias a frente avaTor-p es contrastar.probabilida-des. de aquí que esto último sea más informativo.

'.':l.-,r-r = P¡T <_i-t

-t"/2 -toReeión de , Resión derechazo

- ace"ptación

to to/2

, Resión de' rechazo

Figura 2.6 l:^:¿-::::- ie signifrcancias , valor-p ) ct.

i-{iprit*si; ¡:nrn d*s medias: conrpaiaeión J* ,ii': !r¡f+n¡!*:xfr"¡s

trrit*svm!* d* e*mfi*mzaEn este método se rechaza É16 si el valor del parámetro declarado en la hipótesi: nula

se encuentra fuera del intervalo de conf,ranzapara el mismo parámetro. Cuando la hipó-

tesis planteada es de tipo bilateral, se utiliza directamente el intervalo al 100 \7 - c: t'tde confianza. Si lahipótesis es unilateral, se requiere el intervalo a1 100 (1 -)-c;t'cpara que el área bajo la curva, fuera de cada extremo del intervalo, sea igual a a. Por

ejemplo, en el caso de la hipótesis unilateral sobre la media del peso de costales dada

por la expresión (2.11) se debe construir e1 inter-valo al 100(l - (2 x A.A5DVa = 907c

de confianza para aplicar este criterio con una significancia a = 0.05. El intervalo al

9AVo de confianza para la media¡,r está dado por:

= 4e.40¡'t.16(l'$) = 4e.4at0.4st =148.s. 4s.sl\3873)

Así, con una confianzade90Ta pr esfá entre 48.9 y 49.9. En tanto, el valor50.1 declarado en la hipótesis nula no pertenece al intervalo, y además el intervalo

está ubicado a la izquierda del 50.1, por lo tanto, se rechaza la hipótesis f16 :

¿¿ = 50.1 y la evidencia señala que contienen menos azicar de la que se afirma.

Nótese que para rechazar una hipótesis unilateral también es necesario verificar laubicación del intervalo en relación con el valor declarado en la hipótesis nula; el

intervalo debe ubicarse con respecto a este valor, como 1o indica la hipótesis alter-nativa. En el ejemplo, la hipótesis alternativa es .É1¿ : pt < 50.1, por lo que para re-

chazar la hipótesis nula el intervalo debe ubicarse a la izquierda de 50.1, como

ocurre en este caso.

Este criterio es útil cuando el software proporciona el intervalo de confianza

para el parárnetro de interés, pero no provee la prueba de hipótesis correspondiente.

Tamtrién puede ser que el experimentador quiera, además de la conclusión de la hi-pótesis, el intervalo de confianza para el parámetro que 1e interesa; en ese aspecto,

este criterio tiene ventajas sobre los anteriores.

ffi&p$€mw$w pmrm dmru mm#ümru; ffiffitrffiWmrms$Srx

dm'd*w *wm€mw$ese€wru

lJn problema frecuente que se presenta es comparar la media de dos procesos o dos

tratamientos. Por ejemplo, comparar dos proveedores, dos materiales. dos máquinas

o dos métodos de trabajo.

Supongamos que interesa comparar dos tlatamientos )' que éstos son dos má-

quinas A y B, que realizan la misma operación. Para ello se obtendrá una muestra

aleatoria de observaciones de cada máquina. Supongamos que los datos a observar

en la máquina A son Yor, Yor., ..., Y¡, y los datos de la máquina B son YBy, Ys2, ...,Yu,,. Estos futuros datos se podrán escribir como en latabla2.2:

Para que la comparación sea justa, la materia prima que utilizan las máquinas

se asigna de forma aleatoria a las máquinas, y las 2n pruebas o conidas se hacen en

orden aleatorio. No es adecuado realizar primero todas las pruebas de la máquina A

59

sxlínu., -..ln

l-

a1

i-S.

a-

40 eApíTUL* 2 Eierrentos de inferencia estadística

Tabla 2.2 Comparación de dos tratamientos.

y posteriormente la: de ia rnáqnina B. prorque eso puede favorecer a una de las má-quinas y afecta isesgar la compara.-ión. La asigaación aleatoria del material haceposible que a cada máquina le corresponda material con una calidad equivalente, yel orden aleatorio de la: prueba-s nulifica el efecto de las fuentes de variabilidad queacrúan durante el transcurso de las mismas (como las variables ambientales), al re-partir su efecto equitativamente en ambas máquinas. Ahora, veamos cómo hacer es-tadísticamente este tipo de bomparaciones.

Suposición de varianzas desconocidas. Sean dos procesos o tratamientos conmedias 4" y ltyy varianzas o1y ol, respectivamente. Interesa investigar si las mediasde dichos procesos pueden considerarse estadísticamente iguales. Para ello se plan-tean las siguientes hipótesis:

Ho:&r= &y

Ha: ¡,t, # ¡.t,(2.t2)

que se pueden reescribir como

Ho: #, - /tr, : 0

H^: p,- py + 0(2.13)

Para probar r1o se toman dos muestras aleatorias, como en el ejemplo de las máqui-nas antes descritas, de tamaño n, la del proceso X,y de tamaño nrladelproceso f;en general, es recomendable que n, = ky = n, pero también puede trabajarse con n, *n, si no pudieran tomarse iguales. Si cada proceso sigue una distribución normal yson independientes entre ellos, el estadístico de prueba adecuado para probar la hi-pótesis de igualdad de medias está dado por,

IatYn

Yen

l't:

+X,*"

t='0X_YlrTJ I-+,\r, fr,

(2.14)

Hipétesis para dos medias:comparación de dos tratamier,::s

el cual sigue una distribución 7de Studenfconn,* fly- 2 grados de libertad, donde

Sf es un estimador de la varianza muestral común, suponiendo que dichas varianzas

desconocidas sean iguales, y se calcula como

5,, =(n" -1,)Sl+(nj -l)S)':

nr*nr-2

con S] y S] hs varianzas muestrales de los datos de cada proceso'

Se rechaza Ho ri I tol ) totr, donde to¡2eS elpwto al2 de la cola derecha de la

distribución Z de Student con nx * fty - 2 grados de libertad. Cuando la hipótesis al-

ternativa es de la forma H¿. : lt, > ly, Se rechaza Ho : lt* = pl., si l¡ ) t¿1, y si es de la

forma He: F* < Fy, Sa rechaza si /s < -fo. En forma equivalente, se rechaza ÉIe si el

valor-p < & para la pareja de hipótesis de interés.

Ejernpla ?"5Compáración de dos centr¡fugadoÍas. La calidad de la pintura látex depende,

entre otras cosas, del tamaño de la partícula. Para medir esta característica se utilizan

dos centrifugadoras, y se sospecha que éstai reportan mediciones distintas para la

misma pintura. Se decide hacer un estudio que permita comparaf las medias y las

varianzas reportadas por los dos equipos; para lo cual, de un mismo lote de pintura

se tomaron 13 lecturas con cada centrifugadora. Los resultados son los siguientes:

{il

ta-

lCe

:.yluele-es-

con

dias

üan-4',7'14

5,i

XiJ'4295

47.:44.in=

4896

4561

4987

4:152

4 6011, r.'r rr -:i r' 4:6P6'

q:962,r.r,, r',"'4 06|6

4,684.00;"' " 'l

4.2.|t , 4'326

3:7M 3797

44A892; ,;:,'

4oO5: '-rr'4r8'r0

: &. 626 :..::. .,.. :' 4 924

1,24'732.001s?;

,,.12)

2.13)

Láqui-

:so f;Itt, imal y

la hi-

4 530

4 401

Sl=

4618 4779

4339 41AO

112 020.00

Para comparar las medias se plantea la hipótesis de igualdad de medias con la

alternativa bilateral, puesto que no hay ninguna conjetura del experimentador acerca

de cuál centrifugadora puede reportar valores mayores. Luego, el planteamiento es:

Ho: &, = I'tv, HA: I't,# HY

la cual se desea probar con un nivel de significancia de 57o (a = 0'05)" Suponiendo

igualdad de v¿,rianzas pan el tamaño de la partícula, el estadístico de prueba calcu-

lado con las fórmulas (2.14) está dado por

4684.00-4408.92=2.04to=

344.06JOrc)+Qt:r,

De la tabla de distribución Z de Student con 13 + 13 - 2 = 24 grados de libertad,

se obtiene el punto crítico t¡0.ozs,z+1= 2.064' Como ltol = z'O+ < 2'064 = to¡2' rto sa

rechazaHo, por lo que se concluye que las centrifugadoras A y B reportan en prome-

dio el mismo tamaño de partícula. Es decir, las centrifugadoras son estadísticamente

t2.14)

42 {APíT!"}LS ? ilien"r*nt*s de infer*nci¿r *staciístie*

iguales en cuanto a sus medias. Sin embargo, conviene observar que el rechazo es

por un margen muy escaso, puesto que el estadístico de prueba y el punto crítico son

muy similares. Al comparar la significancia predefinida a = 0.05 con el valor-p =0.053 se concluye lo mismo (no se rechazallo), pero se aprecia que si tal significan-cia predefinida por el experimentador fueraa = 0.055, la decisión sobre la hipótesissería rechazada. Esto es, basta con que el experimentador esté dispuesto a correr4.5% de riesgo tipo I adicional para concluir que las medias de las centrifugadorasno son i-euales. En general, no es recomendable cambiar a posteriori el valor cr para

modificar 1a decrsión sobre una hipótesis. pero habría situaciones en las que se pue-

den a.imtlr pr:b'eblhdades de es¡e errtrr hasta de c,- = 0.1. dependiendo de lo que

::*":- t; ; :-'--:1ir: l- " i: .1-:.1..

Otrr aspecio ¿ ,-on:i.ier"¡ es 1a slgrul-icancia práctica de 1a decisión sobre laLupótesis. 1o cual tiene que ver con la dii'erencia obsen'ada. que en este caso es

X - | =4 684.00 - 4 408.92 = 27 5.A8

y representa un e stimador dé 1a diferencia en las medias poblacionales del tamaño de

partícula que son reportadas por las centrifugadoras. En caso de que 275.08 repre-

sente una diferencia relevante. que puede impactar fuertemente 1a calidad de1 tamaño

de partícula, sería un elemento favorable al tratar de verificar si tal diferencia es real.

Ya sea al anahzat la conveniencia de utilizar o = 0.055 o tomando más datos. Si porel contrario, la diferencia observada se considerara despreciable o irrelevante des-

de el punto de vista práctico, entonces "conviene" aplicar estrictamente a = 0.05 yconcluir que las medias de las centrifugadoras son iguales.

E1 caso de las varianzas desconocidas pero iguales que acabamos de describir,es el más utilizado en la prácticapara probar la igualdad de dos medias. En mu-chos estudios es razonable suponer que las varianzas desconocidas de los dos trata-mientos a comparar son iguales. Pero en ocasiones las varianzas no son iguales, o no

existen datos históricos sobre los dos tratamientos que permitan suponer algo perti-nente sobre las varianzas. Por ejemplo, al comparar dos proveedores del mismo ma-terial puede no haber razones para suponer de antemano que las varianzas de cada

uno de ellos sean i-suales o parecidas (estadísticamente). Si no se supone igualdad de

varianzas. e1 estadístico de prueba para Hs 1 lt,= 4,. está dado por

sj s:

-fh, trr'

(2.1s)

que sigue aproximadamente una distribución T de Student, cuyos grados de libertadv (nu) se calculan mediante la relación:

tSj/n, ¡r {5'/n tr

-T

n -ll. n -1

a[f .f)' t2.16t

Prueba para la iguaidad de varianras

Como antes, se rechazaHo ri I fol ) ton." o si el valor-p < a. Por ejemplo. si en

el caso de las centrif'ugadoras no se pudiera suponer que las varianzas son iguales. e1

valor del estadístico dado por la expresión (2.15) resulta ser /0 - 2.04, y aplicando la

fórmuia (2.16) para calcular los grados de libertad, se obtiene eue v = 26. Con esto

se determina que el valor-p = 0.052. Por lo tanto, con a = 0.05, no se rechaza la

igualdad de las medias. Ésta es la misma decisión que se obtuvo al suponer varian-

zas iguales; observe que los valores de ls y el valor-p son prácticamente iguales que

antes.

Frueha pera Ia *gualdad de variffimxas

En lugar de suponer, en la prueba de medias, que las varianzas son iguales o diferen-

tes, se puede proceder a verificarlo de manera estadística mediante las hipótesis:

4t

t

I

:

S

fS

a

r€

la

1e

e-

ioal.

or)s-

ty

rir,

lu-

TA-

no

rti-

0a-

lda

de

1s)

Hg: O2,= Ol

Ho: o2" * oi(2.w)

(2.18)

(2.19¡

La comparación de varianzas tiene interés en sí misma, con independencia de

las me<lias, puesto que éstas son determinantes en cualquier proceso o tratamiento.

En general se considera que a menor varianza, implica potencialmente mejor cali-

dad. Por ejemplo, en el caso de las centrifugadoras interesa ver si alguna de ellas

tiene mayor error (variabilidad) en sus mediciones. El planteamiento de la hipótesis

se puede reescribir como:

(f'Hn::;=1

o"

o'H^::;*lo;

paru enfatizar que la prueba se basa en la distribución del estadístico,

,s2E -l"s;el cual, bajo el supuesto de que É/6 es verdad, sigue una distribución F con rz, - 1

grados de libertad en el numerador y nn - 1 grados de libertad en el denominador. A1

calcular el valor del estadístico de prueba se obtiene que Fo = f .il. Como la distri-

rtad bución F no es simétrica, el valor-p está dado por el área bajo 1a curva a la derecha

de 1.11,másel áreabajo lacurvaalaizquierdade 1/1.11=0.9.2Medianteelpaque-te estadístico Statgraphics se obtiene valor-p = 0.85. Por lo tanto, utilizando a =0.05, la decisión es no rechazar Ho: ot, = oi., y se concluye que, estadísticamente,

2En general, los puntos porcentuales de cola izquierda y cola derecha de la distribución F cum-

plenlaigualdad'.Ft o.,, t.n2 1=IlFo,,, t.n, r.Esdecir,unoeselinversodelotro,intercambianlosgrados de libertad del numerador y de1 denominador. Si éstos son iguales simplemente es el inverso.

.16)

44 CApíYAitS ? E{ernentos de inferencia estadístiea

las centrifugadoras tienen la misma variabilidad, precisión o effor de medición. Elvalor del valor-p tan grande con respecto al valor de a, señala que la decisión de norechazar la igualdad de varianzas es contundente.

Comparación de proporc¡onesUna situación de frecuente interés es investigar la igualdad de las proporciones de

dos poblaciones o tratarnientos. es decir. se requiere probar la siguiente hipótesis:

=P:*p:

dondepl y pzson las proporciones de cada una de 1as poblaciones o tratamientos. Por

ejemplo, para evaluar dos fármacos contra cierta enfermedad se integran dos grupos

formados por dos muestras aleatorias de nr = ¡1. - 100 personas cada una. A cada

grupo se le suministra un fármaco diferente. Transcurrido el tiempo de prueba se

observan \ = 65 y xz = 7 5 personas que se recuperaron con el fármaco en los grupos

correspondientes. Para ver si estas diferencias son significativas a favor del fármaco

2, se necesita probar la hipótesis de igualdad de proporciones. Para ello, bajo el su-

puesto de distribución binomial, el estadístico de prueba zs está dado por:

H:P,íJn

donde p = {.-'| !-' . Se rechaza Hs si lz0 | >:o/r.' n1ln2fuera unilateral, entonces z¡ se compara con z.t.

(65 + 15)l(100 + 100) = 0.70; entonces.

bo- frt(t-;)

\07(1-0?)[#.#)

En caso de que 1a hipótesis alterativa

En el caso de los fármacos, como f =

7565

100 100= -I.543

Como I ¿o I = t.5+3 no es mayor gtJe Zo.otz= L96, entonces no se rechaz a Hs, por1o que no hay evidencia suficiente para afirmar que un fármaco es mejor que elotro.

PobXaeüomes pareadas {cCImparacñSm dedCIs medñas c$m rmr¡estras dependientes)En las secciones anteriores se probó la hipótesis de igualdad de las medias de dospoblaciones o tratamientos, suponiendo que las dos muestras son independientes.Esta suposición se justifica por la manera en que se obtienen los datos; es decir, a lamuestra a la que se le aplica el tratamiento 1 es independiente de la muestra para eltratamiento 2, y los datos se obtienen en orden completamente al azar. Con esto se

F*hlari***s pnr*ad;*t lri:lt'lp*ra*:i** d* *i*s m*clias r¿¡ilr l'l:r:*str*s iSependielt*:)

justifica la suposición de que no existe relación directa entre los datos en el primertratamiento con los datos en el segundo.

Recordemos que orden completamente al azar significa que las unidades se

asignan de manera aleatoria a los tratamientos, mientras que las pruebas o corridasexperimentales se hacen en orden estrictamente aleatorio, lo cual se hace con la ideade evitar cualquier sesgo que pudiera favorecer a uno de los tratamientos.

Sin embargo, en muchas situaciones experimentales no conviene o no es posi-ble tomar muestras independientes, sino que la mejor estrategia es tomar muestraspareadas. Esto significa que los datos de ambos tratamientos se van obteniendo porpares, de forma que cada par son datos que tienen algo en común; por ejemplo, que

a la misma unidad experimental o espécimen de prueba se le apliquen los tratamien-tos a comparar. Un par de ejemplos son:

* A los mismos pacientes se les aplican dos medicamentos (tratamientos) para

el dolor en distintas ocasiones; los tratamientos a comparar son los dos me-dicamentos.

" A las mismas piezas se les hace una prüeba de dureza con distintos instru-mentos; aquí se quieren comparar los instrumentos.

En el primer caso, el apaleamiento consiste en que el grupo de pacientes que

recibe el medicamento A es el mismo grupo que recibe el medicamento B, por 1o que

las mediciones del efecto de los medicamentos sobre el mismo paciente están rela-cionadas, y en este sentido no son independientes. Al ser el mismo grupo el que re-cibe ambos tratamientos se logra una comparación más justa y precisa, pero además,al observar las diferencias entre los tratamientos en un mismo paciente se eliminanotras fuentes de variación y se logra hacer una comparación sin sesgos. En el caso de

las piezas, si una es grande se espera que ambos instrumentos tiendan a reportar unamedición alta, por lo que se espera que haya una fuerte correlación entre las medi-ciones reportadas con los dos instrumentos. Además, al medir las piezas con los dosinstrumentos, si hay diferencias en las mediciones sobre la misma pieza, entoncesesas diferencias se deben principalmente al sistema de medición.

Ejemplo 2.6Comparación de dos básculas. Se desea ver si dos básculas están sincronizadas.Para ello se toma una muestra aleatoria de 10 especímenes y cada uno se pesa enambas básculas, cuidando que el orden en que se utilizan sea elegido al azar. El tra-bajo lo reaTiza el mismo operador y los datos obtenidos se muestran enlatabla2.3.

Es claro que tenemos el caso de observaciones pareadas, ya que el peso queregistra una báscula para un espécimen no es independiente del que registra la otrabáscula para el mismo espécimen, en el sentido de que si uno es muy pesado se es-pera que ambas básculas lo detecten.

La comparacién de las básculas se puede evaluar probando ia siguiente hipó-tesis:

Hs'. P1 : ¡t,Ho: ¡tt * ¡,Lt

45

t. EIlno

;de!.

Por

pos

ada

rsepos

aco

su-

)or

e1

ffiü ¡e *; ", :,'r:n*pfi gtarr¡*a:t*

a! a¿¿,

Es ¿c-= :r el que l¿s unida,des s::. .^¿. de m¡ner¡¡le¿tc'¿ : :¡ i¡¿tenientos )¡

las piue:.. =' :=" l-eni¡les :ehacen ei -'i=- -:

-.::ol-io,

ffluestras pareacas

Son aquelies -- .. :-.: ;s da-

los de anrbos -. : - :-iJs 5e

obtienen pof :r--: :a rranerS

que éslos iiene - . :' -... co-

Tt:n ) nlr -,On - -. - - ,-. -.

w

lVa

los

es.1^,1d

rel

se

eAPiTUtO 2 Elernentcs de inferencía estadística

Tabla 2,3 Mediciones reportadas por dos básculas.

I2

J

4

-)

6

7

8

9

10

-0.04-0.054.024.02-o.014.02-o.05

0.01

-0.050.03

dondepl es el peso promedio poblacional que mide la báscula I y ptres el peso pro-medio poblacional que mid'e la báscula 2. Entonces, estas hipótesis, en el caso parea-do, se plantean de manera equivalente como:

Hs: ur=g

H^: p¡ * 0

(2.20)

donde pt, es la media de la población de diferencias. De esta manera, el problema decomparar las medias de dos poblaciones se convierte en el problema de comparar lamedia de una población con una constante. En este sentido, el estadístico de pruebapara la hipótesis (2.20) es el caso particular del estadístico (2.8) para una media,cuando &o = 0 (véase sección "Prueba para la media" de este capítulo). Esto es, conla muestra de n diferen cias (d1, cl2, . . . , d,) se obtiene el estadístico dado por:

to= (2.21)

donde d = -0.02 es el promedio muestral de las diferencias, So = 0.02g7 es la des-viación estándar muestral de tales diferencias y /? es el tamaño de la muestra. BajoF1 el estadístico r- se distribul'e como una Z de Student con n - 1 grados de libertacl,prrr lo que ll se rechaza si l ¡" ) r,- : ,, _ .. o si yalor-p < c. Al hacer los cálculos re-sulta que:

= -1.20

como el valor-p = 0.055 es mayor eu€ 6r = 0.05 no se rechaza Hs aun nivel designificancia de (x, = 0.05. Es decir, no hay suficiente evidencia en conÍa de la sin-cronización de las básculas. Sin embargo, esta conclusión es bastante endeble dadoque el varor-p es muy similar al valor a.De hecho, cone, = 0.06 se concluiría locontrario, y el experimentador debería considerar la posibilidad de asumir este riesgode 67a y rechazar la sincronización de las básculas.

as,tJ n

11.23 | 11.27

14.36 i 14.4t8.33 i A.-l:10.50 I 10.s2

23.42 | 23.41

9,15 I 9.t'713.47 I 13.52

6.41 I 6.46Q.4A I 12.4s

19.38 ! 19.35

-{.010.0287 / \ 10

i:iili::i;:r:ir-rl*r r;;'*,*ii.:::; {;.*rrp..:ra*Ér}¡t eJg iiq."* rn*iii;¡s iüí: fiürliii: .:¡cf lirrjii.:ñ'l.e$}

Si en el ejemplo, en lugar de analizar las diferencias, que es la manera co-rrecta de resolver el problema, se analizan por separado las mediciones de cada

báscula, el efecto de las posibles diferencias entre los dos instrumentos se mezcla-ría con la variabilidad que de por sí tienen las piezas. Pero aun si se pesara un

grupo diferente de 10 especímenes con cada báscula, entonces la propia variabili-dad de las piezas dentro de cada grupo, más las diferencias entre los dos grupos.

probablemente ocultaría el efecto de la diferencia de los instrumentos de medición.Así, las observaciones pareadas son necesarias para eliminar fuentes de variabili-dad que podrían no dejar hacer la comparación de manera eficaz, esto quedará más

claro a continuación.

FmbÍaci*n€s p#reades: eñsffi m;.ás generalLa mayoría de las aplicaciones de la prueba pareada buscan una estrategia en donde

las diferencias observadas se deban a los tratamientos que se quiere comparar, y no

al efecto de la heterogeneidad que de por sí tienen los especímenes de prueba. De

esta manera, la prueba pareada puede utilizarseen situaciones más complejas donde

es necesario comparar tratamientos ante la presencia de varias fuentes de variabili-dad explícitas. Por ejemplo, se quieren cornparar dos máquinas por medio de los re-

sultados que generan, pero el material que utilizan tiene una historia larga en la que

sufrió el efecto de varios factores como son: proveedores, lotes, turnos, días, subpro-

cesos, etc.; entonces, al no ser posible hacer dos mediciones sobre la misma pieza

como en el caso de las básculas, se requiere una identificación más estricta de las

t-uentes principales de variabilidad a fin de parear los datos con base en ellas.

Eiemp$* ?"slmpurezas en cofres levantados y bajados. En una fábrica de autos se tiene laconjetura o hipótesis de que el número de impurezas en la pintura de los cofres de los

autos es diferente, dependiendo de si el auto pasó con el cofre cerrado o abierto porios homos de secado. Se decide correr un experimento para comparar el númeropromedio de impurezas en cada situación dei cofre (tratamientos). Se consideró que

no era adecuado úilizar muestras independientes, ya que se sabía que los días de la:€m?lril o los turnos podían tener influencia en el número de impurezas. Estos dos

:actores se incluyen en el estudio como el criterio de apareamiento, como se muestra:n la tabla 2.4, en la cual también se aprecian los datos obtenidos. Así, en cada com-:inación de día y tumo se asignaron caffos con el cofre levantado y cer:rado.

Cada dato en las columnas levantado y bajado en la tabla 2.4 representa el:rorrredio de impurezas en 10 autos, de tal forma que en el experimento se utilizaron:n total 200 autos. La aleatoridad se llevó a cabo por parejas de autos: antes de

-¡ entrada a los hornos se aleatorizó si el cofre del primero estaría levantado rr t,etr-jo: si le tocaba levantado, el cofre del segundo auto debía estar bajado. E1 plantea-

niento estadístico consiste en probar la hipótesis de que 1a n-redia de las drferencias-s cero:

H(j'. ptp = 0

Ho: pt, * 0

47

D)

de

ia

ba

ia,

on

¿1)

ies-

ajo

tad,

:1 de

sin-

ladoia lo

esgo(2.22)

7

48 CAPíTULO 2 Elementos de inferencia estadística

Tabla 2.4 Número de impurezas en cofres de autos.

:1 ,

:2:

J

4

5

6

7

I9,,,

10

!!fPS¡¡L!l!$S',',,,""', "''

MARTES

MARTES

ldncomslffi.cor¡sJUEVES

JUE\'ES

VpRI!$S,,,,r,':,,,

-VIERNES'"',.'t',i

es$f$e$ d

,€ pf$eb3

n la tabla 2'5 se r

. oue inuolucran

. tistan los Prote

udu tuto t" Tt',nteno de tecna

rabala conun s(

1el valor-P' et e

sible rechazar ¡

Énla tabt

Hn: ta lnmelt

'aq iguales' L

,"oút Y tt '

M

TM

T

MT

MT

M

Tr

3.4

3- I

2t9

2.5

1.6

2.8

3.7

5.9

4,,8

4:,s

Al aceptar Ho: LLo= 0 se estaría admitiendo que el número de impurezas pro-medio en el cofre levantado y bajado son iguales (Ho: ltr = ¡t ).El valor del estadís-

tico de prueba es:

A 0.74t =-=_-tr/fl" Sol'ln 0.24131J10

y el nivel de significancia observado (valor-p) es 0.0000046, el cual es menor que

a = 0.05, por lo tanto, se rechaza de manera contundente la hipótesis nula de que lostrat¿rmientos son iguales, es decir, e1 número de impurezas en los cofres depende de

si éste se encuentra levantado o bajado cuando el auto pasa por los homos. Pero ade-

más, como se observa en los datos, cuando el cofre está levantado hay menos impu-rezas: entonces, a partir de esto se decidió que los cofres de los autos se levantarán alentrar a los hornos de secado. Con esta medida se logró reducir en forma significati-va el número de impurezas.

Nótese que en la tabla 2.4La gran variabilidad que existe entre los datos de undía a otro, -v también entre turnos. Eso causa que, si en lugar de analizat las diferen-cias se analizan los datos de cada tratamiento (posición del cofre) por separado, lasdiferencias debido a tratamientos se pueden, minimizar ante tanta variabilidad. Enefecto. si la comparación se hace siguiendo el criterio de muestras independientes,entonces de acuerdo a lo visto en la sección "Hipótesis para dos medios" de estecapítulo, el estadístico de prueba es / = 1.39, que le corresponde un valor-p = 0. 18,

por lo que al proceder de esa manera se concluiría en forma equivocada que no haydiferencias entre tratamientos (los detalles de este análisis se dejan ccmo ejercicio).Esto, aunado a las mejoras logradas, justifica que la forma como se hizo el apaÍea-miento fue necesaria y coffecta, ya que como se aprecia en el arreglo deIatabla2.4,se aseguró que al aparear caffos pintados el mismo día y en el mismo turno, se logranresultados más homogéneos a los que se les aplican los tratamientos, por lo que las

diferencias observadas dentro de un mismo día y turno, se deben en gran medida a

los tratamientos.

Uso de

Los rrrétodt

si se utlhzi

estadísticc

Lncluven t

En ParticSesviacrt¿ Oile-t

tierneil: ¿ i¡'ttet

T

I

I

2:-],

3,L

1",8

1,9

i.1

2.2

2.8

o,*

4;3

3;.,-4

0.7

.',0t5

rl¡11

,o'60,5

0.6

.0.91' f,

',0.5

0.9

>S-

EE

OS

de

le-

)u-

'81rri-

un

tn-

las

EnloS,

:ste

18,

hay

io).

tea-

2.4,

Fanr las

laa

Uso de un software estadístico

Resumen de fórmulas para pracedlmientosde prueba de hipóteslsEn la tabla 2.5 se resumen las fórmulas de los procedimientos de pruebas de hipóte-sis que involucran un parámetro de una sola población, mientras que en la tabla 2.6se listan los procedimientos que involucran a dos parámetros de dos poblaciones. Encada caso se muestra el planteamiento de la hipótesis, el estadístico de prueba y elcriterio de rcchazo, este último para cada una de las tres posibles alternativas. Si setrabaja con un software estadístico es más directo y conveniente basarse en el criteriodel valor-p, el cual, para cualquier hipótesis, debe ser menor qu,e a paruque sea po-sible rechazar ÉIn.

En la tabla 2.6, note que aparecen tres maneras de probar la igualdad de mediasHo: la primera a) es para el caso de muestras independientes suponiendo varian-zas iguales. La segunda b) es para muestras independientes sin suponer varianzasiguales y el caso e) es para muestras pareadas.

Uso de un safhrare e$adísticol-os métodos estadísticos tratados en el presente capítulo son más fáciles de aplicarsi se utiliza un software para hacer los cálculos. Prácticamente en cualquier softwareestadístico se incluyen los métodos aquí tratados. por ejemplo, en Statgraphics seincluyen en los menús de Describe y Compare que aparecen en la pantalla principal.En particular, para hacer una estimación puntual y por intervalo, para la media y ladesviación estándar, la secuencia a elegir es la siguiente: Describe + Numeric data-+ One-variable analysi,s; entonces, se declara la variable a analizar,la cual fue pre-r-iamente capturada en una columna de la hoja de datos y después se pide Confiden-ce intervals en las opciones tabulares y se especifica el nivel de confianza deseado

¡l{9

Tabla 2.5 Procedimientos de prueba de hipótesis para un parámetro.

7

50 Capítulo 2 Elementos de inferencia estadística

a|H.n

',.',,::tH).

,;t,..:,,,H'1.

':''. Hi:

b) Hc

HA

fIA

H^

a],Ha.:.a ,' .,.:'

'',H.í

HiHA

AHoH"

HA

'He

'¿,)::Hb

:.H¡HA

HA

lL:1-=.&z

t{.i,,',,t,ltt:lt;¡,2:::p2

pr''1'P:"

Ft=$zFt* Fz

l\> Ittt\<th

. xr- x,-u-------F

'"J;.;.donde

" _ F,-l)s',*("r{)slo ! \+n'-2, _ xr-Í,,o-m

{t*t

Ful>r.,="-*,to> to- q*..-z

to < -to. ¡ r4-z

li;,li;;y"¡',.,,to',>.,'{_t:-;..r'.il

to 1 -t o,, u:::,::,,,;,:ldffde

o!,,;,,::6;'tr:,'

i?¡,.¿;z

á7';;'o?'< atr

Pt=Pz

Pt+Pz!t)Pz.Pt<Pz

s;.s;\n2

lL:.*1,L.,:,.::,;;..;:,:.,;,,:f4;,¡l

^ X,+X.p- ) :\*nz

..:' .

n. t. n2-t o Fo < Fr-o,r, o ,, nr-

Fo> Fo.nl t.n2-l

F, < F, .o, t l, nr-7 t '

t:'',;'

..,,t1,

lrol, ,",,

:'tt .,., :' . Al>;¡,Qt:'::.i.lliii t1,ljii.,i¡:r,.::::,,iti'l'it I

ZO'2-:,; :::r:: : 111'''l ':'11'

rl';'11

It f:> i ur r"' ;t;:' "::'"

:'::.,' .: :'

,ru.>-.rr;:];:¡;.,,.,:::.r,,r,:

at:fii,::<.+:1.¿,.:,it:i..::.,:,:):.:::.:.,,':

;:riü

li;t;,,;i r,r,

dt

-_'o - s,lJi

ior>"F¿it

l4-.t = FzP1* P,pr') ltzPtlFz

(Pane options). Ahí mismo está la opción Hypothesis tests.Enlas opciones de panelse especifican: el valor Qtú que define la hipótesis nula, el nivel de signiñcanciaa yel tipo de hipótesis alternativa que se tiene.

Las hipótesis sobre la desviación estándar se prueban en la opción Confidenceinteruals usando el criterio del intervalo de confianza: si el valor especificado en lahipótesis nula oo se encuenÍa dentro del intervalo no se rechaz a H0: en caso contra-rio se rechaza.

El problema de comparar dos medias o dos varianzas con muestras indepen-dientes. esrá en Compare -> T\ro samples -+ Ttro-sample comparison. En las opcionestabulares se escogen Comparison of nteans y Comparison of standard deviations.

Tabla 2.6 Procedimientos de prueba de hipótesis para dos parrh€-rs

t

Fregunias y eiereicios

Para comparar medias con muestras pareadas la secuencia de opciones a utili-zar es Compare + Two samples -> Paired-sample comparison.En Minitab, la se-

cuencia para estimación y prueba de hipótesis es: Stctt + Basic Statistics, y ahí se

elige la opción deseada para una, dos muestras (sample) o muestra pareada.

a

hn kxcel

Para hacer cálculos estadísticos en Excel se utilizan las funciones (f,) estadísticas r'

la opción Análisis de datos dentro del menú de Herramientas . Si no estuviera activa-

da la opción de Análisis de datos, ésta se activa usando la opción Complemenlos que

está dentro del mismo menú de Herramientas. Para probar la hipótesis o encontrar

intervalos de confianza para un parámetro, se usa la secuencia: Herramientas '>

Análisis de datos -> Estadística descriptiva. Ahí se activa el cuadro u opción Nlvel

de confianza para la media. En todos los casos, después de señalar el análisis que

se desea hacer, se abrirá una ventana en la que se especifica el rango de celdas donde

se encuentran los datos y las estadísticas deseadas.

En caso de comparar las medias de dos poblaciones suponiendo varianzas des-

conocidas pero iguales, la secuenciaes'. Herramientas -+ Anólisis de datos -> Prueba

t para dos muestras suponiendo varianzas iguales. Para probar la igualdad de dos

medias usando muestras pareadas la secuencia es'. Herramientas -> Análisis de datos+ Prueba t para medias de dos muestras emparejadas. Al final, para probar la igual-

dad de las varianzas se utiliza la serie de comandos'. Herramientas -> Análisis de

datos -¿ Prueba F para varianzas de eJos muestras.

En un estudio estadístico, cqué es una población y Para qué se toma una muestra?

iQué es probar una hipótesis?

iQué es hacer una estimación puntual y en qué consiste hacer una estimación por in-

tervalo para la media, por ejemplo?

ZPor qué no es suficiente la estimación puntual y por qué se tiene que recurrir a la es-

timación por intervalo?

Explique el papel que desempeñan las distribuciones de probabilidad en la inferencia

estadística.

En el contexto de estimación por intervalo, señale en forma específica para estimar qué

parámetro utiliza cada una de las siguientes distribuciones: f de Student, Normal y ji-

cuadrada.

Explique qué es un estadístico de prueba y señale su relación con los intervalos de

aceptación y rechazo.

B. óQué son los errores tipo I y ll en pruebas de hipótesis?

9. Señale y describa de manera breve los tres criterios equivalentes de rechazo de una

hipótesis.

10. Señale un ejemplo de datos o muestras pareadas.

5l

_-i

panel

iaay

dence

en laontra-

iepen-

:ionesrt? s.

t.

2.

3.

Al.

5.

6.

7.

fg2

' ':.''.)¡-' '-¡ " ','t , :..,

-, . , ,

Ejercicios de estimación

I I. En la elaboración de envases de plástico es necesario garantizar que cierto tipo de bo-tella en posición vertical tenga una resistencia mínima de 50 kg de fuerza. Para garanti-zar esto, en el pasado se realizaba una prueba del tipo pasa-no-pasa, donde se aplicabala fueza de 50 kg y se veía si la botella resistía o no. En la actualidad se realiza una

prueba exacta, en la que mediante un equipo se aplica fuerza a la botella hasta que ésta

cede, y el equipo registra la resistencia que alcanzó la botella.

o) iQué ventajas y desventajas tiene cada método de prueba?

b) Para evaluar la resistencia media de los envases se toma una muestra aleatoria de

n :20 piezas. De los resultados se obtiene que X : 55.2 y S : 3. Estime con una

confianza de 95o/o, Zcuál es la resistencia promedio de los envases?

c) Antes del estudio se suponía que ,& : 52. Dada Ia evidencia de los datos, ital su-puesto es correcto?

d) Con los datos anteriores, estime con una confianza de 950/0, icuál es la desviación

estándar poblacional (del proceso)?

12. Para evaluar el contenido de nicotina en cierto tipo de cigarros elaborados por un pro-

ceso, se toma un muestra aleatoria de 40 cigarrillos y se obtiene que i : I 8.1 mg y5 : 1.7.

o) Estime con una confianza de 95o/a, icuál es la cantidad de nicotina promedio porcigarro?

ó) Antes del estudio se suponía que lt: 17.5. Dada la evidencia de los datos, ise pue-

de rechazar tal supuesto?

c) Con los datos anteriores, estime con una confianza de95o/o, Zcuál es la desviaciónestándar poblacional (del proceso)?

d) iQué puede decir sobre la cantidad mínima y máxima de nicotina por cigarro? Es

posible garantizar con suficiente confianza que los cigarros tienen menos de 20 mgde nicotina.

13. En un problema similar al del ejercicio I l, es necesario garantizar que Ia resistenciamínima que tiene un envase de plástico en posición vertical sea de 20 kg. Para evaluaresto se han obtenido los siguientes datos mediante pruebas destructivas:

28J 26.8 26.6 265 28.1 24.8 27.4 26.2 29.4 28.6 24.9 25.2 30.4 27.7 27.O 26.1 28j26.9 28.O 27.6 25.6 29.5 27.6 27.3 26.2 27.7 27.2 25.9 26.5 28.3 26.5 29j 23.7 29J26.8 29.5 28.4 26.3 28.1 28.7 27.O 25.5 26.9 27.2 27.6 25.5 283 27.4 2B.B 25.O 25.327.7 25.2 28.6 27.9 28.7

a) Esta variable, forzosamente tiene que evaluarse mediante muestreo y no al lOOo/0,

ipor qué?

á) Haga un análisis exploratorio de estos datos (obtenga un histograma y vea el com-portamiento de los datos obtenidos).

c) Estime, con una confianza de 950/0, Zcuál es la resistencia promedio de los en-vases?

d) Antes del estudio se suponía quep:25. Dada la evidencia de ios datos, Ztal su-puesto es correcto?

e) Con los datos anteriores estime, con una confianza de 950/0, icuál es la desviaciónestándar poblacional (del proceso)?

14. En fa elaboración de una bebida se desea garantizar que el porcentaje de CO (gas) porenvase esté entre 2.5 y 3.O. Los siguientes datos son obtenidos del monitoreodel proceso:

2.61 2.62 2.65 2.56 2.68 2.51 2.56 2"62 2.63 2.57 2.60 2.53 2.69 2.53 2,67 2.66 2 6a

252 2.61 2.60 252 2.62 2.67 2.58 2.61 2.64 2.49 2.58 2.61 253 2.53 2.57 2.66 2.a'l

2.57 2.55 2.57 2.56 2.52 2.58 2.64 2.59 2.57 2.58 252 2.61 2.55 2.55 2.73 2.51 2.61

2.71 2.64 2.59 2.60 2.64 2.56 2.60 2.57 2.48 2.60 2.61 2.55 2.66 2.69 2.56 2.64 2.67

o) Haga un análisis exploratorio de estos datos (obtenga un histograma y vea el com-

portamiento de los datos obtenidos).

ó) Estime, con una confianza de 950/0, icuál es el CO promedio por envase?

c) Se supone que p debe ser igual a 2.75. Dada la evidencia, ise puede rechazar tal

supuesto?

d) Con los datos anteriores estime, con una confianza de 950/0, icuál es la desviación

estándar del proceso?

e) El análisis de los datos muestrales establece que el mínimo es 2.48 y el máximo es

2.73, Lpor qué el intervalo obtenido en el inciso o) tiene una menor amplitud?

15. Una característica importante en la calidad de la leche de vaca es la concentración de

grasa. En una industria en particular se fijó como estándar mínimo que el producto que

recibe directamente de los establos lecheros es de 3.00/0. Por medio de 40 muestreos y

evaluaciones en cierta época del año se obtuvo que X: 3.2 y 5: 0.3.

o) Estime con una confianza de 9oo/o el contenido promedio poblacional de grasa.

b) iCuál es el error máximo de estimación para la media? iPor qué?

c) Estime, con una confianza de 950/0, icuál es la desviación estándar poblacional?

@ ZQué puede decir sobre la cantidad mínima y máxima de grasa en la leche? iEs po-

sible garantizar con suficiente confianza que la leche tiene más de 5.00/o de grasa?

16. En la fabricación de discos compactos una variable de interés es la densidad mínima

(grosor) de la capa de metal, la cual no debe ser menor de 1.5 micras. 5e sabe por ex-

periencia que la densidad mínima del metal casi siempre ocurre en los radios 24y 57,

aunque en el método actual también se miden los radios 32, 40 y 48. Se hacen siete

lecturas en cada radio dando un total de 35 lecturas, de las cuales sólo se usa Ia míni-

ma. A continuación se presenta una muestra histórica de l8 densidades mínimas:

1.81, 1.97,1.93, 1.97, 1.85, 1.99, 1.95, 1.93, 1.85, '.l .87, 1.98, 1.93, 1.96,2.O2,2.O7,

1.92, 1.99, 1.93.

o) Argumente estadísticamente si las densidades mínimas individuales cumplen con la

especificación de 1.5 micras.

b) Encuentre un intervalo de confianza de99o/o para la media de Ia densidad mínima.

c) Dé un intervalo de confianza de 990/o para la desviación estándar.

d) Dibuje el diagrama de cajas para estos datos. lnterprete lo que observa.

En una auditoría se seleccionan de manera aleatoria 200 facturas de las compras reali-

zadas durante el año, y se encuentra que l0 de ellas tienen algún tipo de anomalía.

o) Estime con una confianza de 950/o el porcentaje de facturas con anomalías en todas

las compras del año.

ó) ZCuál es el error de estimación? tPor qué?

c) tQu¿ tamaño de muestra se tiene que usar si se quiere estimar tal porcentaje con

un error máximo de 2o/o?

En la producción de una planta se está evaluando un tratamiento para hacer que ger-

mine cierta semilla. De un total de 60 semillas se observó que 37 de ellas germinaron.

o) Estime con una confianza de 900/0, la proporción de germinación que se logrará con

tal tratamiento.

55

F

i-

a

a

)n

'o-

tv

Ie-

on

U-

Es

m8

rcia

uar

Ao/0,

om-

en-

I su-

ción

I Pororeo

:8.1

t9.7

t5.3

17.

lB.

54 i-.éFETiJ! ril ? i-:l*rr¡*:lÍ.i:t ii¡,: i;-:'¡+i¡::'¡t.l;r ::5i¡::.:,: ,:L

ó) Con una confianza de 900/0, óse puede garantizar que la mayoría (más de la mitad)de las semillas germinarán?

c) Conteste los dos incisos anteriores pero ahora con 950/o de confianza.

I 9. Para er"aluar la efectividad de un fármaco contra cierta enfermedad se integra en formaaleatoria un gruPo de 'l00 personas. Se suministra el fármaco y transcurrido el tiempode crleba se observa x:65 personas con un efecto favorable.c' Es'ttre crn una confianza de 900/0, la proporción de efectividad que se logrará con

:e ::'!r-¿:o. l-.iaga una interpretación de los resultados.

ia !- ': :::: : i:l:lema Cel ejercicio l l, los datos anteriores al diseño de la pruebacc":'--: --:s:':- : siguienie: de n: r20 envases de plástico probados para ver si

tenl¿r : r=s.;=-:: r- :,::a de 50 kg de fuerza,x: l0 envases no pasaron la prueba.o) E-in-r::c---a::-i¿:¡aie95::, laproporcióndeenvasesquenotienenlaresis-

tencia mlnir¡a es:e:::::¿. ::aqa ..]na interpretación de los resultados.ó) iCuál es el e-ro- ce =; -a::-lc) Calculeel tarnañcde 'r-:;-=c-:s:recesitaparaqueel errordeestimaciónmáxi-

mo sea de 0.03.

21 . Dos máquinas, cada una operada por Lrna ,ersona, son utilizadas para cortar tiras dehule, cuya longitud ideal debe ser de 20Cr min" De las inspecciones de una semana (25píezas) se observa que la longitud media de las 25 piezas para una máquina es de200.1 y para fa otra es de 201.2. ZEs significativa la diferencia entre los dos casos? Argu,mente.

Prueba de hipótesis(comparación de tratamientos)

22' Se desea comPrar una gran cantidad de bombillas y se tiene que elegir entre las marcasA y B. Para ello, se comPraron I o0 focos de cada marca, y se encontró que las bombillasprobadas de la marca A tuvieron un tiempo de vida medio de I 120 horas, con unadesviación estándar de 75 horas; mientras que las de Ia marca B tuvieron un tiempo devida medio de I 064 horas, con una desviación estándar de g2 horas.o) iEs significativa Ia diferencia entre los tiempos medios de vida?

Use a : 0.05.

á) ZCon qué tamaño de muestra se aceptaría que las marcas son iguales, utilizandoA: O.Q5?

23. En un laboratorio bajo condiciones controladas, se evaluó, para l0 hombresy lo mu-jeres, la temperatura que cada persona encontró más confortable. Los resultados engrados Fahrenheit fueron los siguientes:

75i77i78.79 77 73:78 t9 lZslsol-..-.- --.-.-L---,-.--.1--,,--.-r.--- -- l---*-'-*i-- I--i,.- " ._i_1__-l__-1_" 1 "" i

74 i tz | 77 : 76 i l¿-T it i' l]- ia ,-14 t 7s ',..,.-'.'-..'-i-''...--"'*....i.-*-.'.'''*.l"--.-,....,-,*,-.*---....--]..*--.:

o) zcuáles son en realidad los tratamientos que se comparan en este estudio?b) ZLas muestras son dependientes o independientes? Explique.c) ila temperatura promedio más confortable es igual para hombres que para mujeres?

Pruebe la hipótesis adecuada.

24. Se prueban l0 Partes diferentes en cada nivel de temperatura y se mide el encogimien-to sufrido en unidades de porcentaje multiplicado por 10. Los resultados son:

r

ixi-

de

(2s

de

gu-

rcaS

illas

una

¡de

rndo

mu-

5en

eres?

Preguntas y ejercicios

o) ZLa temperatura tiene algún efecto en el encogimiento? Plantee las hipótesis esta-

dísticas correspondientes a esta interrogante.

b) Dé un intervalo de confianza para la diferencia de medias.

c) ZCuál temperatura provoca un encogimiento menor?

d) Compare las varianzas en cada temperatura.e) Dibuje los diagramas de cajas simultáneos e interprete.

i5. Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercan-

cía de un depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudiose seleccionaron al azar cinco choferes de un grupo de 10 y se asignaron a la ruta A; los

cinco restantes se asignaron a la ruta B. Los datos obtenidos fueron:

55

d)

na

Po

ba'si)4.

;is-

?6.

o) iExisten diferencias significativas entre las rutas? Plantee y pruebe las hipótesis es-

tadísticas correspondientes.

ó) En caso de rechazar Ia hipótesis del inciso o), dibuje los diagramas de cajas simul-táneos para determinar cuáf ruta es mejor.

c) Sugiera otra manera de obtener los datos (diseño alternativo), de manera que se

pueda lograr una comparación más efectiva de las rutas.

Se tienen dos proveedores de una pieza metálica, cuyo diámetro ideal o valor objetivoes igual a 20.25 cm. Se toman dos muestras de l4 piezas a cada proveedor y los datosobtenidos se muestran a continuación:

21.38, 20.13, 19i12, 19.85, 20.54, 18.00, 22.24,21.94,22.ó0, r8. 10, 19.25

nten-

o) Describa un procedimiento de aleatorización para la obtención de estos datos.

b) Pruebe la hipótesis de igualdad de los diámetros de los proveedores en cuanto a

sus medias.

c) Pruebe la hipótesis de igualdad de varianzas.

17.2

17.5

18,6

15.9

16,4

r'7 316.8

18:4

16.7:

17.6

2t.4

;0.9

19.8

20.4

20.6: -.

z\.a

20.8

19:9

2t.1

20.3

2I.57, 22.22 ; 2L49, 2l ;9 1, 21.52, 22.06, 2I.5 r, 2r.29, 22.7 l, 22.65, 21 .53,22.22,2l .92, 20.82

56 CAP{-ru.*.|o:

c r Í as eseemurs pre d cñarmo su¡ 2O25 nnrn - 2.25 mm, Zcuál proveedor

fqdre Írúreiru p*ms ¡¡¡¡e.r*r¡sasl

et ¿f-rt a*"fl p¡qeefu 5e rFFr{tra l*r[-l2i. En Xow" S- Srnranapee, V" A f*rri 't {2m5} se pre.senta un estudio donde se

mdan dos tiff de brró de poenerc, orp Ensión se refueza con fibra de vidrio(RP)- EG btrr-ds, en sffiÍión de hs ykFs de acero, son utilizadas para reforzar

corlcreto, por lo q-re su caracterización es irportanb para fines de diseño, control y

optimiza€im para los ingenieros estrudr¡raler Las bafi-ds se sometieron a tensión hasta

regi*ar- su ruptura (en Mpa). Los datos para dos t{¡os de banas se muestran a con-

tinuación:

o) Formule la hipótesis para probar la igualdad de medias de los tratamientos.

ó) Anote la fórmula del 'estadístico de prueba para demostrar la hipótesis.

c) Pruebe la hipótesis a un nivel de significancia de 5olo. Para rechazar o no la hipóte-

sis, apóyese tanto en el criterio del valor-p como en el del valor crítico de tablas.

d) Explique cómo se obtiene el valor-p del inciso anterior.

e) Pruebe la hipótesis de igualdad de varianzas entre tratamientos.

f) iExiste algún tratamiento mejor?

Se realiza un estudio para comparar dos tratamientos que se aplicarán a frijoles crudos,

con el objetivo de reducir el tiempo de cocción. Un tratamiento (Tl ) es a base de bicar-

bonato de sodio; el otro, T2, es a base de cloruro de sodio o sal común. La variable de

respuesta es el tiempo de cocción en minutos. Se hacen siete réplicas. Los datos

se muestran en la siguiente tabla:

o) Formule la hipótesis para probar la igualdad de medias de los tratamientos.ó) Anote la fórmula delestadístico de prueba para probar la hipótesis.

c) Pruebe la hipótesis a un nivel de significancia de 5ol0. Para rechazar o no la hipóte-sis, apóyese tanto en el criterio del valor-p como en el valor crítico de tablas.

d) Pruebe la hipótesis de igualdad de varíanzas entre tratamientos.e) De acuerdo con el análisis hecho hasta aquí, ihay algún tratamiento mejor?

Se comparan dos métodos para inocular o contagiar una cepa del hongo del maíz co-

nocido como huitlacoche. En una primera etapa del estudio, el experimentador quiere

determinar cuál de los métodos genera mayor porcentaje de infección. El método A

consiste en cortar la punta de la mazorca para aplicar la cepa, y en el método B se in-yecta la cepa de forma transversal. De 4't mazorcas inoculadas con el método An 20 se

infectaron, es decir, generaron huitlacoche; en tanto, de 38 mazorcas inoculadas con el

método B se infectaron 27.

o) ZHay evidencia estadística suficiente para afirmar que el método B genera una ma-

yor infección de huitlacoche? Plantee y pruebe la hipótesis correspondiente.

El mejor método de inoculación del problema anterior se aplicó a dos variedades de

maíz en dos localidades. Una vez infectada la mazorca, interesa medir el porcentaje

29.

30.

iier;',:ii.!. '' -;i-' : -.:

inal de la superficie de ésta que fue cubierta por el hongo y el peso en gramos del

¡r.¡itlacoche. Los resultados para la variedad 2demaiz, obtenidos en l5 mazorcas de

lexcoco y en l5 mazorcas de Celaya son los siguientes:

57

ripóte-

rlas.

:dor

le se

idrioofzaf

trol Y

hasta

L COf'l-

crudos,

e bicar-

rable de

¡s datos

5.

a hiPóte-

a5.

lr?

I maíz co-

ior quiere

método A

lo B se in-

lo A, 20 se

¡das con el

fa una ma-

:nte.

iedades de

porcentaie

1

2

J

4

5

6

8

9

10

1l

12

13

14

t5

60

40

95

55

40

20,

10

10

55

15

35

25

70

2A

2A

95

100

70

40

35

100

30

100

100

100

25

15

85

15

30

122.6

182:74

203.45

84.03

128.46

31.85

12.81

57.05

145.83

49.49

103.66

95.05

125.02

40.57

19.36

231.80

346.74

23.1.4t

t41.49

t49.69

29t.28

86.03

r58.74

167.2s

120.89

19.74

22.08

134.O2

28.76

24.87

51.

o) iSe puede afirmar que el porcentaje de cobertura del hongo es mayor en Celaya

que en Texcoco?

b) Utilice un diagrama de dispersión (gráfica tipo X-Y) para ver si existe una relación li-

neal entre el porcentaje de cobertura de la mazorca con los gramos de huitlacoche.

c) lgnore la cobertura y pruebe la igualdad de la producción promedio de huitlacoche

en las dos localidades.

d) Es evidente que a mayor cobertura hay una mayor producción de huitlacoche, iha-bría forma de saber con estos datos si a igual cobertura corresponde una produc-

ción de huitlacoche semejante en ambas localidades? Argumente su respuesta.

Con respecto al problema del ejercicio 18, se desea comParar dos tratamientos Para

hacer que germine cierta semilla. Los datos del tratamiento A son los del ejercicio 18,

es decir, de 60 semillas puestas a germinar se observó que 37 de ellas germinaron.

Mientras que para el tratamiento B, de 70 semillas se observó que 50 germinaron.

o) ZHay una diferencia significativa entre los dos tratamientos? Pruebe la hipótesis co-

rrespondiente a 950/o de confianza.

b) Estime, con una confianza de 95o/o,la proporción de germinación que se logrará con

cada tratamiento.

Se desea comparar dos proveedores; para ello, se toma una muestra aleatoria de la

producción de cada uno de n : 150 piezas, y se les hace en orden aleatorio una prueba.

En el caso del primer proveedor se obtuvieron xr : I I piezas que no pasaron la prueba,

mientras que para el segundo fueron xz:22.o) iQué proveedor parece mejor?

b) LHay una diferencia significativa entre los dos proveedores? Pruebe Ia hipótesis co-

rrespondiente a 950/o de confianza.

32.

58 CAPÍTUIO 2 Elemen::s := -'=.=-: =

Pruebas pareadas

33. La prueba actual de un solo disco se tarda 2 rni¡utos. 5e orcpcne un nuevo método deprueba que consiste en medir solamente los racias 2-:. ¡ 5f donde casi es seguro queestará el valor mínimo buscado. Si el método r¡uer resuka igual de efectivo que elmétodo actual se podrá reducir en 600/o el tiempo de prueba,5e plantea un experimen-to donde se mide la densidad mínima de metal en l8 dlxos u-ndo tanto el métodoactual como el método nuevo. Los resultados están o¡deraios horizontalmente pordisco. Así LB8 y 1.87 es el resultado para el primer disco ccr- anrbos métodos.

o) Pruebe la igualdad de las medias usando Ia prueba pareada. ¿Cuál es el criterio deapareamiento?

b) Encuentre un intervalo para la diferencia de medias usando la desviación estándarde las diferencias. Inteprete.

c) Haga el análisis de los datos ignorando el apareamiento. Compare con los resulta-dos del inciso o), ipor qué ignorar el apareamiento es incorrecto?

d) Determine un intervalo de confianza para Ia diferencia de medias suponiendo mues-tras independientes. Compare con el inciso b).

e) iQué se gana con el apareamiento de los datos en este caso?f) iRecomendaría usted la adopción del método nuevo? Argumente su respuesta.

En una prueba de dureza, una bola de acero se presiona contra el material al que semide la dureza. El diómetro de Ia depresión en el material es la medida de su dureza.Se dispone de dos tipos de bolas de acero y se quiere estudiar su desempeño. para ello,se prueban ambas bolas con los mismos l0 especímenes elegidos de manera aleatoriay los resultados son:

o) Analice paso a paso cómo se hizo el experimento y explique por qué es importanterealizarlo de esa manera.

ó) Pruebe la hipótesis de que ambas bolas dan las mismas mediciones de dureza.c) Pruebe la igualdad de las bolas sin considerar que están pareadas. Compare los

resultados con los obtenidos en el inciso ó).d) LEn qué situación se esperaría que los análisis ó) y c) den los mismos resultados?

Se conduce un experimento Para determinar si el uso de un aditivo químico y un ferti-lizante estándar aceleran el crecimiento de las plantas. En cada una de l0 localidadesse estudiaron dos plantas sembradas en condiciones similares. A una planta de cadalocalidad se le aplicó el fertilizante puro y a Ia otra el fertilizante más el aditivo. Despuésde cuatro semanas el crecimiento en centímetros fue ef siguiente:

34.

1.83 I 1.91 1.9+ i.95 i.93 I 2.01

2.18 1.81 t.t_1 1.97 2.0A

1.92 . 2.A) t.fn 1.95 2.05

35.

rde

que

3el€n-

rdo

Por

)t

n

feza.

ello,

ftoria

¡de

ndar

ulta-

ües-

t.

le se

tante

'4.

l! to'

Cos?

rferti-

Cades

cada

spués

Preguntas y ejercicios

Sin aditivo

Con aditivo

o) ZLos datos obtenidos apoyan la afirmación de que el aditivo químico acelera el

crecimiento de las plantas? Plantee las hipótesis apropiadas y pruébelas usando

a :0.05.ó) Obtenga un intervalo al 950/o de confianza para Ia diferencia promediop¿.

c) Explique con detalle cómo se pueden asignar de manera aleatoria los tratamientos

a las plantas en cada localidad utilizando una moneda.

d) Suponga que en cada localidad una planta queda hacia el Este y la otra hacia el

Oeste, realice una asignación aleatoria de los tratamientos a las plantas lanzando

una moneda l0 veces.

Retome los datos del ejemplo 2.6 (impurezas en cofres levantados y bajados):

o) lgnore el apareamiento, y compare de manera independiente los dos tratamientos.

Obtenga conclusiones.

b) Explique si las conclusiones son diferentes con el análisis en forma pareada y. de

manera independiente.c) iCuál es la conclusión correcta, hay o no diferencia entre los tratamientos?

Se realizó un experimento para ver si dos técnicos tienen alguna tendencia a obtenerdiferentes resultados cuando determina la pureza de cierto producto. Cada muestra fue

dividida en dos porciones y cada técnico determinó la pureza de una de las porciones.

Los resultados se muestran a continuación:

o) Estos datos deben analizarse en forma pareada, explique por qué.

b) Formule la hipótesis correcta al problema.

c) Pruebe la hipótesis y obtenga conclusiones.

d) Si los técnicos son diferentes, ihay alguna evidencia sobre cuál de ellos hace mal el

trabajo?

e) ZQué recomendaría para lograr mayor uniformidad en las determinaciones de los

dos técnicos?

59