morcillo - estatisticas
Post on 08-Jul-2018
227 Views
Preview:
TRANSCRIPT
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 1/133
AMOSTRAS E POPULAÇÕES
André Moreno Morcillo1
Nem sempre é possível incluir no estudo todos os elementos de uma população, seja em
decorrência dos altos custos implicados, por premência de tempo, por questões
operacionais, etc. Nestes casos, a solução é estudar um grupo (amostra) desta
população. Por mais adequado que seja o planejamento e a execução do processo de
amostragem, os resultados obtidos a partir de amostras raramente são iguais aos da
população. A média, o desvio padrão e outros parâmetros da amostra serão
provavelmente próximos aos da população de origem, mas raramente iguais. Esta
diferença se deve ao acaso, fenômeno também chamado de erro amostral.
Considerando que o processo de seleção da amostra foi realizado de forma técnica
correta, o tamanho da amostra (n) passa a ser o principal responsável para diminuir a
importância do erro amostral. Amostras com pequeno número de casos geram dados
mais imprecisos; quanto maior o n mais seus parâmetros se aproximarão daqueles da
população.
Daí a importância que no momento se dá ao dimensionamento da amostra durante aelaboração do projeto e da apresentação do chamado Intervalo de Confiança nos
resultados. Ambos tentam tornar claro ao leitor o grau de precisão dos nossos
resultados.
A relação existente entre os parâmetros (média e variância) da população e das
amostras podem ser deduzidas a partir de um exemplo bastante simples. Na tabela 1 e figura 1 são apresentadas as idades de uma população de crianças com
uma doença muito rara.
Tabela 1 – Idades (anos)
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 2/133
Idade (anos) 8 6 4 2
Fre
qü
ên
cia
2,0
1,0
0,0
Figura 1 – Distribuição das idades (anos)
Como estes quatro pacientes formam uma população, seus parâmetros são:
54
20===∑
n
xµ
( )5,0
44
202
120
nn
x2
x2σ
2 =−
=∑−∑
=
Se não pudéssemos estudar todos as crianças, poderíamos sortear amostras com um,
dois ou três elementos. Sabemos que amostras com n=1 serão imprecisas, com n=3
muito melhor, mas vamos estudar o comportamento de amostras com n=2.
Considerando um processo de amostragem com reposição, teremos 16 possibilidades decomposição, cada uma com sua média e desvio padrão. Como tomamos todas as
amostras possíveis, neste caso temos uma "população de amostras" e uma "população
de médias das amostras". As amostras e suas médias são apresentadas na tabela 2 e
figura 2.
Tabela 2 -Distribuição das amostras de 2 elementos e suas médias (anos)
Amostras Média da amostra ( x )
2 e 2 22 e 4 32 e 6 42 8 5
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 3/133
Os parâmetros desta população de médias amostrais são:
516
80===
∑µn
x
x
( )
5,2
16
1680440
n
n
xx
x
22
2
2 =−
=
∑−∑
=σ
1. A média da população de médias das amostras (µ ) é igual à média da
população (µ)
x
2. A variância das médias amostrais (σ2
x) é menor que a da população inicial (σ2).
A razão entre a variância da população e a variância das médias amostrais é:
amostrasdastamanho n
x
⇒===σσ
25,2
0,52
2
3. A distribuição das médias amostrais tem distribuição aproximadamente normal.
Distribuição das m édias das amostras
8,0 - 10,0 6,0 - 8,0 4,0 - 6,0 2,0 - 4,0 0,0 - 2,0
Fr
eq
üê
8
7
6 5
4
3
2
1 0
Figura 2 – Distribuição das médias das amostras
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 4/133
distribuição. Na pesquisa o caminho é diferente: só conhecemos alguns dados de uma
das possíveis amostras e queremos concluir a respeito da população. Como isto é
possível?
CONCEITOS FUNDAMENTAIS:
1. Sabe-se que a média de uma amostra obtida em condições técnicas razoáveis é um
bom parâmetro da média da população que a originou.
2. A variância de uma amostra quando calculada com n-1 casos é um bom parâmetro
da variância da população que a originou.
3. Quando a população de estudo tem distribuição normal, as médias amostrais têm
distribuição normal; nos casos em que a população de estudo não tem distribuição
normal, a distribuição das médias amostrais tem distribuição aproximadamentenormal se o tamanho das amostras for grande (n>30).
Transformando-se algebricamente a fórmula anterior:
nx =σ
σ2
2
e nx
σ
=
22
σ
nnEPx
σ=σ=
2
(1)
Aplicando-se a fórmula (1) com os parâmetros obtidos de uma amostra qualquer
teremos:
n
sEPx =
A partir da média da amostra e do Erro Padrão podemos determinar o intervalo de
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 5/133
790,040
0,5
=== n
s
EPx
2. Como n é maior que 30 as médias das amostras tem distribuição normal ou
aproximadamente normal. Assim, a seguir calculamos o valor de z equivalente a
98 cm considerando a média 100,0 cm e o erro padrão igual a 0,790 cm.
531,2790,0
10098−=
−=
µ−=
EP
xz
x
A probabilidade de uma amostra com 40 casos ter média menor que 98cm é equivalente
à probabilidade de z < -2,531 (probabilidade da curva normal reduzida), que é igual a
0,005687 ou 0,56 % (figura 3).
Probability Density Function
y=normal(x;0;1)
0,00
0,15
0,30
0,45
0,60
-3,50 -1,75 0,00 1,75 3,50
Figura 3 – Curva normal
I NTERVALO DE CONFIANÇA DA MÉDIA POPULACIONAL
A primeira aplicação prática destes conceitos é a determinação do intervalo de
confiança da média populacional [IC] a partir das informações obtidas de uma amostra
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 6/133
A amplitude do intervalo de confiança [IC] está relacionada com a precisão desejada.
Para um intervalo de confiança de 95% (IC95%), usamos z = 1,96; para IC99%
tomamos z = 2,58; para IC90% o valor de z será 1,64.
O intervalo de confiança tem dois limites:
1. Limite inferior: que é igual à média + z.EP
2. Limite superior: que é igual à média - z.EP
.EPx.EP 2/2/ z z x αα +⇔−
Para o cálculo do IC95% o cálculo é apresentado abaixo.
1,96.EPxEP.96,1 +⇔− x
Por exemplo, um pesquisador ao estudar a altura de uma amostra da 120 crianças obteve
média 120 cm e desvio padrão de 5,6 cm. O intervalo de confiança de 95% [IC95%] da
média populacional será:
511,0120
6,5===
n
s EP
131,95]-[108,08IC95%
1)1,96.(0,51120 |---| 1)1,96.(0,51-120
1,96.EPxEPx
=
+
+⇔− .96,1
Estima-se com 95% de precisão que a média populacional esteja contida no intervalo
108,08 cm a 131,95 cm.
OS CASOS COM PEQUENAS AMOSTRAS
Quando as amostras são pequenas (n < 30) temos que fazer uma pequena modificação
no procedimento. Trocamos z pelo valor de t, estatística que leva em consideração o
número de casos estudado.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 7/133
DETERMINANDO O TAMANHO DA AMOSTRA
Para calcular o número de casos (n) que terão que ser incluídos na amostra
necessitaremos de informações sobre a média e o desvio padrão da variável que vamos
estudar, que podem ser obtidas da literatura ou então de estudos piloto. Empiricamente
estabelece-se a amplitude do intervalo de confiança desejado.Sabendo-se que µ + 1,96.(EP) = µ - 1,96.(EP), chamaremos d = µ + 1,96.(EP).
Usaremos x no lugar de µ e s no lugar de σ.
n
sEPx =
d
s
n
d
sn
n
s1,96.d
EPd X
2
22
.96,1
.96,1
.96,1
=
=
=
=
Exemplo: se um pesquisador planeja estudar a altura de crianças, inicialmente realiza
um estudo piloto a partir do qual obteve média = 120 cm e desvio padrão = 5,6 cm.
Arbitrariamente define d = 1% da média da amostra (1,2 cm) e IC95%. O número
mínimo de casos a ser incluído na amostra será:
77,2144,1
36,31.8416,3.96,1
2
22 =
==
d
sn
Portanto, serão necessários somente 22 casos para se obter a precisão desejada com
confiança de 95%
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 8/133
3. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação de Pesquisas
Científica de Ribeirão Preto, 2002.4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.
5. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.
6. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
7. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.
8. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,
2003.9. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.
10. GUIMARÃES RC, CABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.
11. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.
13. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.14. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e Científicos
Editora Ltda, 1999.
15. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.
16. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 9/133
COMPARAÇÃO DE TRÊS OU MAIS AMOSTRAS INDEPENDENTES
A NÁLISE DE VARIÂNCIA André M. Morcillo1
A comparação de três ou mais amostras independentes, tomadas ao acaso, de uma população com
distribuição normal, deve ser realizada pela Análise de Variância, que. tem sido considerada a mais
importante e poderosa prova paramétrica.
Apesar das hipóteses de trabalho contemplarem a igualdade ou não das médias, toda a análise é realizada
comparando a dispersão dos dados das amostras.
Esta prova exige:
1. a variável estudada deve ser contínua e ter distribuição normal
2. as amostras devem ser independentes e tomadas ao acaso
3. as variâncias das amostras devem ser homogêneas (“iguais”).
Se forem tomadas duas amostras razoavelmente grandes, ao acaso, de uma determinada população com
distribuição normal, observa-se que as médias e respectivas variâncias têm valores muito próximos, não
exatamente iguais. Esta diferença expressa o papel do acaso, o chamado erro amostral, que ocorreu na
seleção dos elementos.
Como as variâncias são homogêneas, as dispersões das amostras são muito semelhantes. O mesmo ocorre
em relação às médias. Um gráfico de toda a população e das amostras que se está estudando, mostrará que
as curvas praticamente se sobrepõem.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 10/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
Por outro lado, se no caso extremo, as amostras tivessem sido tomadas de duas populações distintas, suas
médias e variâncias seriam diferentes. Teremos distribuições totalmente diferentes.
m e d i a 1
m e d i a 2med ia g e r a l
G r u p o 2G r u p o 1
O princípio da análise de variância é comparar a dispersão dos dados entre as amostras com a dispersão
observada dentro das mesmas.
A dispersão observada, considerando todos os N elementos que compõem a população, pode ser dividida
em:
1. a dispersão observada dentro dos grupos
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 11/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
Uma boa maneira de avaliar a dispersão de um conjunto de dados é estudar o desvio que cada elemento
tem em relação à média, mais precisamente, o quadrado destes desvios. Considerando uma observação
qualquer xi e a média da amostra de x , o quadrado do seu desvio será:
( ) x xiQD −= 2
A soma dos quadrados dos desvios (SQD) de todos os n elementos da amostra será:
( )∑ −=
=n
i x xiSQD
12
Calculando a SQD da população ou SQD total (SQDT)
A partir do conceito acima, pode-se calcular a soma dos quadrados dos desvios, em relação à média da
população, para o conjunto das N observações envolvidas no estudo:
N
X
X
N
i∑== 1
O cálculo da soma dos quadrados dos desvios passa a ser: .
( )∑ −=
= N
iT X X SQD
1
2
Calculando a SQD dentro das amostras (SQDD)
Calcula-se a soma dos quadrados dos desvios de cada amostra. Tem-se uma SQD da primeira amostra,
outra para a segunda, etc., cuja soma recebe o nome de soma dos quadrados dos desvios dentro dos
grupos (SQDD). A SQDD expressa a variação ocorrida dentro dos grupos em decorrência do acaso - o
chamado Erro Amostral.
SQDD = SQD1 + SQD2 + SQD3 + ... + SQDk
( ) ( ) ( ) ( )∑ ∑ ∑ −−−∑ − ++++=n n nn
D xxxxxxxxSQD kiiii2222
...321
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 12/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
A SQDE é fundamental na Análise de Variância, pois expressa a variação ocorrida na formação dos
grupos. Se o fator que se estuda tem significativo impacto, haverá grande diferença entre os grupos, queresultará em importante desvio entre os grupos (SQDE).
Comparando as somas dos quadrados dos desvios
Como saber se uma determinada SQD=15 é ou não maior do que outra SQD=13 ?
Esta comparação torna-se mais clara quando se leva em conta o tamanho das amostras envolvidas.
Calcula-se a média das somas dos quadrados dos desvios (QMD) de cada amostra:
n
SQDQMD =
Uma amostra com 20 elementos e SQD = 15 tem QMD = 15/20 = 0,75 . Outra com 10 elementos com
SQD=13 terá QMD = 13/10 = 1,3
Portanto, compara-se as médias das somas dos quadrados (QMD), porém, estas serão calculadas a partir
dos respectivos graus de liberdade, que é o número de elementos de cada amostra menos um [gli= ni - 1].
Assim, os quadrados médios serão calculados da seguinte forma:
gl SQDQMD =
Quadrado médio dentro das amostras (QMDD)
O QMDD é calculado a partir da SQDD e seus graus de liberdade (N-k) [gld = N - k]
.
k N
SQDQMD D
D −=
k
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 13/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
1−=
k
SQDQMD E
E
Calculando a estatística F
A estatística F avalia a relação existente entre o QMDE e o QMDD. Quanto maior a diferença entre os
grupos, maior será o valor de F.
QMD
QMD
D
E F =
Teste de hipótese
A Análise de Variância avalia se as amostras, que têm variâncias homogêneas, têm médias iguais ou
diferentes. A hipótese inicial prevê a igualdade das médias, enquanto que a hipótese alternativa afirma
que pelo menos uma das médias é diferente (o que significa dizer que pelo menos uma amostra não é procedente da mesma população).
H0 : todas as médias das amostras são iguaisH1 : pelo menos uma amostra tem média diferente
As hipóteses também poderiam ser escritas da seguinte forma:
x...xxx :HO k 321 ====
x...xxx :H1k 321
≠≠≠≠
Uma vez estabelecido o nível de significância desejado (α) e calculada a estatística F. Procura-se na
tabela de distribuição de F o valor de Fcrítico para k-1 graus de liberdade entre os grupos e N-k graus de
liberdade dentro dos grupos.
Se o valor de F obtido é igual ou maior ao Fcrítico rejeita-se H0
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 14/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
Exemplo: desejando saber se havia diferença significativa entre as idades de crianças de três classes da
quarta série de uma escola do ensino fundamental, um pesquisador tomou uma amostra ao acaso (n=15)de cada classe.
H0 : não há diferença entre as idades das crianças das três classes
H1 : pelo menos uma classe tem crianças com idades diferentes
Nível de significância adotado: 0,05
Calculando a Soma dos Quadrados das Diferenças do Total (SQDT)
1. Calculando a soma das idades de todas as crianças: ΣX = 450
2. Calculando a média (geral) de todas as crianças: 1045
450== X
3. Calculando o quadrado da diferença de cada criança em relação à media geral: ( ) X X −2
4. Calculando a soma dos quadrados das diferenças de todas as crianças: ( ) 461
2== ∑ −
=
N
iT X X SQD
Classe A Classe B Classe C
X ( ) X X −2
X ( ) X X −
2
X ( ) X X −2
8,00 4,00 10,00 0,00 10,00 0,008,00 4,00 11,00 1,00 11,00 1,00
11,00 1,00 9,00 1,00 10,00 0,00
11,00 1,00 10,00 0,00 10,00 0,00
11,00 1,00 9,00 1,00 10,00 0,00
10,00 0,00 10,00 0,00 9,00 1,00
9,00 1,00 9,00 1,00 7,00 9,00
12,00 4,00 11,00 1,00 11,00 1,00
10,00 0,00 11,00 1,00 11,00 1,00
10,00 0,00 9,00 1,00 11,00 1,00
11,00 1,00 10,00 0,00 10,00 0,00
10,00 0,00 10,00 0,00 9,00 1,00
10,00 0,00 10,00 0,00 10,00 0,00
11,00 1,00 10,00 0,00 12,00 4,00
9 00 1 00 10 00 0 00 9 00 1 00
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 15/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
Calculando a Soma dos Quadrados das Diferenças dentro dos grupos (SQDD)
1. Calculando a média das idades das crianças dentro de cada classe:n
x
x
n
i∑== 1
2. C o quadrado da diferença de cada criança em relação à media da respectiva classe:alculando( ) x x− 2
3. Calculando a soma dos quadrados das diferenças dentro cada classe: ( )∑ −= x xSQD2
4. Calculando a soma dos quadrados das diferenças dentro das três classes:
SQDD= SQDClasse A + SQDClasse B + SQDClasse C
SQDD= 18,9335 + 6,9335 + 20 = 45,867
Classe A Classe B Classe C
x ( ) x x− 2 x ( ) x x− 2 x ( ) x x− 2
8,00 4,2711 10,00 0,0044 10,00 0,00008,00
4,2711 11,00 1,1378 11,00 1,000011,00
0,8711 9,00 0,8711 10,00 0,000011,00
0,8711 10,00 0,0044 10,00 0,000011,00
0,8711 9,00 0,8711 10,00 0,000010,000,0044 10,00 0,0044 9,00 1,0000
9,001,1378 9,00 0,8711 7,00 9,0000
12,003,7378 11,00 1,1378 11,00 1,0000
10,000,0044 11,00 1,1378 11,00 1,0000
10,000,0044 9,00 0,8711 11,00 1,0000
11,000,8711 10,00 0,0044 10,00 0,0000
10,000,0044 10,00 0,0044 9,00 1,0000
10,000,0044 10,00 0,0044 10,00 0,0000
11,000,8711 10,00 0,0044 12,00 4,0000
9,001,1378 10,00 0,0044 9,00 1,0000
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 16/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
Construindo a tabela da Análise de Variância
Uma forma clássica de apresentação dos dados da análise de variância é a da tabela abaixo:
SQD Gl QMD F
Entre as amostras 0,1339 2 0,06695 0,061307
Dentro das amostras 45,8661 42 1,09205
Do total (as três amostras juntas) 46 44
Comparando o F calculado e tomando decisão
F = QMDE / QMDD = 0,06695 / 1,09205 = 0,061307
O valor de F crítico para 2 gl entre as classe e 42 gl dentro das classes é F =0,05;2;42 = 4,05
Como o F calculado é menor que o Fcrítico não se pode rejeitar H0, concluindo que as três classes têmmédias de idade iguais.
x A = x B = x C
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 17/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
FORMA PRÁTICA PARA CALCULAR AS SOMAS DE QUADRADOS
Há uma forma mais simples que permite que as somas dos quadrados sejam calculadas sem usar
diretamente os desvios ( x x− 2) , diminuindo o número operações efetuadas e, consequentemente, de erros
cometidos. Serão utilizados nos cálculos somente os valores originais (x) e seus quadrados (x2).
Calculando a soma dos quadrados do conjunto das amostras (SQDT)
( ) N
X X SQD
T
∑−= ∑
22
onde
ΣX : soma de todos os elementosΣX2 : soma dos quadrados de todos os elementosn : número de elementos da amostra i N: total de elementos de todas as amostras
Calculando a soma dos quadrados dos desvios dentro das amostras (SQDD)
( )∑ ∑=
∑
−
=
K
I D n
x xSQD
1
22
onde
Σx : soma de todos os elementos da amostra ix2 : quadrado de qualquer elemento da amostra i n : número de elementos da amostra i
Calculando a soma dos quadrados dos desvios entre as amostras (SQDE)
SQDDSQDTSQDE −=
Calculando os quadrados médios das diferenças (QMD)
QMDE = SQDE / k-1
QMDD = SQDD / N – k
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 18/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
Classe A Classe B Classe C
x x2 x x2 x x2
8,00 64 10,00 100 10,00 1008,00 64 11,00 121 11,00 121
11,00 121 9,00 81 10,00 100
11,00 121 10,00 100 10,00 100
11,00 121 9,00 81 10,00 100
10,00 100 10,00 100 9,00 819,00 81 9,00 81 7,00 49
12,00 144 11,00 121 11,00 121
10,00 100 11,00 121 11,00 121
10,00 100 9,00 81 11,00 121
11,00 121 10,00 100 10,00 100
10,00 100 10,00 100 9,00 81
10,00 100 10,00 100 10,00 100
11,00 121 10,00 100 12,00 144
9,00 81 10,00 100 9,00 81
151 1539 149 1487 150 1520
Soma de x Soma de x2 n
Classe A 151 1539 15
Classe B 149 1487 15
Classe C 150 1520 15
Total 450 4546 45
SQDT = 4546 - (450)2
/ 45 = 46SQDD = 18,9333 + 6,9333 + 20 =45,867
SQDE = 46 – 45,867 = 0,133
QMDE = 0,133 / 2 = 0,0665
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 19/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
ESTUDANDO A HOMOGENEIDADE DAS VARIÂNCIAS - O TESTE DE BARTLETT
Antes de iniciar a Análise de Variância é importante demonstrar que as variâncias das amostras são
homogêneas ("iguais"). Para isto emprega-se o Teste de Bartlett, uma forma de χ2 que indica se há ou não
diferenças significantes entre as variâncias dos grupos estudados.
Teste de Bartlett para k amostras de mesmo tamanho n (n1=n2=n3=...=nk =n)
( )
−××−×= ∑
=
k
i s sk n
1
222 loglog13026,2 χ
onde n é numero de casos das amostras (todas têm o mesmo número de casos) e s2
é a média aritmética das
variâncias observadas nas k amostras, calculadas por:
k
k
i s
s∑
== 1
2
2
Compara-se o χ2 calculado com o χ2crítico com k-1 graus de liberdade. Quando o χ2 calculado for ≥ χ2
crítico rejeita-se a
hipótese de que as amostras sejam homogêneas.
Quando o χ2 for estatisticamente significante, torna-se necessário aplicar um fator de correção (C), tal como segue
abaixo.
( )13
1
1 −××
−
+= nk
k
C
χ χ
22
=
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 20/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
k N
SQD
QMD s D
D −==
2
onde SQDD é a soma dos quadrados dos desvios dentro das amostras e N é o número total de elementos encontrados
nas k amostras.
( )[ ] ( )[ ]
×−−−××= ∑=
k
i s s nk N 1
222
log1log3026,2 χ
Quando o χ2 for maior que o χ2crítico, deverá ser corrigido da seguinte maneira:
( ) ( ) ( )
−−
−×
−×+= ∑
=k N
nk
C k
i i
1
1
1
13
11
1
C corr
χ χ
22
=
Se o χ2corr for maior ou igual ao χ2
crítico com k-1 graus de liberdade rejeita-se a hipótese de que as amostras sejam
homogêneas.
Retomando o exemplo anterior:
Classes N n-1 s2 Log s2
A 15 14 1,352 0,1309766
B 15 14 0,495 -0,3053948
C 15 14 1,429 0,15503222
Retomando o exemplo anterior, todas as amostras têm o mesmo tamanho.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 21/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
( ) (( )
( )( )
321416,4134054,02364,32
019386,0038223,03143026,2
019386,0092,1log31153026,2
2
2
2
=×=
+×××=
−−××−×=
χ
χ
χ )
Considerando que são 2 graus de liberdade o valor do χ20,05,2gl é 5,991
Portanto,
χ2 < χ20,05,2gl
Neste caso, por não haver significância não há necessidade de aplicar o fator de correção.
Não se pode rejeitar a hipótese de que a amostras têm variâncias homogêneas, concluindo-se que as variâncias são
"iguais".
Observação: o teste de Bartlett é poderoso quando a população tem distribuição normal. Não deve ser utilizado
quando esta condição não é observada. Portanto, antes de aplicar o teste de Bartlett deve-se avaliar a condição de
normalidade da população.
BIBLIOGRAFIA
1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall, 1991.
2. A NDERSON DR, SWEENEY DJ, WILLIAMS TA – Estatística aplicada à administração e economia.
2ª ed. São Paulo: Pioneira, 2002.
3. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação de PesquisasCientífica de Ribeirão Preto, 2002.
4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.
5. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.
6 BUNCHAFT G Estatística sem mistérios 4ª ed Petrópolis RJ: Vozes 1997
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 22/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
13. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.
14. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e CientíficosEditora Ltda, 1999.
15. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.
16. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 23/133
Análise de Variância - André Moreno Morcillo
__________________________________________________________________________________________________
COMO PROCESSAR NO SPSS
A estrutura da planilha deve ter duas variáveis: uma que receberá o código dos grupos e a outra para
os dados da variável independente.
Classe Idade Var0003
1 A 82 A 8
3 A 114 A 115 A 116 ... ...16 B 1017 B 1118 B 919 B 1020 B 9... ... ...31 C 1032 C 1133 C 1034 C 1035 C 10... ... ...
1,223 2 42 ,305IDADE
Levene
Statistic df1 df2 Sig.
Test of Homogeneity of Variances
,133 2 6,667E-02 ,061 ,941
45,867 42 1,092
46 000 44
Between
Groups
Within
Groups
Total
IDADE
Sum of
Squares df
Mean
Square F Sig.
ANOVA
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 25/133
A CURVA NORMAL André Moreno Morcillo1
O conhecimento desta distribuição de probabilidades se deve a Abraham de Moivre
(1667-1754) que, em 1733, apresentou a função que a representa. Tratava-se até então
de um exercício teórico, sem aplicação prática. J. Bernoulli (1654-1705) acreditava que
poderia haver aplicação na área da economia, no entanto, o uso desses conhecimentos
na prática se deve a Pierre-Simon Laplace (1749-1827) na França e a Johan K. F. Gauss
(1777-1855) na Alemanha. O nome “Curva de Gauss” se deve à suposição que Gauss
tivesse sido a primeira pessoa a fazer uso de suas propriedades; no entanto, em 1924,
Karl Pearson reafirmou o papel fundamental de Abraham de Moivre.2
Esta distribuição de probabilidades é definida pela função:
e σ
µx.
2.πσ.
1y 2
2
2.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 26/133
Esta curva é definida por dois parâmetros: sua média (µ) e sua variância (σ2). Dessa
forma são possíveis infinitas curvas normais, ora variando a média, ora a sua variância.
Suas principais características são:
A variável x pode assumir qualquer valor real (-∞ a +∞)
Os valores de y são assintóticos em relação ao eixo das abcissas, isto é, nunca tocam oeixo de x.
A curva é simétrica e unimodal, apresentando um ponto de inflexão à esquerda (x = µ -
1σ) e outro à direita (x = µ +1σ).
Sua aplicação na análise de dados na área biomédica é grande, pois muitas variáveis
numéricas contínuas que estudamos têm distribuição normal ou aproximadamente
normal. Em alguns casos é possível transformá-las, tornando-as compatíveis com a
normal. Como exemplo podemos citar a altura, o peso, o índice de massa corporal, etc.
Alguns dos principais métodos empregados na análise estatística (teste t de Student,
análise de variância, análise de regressão, etc.) exigem que os dados tenham distribuiçãonormal.
Como se trata de distribuição de probabilidade contínua, a área que fica entre a curva e
o eixo das abcissas representa a probabilidade. A probabilidade de ocorrer um evento
entre os pontos a e b é calculada pela integral definida da função entre os pontos a e b,
representada pela área azul no gráfico seguinte.
b µx2
1
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 27/133
A probabilidade de ocorrer um evento entre x=-∞ e x=+∞ é igual a 1 ou 100%,representada pela área azul no gráfico seguinte.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 28/133
A probabilidade de ocorrer um evento entre x=µ e x=+∞ é 0,5 ou 50%, representada
pela área azul no gráfico seguinte..
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 29/133
A CURVA NORMAL REDUZIDA
Curvas normais, com qualquer µ e σ, podem ser transformadas em uma normal muito
especial que tem média 0 (µ = 0) e desvio padrão 1 (σ = 1). Esta curva normal com
média 0 e desvio padrão 1 é conhecida como curva normal reduzida. Suas
probabilidades já foram calculadas e são apresentadas em tabelas de fácil utilização.
Como a normal é simétrica, os livros apresentam somente as probabilidades da metade
direita da curva. A probabilidade de um intervalo qualquer da metade esquerda é igual à
probabilidade do intervalo equivalente na metade direita.
Na normal reduzida P(0,z) = p enquanto P(> z) = 0,5 – p
P(-z,0) = P(0,+z)
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 30/133
COMO USAR A TABELA PARA OBTER AS ÁREAS OU PROBABILIDADE
A tabela que apresentamos3 dá a probabilidade de ocorrência de um evento entre 0 e z.
Na margem esquerda temos o valor de z com uma decimal e, se necessitamos considerar
a segunda decimal, a procuramos na margem superior. No interior obtemos as
probabilidades.
Para calcular a probabilidade de z entre 0 e 1, procuramos na margem esquerda a linha
que tem z = 1,0 e a coluna 0,00 e encontramos o valor 0,3413. Isto significa que a
probabilidade de encontrar um valor de x entre a média zero e z=1,0 é 0,3413 ou
34,13%.
Por outro lado, para se obter a probabilidade de z maior que 1, calculamos a
probabilidade de z entre 0 e 1 que é 0,3413 e a seguir fazemos 0,5-0,3413 = 0,1587 ou
15,87%.
Para se obter a probabilidade de z entre 0 e 1,87, procuramos a célula cuja linha é 1,8 e
coluna 0,07 o que resulta o valor 0,4693 ou 46,93%.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 31/133
Curva Normal (p = área entre 0 e z)
segunda casa decimal
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 32/133
COMO TRANSFORMAR UMA NORMAL QUALQUER NA NORMAL REDUZIDA
Devemos calcular o z equivalente aos limites desejados utilizando a fórmula:
x z
onde
x = ponto que se deseja converter em z
µ = média da normal original
σ = desvio padrão da normal original
Dada uma distribuição normal com média 100 e desvio padrão 5, calcule a
probabilidade x entre 100 e 107.
O procedimento é simples. Precisamos saber qual é o intervalo da normal reduzida que
é equivalente ao intervalo 100 a 107 da normal com média 100 e desvio padrão 5.
Aplicando a fórmula acima, calcula-se o valor de z para x=100 e para x=107.
05
100100
x z
4,15
100107
x z
O ponto 100 corresponde a z = 0 e o ponto 107 a z = 1,4. Assim, o intervalo 100-107 é
equivalente ao intervalo 0-1,4 da normal reduzida.
Como a probabilidade de z entre 0 e 1,4 é 0,4192 ou 41,92% podemos afirmar que a
probabilidade de z entre 100-107 é igual a 0,4192 ou 41,92%
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 33/133
Alguns exemplos de aplicação na área biomédica:
Sabendo-se que a altura de crianças dos sexo masculino aos 4 anos de idade tem
distribuição normal com média 100 cm e desvio padrão 6,0 cm, pergunta-se:
1. Qual é a probabilidade de uma criança ter altura menor que 110 cm?
z = (110 – 100)/6 = 1,67
A probabilidade de 0 < z < 1,67 = 0,4525 . A probabilidade de z < 0 é 0,5
Assim a probabilidade de uma criança ter altura menor que 110 cm é 0,50 +
0,4525 = 0,9525 ou 95,25%
2. Qual é a probabilidade de uma criança ter altura maior que 103 cm?
z = (103 – 100)/6 = 0,50
A probabilidade de 0 < z < 0,50 = 0,1915. A probabilidade de z > 0,50 é
0,50 – 0,1915 = 0,3085 ou 30,85%.
3. Qual é a probabilidade de uma criança ter altura menor que 100 cm?
Assim a probabilidade de uma criança ter altura menor que 100 cm é 0,50 +0,1915 = 0,6915 ou 69,15%.
4. Qual é a probabilidade de uma criança ter altura entre 103 cm e 110 cm?
Para 103 z = 0,50 sendo que a probabilidade de 0 < z < 0,50 é 0,1915
Para 110 z = 1,67 sendo que a probabilidade de 0 < z < 1,67 = 0,4525
A probabilidade de ser maior que 103 e menor que 107 é igual a 0,4525 –
0,1915 = 0,2610 ou 26,10%.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 34/133
4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.
5. Bland M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.6. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
7. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.
8. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,
2003.
9. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.
10. GUIMARÃES RC, CABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.
11. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.
13. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.
14. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e Científicos
Editora Ltda, 1999.
15. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.
16. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 35/133
ESTATÍSTICA DESCRITIVA
André Moreno Morcillo1
A divulgação de dados de pesquisa requer o uso de técnicas universalmente reconhecidas, de tal
forma, que os trabalhos e relatórios possam ser lidos e avaliados por pesquisadores em
diferentes cidades ou países.
Esta parte da estatística, cujo objetivo é sintetizar e tornar clara a apresentação de dados, é
chamada de estatística descritiva. Entre outras técnicas, utiliza as tabelas, os gráficos, as
medidas de tendência central, de dispersão e de posição, etc.
TABELAS
a) DISTRIBUIÇÃO DE FREQÜÊNCIAS
Para obtermos uma distribuição de freqüência de dados categóricos, basta contarmos quantos
casos ocorrem em cada categoria. Quanto aos dados numéricos, inicialmente criamos os
intervalos de classe e, posteriormente, contamos quantos casos ocorrem em cada intervalo.
As freqüências das categorias ou intervalos de classe podem ser expressas por seu número
absoluto, pela proporção em relação ao total de casos ou pela porcentagem.
Avaliação nutricional pelo critério de Gomez de 521 crianças de pré-escolas da cidade de
Paulínia – São Paulo (Zanolli,1992)2.
Estado NutricionalFreqüência absoluta
(N)Porcentagem
(%) Proporção
Eutrófico 412 79,1 0,79Desnutridos de Iº 104 20,0 0,20
Desnutridos de IIº 5 1,0 0,01
Desnutridos de IIIº 0 0 0
Total 521 100,0 1,0
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 36/133
Neste caso é conveniente fazer a aproximação para três casas decimais.
O calculo da porcentagem de uma determinada categoria é muito simples: divide-se afreqüência absoluta pelo total e multiplica-se por 100.
No exemplo anterior, para o grupo dos eutróficos seria:
% = 412 : 521 x 100 = 79,07869
Geralmente fazemos a aproximação para uma casa decimal que, no exemplo acima, resulta
79,1%.A interpretação destes dados é muito simples. Ao lermos a tabela verificamos que 412 crianças
entre as 512 eram nutridas, o que corresponde a 0,790 ou 79,1% do total.
Em algumas circunstâncias pode interessar ao pesquisador apresentar também a freqüência
acumulada.
Avaliação nutricional pelo critério de Gomez de 521 crianças de pré-escolas da cidade de
Paulínia – São Paulo (Zanolli, 1992)3
Estado NutricionalFreqüência absoluta
(N)
Porcentagem
(%)
Porcentagem acumulada
(%)
Eutrófico 412 79,1 79,1
Desnutridos de Iº 104 20,0 99,1
Desnutridos de IIº 5 1,0 100,1
Desnutridos de IIIº 0 0 0
Total 521 100,1 100,1
Quando trabalhamos com variáveis numéricas contínuas torna-se necessário agrupar os dados para poder apresentá-los na forma de distribuição de freqüências. Os dados são agrupados em
intervalos de classes, cujo número não deve ser pequeno ou muito grande, recomendando-se que
varie de 5 a 20. Há algumas fórmulas para determinar o número de classes, mas a lógica e o
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 37/133
Distribuição da idade(anos) de 521 crianças de pré-escolas da cidade de Paulínia –
São Paulo (Zanolli, 1992)4.
Classes de Idade(meses)
Freqüência absoluta(N)
Porcentagem(%)
36,0 –| 48,0 35 6,748,0 –| 60,0 70 13,460,0 –| 72,0 168 32,272,0 –| 83,9 204 39,284,0 –| 96,0 44 8,4
Total 521 99,9
b) DISTRIBUIÇÃO DE FREQÜÊNCIA DE UMA AMOSTRA EM RELAÇÃO A DUAS VARIÁVEIS
QUALITATIVAS – TABELA DE CONTINGÊNCIA
Neste caso o objetivo é contruir uma tabela contendo informações sobre o comportamento de
uma população ou amostra com relação a duas variáveis.
Distribuição de 521 crianças de pré-escolas da cidade de Paulínia – São Paulo em relação ao sexo eà idade (Zanolli,1992)5.
Sexo
Classes de Idade(meses) Feminino
N (%)Masculino N (%)
Total
N (%)
36,0 – 47,9 15 (42,9) 20 (57,1) 35 (100,0)
48,0 – 59,9 41 (58,6) 29 (41,4) 70 (100,0)
60,0 – 71,9 81 (48,2) 87 (51,8) 168 (100,0)
72,0 – 83,9 99 (48,5) 105 (51,5) 204 (100,0)
84 0 95 9 24 (54 5) 20 (45 5) 44 (100 0)
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 38/133
Avaliação nutricional pelo critério de Gomez em relação sexo de 567 crianças matriculadas nas 14creches do município de Paulínia – SP, 1995 (Antonio,1995)6 .
Sexo Eutrofia D. Leve D. Moderada Total
Masculino 221 (81,0) 49 (17,9) 3 (1,1) 273
Feminino 227 (77,2) 66 (22,4) 1 (0,3) 294
Total 448 (79,0) 115 (20,3) 4 (0,7) 567
D. Leve – desnutrição de Iº grau; D. Moderada – Desnutrição de IIº; N (%)
GRÁFICOS
Os dados categóricos podem ser apresentados em gráficos do tipo setorial e de barras, enquanto
os numéricos podem ser apresentados na forma de histograma, diagrama esquemático (box-plot)
e de erro padrão.
a) GRÁFICOS SETORIAIS
Os gráficos setoriais (pie chart, “pizza”) são indicados para apresentar a distribuição de dados
qualitativos. A área do círculo atribuída para cada categoria é proporcional à sua freqüência. A
maneira mais prática para determiná-la, sabendo-se que ao total (100%) corresponde um ângulo
de 360º, é:
Ângulo desejado = (% x 360)/100
Por exemplo, para uma freqüência de 45% devemos tomar um ângulo de 162º:
Ângulo desejado = (45 x 360)/100 = 162º
A seguir apresentamos um gráfico setorial com os dados do exemplo anterior.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 39/133
b) GRÁFICOS DE BARRA
Da mesma forma que o anterior, este tipo de gráfico é indicado para apresentar a freqüência dedados qualitativos. Neste caso a freqüência está relacionada à altura da barra, sendo que as
barras devem ter a mesma largura.
A seguir apresentamos um gráfico de barras com os dados do exemplo anterior.
No figura seguinte apresentamos um gráfico de barras expressando a freqüência em relação aos
grupos etários e sexo de uma amostra.
40
50
60
70
Eutroficos
Desnutridos Iº Desnutridos IIº Desnutridos IIIº Estado Nutricional
0
20
40
60
80
100
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 41/133
z - s c o r e
5
4
3
2
1
0
-1
-2
-3
-4
2441109949025245964158824326748085003533348449152366329418422270859
457836792390351953748662833275467446444663010985413426582078241117594447
2733
1466
Mínimo
Máximo
Mediana
Iº uartil
IIIº Quartil
e) GRAFICO DE ERRO PADRÃO
Este gráfico apresenta o intervalo de confiança da média populacional de dados quantitativos.
A partir de uma amostra, calculamos a média e o erro padrão. Desenhamos um segmento de reta
com comprimento igual ao intervalo de confiança da média da população e assinalamos a média
da amostra.
95
%CI
z-
sco
,06
,05
,04
,03
,02
,01
0 00
Média da
amostra
Intervalo deconfiança
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 42/133
f) DIAGRAMA DE DISPERSÃO O diagrama de dispersão é uma apresentação gráfica da relação existente entre duas variáveis
quantitativas. No exemplo abaixo o gráfico expressa a distribuição da altura em relação à idade,
podendo-se observar que como o aumento da idade ocorre um aumento na altura.
Idade (anos)
161412108642
A l t
u r a ( c m )
170
160
150
140
130
120
110
100
90
Alguns tipos de gráficos não foram aqui apresentados (de linhas, de área, etc.) mas que devem
ser considerados úteis.
A recomendação final é, se possível, evitar os gráficos em três dimensões, cuja interpretação
pelo leitor fica comprometida. No exemplo abaixo apresentamos os mesmos dados apresentados
em gráficos de duas e três dimensões.
60
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 43/133
Para a apresentação de dados quantitativos, além das tabelas e gráficos, podemos utilizar
alguns métodos numéricos, cujo objetivo é descrever o que ocorre no centro da distribuição e a
forma como os dados da amostra estão dispersos. Estes métodos podem ser divididos em:
• MEDIDAS DE TENDÊNCIA CENTRAL: média, moda e mediana
• MEDIDAS DE DISPERSÃO: amplitude máxima, amplitude interquartil, variância, desvio
padrão e coeficiente de variação• MEDIDAS DE POSIÇÃO: quartis e z-score
MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA ARITMÉTICA
A média aritmética é a soma dos valores medidos, dividida pelo número de casos. Indicamos a
média de uma população por µ e a da amostra por x .
N
X ∑=µ
ΣX = soma dos valores da população N = número de casos da população
n
x x ∑=
Σx = soma dos valores da amostran = número de elementos da amostra
Exemplo: dado um conjunto de números [ 100; 101; 105,2; 99,2; 100,5] sua média será:
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 44/133
( )93,18
5
5,1002,992,10510160=
++++= x
A troca de um único elemento da amostra causou uma diminuição de 8 unidades na média.
A média aritmética representa com certeza o centro da distribuição, quando as variáveis têm
distribuição simétrica.
MEDIANA
Se ordenarmos a amostra (ordem crescente), a mediana (percentil 50º ou IIº quartil) é o valor da
variável do elemento que ocupa o centro da distribuição. A mediana divide a amostra em dois
grupos que têm o mesmo número de casos, sendo que metade destes têm valores menores que a
mediana e a outra metade, valores maiores.
Para a sua determinação, primeiramente a amostra deve ser ordenada (ordem crescente) e, a
seguir, identifica-se o elemento que ocupa a posição central. O valor da variável deste elemento
será a mediana.
No exemplo anterior - dado um conjunto de números [ 100; 101; 105,2; 99,2; 100,5] :
Inicialmente ordenamos os dados – [99,2; 100; 100,5; 101; 105,2]
Ordem 1º 2º 3º 4º 5º
Valor 99,2 100 100,5 101 105,2
O centro da distribuição é ocupado pelo 3º elemento cujo valor é 100,5. A mediana destaamostra é 100,5
md = 100,5
A etapa fundamental na determinação da mediana é a identificação do elemento que
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 45/133
b) O número de casos da amostra é par
Nesta circunstância dois elementos ocupam o centro da distribuição, cujas ordens podem ser
determinadas por:
2
nElementoPrimeiro =
12
nElementoSegundo +=
n = número de casos da amostra.
A mediana será estimada por interpolação, correspondendo à média aritmética dos valores
destes dois elementos.
Por exemplo, se tivermos uma amostra com 10 elementos:
º52
10ElementoPrimeiro == º612
10ElementoSegundo =+=
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
↓ ↓
Outro exemplo: em um conjunto de 6 elementos [100; 105; 101; 98; 99; 103]
1. ordenamos a amostra: - [98; 99; 100; 101; 103; 105]
2. determinamos os elementos centrais:
Primeiro elemento = 6 / 2 = 3º
Segundo elemento será o 4º
1º 2º 3º 4º 5º 6º
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 46/133
MODA
A moda expressa os valores que têm maior freqüência no grupo de estudo.
Uma vez realizada a distribuição de freqüências, fica fácil determinar a moda: basta identificar o
valor ou valores que apresentam maior freqüência.
Podemos ter distribuições de dados sem moda, com uma moda (unimodal), com duas (bimodal)
ou mais de duas modas (multimodal).
No exemplo acima todos os valores ocorrem uma única vez, portanto esta distribuição nãoapresenta moda.
Ao tomarmos uma amostra com 15 crianças de uma escola, poderíamos obter as seguintes
idades (anos):
7; 6; 7; 7; 8; 5; 4; 7; 8; 9; 7; 7; 7; 7;7
A distribuição de freqüências será:
Valor Freqüência4 15 16 17 9
8 2
9 1
A idade que apresentou a maior freqüência é 7 anos; portanto, a moda desta distribuição é 7
anos.
MEDIDAS DE DISPERSÃO
APLITUDE MÁXIMA [RANGE]
A amplitude máxima é a diferença existente entre o maior (máximo) e o menor (mínimo) valor
observado Por ser uma medida de dispersão calculada a partir de dois elementos expressa de
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 47/133
VARIÂNCIA
Para determinar a variância calculamos a diferença (desvio) de cada elemento da amostra em
relação à média aritmética. A seguir, estas diferenças (desvios) são elevadas ao quadrado e,
finalmente, calculamos a sua média.
Indicamos a variância de uma população por σ2 e de uma amostra por s2
( ) N
X ∑ −= µσ2
2
Quando trabalhamos com amostras, temos o interesse de que a variância (s2) calculada seja
representativa da variância da população. Levando em conta este fato, a variância da amostra
deve ser calculada pela fórmula:
( )1
2
2
−
−=∑ n
x x
s
Observe que a soma dos quadrados dos desvios foi dividida por (n-1).
Exemplo: considerando as idades (anos) de uma amostra de 10 crianças:
7; 5; 6; 7; 8; 6; 6; 8; 5; 4
1. calculamos a média
( )2,6
10
4586687657=
+++++++++= x
2. montamos uma tabela para facilitar os cálculos.
Idades ( ) x x − desvio
( ) x x −2
desvio2
7 0,8 0,645 -1,2 1,446 -0,2 0,047 0,8 0,648 1 8 3 24
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 48/133
Se tivermos um pouco de paciência, por transformações algébricas simples, podemos
desenvolver (∑ − x x 2
) , chegando a uma expressão equivalente, que apresenta a vantagem de
não usar a média.
( ) ( )
n
x x x x
∑−=− ∑∑
2
22
Assim, passamos a contar com uma nova maneira de calcular a variância:
( )
1
2
2
2
−
∑−
=∑
n
n
x x
s
Retomando o exemplo anterior e aplicando este novo método temos:
Idades x x2
7 7 495 5 256 6 367 7 498 8 646 6 36
6 6 368 8 645 5 254 4 16
Total 62 400
( )anos 73331
9
615
910)62(
2
400
1
2
22 2 , ,
n
n
x x
s ==−
=−
∑−∑
=
DESVIO PADRÃO
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 49/133
Como o desvio padrão é a raiz quadrada da variância, ele passa a receber a unidade original em
que os dados foram medidos. No exemplo anterior a unidade da variância era anos2 e a do
desvio padrão é anos.
O desvio padrão representa quanto, em média, cada observação está distante da média. Quanto
mais próximas da média, menor será o desvio padrão, quanto mais distantes maior ele será.
Quando em uma amostra todas as observações têm o mesmo valor, o desvio padrão será igual a
zero.
COEFICIENTE DE VARIAÇÃO
O coeficiente de variação é a razão entre o desvio padrão e a média da amostra, expressa em
porcentagem. O coeficiente de variação é uma medida usada para comparar as dispersões de
duas amostras.
100. x
sCV =
Por exemplo: deseja-se saber se a dispersão das idades de alunos de duas classes são muito
diferentes:
Classe A – x =10,2 e s = 2,4 %5,23100.2,10
4,2100. ===
x
sCV
Classe B – x =8,9 e s = 3,2 %9,35100.9,8 2,3100. === x sCV
A dispersão da classe B é 1,52 vezes à da classe A.
MEDIDAS DE POSIÇÃO
QUARTIS
Estando a amostra ordenada (crescente), os quartis são valores da variável que dividem o
conjunto dos dados em quatro partes iguais, cada uma contendo 25% dos casos.
O Iº quartil corresponde ao percentil 25º; o IIº quartil correponde ao percentil 50º, sendo
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 50/133
P25
Iº Quartil
↓
P50
Mediana
IIº Quartil
↓
P75
IIIºQuartil
↓
25% dos casos 25% dos casos 25% dos casos 25% dos casos
→ Amplitude Interquartil ←
Inicialmente ordenamos a amostra (crescente) e, a seguir, identificamos os elementos que
dividem a população em quatro grupos com igual número de casos.
Para determinar a ordem do elemento que corresponde ao percentil desejado, utiliza-se a
seguinte fórmula:
( )100
P.1nJ
+=
onde n é o tamanho da amostra e P o percentil desejado.
Abaixo apresentamos exemplos da forma de se determinar o elemento correspondente ao Iº
quartil, IIIº quartil e à mediana
Para o Iº Quartil:
( )
100
251n
J
×+
=
Para o IIIº Quartil:( )
100
751nJ
×+=
Para a mediana:( )
100
051nJ
×+=
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 51/133
( ) ( )
−
++= x x x g
J1J.Quartil
J
Por exemplo, para calcular o Iº quartil quando n = 11, :
( )3
100
2512
100
25111J =
×=
×+=
Como J = 3 é um número inteiro, o Iº quartil será o valor da variável do elemento de ordem
j = 3
Por outro lado, para calcular o Iº quartil quando n = 10:
( )75,2
100
2511
100
251nJ =
×=
×+=
como J = 2,75 não é um número inteiro temos:
j = 2 ; (j + 1) = 3; g = 0,75
Aplicando a fórmula para interpolação teremos:
xxx 2320,75.Quartil −+=
Basta verificar o valor X2 e X
3 na série ordenada e realizar o cálculo para se obter a estimativa
do Iº quartil.
Z-SCORE
O z-score é a posição relativa dos elementos da amostra em relação à média aritmética. O
objetivo é expressar em unidades de desvio padrão quanto um determinado caso está distante da
média.
Para o cálculo do z-score é necessário conhecer a média e o desvio padrão. A partir deste dados,
utilizamos a fórmula:
( )
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 52/133
Inicialmente calculamos e média e o desvio padrão:
101,18= x e s = 2,34
O z-score de 105,2 é:
( )71,1
34,2
18,1012,105scorez =
−=
−=−
s
x x
Este elemento está situado 1,71 unidades de desvio padrão acima da média
O z-score de 100 é:
( )50,0
34,2
18,1010,100scorez −=
−=
−=−
s
x x
Este caso está situado 0,50 unidades de desvio padrão abaixo da média
O z-score de 101,18 é:
( )0
34,2
18,10118,101scorez =
−=
−=−
s
x x
Z-score = 0 significa que o caso tem valor igual à média
ANÁLISE EXPLORATÓRIA DE DADOS
Antes de iniciar a descrição da amostra ou mesmo a aplicação de testes estatísticos é necessário
fazer uma análise preliminar, cujo objetivo é conhecer a intimidade dos dados e detectar
possíveis erros que possam interferir com os resultados da pesquisa.
Os dados suspeitos são aqueles que estão muito distantes do centro da distribuição, que até podem ocorrer, mas que, às vezes, resultam de erro de medida, de anotação ou de digitação.
Por exemplo, em um estudo sobre altura de crianças de idade escolar, encontramos casos com
l i l h id d d di i
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 53/133
o mínimo, o Iº quartil, a mediana, o IIIº quartil e o máximo. Com estes pontos calculamos a
amplitude interquartil (AIQ). A seguir construímos um gráfico que recebe o nome de Diagrama
Esquemático (Box-Plot).
Marcamos o mínimo e o máximo; desenhamos um retángulo que passa por Q1 e Q3; no interior
do retángulo assinalamos a mediana. Desenhamos dois segmentos de reta com comprimento
igual a 1,5 a AIQ. O primeiro, acima do bordo superior do retángulo e o outro, abaixo da bordo
inferior. Na figura abaixo apresentamos, com finalidade didática, a estrutura do diagrama
esquemático na posição horizontal.
* *
↑
mínimo
↑
Q1
↑
mediana
↑
Q3
↑
máximo
Os casos cujos valores não estão incluídos entre os dois extremos dos segmentos de reta devem
ser reavaliados antes de se prosseguir na análise dos dados. Na figura abaixo apresentamos um
típico gráfico de box-plot.
v a l o r e s a b s o l u t o
s
80
60
40
20
0
-20
8893232687238418377897888461293442635933221989413609448465743324709757093018221683976144415138748706649835291093148450327648261863076
6710
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 54/133
BIBLIOGRAFIA
1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall, 1991.
2. A NDERSON DR, SWEENEY DJ, WILLIAMS TA – Estatística aplicada à administração e economia.
2ª ed. São Paulo: Pioneira, 2002.
3. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação de Pesquisas
Científica de Ribeirão Preto, 2002.
4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.
5. Bland M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.
6. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
7. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.
8. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,
2003.
9. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.10. GUIMARÃES RC, CABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.
11. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.
13. PIEDRABUENA AE – Elementos de bioestatística. Unicamp [apostila], 1995.
14. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.
15. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e CientíficosEditora Ltda, 1999.
16. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.
17. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 55/133
TESTE DE HIPÓTESES
André M. Morcillo 1
“O objetivo fundamental é verificar se os dados amostrais (ou estimativas obtidasa partir deles) são ou não compatíveis com determinadas populações (ou comvalores previamente fixados dos correspondentes parâmetros populacionais.”
Trata-se, na verdade, de uma forma lógica de organização do pensamento, que nos ajudará adecidir se os resultados obtidos na pesquisa confirmam ou contradizem os dados existentes atéentão na literatura.
Tomar decisões é parte do nosso cotidiano:
Decidir sobre o trajeto para ir à cidade; qual roupa colocar para ir a uma festa; qual escolacolocar os filhos; quando realizar a compra de um automóvel melhor e mais caro; comprar ou
não os livros de Bioestatística; etc.Em todos os casos pondera-se as vantagens e os riscos. Em condições normais, um adulto sadio,sempre escolherá a opção que lhe ofereça mais vantagens e menor risco.
Este processo é automático – não se escrevem as hipóteses, não se aplica um método técnico,não se calculam as probabilidades. Isto se deve ao fato de que ao longo dos anos fomostreinados para realizar estas tarefas.
No entanto, quando o empreendimento é muito importante – comprar uma nova casa, viajar ao
exterior, etc. – reunimos a família várias vezes, com muito papel e lápis e, após muitas horas emuita ansiedade, decide-se sobre o assunto.
Importante: em todos os casos sabíamos com clareza qual era o nosso problema,conhecíamos os riscos.
Decidir sobre o trajeto de uma viagem implica em ter conhecimento dos problemas de trânsitolocal, da planta da cidade, etc. Não há como decidir sobre o melhor trajeto a ser tomado em umacidade desconhecida, de um país desconhecido.
Quanto a roupa, temos que saber como será a festa: uma reunião de amigos, uma solenidadeformal com autoridades, etc.
Não se pode decidir sobre a compra de uma nova casa se não se sabe como ela é, em qual bairro, rua ou cidade está localizada.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 57/133
♦ A Hipótese Alternativa (H1)
Ela expressará a hipótese de trabalho do pesquisador, recomendando-se que sempre sejaestabelecida na forma de “diferenças” do tipo maior que, menor que, diferente de.
Novamente, em relação às crianças asmáticas.
H1: a média das alturas das crianças asmáticas de nível social menos favorecido é menor que amédia das crianças asmáticas de nível social superior.
Do ponto de vista da Bioestatística escrevemos:
H1: µ NSB < µ NSA
Finalmente, temos:
H0: µ NSB > µ NSA
H1: µ NSB < µ NSA
• Nível de Significância (α)
É um ponto de corte arbitrário, adotado pelo pesquisador, para definir um risco máximo que se
pode corre ao rejeitar H0 em função dos resultados obtidos. Na verdade temos uma distribuição de probabilidades sob condição de H0. Se encontramos nonosso experimento uma probabilidade de ocorrência do evento sob H0 muito pequena, sabemosque é pequena (≤α) a probabilidade de rejeitarmos H0 sendo ela verdadeira.
• Testes Unilaterais e Bilaterais
Os testes são unilaterais quando eles exprimem claramente qual é o sentido da diferença que seestuda (maior que ou menor que). Por outro lado, quando o pesquisador não sabe exatamente oque busca, ele define H1 coma uma diferença (por ser maior que ou menor que)
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 58/133
Bilaterais:
H0: µ NSB = µ NSA
H1: µ NSB ≠ µ NSA
• Erros tipo I e tipo II
Em relação a H0 pode-se cometer dois tipos de erro:
a) ela é rejeitada sendo verdadeira
Neste caso temos o erro tipo I que é determinado pelo pesquisador ao definir o nível designificância (α) = 1%, 5%, 10%, etc
b) ela não é rejeitada sendo falsa
Neste caso temos o erro tipo II cuja probabilidade é β. É mais difícil de ser controlado pelo pesquisador e está relacionado ao α e ao N.
Para um determinado N ao diminuirmos α consequentemente elevamos β.
Como o pesquisador define α previamente e o mantém fixo durante a pesquisa, a única maneirade diminuir β é aumentar o tamanho da amostra (N).
Chama-se poder de um teste a probabilidade complementar de β que é igual a:
Poder = 1- β
A condição ideal para o pesquisador é aquela em que tanto α quanto β são pequenos.
Decisões possíveis em um teste de hipóteses
H0 é verdadeira H0 é falsa
Rejeita-se H0 Erro tipo I (α) decisão correta (1-β)
Aceita-se H0 decisão correta (1-α) Erro tipo II (β)
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 59/133
ETAPAS DE UM TESTE DE HIPÓTESES
Tomada de decisão
Seleciona-se e aplica-se um teste
estatístico
Levantamento dos dados
Estabelece-se H0 e H1
Determina-se N, e
Revisão da literatura
Faz-se um questionamento
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 60/133
BIBLIOGRAFIA
1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall, 1991.
2. A NDERSON DR, SWEENEY DJ, WILLIAMS TA – Estatística aplicada à administração e economia.
2ª ed. São Paulo: Pioneira, 2002.
3. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.
4. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
5. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.
6. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,
2003.
7. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.8. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.
9. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.
10. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
T K S
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 61/133
TESTE DE K OLMOGOROV-SMIRNOV
André M. Morcillo
1
Esta prova avalia se duas amostras têm distribuições semelhantes ou, melhor dizendo, se foram
extraídas de uma mesma população. Se as diferenças observadas entre elas forem grandes é
provável que não se devam ao acaso. É muito sensível, detectando diferenças em relação à
tendência central, dispersão e simetria. Pode ser utilizada para dados medidos nas escalas
ordinal, intervalar ou de razão, não havendo a exigência que estes tenham distribuição normal.
O princípio básico é comparar as freqüências acumuladas das duas amostras.
PROCEDIMENTOS
1. Ordenamos as duas amostras2. Construímos as distribuições de freqüências acumuladas nos intervalos de classe de cada
amostra
3. Calculamos as diferenças entre as freqüências acumuladas de cada amostra em cada um dos
intervalos de classe. Este capítulo está estruturado sempre considerando as diferenças entre
a primeira e a segunda amostra (A-B)
4. Escolhemos a maior diferença [Dmax] que será comparada com Dcrítico
Se D ≥ Dcrítico rejeitamos a hipótese de igualdade das amostras.
DETERMINANDO D
a) Quando n1 = n2 ≤ 40
Neste caso o procedimento é simples. Uma vez estabelecidos os intervalos de classe,
d t i f üê i l d d d t A i l l dif
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 62/133
b) Quando n1 ou n2 > 40 ou n1 ≠ n2
Neste caso, deve-se determinar a proporção que cada amostra apresenta nos intervalos de classe.A seguir, calculamos as diferenças entre as proporções de cada amostra nestes intervalos de
classe.
Lembre-se que a proporção de casos dentro de uma determinada classe é igual à freqüência
observada na classe dividida pelo número de casos da amostra. Seja f i a freqüência em uma
classe i e n o número de casos da amostra, a proporção pi na classe i será:
nf i pi =
O valor de Dmax será o valor absoluto de uma das diferenças e será escolhido considerando o
teste de hipóteses estabelecido:
A diferença com maior valor absoluto |D| para os testes bilaterais, ou o valor absoluto da
diferença com menor valor negativo ou com o maior valor positivo nos testes unilaterais.
TESTE DE HIPÓTESES
1. TESTES BILATERAIS
H0 : as amostras têm a mesma distribuição H1 : as amostras têm distribuições diferentes
Nos teste bilaterais seleciona-se a diferença com maior valor absoluto, que será chamada de
Dmax para comparação com Dcrítico .
Se |Dmax| ≥ Dcrítico,α rejeitamos H0, concluindo que as populações têm distribuições diferentes.
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 63/133
Se D
+
≥ Dcrítico,α rejeitamos H0, concluindo que a população A tem valores maiores que a população B.
b) A POPULAÇÃO A É MENOR QUE A B
H0 : a população A tem distribuição diferente sendo seus valores iguais ou maiores que a população B
H1 : a população A tem distribuição diferente sendo seus valores menores que a população B
Neste caso seleciona-se a diferença com o menor valor negativo, cujo valor absoluto será
simbolicamente chamado de D- .
Se D- ≥ Dcrítico,α rejeitamos H0, concluindo que a população A tem valores menores que a
população B.
O VALOR DE DCRITICO
A) QUANDO AS AMOSTRAS SÃO PEQUENAS E DE MESMO TAMANHO ( N1 = N2 ≤ 40 )
Neste caso o valor de Dcrítico é obtido na tabela de distribuição de D para pequenas amostras.
B) GRANDES AMOSTRAS EM TESTES BILATERAIS
Se n1 ou n2 são maiores que 40, seja n1 = n2 ou n1 ≠ n2, obtém-se o valor de Dcrítico através
das fórmulas:
Para α=0,05 ⇒ nnnnD
21
21
critico1,36
×
+×=
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
C) GRANDES AMOSTRAS EM TESTES UNILATERAIS
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 64/133
C) GRANDES AMOSTRAS EM TESTES UNILATERAIS
Se n1 ou n2 são maiores que 40, seja n1 = n2 ou n1 ≠ n2, utiliza-se um teste de χ 2 obtido a
partir da fórmula abaixo, com dois graus de liberdade:
nnnnDχ
21
212
max
24
+
×××=
Se o χ 2 calculado for maior ou igual ao χ
2crítico pode-se rejeitar H0.
Os valores críticos de χ 2 com 2 graus de liberdade são:
Nível de significânciaα χ 2crítico
0,05 5,99
0,01 9,21
0,001 13,82
Observação: Esta fórmula pode ser usada na comparação de amostras pequenas que tenham
diferentes número de casos (n1 ≠ n2 < 40). Neste caso a prova é muito segura. Se H0 é rejeitada,
pode-se ficar “estatisticamente” tranqüilos.
Exemplo para n1=n2<40 – Foram sorteadas 10 meninos e 10 meninas de uma classe de terceira
série do ensino fundamental. Deseja-se saber se há diferença entre as idades dos dois grupos. A
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
Como o número de meninos (n1) é igual ao de meninas (n2) e menores que 40 o valor de D íti
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 65/133
Como o número de meninos (n1) é igual ao de meninas (n2) e menores que 40, o valor de Dcrítico
é obtido na tabela de D.
Para um teste bilateral com N=10 e α=0,05, temos Dcrítico = 7
a) ordenamos os valores das amostras
b) Usando intervalos de classe de 6 meses, montamos a tabela abaixo
Classe de
idadeMeninos Meninas
f acum
Meninos
f acum
Meninas
Diferença
das f acum |D|
7,0 |– 7,5 1 3 1 3 -2 2
7,5 |– 8,0 4 2 5 5 0 0
8,0 |– 8,5 2 3 7 8 -1 1
8,5 |– 9,0 1 2 8 10 -2 2
9,0 |– 9,5 2 0 10 10 0 0
Como o teste é bilateral tomamos a diferença entre as freqüências acumuladas com maior valor
absoluto | D | = | -2 | = 2 , portanto, Dmax = 2.
Como o Dmax é menor que o Dcrítico,α ( 2 < 7 ) não podemos rejeitar H0, concluindo que os
dois grupos têm semelhantes distribuições de idade.
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 66/133
Exemplo para n1≠n2>40 – Sortearam-se ao acaso dois conjuntos com 45 elementos com a
expectativa que tivesssem média 100 e desvio padrão 15. Como este sorteio foi realizado
utilizando um software, deseja-se verificar se há diferença entre as duas amostras.
Grupo 1 Grupo 2
92 110 103 113 95 83
106 100 81 77 105 81
125 113 92 98 121 73
101 123 106 104 79 89
111 96 97 106 121 92
80 75 104 121 118 102
84 91 108 83 65 111
85 112 64 108 76 116
97 93 96 103 106 93
104 77 95 101 107 83
81 93 122 123 109 111
129 104 102 98 89 114
121 85 104 93 97 78
89 116 92 78 108 110
81 97 106 105 131 98
Procedimentos:
a) Estabelecemos os intervalos de classe
b) Determinamos as freqüências dentro de cada intervalo de classe
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
Grupo 1 Grupo 2 p1-p2
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 67/133
Grupo 1 Grupo 2 p1-p2
f f acumulada p1 f f acumulada p2
60 --| 65 1 1 0,022 1 1 0,022 0
65 --| 70 0 1 0,022 0 1 0,022 0
70 --| 75 1 2 0,044 1 2 0,044 0
75 --| 80 2 4 0,089 5 7 0,156 -0,067
80 --| 85 5 9 0,200 4 11 0,244 -0,044
85 --| 90 2 11 0,244 2 13 0,289 -0,045
90 --| 95 7 18 0,400 4 17 0,378 0,022
95 --| 100 6 24 0,533 4 21 0,467 0,066
100 --| 105 7 31 0,689 6 27 0,600 0,089
105 --| 110 5 36 0,800 7 34 0,756 0,044
110 --| 115 3 39 0,867 4 38 0,844 0,023
115 --| 120 1 40 0,889 2 40 0,889 0
120 --| 125 4 44 0,978 4 44 0,978 0
125 --| 130 1 45 1,000 0 44 0,978 0,022
130 --| 135 0 45 1,000 1 45 1,000 0
Total 45 45
A diferença entre as proporções das freqüências acumuladas com maior valor absoluto ocorreu
na classe [100 -- | 105], portanto, o nosso Dmax = | 0,089 | = + 0,089.
Considerando um teste bilateral com α = 0,05 temos:
0,28670,210818.1,3645.454545 .1,36
n2.n1n2n1 .1,36D 05crítico;0. ==+=+=
Como o valor do Dmax calculado é menor que o Dcrítico não podemos rejeitar H0.
Se por outro lado nosso teste de hipóteses fosse unilateral teríamos que calcular o χ2 e
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 68/133
Tabela de Dcrítico do teste de Kolmogorov-Smirnov para duas amostras pequenas e
independentes (n1 = n2 ≤ 40).
Testes Unilaterais Teste Bilaterais N
α=0,05 α=0,01 α=0,05 α=0,01
3 3 - - -4 4 - 4 -5 4 5 5 56 5 6 5 67 5 6 6 68 5 6 6 79 6 7 6 710 6 7 7 8
11 6 8 7 812 6 8 7 813 7 8 7 914 7 8 8 915 7 9 8 916 7 9 8 1017 8 9 8 1018 8 10 9 1019 8 10 9 1020 8 10 9 1121 8 10 9 1122 9 11 9 1123 9 11 10 1124 9 11 10 1225 9 11 10 1226 9 11 10 1227 9 12 10 1228 10 12 11 1329 10 12 11 1330 10 12 11 1335 11 13 12 -40 11 14 13 -
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 69/133
BIBLIOGRAFIA
1. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
2. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,
2003.
3. CAMPOS H – Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de
Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universiade de São
Paulo, 1979.
4. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.
5. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.
6. SIEGEL S – Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975.
7. VIEIRA S – Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003.
8. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 70/133
TESTE DE K RUSKAL-WALLIS
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 71/133
André M. Morcillo1
Este teste foi proposto para avaliar se três ou mais amostras são iguais (procedentes de uma mesma
população) ou diferentes. É o substituto da Análise de Variância quando esta não pode ser utilizada, já
que não exige a homogeneidade das variâncias, que as amostras tenham sido tomadas ao acaso e que
tenham distribuição normal. As amostras devem ser independentes e medidas nas escalas ordinal,
intervalar ou de razão.
COMO FAZER
Dado um conjunto de N observações pertencentes a k amostras independentes:
1. Ordena-se em ordem crescente o conjunto das N observações (todas as amostras)
2. Atribui-se os postos ou ranks a cada observação. Quando houver empates cada elemento deverá
receber a média aritmética dos respectivos postos.
3. Soma-se os postos de cada amostra (R j)
4. Calcula-se (R j)2/n j
5. Calcula-se a estatística H
6. Toma-se a decisão quanto a rejeição de H0
TESTE DE HIPÓTESES
H0 : todas as amostras são iguais H1 : pelo menos uma amostra é diferente
CALCULANDO H
( ) ( )∑
=
+−+
=k
1 j j
2 j
1 N3..1 N N
12H
n
R
C Ã Ê
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 72/133
CORREÇÃO EM DECORRÊNCIA DE EMPATES
Quando ocorrerem empates entre observações, torna-se necessário realizar uma correção no H calculado,
dividindo-se H por um fator de correção C.
( )( )1.1.1
−+−=
N N N
T C
e
∑= T iT
f f iiT −=3
e
f i é o número de valores em cada grupo de empateaplicando-se a correção temos,
C
HH =
Exemplo: em um determinado estudo referente a notas de 30 alunos do ensino fundamental, observou-se
que vários alunos tiveram a mesma nota.Paulo, José e Maria tiveram nota 7,5 ; Joana, André, Juca e Pedro tiveram nota 8,5 ; Lara e Romeu
tiveram nota 8,9.
Três alunos receberam a nota 7,5 portanto f i = 3 ⇒ Ti = 33 - 3 = 24
Quatro alunos receberam a nota 8,5 portanto f i
= 4 ⇒ Ti = 43 - 4 = 60
Dois alunos receberam a nota 8,9 portanto f i = 2 ⇒ Ti = 23 - 2 = 6
T ΣT 24 60 6 90
TOMADA DE DECISÃO
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 73/133
TOMADA DE DECISÃO
a) QUANDO SÃO TRÊS AMOSTRAS COM PEQUENO NÚMERO DE CASOS (k=3 e n j 5)
Neste caso utiliza-se a tabela que fornece a probabilidade de H para três amostras de diferentes tamanhos.
Se a probabilidade de H for menor que α rejeita-se H0.
b) QUANDO SÃO MAIS QUE TRÊS AMOSTRAS OU ELAS TÊM GRANDE NÚMERO DE CASOS (k>3 ou n j>5)
Neste caso H tem distribuição de χ 2 com k-1 graus de liberdade. Uma vez estabelecido α procura-se na
tabela de distribuição de χ 2 o valor crítico de χ 2 para α e k-1 graus de liberdade.
Se H ≥ χ 2α,k-1 rejeita-se H0.
Exemplo com k = 3 e n<6 – Desejando saber se havia diferença entre as idades de crianças de três classesdiferentes, foram selecionadas aleatoriamente três grupos com cinco crianças
H0 : as três classes têm idades iguaisH1 : pelo menos uma das classes tem idade diferente
Nível de significância = 5% (α = 0,05)
Classe A Classe B Classe C8.5 8.1 9.1
8.9 8.2 8.6
7.3 8.4 9.3
Calculando Rj ; (Rj)2 e (Rj)2/n de cada classe
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 74/133
Calculando Rj ; (Rj) e (Rj) /n j de cada classe
Classe A Classe B Classe C
Idade Ranks Idade Ranks Idade Ranks
8.5 8 8.1 4 9.1 128.9 10 8.2 5 8.6 97.3 2 8.4 7 9.3 14
6.9 1 8.3 6 10.0 157.7 3 9.0 11 9.2 13Rj 24 33 63
(Rj)2 576 1089 3969
n j 5 5 5
(Rj)2/nj 115,2 217,8 793,8
Calculando H
Σ(Rj)2/nj = 115,2 + 217,8 + 793,8 = 1126,8
( )8,341)3.(15-.1126,8
11515.
12H =+
+=
Decidindo sobre H0
Consultando na tabela o valor de H para três amostras com 5 elementos, encontra-se que a probabilidade
fica entre 0,007 e 0,009. Desta forma H0 deve ser rejeitada concluindo-se que as classes não têm a
mesma idade.
Exemplo com k > 3 ou n > 6 – Foram tomadas ao acaso as alturas de algumas crianças do sexo masculino
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 75/133
Exemplo com k > 3 ou n > 6 Foram tomadas ao acaso as alturas de algumas crianças do sexo masculino
de quatro classes diferentes. Deseja-se saber se há diferença nas alturas dos quatro grupos.
H0 : as quatro amostras têm alturas iguais
H1 : pelo menos uma das quatro amostras tem alturas diferentes
Nível de significância: 5%
Guimarey Zanolli Marmo Morcillo
118,4 130,6 123,8 117,1
101,5 118,3 113 127,5
116,6 114,7 104,7 120,3
107,2 125,8 115,4 116,5
118,9 117,9 120,8 119,2
115,4 117,3 122,4 120,5
108 116,2 115,5 111,1
118,9 125,1 117,5 120,2
114,3 120 121,5 122,3
115 116,8 124
120
Ordena-se e atribui-se os postos ou ranks às observações
Calcula-se R j (soma dos postos de cada amostras), (R j)2 (o quadrado da soma dos postos de cada
amostra) e (R j)2/n j (quadrado da soma dos postos de cada amostra dividido pelo respectivo número de
Guimarey Zanollli Marmo Morcillo
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 76/133
Guimarey Zanollli Marmo Morcillo
Altura Rank Altura Rank Altura Rank Altura Rank
118,4 22 130,6 40 123,8 35 117,1 17
101,5 1 118,3 21 113,0 6 127,5 39
116,6 15 114,7 8 104,7 2 120,3 29
107,2 3 125,8 38 115,4 10,5 116,5 14
118,9 23,5 117,9 20 120,8 31 119,2 25
115,4 10,5 117,3 18 122,4 34 120,5 30
108,0 4 116,2 13 115,5 12 111,1 5
118,9 23,5 125,1 37 117,5 19 120,2 28
114,3 7 120,0 26,5 121,5 32 122,3 33
115,0 9 116,8 16 124,0 36
120,0 26,5
R j 118,5 221,5 197,5 282,5
(R j)2 14042,25 49062,25 39006,25 79806,25
n j 10 9 10 11
(R j)2/n j 1404,225 5451,361 3900,625 7255,114
Calcula-se a soma de todos os (R j)2/n j
∑=
=4
1
2
32475,18011 j j
j
n R
Como ocorreram empates há a necessidade de se calcular o fator de correção C
Tratamento dos empates
Calculando o fator de correção C
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 77/133
Calculando o fator de correção C
( )( ) ( )( )999718,0
140.140.40
181
1.1.1 =
+−−=
+−−=
N N N
T C
Calculando o valor de H
79018,841332475,180114140
12=×−×
×= H
Calculando o H corrigido pelos empates
79266,8999718,0
79018,8== H
Verificando o χ2 crítico
Como são quatro amostras, H deve ser comparado com o χ2 , considerando α=0,05 e 3 graus
de liberdade (número de amostras menos um). Neste caso χ20,05;3 = 7,82
Tomada de decisão
Como H é maior que χ20,05;3 rejeita-se H0.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 78/133
Limites de probabilidade da distribuição de H no teste de Kruskal-Wallis(k=3), com n1≤ n2 ≤ n3≤ 6. [ p é a probabilidade de H ≥ h P0(H ≥ h) = p]
n1 n2 n3 h p n1 n2 n3 h p n1 n2 n3 h p
1 1 4 3.571 .200 1 4 5 4.860 .056 2 3 3 3.778 .2001 1 5 3.857 .143 4.986 .044 4.556 .1001 2 2 3.600 .200 6.840 .011 5.139 .061
1 2 3 3.524 .200 6.954 .008 5.556 .0254.286 .100 7.364 .005 6.250 .0111 2 4 3.161 .190 1 5 5 2.946 .227 2 3 4 3.311 .203
4.018 .114 3.236 .188 3.444 .1974.821 .057 4.036 .105 4.444 .102
1 2 5 3.333 .190 4.109 .086 4.511 .0984.200 .095 4.909 .053 5.400 .0515.000 .048 5.127 .046 5.444 .0465.250 .036 6.836 .011 6.300 .011
1 3 3 3.286 .157 7.309 .009 6.444 .0084.200 .095 7.746 .005 7.000 .0055.000 .048 8.182 .002 2 3 5 3.386 .2015.250 .036 2 2 2 3.714 .200 3.414 .193
1 3 3 3.286 .157 4.571 .067 4.494 .1014.571 .100 2 2 3 3.750 .219 4.651 .0915.143 .043 3.929 .181 5.106 .052
1 3 4 3.208 .200 4.464 .105 5.251 .0494.056 .093 4.500 .067 6.822 .0105.208 .050 4.714 .048 6.909 .0095.833 .021 5.357 .029 6.949 .006
1 3 5 3.218 .190 2 2 4 3.458 .210 7.182 .0044.018 .095 3.667 .190 2 3 6 5.227 .0524.871 .052 4.458 .100 5.348 .0464.960 .048 5.125 .052 6.061 .0266.400 .012 5.500 .024 6.136 .023
1 4 4 3.000 .222 6.000 .014 6.727 .011
3.267 .178 2 2 5 3.333 .206 6.970 .0094.067 .102 3.360 .196 2 4 4 3.354 .2104.867 .054 4.293 .122 3.464 .1924.967 .048 4.373 .090 4.446 .1036.667 .010 5.040 .056 4.554 .098
1 4 5 3.000 .208 6.133 .013 5.236 .0523.087 .194 6.533 .008 5.454 .0463.960 .102 2 2 6 5.018 .050 6.546 .0203.987 .098 5.345 .038 6.873 .011
5.527 .036 7.036 .0065.745 .021 7.854 .0026.545 .011 2 4 5 3.364 .2006.654 .008 4.518 .101
4.541 .0985.268 .051
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 79/133
Limites de probabilidade da distribuição de H no teste de Kruskal-Wallis(k=3), com n1≤ n2 ≤ n3≤ 6. [ p é a probabilidade de H ≥ h P0(H ≥ h) = p]
n1 n2 n3 h p n1 n2 n3 h p n1 n2 n3 h p
2 4 5 5.273 .049 3 3 4 6.746 .010 3 4 5 7.641 .0076.504 .020 7.000 .006 7.906 .0057.118 .010 7.318 .004 8.446 .0027.500 .007 7.436 .002 8.503 .0017.573 .005 8.018 .001 9.118 .0018.114 .001 3 3 5 3.394 .209 3 4 6 5.604 .050
2 4 6 5.263 .050 3.442 .196 5.610 .0495.340 .049 4.412 .109 6.500 .0256.109 .025 4.533 .097 6.538 .0256.186 .024 5.515 .051 7.467 .0107.212 .011 5.648 .049 7.500 .0107.340 .010 6.303 .026 3 5 5 3.306 .202
2 5 5 3.369 .203 6.376 .020 3.429 .1953.392 .198 6.982 .011 3.798 .1524.508 .100 7.079 .009 4.545 .1005.246 .051 7.467 .008 4.993 .0755.338 .047 7.515 .005 5.626 .0516.346 .025 8.048 .002 5.706 .0466.446 .020 8.242 .001 6.488 .0257.269 .010 8.727 .001 6.752 .0217.762 .007 3 3 6 5.551 .051 6.866 .0198.131 .005 5.615 .050 7.543 .0108.685 .001 6.385 .025 7.894 .007
2 5 6 5.319 .050 6.436 .022 8.237 .0055.338 .047 7.192 .010 8.334 .0056.189 .026 7.410 .008 8.950 .0026.196 .025 3 4 4 3.394 .201 9.055 .0017.299 .010 3.417 .195 9.398 .0017.376 .010 3.848 .150 3 5 6 5.554 .052
2 6 6 5.352 .051 4.477 .102 5.600 .0505.410 .050 4.546 .099 6.621 .0266.171 .026 5.576 .051 6.667 .0246.210 .024 5.598 .049 7.560 .0107.410 .010 6.394 .025 7.590 .0107.467 .010 6.659 .020 3 6 6 5.600 .052
3 3 3 3.467 .196 7.144 .010 5.625 .0504.622 .100 7.636 .004 6.683 .0255.600 .050 8.227 .002 6.725 .0255.956 .025 8.909 .001 7.683 .0106.489 .011 3 4 5 3.312 .204 7.725 .0107.200 .004 3.318 .199 4 4 4 3.231 .212
3 3 4 3.391 .196 3.831 .150 3.500 .1973.836 .150 4.523 .103 3.846 .1514.700 .101 4.549 .099 3.962 .1454.709 .092 4.939 .075 4.500 .1045.727 .050 5.631 .050 4.654 .0976.154 .025 6.410 .025
6.676 .0207 445 010
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 80/133
Limites de probabilidade da distribuição de H no teste de Kruskal-Wallis(k=3), com n1≤ n2 ≤ n3≤ 6. [ p é a probabilidade de H ≥h P0(H ≥ h) = p]
n1 n2 n3 h p n1 n2 n3 h p n1 n2 n3 h p
4 4 4 5.115 .074 4 5 5 3.311 .200 5 5 5 5.040 .0755.654 .055 3.846 .151 5.660 .0515.692 .049 3.883 .148 5.780 .0496.577 .026 4.520 .101 6.740 .0256.615 .024 4.523 .099 7.020 .0206.731 .021 5.023 .075 7.980 .0116.962 .019 5.643 .050 8.000 .0097.538 .011 6.671 .025 8.060 .0097.731 .007 6.760 .025 8.420 .0078.000 .005 6.943 .020 8.720 .005
8.346 .002 7.766 .010 8.820 .0058.654 .001 7.860 .010 9.420 .0029.269 .001 8.226 .007 9.620 .002
4 4 5 3.330 .200 8.371 .005 9.680 .0013.828 .151 8.543 .005 10.220 .0014.619 .100 9.163 .002 5 5 6 5.698 .0505.014 .076 9.323 .001 5.729 .0505.024 .074 9.926 .001 6.781 .0255.618 .050 4 5 6 5.656 .051 6.788 .0256.597 .026 5.661 .050 8.012 .0106.676 .024 6.736 .025 8.028 .010
6.943 .020 6.750 .025 5 6 6 5.752 .0507.744 .011 7.896 .010 5.765 .0507.760 .009 7.936 .010 6.838 .0257.810 .009 4 6 6 5.721 .050 6.848 .0258.140 .005 5.724 .050 8.119 .0108.189 .005 6.783 .025 8.124 .0108.782 .002 6.812 .024 6 6 6 5.719 .0508.997 .001 7.989 .010 5.801 .0499.590 .001 8.000 .010 6.877 .026
4 4 6 5.667 .050 5 5 5 3.380 .201 6.889 .0255.681 .049 3.420 .190 8.187 .0106.595 .026 3.860 .150 8.222 .010
6.667 .025 4.560 .1007.724 .0107.795 .010
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 81/133
Teste de Kruskal-Wallis para três amostras e n < 6
Rejeita-se H0
Se p <= 0,05
Não se rejeita H0
Se p > 0,05
Encontrar a probabilidade de H na tabela
levando em cota n1, n2, n3
Calcular H
Se houver empates aplicar o fator de correção C
Somar os ranks de cada amostras (Rj)
Elevar Rj ao quadrado (Rj)2
Dividir (Rj)2 pelo n de cada amostra
Atribuir os ranks às observações
Reunir as N observações em um único grupo
e ordená-las
Estabelecer as hipóteses de trabalho e
o nível de significância
Verificar se as amostras são independentes
Verificar se as medidas foram medidas nas escalas
ordinal, intervalar ou de razão
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 82/133
Teste de Kruskal-Wallis para três ou mais amostras ou n > 6
Se H >= qui-quadrado crítico Se H < qui-quadrado crítico
Verificar o valor de Qui-quadrado para k-1 graus de liberdade
Calcular H
Se houver empates aplicar o fator de correção C
Somar os ranks de cada amostras (Rj)
Elevar Rj ao quadrado (Rj)2
Dividir (Rj)2 pelo n de cada amostra
Atribuir os ranks às observações
Reunir as N observações em um único grupo
e ordená-las
Estabelecer as hipóteses de trabalho e
o nível de significância
Verificar se as amostras são independentes
Verificar se as medidas foram medidas nas escalas
ordinal, intervalar ou de razão
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 83/133
BIBLIOGRAFIA
1. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
2. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,
2003.
3. CAMPOS H – Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de
Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universiade de São
Paulo, 1979.
4. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.
5. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.
6. SIEGEL S – Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975.
7. VIEIRA S – Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003.
8. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 84/133
TESTE DE WILCOXON
André M. Morcillo1
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 85/133
O teste de Wilcoxon pode ser usado na comparação de dados pareados, medidos nas escalas
ordinal, intervalar ou de razão. Não há a exigência de que as amostras tenham distribuição
normal. Tem 95% do poder do teste t pareado e, sua indicação, restringe-se às situações em que
este último não pode ser utilizado.O princípio do teste consiste em avaliar se ocorreram modificações significativas nos dois
conjuntos de dados. Quando as modificações ou diferenças são muito pequenas, elas podem ser
devidas ao acaso, porém, quando são expressivas, é pouco provável que se devam ao acaso,
sendo fruto de um fator causal.
COMO FAZER
1. Calcula-se para cada elemento do grupo de estudo a diferença (d) entre a suas duas medidas,
seja a primeira menos a segunda ou vice-versa. Neste capítulo será sempre considerada a
primeira menos a segunda (A-B).
2. Ordena-se e atribui-se ranks aos valores absolutos das diferenças que sejam diferentes de
zero ( d ≠ 0 )
3. Soma-se os ranks das diferenças positivas (T+)
4. Soma-se os ranks das diferenças negativas (T-)
5. Seleciona-se entre T+ e T- o de menor valor, que será chamado de T
6. Verifica-se o valor de Tcrítico,α na tabela7. Compara-se T com Tcrítico e toma-se a decisão quanto a rejeição de H0
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
TESTE DE HIPÓTESES
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 86/133
a) Bilateral H0 : não há diferença entre as notas obtidas no início e no final do curso
H1 : há diferença entre as notas obtidas no início e no final do curso
b) Unilateral
H0 : As notas obtidas no início são menores ou iguais às do final do curso
H1 : As notas obtidas no início são maiores que as do final do curso
ou
H0 : As notas obtidas no início são maiores ou iguais às do final do curso
H1 : As notas obtidas no início são menores que as do final do curso
TOMADA DE DECISÃO
Teste bilateral
Seleciona-se entre T+ e T- aquele que tiver o menor valor, que passará a ser chamado de T e
que será comparado com o Tcrítico (Tα,n).
Se T for menor ou igual ao Tcrítico, rejeita-se H0.
Teste unilateral
Considerando que no nosso caso d = primeira medida menos a segunda:
a) H1 : as segundas medidas são menores que as primeiras [ A > B ]
Se isto for verdadeiro T+ é maior que T-, sendo que T- passa a ser o valor de T.Se T ≤ Tα,n ⇒ rejeita-se H0
b) H1 : as segundas medidas são maiores que as primeiras [ A < B ]
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
Exemplo - Um grupo de 10 alunos foi avaliado no início e no final do curso. Natabela abaixo são apresentadas as notas obtidas nas provas.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 87/133
Nomes Prova inicial Prova final
André 7,3 7,6
Paulo 7,9 7,5
Manoel 8,1 8,6
Joaquim 9,6 9,5Pedro 8,0 8,5
Luís 8,5 8,3
Miguel 7,9 7,9
Ângelo 6,9 6,9
Cláudio 7,2 7,8
Aurélio 8,8 7,5
♦ Calculando as diferenças (d = nota inicial – nota final)
Prova inicial Prova final Diferença (Inicial-Final)
André 7,3 7,6 -0,3
Paulo 7,9 7,5 +0,4
Manoel 8,1 8,6 -0,5
Joaquim 9,6 9,5 +0,1
Pedro 8,0 8,5 -0,5Luís 8,5 8,3 +0,2
Miguel 7,9 7,9 0
Â
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
♦ Atribuindo ranks às diferenças
Ordena-se as diferenças (d) que são diferentes de zero, pois só interessa estudar os casos em que
h difi ã id d l b l ib i k
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 88/133
houve modificação na nota, considerando o seu valor absoluto e atribui-se os postos ou ranks ao
valor absoluto das diferenças
| d | 0,1 0,2 0,3 0,4 0,5 0,5 0,6 1,3
Ranks 1 2 3 4 5,5 5,5 7 8
Nota inicial Nota finalDiferença
d=(Inicial - final)| d | Ranks Ranks - Ranks +
André 7,3 7,6 -0,3 0,3 3 3
Paulo 7,9 7,5 +0,4 0,4 4 4
Manoel 8,1 8,6 -0,5 0,5 5,5 5,5
Joaquim 9,6 9,5 +0,1 0,1 1 1
Pedro 8,0 8,5 -0,5 0,5 5,5 5,5
Luís 8,5 8,3 +0,2 0,2 2 2
Miguel 7,9 7,9 0
Ângelo 6,9 6,9 0
Cláudio 7,2 7,8 -0,6 0,6 7 7
Aurélio 8,8 7,5 +1,3 1,3 8 8
Total T- = 21 T+ = 15
♦ Calculando T
1 Soma-se os ranks das diferenças negativas que será chamado de T-
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 89/133
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
Calculando o desvio padrão de T
( )( )121 ++= nnnσ
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 90/133
( )( )24 121 ++= nnnT σ
Quando ocorrer empates entre diferenças diferentes de zero (d ≠ 0), será necessário fazer uma
correção no cálculo de σT.
Correção decorrente de empates
Esse fator de correção chamado de ΣT será calculado a partir do número observações
empatadas.
( )( )
242
T1n21nn
T
∑σ
−++=
∑ ∑=
=k
i
TiT 1
onde
f f T iii−=
3
onde f i é o número de elementos que estão empatados dentro do grupo i
Exemplo de correção dos empates: imagine que em uma determinada amostra de alturas haja
quatro casos com valor 145, seis com valor 154, três com altura 156 e dois casos com altura
185cm. Há, portanto, quatro grupos com empates.
Primeiro grupo: 145 ; 145 ; 145 ; 145 Neste caso fi = 4 e Ti = 43 – 4 = 60
Segundo grupo: 154 ; 154 ; 154 ; 154 ; 154 ; 154
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
Calculando o valor de z
µ−
= TT
z
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 91/133
σµ=
T
Tz
TOMADA DE DECISÃO
1. Teste bilateral
H0 : não há diferença entre as notas obtidas no início e no final do curso H1 : há diferença entre as notas obtidas no início e no final do curso
Calcula-se z a partir do menor valor dos T (T+ e T-)
Estabelece-se α e toma-se os dois valores de zcríticoα,(2) (o da cauda inferior e o da cauda
superior)
Se o z calculado for igual ou maior que zcrítico, α(2) da cauda superior ou menor ou igual ao
zcrítico, α(2) da cauda inferior rejeita-se H0
Se o z calculado for menor que o zcrítico,α,(2) da cauda superior e maior que o zcrítico,α,(2) da
cauda inferior não se pode rejeitar H0
Observação: para testes bilaterais com α = 0,05 os valores críticos de z são –1,960 e +1,960.
2. Teste unilateral do tipo: os valores iniciais são maiores que os finais (A>B)
H0 : As notas obtidas no início são menores ou iguais às do final do curso
H1 : As notas obtidas no início são maiores que a do final do curso
Calcula-se z a partir de T (o menor valor entre T+ e T-)
Estabelece-se α e toma-se o valor de z íti (1)
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
3. Teste unilateral do tipo: os valores iniciais são menores que os finais (B>A)
H0 : As notas obtidas no início são maiores ou iguais às do final do curso
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 92/133
H0 : As notas obtidas no início são maiores ou iguais às do final do curso H1 : As notas obtidas no início são menores que a do final do curso
Calcula-se z a partir de T (o menor valor entre T+ e T-)
Estabelece-se α e toma-se o valor de zcrítico,α(1)
Se o z calculado for igual ou menor que zcrítico,α(1) e T- > T+ rejeita-se H0 (lembre-se que
nosso d = inicial – final)
Se o z calculado for maior que o zcrítico,α(1) ou se T- ≤ T+ não se pode rejeitar H0
Observação: se d = B - A há a necessidade de rever com cuidado o raciocínio exposto
acima.
Retomando o exemplo anterior:
1. T+ = 21 e T- = 15 , portanto T = 15
2. Calculando a média de T ⇒
( )
184
188
=
+×
=µ T
3. Calculando o desvio padrão de T ⇒ ( )( )
14,724
182188=
+×+=σ T
4. Calculando do valor de z ⇒ 42,014,7
1815−=
−= z
Consultando a tabela de probabilidades de z, verifica-se que a probabilidade de z < -0,42 é
0 3372 (33 72%) t t ã d j it H0
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 93/133
Distribuição dos valores críticos de T (o menor valor entre T+ e T-) do teste de Wilcoxon 2
Teste Bilateral 0,10 0,05 0,02 0,01
Teste Unilateral 0,05 0,025 0,01 0,005
n5 0
6 2 0
7 3 2 0
8 5 3 1 0
9 8 5 3 1
10 10 8 5 3
11 13 10 7 5
12 17 13 9 7
13 21 17 12 914 25 21 15 12
15 30 25 19 15
16 35 29 23 19
17 41 34 27 23
18 47 40 32 27
19 53 46 37 32
20 60 52 43 37
21 67 58 49 42
22 75 65 55 4823 83 73 62 54
24 91 81 69 61
25 100 89 76 68
Se T ≤ Tcrítico,α então p ≤ α. Rejeita-se H0
Teste de Mann-Whitney - André M. Morcillo
___________________________________________________________________________________________________
BIBLIOGRAFIA
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 94/133
BIBLIOGRAFIA
1. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
2. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,
2003.
3. CAMPOS H – Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de
Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universiade de São
Paulo, 1979.
4. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.
5. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.
6. SIEGEL S – Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975.
7. VIEIRA S – Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003.
8. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
Teste de Wilcoxon para pequenas amostras (n<25)
Estabelecer
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 95/133
Comparar T com Tcritico
Atribuir a menor das duas somas a T
Somar os ranks com sinal +
Somar os ranks com sinal -
Atribuir o sinal da diferença aos ranks
Atribuir ranks às diferenças
Ordenar as diferenças
sem considerar seu sinal
Excluem-se os casos com d = 0
Calcular a diferença (d) para
todos os casos
H0, H1
Nível de Significância
Teste de Wilcoxon para grandes amostras (n>25)
Estabelecer H0, H1
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 96/133
Calcular a média e o desvio padrão de T
Atribuir a menor das duas somas a T
Somar os ranks com sinal +Somar os ranks com sinal -
Atribuir o sinal da diferença aos ranks
Atribuir ranks às diferenças
Ordenar as diferenças
sem considerar seu sinal
Excluem-se os casos com d = 0
Calcular a diferença (d) para
todos os casos
,
Nível de Significância
TESTE NÃO-PARAMÉTRICOS André M. Morcillo1
Os testes não-paramétricos (TNPs) são menos poderosos que seus equivalentes paramétricos (TPs).
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 97/133
p ( ) p q q p ( )
Devem ser utilizados nas situações em que os TPs não podem ser usados.
Enquanto nos TPs são comparados os parâmetros da população (média e variância), nos TNPs
comparam-se os postos ou “ranks” que cada observação recebe após sua ordenação.
O primeiro passo para realizar um TNP é atribuir postos ou “ranks” aos valores obtidos nas amostras.
ATRIBUINDO POSTOS
1. Inicialmente ordena-se os dados preferencialmente em ordem crescente
2. Atribui-se os postos (“ranks” ou notas) aos valores ordenados, o que significa que os valores medidos
são classificados de acordo com uma nova escala.
Exemplo 1 - Dada a distribuição de notas de 10 alunos de uma classe de 8ª série:
João: 8,0 Maria: 8,1
Pedro: 7,5 Marta: 8,5
Paulo: 8,2 Larissa: 8,7
Manoel: 8,8 Rita: 7,8
Marcos: 7,9
Joaquim: 7,7
Os passos a seguir são:
1. Ordenar todas as notas (em ordem crescente): 7,5; 7,7; 7,8; 7,9; 8,0; 8,1; 8,2; 8,5; 8,7; 8,8
2. Atribuir os postos:
Atribuir ao primeiro elemento (o de valor mais baixo) o rank [1], ao segundo o posto [2], ao terceiro o
posto [3] e assim, sucessivamente, até o último.Como pode ser observado no exemplo acima o menor valor observado (7,5) recebeu o posto [1]; o
segundo (7,7) o posto [2] e a maior nota (8,8) o posto [10].
3. Reorganiza-se os dados, apresentando as notas, os nomes dos alunos e os postos.
O d d l t li t N t N P t R k
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 98/133
Ordem do elemento na lista Notas Nomes Postos ou Rank
1º 7,5 Pedro 1
2º 7,7 Joaquim 2
3º 7,8 Rita 3
4º 7,9 Marcos 4
5º 8,0 João 5
6º 8,1 Maria 6
7º 8,2 Paulo 7
8º 8,5 Marta 8
9º 8,7 Larissa 9
10º 8,8 Manoel 10
Total 29 26
Soma dos postos das mulheres: 3 + 6 + 8 + 9 = 26
Soma dos postos do homens : 1 +2 + 4 + 5 + 7 + 10 = 29
Média dos postos das mulheres: 26 / 4 = 6,5
Média dos postos dos homens: 29 / 6 = 4,8
ATRIBUINDO POSTOS QUANDO HÁ VÁRIAS OBSERVAÇÕES COM O MESMO VALOR
Um situação especial ocorre quando há observações com valores repetidos. Fazendo-se uma pequena
modificação no exemplo anterior, atribui-se ao Pedro, ao Joaquim e à Rita a mesma nota 7,5. Os novos
dados já ordenados são apresentados abaixo:
7,5; 7,5; 7,5; 7,9; 8,0; 8,1; 8,2; 8,5; 8,7; 8,8
Ordem 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
Notas 7,5 7,5 7,5 7,9 8,0 8,1 8,2 8,5 8,7 8,8
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 99/133
Rank 2 2 2 4 5 6 7 8 9 10
Observe que os três alunos que tinham as notas mais baixas receberam o mesmo posto.
Um outro exemplo: num conjunto de 4.500 observações de alturas temos empatados os elementos 278º,279º, 280º e 281º com o valor 145cm; os elementos 376º, 377º, 378º com 147,5cm.
Os ranks das altura iguais a 145cm seria: (278+279+280+281)/4=279,5
Os ranks das altura iguais a 147,5cm seria: (376+377+378)/3=377
Ordem ... 278º 279º 280º 281º ... 376º 377º 378º ...
Valor ... 145,0 145,0 145,0 145,0 ... 147,5 147,5 147,5 ...
Rank ... 279,5 279,5 279,5 279,5 ... 377 377 377 ...
COMPARAÇÃO DE DUAS AMOSTRAS INDEPENDENTES
TESTE DE MANN-WHITNEY
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 100/133
Esta prova requer que as duas amostras sejam independentes, que os dados sejam contínuos e mensurados
nas escalas ordinal, intervalar ou de razão. Não deve ser aplicada quando os dados foram medidos na
escala nominal.
Para a realização do teste as observações originais das duas amostras são reunidas em um único grupo,
sendo o conjunto ordenado e transformado em ranks, que serão utilizados para calcular a estatística U.
Considerando:
n1 = número de casos da menor amostran2 = número de casos da maior amostra
N = total de casos das duas amostras
R 1 = soma dos ranks da amostra de tamanho n1
R 2 = soma dos ranks da amostra de tamanho n2
Calcula-se U e U’ a partir de R 1 e de R 2 pelas fórmulas abaixo e toma-se o menor deles:
( )R 12
1n1.n1n2.n1U −
++=
( )R 22
1n2.n2n2.n1U' −
++=
TESTE DE HIPÓTESES
Se U > Uα(2),n2,n1 não se rejeita H0
Se U ≤ Uα(2),n2,n1 rejeita-se H0
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 101/133
b) Teste unilateral
H0 : as duas amostras apresentam a mesma distribuição
H1 : as duas amostras têm distribuições diferentes, sendo que a amostra 1 tem valores maiores que aamostra 2
ou
H1 : as duas amostras têm distribuições diferentes, sendo que a amostra 1 tem valores menores que a
amostra 2
Uma vez selecionado o menor dos dois valores de U calculados, recorre-se à tabela unilateral de U para α previamente selecionado, procurando localizar o valor crítico de Uα(1),n2,n1 .
Se U > Uα(1),n2,n1 não rejeitamos H0
Se U ≤ Uα(1),n2,n1 rejeitamos H0
Retomando o exemplo anterior, deseja-se saber se as notas dos alunos do sexo masculino são diferentes
das notas do feminino.
Exemplo 1 - Dada a distribuição de notas de 10 alunos de uma classe de 8ª série:
Ordem do elemento na lista Notas Nomes Postos ou Ranks
1º 7,5 Pedro 1
2º 7,7 Joaquim 2
3º 7,8 Rita 3
4º 7,9 Marcos 4
5º 8,0 João 5
U = 4 x 6 + [(4 x 5)/2] - 26 = 8
b) CALCULANDO U’ A PARTIR DE R2
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 102/133
U’ = 4 x 6 + [(6 x 7)/2] - 29 = 16
Toma-se o valor de U = 8 para α = 0,05 e n1=4 e n2 = 6. Nestas circunstâncias o valor de U0,05(2);4; 6 = 2.
Como U > U0,05(2);4; 6 não se pode rejeitar H0
UMA SITUAÇÃO ESPECIAL
A tabela de U abrange até n1=20 e n2=40. Quando as amostras são maiores, U tem distribuição que
tende para curva normal, sendo que neste caso, U deve ser transformado em z e sua probabilidade de
ocorrência verificada na tabela de z.
Determinando a significância de U quando n1>20 ou n2>40
Quando n1>20 ou n2>40 não é mais possível a utilização da tabela de U, porém sabe-se que U tende a ter
distribuição normal. A partir do valor da média de U e de seu desvio padrão, calcula-se o valor de z e, a partir da tabela de distribuição de z, a sua probabilidade. Do ponto de vista prático, rejeita-se H0 para
α=0,05, se z ≥ 1,960 nos testes bilaterais ou se z ≥ 1,645 no unilaterais.
σU
µUUzU
−=
1) Obtendo a média de U (µU)
2n2n1µU
×=
N = n1 + n2
K é o número de grupos onde ocorreram empatesf i é o número de elementos empatados dentro de um grupo.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 103/133
Exemplo: se dentro de um conjunto de dados houvesse empates como é apresentado a seguir:
... 100, 100, 100, ... , 120, 120, ... , 150, 150, 150, 150, 150, ...
O primeiro grupo com empates tem três elementos [100, 100, 100] portanto fi=3
Ti = 33
- 3 = 27 - 3 = 24O segundo grupo com empates tem dois elementos [120,120] portanto fi=2
Ti = 23 - 2 = 8 - 2 = 6
O terceiro grupo com empates tem cinco elementos [150,150,150,150,150] portanto fi=5
Ti = 53 - 5 = 125 - 5 = 120
Somando-se os valores de Ti:T = Ti = 24 + 6 + 120 = 150
Exemplo 2 - Comparando-se dados de altura de duas amostras em relação ao sexo encontramos empates
que proporcionam T = ΣTi = 150
Considerando n1=120 o número de meninos e n2=150 o número de meninas, U = 9538 e α = 0,05 tem-se:
n1 = 120 n2 = 150 N = 270 U = 9538
µU = (120 . 150)/2 = 9000
637,57
12
150-70.269.2712
269.270
150120σU =
××
=
como
BIBLIOGRAFIA
1. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
2 CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações 1ª ed Porto Alegre: Artmed
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 104/133
2. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1 ed. Porto Alegre: Artmed,
2003.
3. CAMPOS H – Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de
Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universiade de São
Paulo, 1979.
4. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.
5. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.
6. SIEGEL S – Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975.
7. VIEIRA S – Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003.
8. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
Distribuição de U do teste de Mann-Whitney (Unilateral ao nível de 2,5% ; Bilateral ao nível de 5%) N1
N2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 202 - -3 - - -
4 - - - 05 - - 0 1 26 - - 1 2 3 5
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 105/133
6 1 2 3 57 - - 1 3 5 6 88 - 0 2 4 6 8 10 139 - 0 2 4 7 10 12 15 1710 - 0 3 5 8 11 14 17 20 2311 - 0 3 6 9 13 16 19 23 26 3012 - 1 4 7 11 14 18 22 26 29 33 3713 - 1 4 8 12 16 20 24 28 33 37 41 4514 - 1 5 9 13 17 22 26 31 36 40 45 50 5515 - 1 5 10 14 19 24 29 34 39 44 49 54 59 6416 - 1 6 11 15 21 26 31 37 42 47 53 59 64 70 7517 - 2 6 11 17 22 28 34 39 45 51 57 63 69 75 81 8718 - 2 7 12 18 24 30 36 42 48 55 61 67 74 80 86 93 9919 - 2 7 13 19 25 32 38 45 52 58 65 72 78 85 92 99 106 11320 - 2 8 14 20 27 34 41 48 55 62 69 76 83 90 98 105 112 119 12721 - 3 8 15 22 29 36 43 50 58 65 73 80 88 96 103 111 119 126 13422 - 3 9 16 23 30 38 45 53 61 69 77 85 93 101 109 117 125 133 14123 - 3 9 17 24 32 40 48 56 64 73 81 89 98 106 115 123 132 140 14924 - 3 10 17 25 33 42 50 59 67 76 85 94 102 111 120 129 138 147 156
25 - 3 10 18 27 35 44 53 62 71 80 89 98 107 117 126 135 145 154 16326 - 4 11 19 28 37 46 55 64 74 83 93 102 112 122 132 141 151 161 17127 - 4 11 20 29 38 48 57 67 77 87 97 107 117 127 137 147 158 168 17828 - 4 12 21 30 40 50 60 70 80 90 101 111 122 132 143 154 164 175 18629 - 4 13 22 32 42 52 62 73 83 94 105 116 127 138 149 160 171 182 19330 - 5 13 23 33 43 54 65 76 87 98 109 120 131 143 154 166 177 189 20031 - 5 14 24 34 45 56 67 78 90 101 113 125 136 148 160 172 184 196 20832 - 5 14 24 35 46 58 69 81 93 105 117 129 141 153 166 178 190 203 21533 - 5 15 25 37 48 60 72 84 96 108 121 133 146 159 171 184 197 210 22234 - 5 15 26 38 50 62 74 87 99 112 125 138 151 164 177 190 203 217 23035 - 6 16 27 39 51 64 77 89 103 116 129 142 156 169 183 196 210 224 237
36 - 6 16 28 40 53 66 79 92 106 119 133 147 161 174 188 202 216 231 24537 - 6 17 29 41 55 68 81 95 109 123 137 151 165 180 194 209 223 238 25238 - 6 17 30 43 56 70 84 98 112 127 141 156 170 185 200 215 230 245 25939 0 7 18 31 44 58 72 86 101 115 130 145 160 175 190 206 321 236 252 26740 0 7 18 31 45 59 74 89 103 119 134 149 165 180 196 211 227 243 258 274
9
Teste de Mann-Whitney para n1 até 20 e n2 até 40
Verificar se as amostras são independentes
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 106/133
U calculado é menor ou
igual ao U da tabela
U calculado é maior que
o U da tabela
Encontrar o valor crítico de U na tabela
levando em conta n1, n2 e alfa
Assumir o U de menor valor como a estatística U
Calcular os dois valores de U
Somar os ranks de cada amostra
Atribuir ranks às observações
Reunir as observações das duas amostras
em um único grupo e ordená-las
Estabelecer as hipóteses de trabalho
e o nível de significância alfa
p
Verificar se foram medidas nas escalas ordinal,
intervalar ou de razão
Teste de Mann-Whitney para n1 maior que 20 e n2 maior que 40
Verificar se as amostras são independentes
Verificar se foram medidas nas escalas ordinal,
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 107/133
Se a probabilidade de se ter
um valor de z maior ou igual ao
calculado for menor ou igual a 5%
Se a probabilidade de se ter
um valor de z maior ou igual ao
calculado for maior que 5%
Calcular a média de U
Calcular o desvio padrão de U
Calcular o z de U
Assumir o U de menor valor como a estatística U
Calcular os dois valores de U
Somar os ranks de cada amostra
Atribuir ranks às observações
Reunir as observações das duas amostras
em um único grupo e ordená-las
Estabelecer as hipóteses de trabalho
e o nível de significância alfa
intervalar ou de razão
TESTE DO QUI-QUADRADO ( 2)
André Moreno Morcillo1
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 108/133
O teste do χ2 é muito eficiente para avaliar a associação existente entre variáveis qualitativas
(dados do tipo categórico). O princípio básico deste método não paramétrico é comparar as
divergências entre as freqüências observadas e as esperadas.
De uma maneira geral, pode-se dizer que dois grupos se comportam de forma semelhante se as
diferenças entre as freqüências observadas e as esperadas em cada categoria forem muito
pequenas, próximas a zero.
O χ2 é calculado pela fórmula:
( )∑
−=
E
E O2
2 χ (1)
onde:
O = freqüência observada E = freqüência esperada
Observe que ( O-E ) é a diferença entre a freqüência observada e a esperada, que deverá ser
calculada para cada célula da tabela. Quando as freqüências observadas são muito próximas às
esperadas, o valor ( O-E ) é pequeno; no entanto, quando as discrepâncias são grandes, ( O-E )
passa a ser grande e, consequentemente, o χ2 assume valores altos.
O pesquisador estará sempre trabalhando com duas hipóteses:
Na prática, a freqüência esperada em uma determinada célula é calculada pela multiplicação dototal de sua coluna (Tc), pelo total de sua linha (Tl), dividindo-se o produto pelo total geral da
tabela (N).
E = ( Tc x Tl ) / N
Tc : total da coluna
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 109/133
Tl : total da linha
Uma vez calculado o χ2, procura-se na tabela de distribuição de χ2 o valor do χ2 críticoconsiderando o nível de significância adotado e os graus de liberdade.
Os graus de liberdade da tabela são obtidos por:gl = (número de linhas –1 x número de colunas – 1)
Se o χ2 obtido for igual ou maior que o χ2 crítico, H0 deverá ser rejeitada.
Exemplo: Um pesquisador deseja verificar se há associação entre três cursos deuma universidade e dependência de drogas. Entrevistou 120 alunos, sendo 25 da
Medicina, 35 de Farmácia e 60 de Biologia, perguntando sobre o uso de drogas,admitindo somente duas respostas: sim ou não. Após o processamento dos dadosficou com a seguinte tabela de distribuição de freqüências:
Medicina Farmácia Biologia Total
Usa droga 10 20 30 60
Não usa droga 15 15 30 60
Total 25 35 60 120
Como pode ser observado, entre os 120 alunos incluídos no estudo, há um número igual deusuários e não usuários de drogas, entretanto, a distribuição dentro dos vários cursos não ocorreda mesma forma.
Veja as dificuldades na interpretação dos dados. Há um número diferente de alunosentrevistados, assim como há uma proporção diferente de usuários e não usuários de drogas em
1. Calcular as freqüências esperadas
A freqüência esperada de cada célula é calculada por (Tc x Tl) / N. Na célula que representaMEDICINA X USUÁRIO é (25 x 60) / 120 = 12.5. A freqüência esperada na célula que representaBIOLOGIA X NÃO USUÁRIO é (60 x 60) / 120 = 30 E assim com todas as células da tabela
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 110/133
BIOLOGIA X NÃO USUÁRIO é (60 x 60) / 120 = 30. E assim com todas as células da tabela.
E = ( Tc x Tl ) / N
2. As freqüências esperadas deverão ser anotadas nas correspondentes células.
Medicina Farmácia Biologia Total
O 10 20 30 60Usa droga
E 12,5 17,5 30,0
O 15 15 30 60 Não usa
Droga E 12,5 17,5 30,0
Total 25 35 60 120
3. A seguir aplica-se a fórmula [1].
χ2 = [10 - 12,5]2 / 12,5 + [20 - 17,5] 2 /17,5 + [30 – 30] 2 / 30 +[15 – 12,5] 2 / 12,5 +
[15 – 17,5] 2 / 17,5 + [30 – 30] 2 /30 = 1,7
χ2 = 1,7
4. Determina-se os graus de liberdade (gl) da tabela:
Os graus de liberdade da tabela são calculados multiplicando-se o número de linhas da tabelamenos um pelo número colunas da tabela menos um.
O χ2 = 1.7 é menor que o χ22gl;α=0.05 que é 5.99. Assim sendo, a hipótese H0 não pode ser
rejeitada, concluindo-se que no grupo estudado, não há associação entre as variáveis. A proporção de usuários e não usuários de drogas entre os alunos dos cursos de Medicina,
Biologia e Farmácia é igual.Observação: caso 20% ou mais das células tenham freqüências esperadas menores
5 h j i f üê i d l i l 1
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 111/133
que 5, ou haja uma ou mais freqüências esperadas com valores menores ou igual a 1,não se deve usar o teste do χ2. Uma boa alternativa para estes casos é oagrupamento de linhas e colunas, desde que tenha algum sentido lógico.
Como pode ser observado, o teste é facilmente realizado porém, com grande trabalho manual.Este trabalho manual pode ser minimizado em algumas situações especiais: as tabelas 2 x 2, n x2 e m x n.
1) TABELAS 2 x 2
Quando os dados estão tabulados em tabelas de duas linhas por duas colunas podem serutilizar fórmulas que necessitam somente das freqüências observadas, não requerendo o cálculodas freqüências esperadas.
1. Quando o número de casos é maior que 40 (N > 40) deve-se empregar a fórmula:
( )4T1.T2.T3.T
.N b.ca.d 22 −= χ (2)
2) Quando o número de casos estudados é maior ou igual a 20 e menor ou igual a 40 (20 ≤ N ≤ 40) deve-se empregar a fórmula:
4T1.T2.T3.T
.N2
N b.ca.d
2
2
−−
= χ (3)
onde:
Exemplo: um pesquisador quer saber se a proporção de crianças acometidas poruma determinada doença é a mesma entre dois grupos de estudo (A e B). Estudouuma amostra com 28 casos, obtendo a seguinte distribuição de freqüências:
H0: A proporção de crianças acometidas entre os dois grupos é igual .H1: A proporção de crianças acometidas entre os dois grupos é diferente .
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 112/133
GRUPO A GRUPO B Total
SADIOS 6 7 13
ACOMETIDOS 6 9 15
Total 12 16 28
a = 6 b = 7 c = 6 d = 9
T1 = 13 T2 = 15 T3 = 12 T4 = 16
N = 28
Como N = 28 deve-se usar a fórmula [3]:
003,0613.15.12.1
.28
2
28.766.9
2
2 =
−−
=
χ
Observe que nas tabelas 2x2 há somente 1 grau de liberdade, pois ( 2 - 1 ) x ( 2 – 1 )=1
Para 1 g.l. e α=0,05 o χ 2 crítico é 3,84.
Como o χ2
= 0,003 é menor que 3,84, não se pode rejeitar H0, podendo-se afirmar que naamostra estudada a proporção de crianças acometidas é igual nos grupos A e B.
2) TABELAS DE m LINHAS POR DUAS COLUNAS (mx2)
Quando as tabelas têm m linhas por duas colunas, pode-se utilizar a fórmula [4] que requer as
freqüências observadas de uma das colunas, cuja escolha fica a critério do pesquisador. A
fórmula [4] está escrita para uso da coluna 1.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 113/133
[ ] p
( )
q. p
N1O
n
O2
j
1i i
2
1i
2
∑−
=
∑=
χ (4)
onde:
O1i = freqüência observada na coluna 1 da linha ini = total da linha i∑ 01= total da coluna 1
pq
N Oi p
−=
∑=
1
Observe que se trabalha com as freqüências observadas de uma única coluna, o que facilita os
cálculos.
Neste caso os graus de liberdade ( g.l.) são determinados por: número de linhas –1.
Exemplo:
Um pesquisador investigando o uso de drogas entre universitários desejava saber se haviadiferença quando se considerava diferentes cursos. Aplicou um questionário entre alunos dediferentes cursos, obtendo os resultados apresentados na tabela abaixo:
CURSO USA DROGA NÃO USA DROGA TOTAL
As hipóteses de trabalho são:
HO: os grupos se comportam como se fossem de uma mesma população e, portanto, as freqüências de
usuários de drogas são iguais entre os cursos. H1: os grupos se comportam como se fossem de populações diferentes e, portanto, as freqüências deusuários de drogas são diferentes entre os cursos.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 114/133
Como se trata de uma variável que pode assumir somente duas situações (usa droga ou não usa
droga), pode-se construir uma tabela tipo m linhas x 2 colunas e, consequentemente, aplicar o
teste do χ2 usando-se a fórmula [4].
Para maior clareza e facilidade nos cálculos, deve-se refazer a tabela contendo somente uma das
duas colunas ( a critério do pesquisador) e os totais. Neste exemplo foi escolhida a coluna 1 (usa
drogas). Observe que foram acrescentadas mais duas colunas na tabela para permitir a anotação
dos cálculos intermediários:
CURSO USA DROGA(O1i )
TOTAL(ni )
(O1i)2 / ni
Medicina 40 100 402 / 100
Física 50 120 502 / 120
Química 80 130 802
/ 130
Farmácia 100 220 1002 / 220 ∑(O1i)2 / ni = 131,519
TOTAL ∑(O1 ) = 270 N = 570 2702 / 570 ∑(Oi)2 / N = 127,895
O próximo passo será o cálculo das probabilidades p e q:
p = 270 / 570 = 0,4737
Como a tabela tem 4 linhas são 3 graus de liberdade.
Considerando-se α = 0,05 e 3 graus de liberdade, o χ2
crítico é igual a 7,81.
Como o χ2 (14 5362) é maior que o χ2 crítico (7 81) rejeita se H0 e aceita se H1 concluindo se
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 115/133
Como o χ (14,5362) é maior que o χ crítico (7,81), rejeita-se H0 e aceita-se H1, concluindo-se
que, a partir dos dados observados, o hábito de usar drogas é diferente entre os alunos dos
quatro cursos incluídos na amostra.
3) CÁLCULO DO 2 EM TABELAS DE GRANDES DIMENSÕES (mxn)
Há uma forma de se obter o χ2 em tabelas de grandes dimensões sem haver a necessidade do
conhecimento das freqüências esperadas. Esta técnica foi desenvolvida pelo Professor Aquiles
E. Piedrabuena utilizando sua fórmula para proporções, considerando os totais das colunas
(comunicação pessoal).
Calcula-se individualmente o valor do χ2 de cada linha da tabela, usando-se a fórmula [5] e,
posteriormente, soma-se os valores obtidos em cada linha conforme a fórmula [6], que será o
valor do χ2.
Considerando-se uma linha i qualquer de uma tabela:
T T T
O
T
O
T
O
T
Oli
licr
ir
c
i
c
i
c
ii
N −
++++= ....
2
3
23
2
22
1
212
χ (5)
e
χ χ χ χ χ 22
322
21
2 ...r
++++= (6)
COLUNA 1 COLUNA 2 COLUNA 3 ... COLUNA r
TOTAL
(LINHAS)
LINHA 1 Tl1
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 116/133
LINHA 2 Tl2
LINHA 3 Tl3
... ...
LINHA i Oi1 Oi2 Oi3 ... Oir Tli
... ...
LINHA n Tln
TOTAL
(COLUNAS)Tc1 Tc2 Tc3 ... Tcr N
Oi1: freqüência observada na coluna 1 linha iOi2: freqüência observada na coluna 2 linha iOi3: freqüência observada na coluna 3 linhaiOir: freqüência observada na coluna r linha iTli: total da lina iTc1: total da coluna 1Tc2: total da coluna 2Tc3: total da coluna 3Tcr: total da coluna r N: total de casos na tabela
Retornando ao primeiro exemplo:
Medicina Farmácia Biologia Total
Usa droga 10 20 30 60
Primeiro será calculado o valor do χ2 da linha 1 (grupo que usa drogas):
χ2 linha 1 =[ ( 102 )/ 25 + ( 202 )/ 35 + ( 302 )/ 60 ] x ( 120/ 60 ) – 60 = 0,8571
Passa-se agora a trabalhar com a linha 2 (grupo que não usa drogas)
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 117/133
χ2linha 2 =[ ( 152 )/ 25 + ( 152 )/ 35 + ( 302 )/ 60 ] x ( 120/ 60 ) – 60 = 0,8571
Finalmente,
χ2 = χ2
linha 1 + χ2
linha 2
χ2 = 0,8571 + 0,8571 = 1,714 com 2 g.l.
Considerando-se que o χ2 crítico para 2 graus de liberdade e α=0,05 é 5,99 , H0 não pode serrejeitada.
BIBLIOGRAFIA
1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall,1991.
2. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação dePesquisas Científica de Ribeirão Preto, 2002.
3. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.
4. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford UniversityPress, 1995.
5. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.6. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.7. C ALLEGARI-J ACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre:
Artmed, 2003.8. D ANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed.,
New York: John Wiley & Sons, Inc., 1995.9. GUIMARÃES RC, C ABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.
10. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil,1987.
11. M ARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.12. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.
Distribuição de valores de χ2 para α de 5%, 1% e 0,1%
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 118/133
GL = 5% = 1% = 0,1%
1 3,84 6,64 10,832 5,99 9,21 13,823 7,82 11,34 16,274 9,49 13,28 18,465 11,07 15,09 20,526 12,59 16,81 22,467 14,07 18,48 24,328 15,51 20,09 26,129 16,92 21,67 27,8810 18,31 23,21 29,5911 19,68 24,72 31,2612 21,03 26,22 32,9113 22,36 27,69 34,5314 23,68 29,14 36,1215 25,00 30,58 37,7016 26,30 32,00 39,2917 27,59 33,41 40,7518 28,87 34,80 42,3119 30,14 36,19 43,8220 31,41 37,57 45,3221 32,67 38,93 46,8022 33,92 40,29 48,2723 35,17 41,64 49,7324 36,42 42,98 51,1825 37,65 44,34 52,5226 38,88 45,64 54,0527 40,11 46,96 55,4828 41,34 48,28 56,8929 42,56 49,59 58,3030 43,77 50,89 59,70
Comparação de duas populações - André Moreno Morcillo
COMPARAÇÃO DE DUAS POPULAÇÕES INDEPENDENTES
André M. Morcillo1
COMPARAÇÃO DE VARIÁVEIS NUMÉRICAS CONTÍNUAS MEDIDAS NA ESCALA INTERVALAR OU DE
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 119/133
Ç
RAZÃO
Considera-se que duas amostras ou populações são independentes quando elas não têm elementos
comuns.
Os dois principais parâmetros (do ponto de vista estatístico) de um população são a média e a variância.
Desta forma, quando desejamos saber se duas amostras são iguais ou diferentes, temos que comparar as
suas médias e dispersões. Do ponto de vista prático, comparamos as médias e as variâncias.
Duas populações podem ser consideradas semelhantes quando têm médias e variâncias iguais.
É recomendável que inicialmente comparemos as variâncias e, posteriormente, as médias das duas
amostras.
COMPARAÇÃO DAS VARIÂNCIAS – R AZÃO DAS VARIÂNCIAS
A comparação de variâncias de duas amostras tomadas ao acaso de uma população com distribuição
normal é realizada pela fórmula:
s s F 2
2
2
1=
No numerador colocamos a maior e no denominador a menor das variâncias encontradas nas amostras.
O valor de F calculado será comparado ao valor de Fcrítico obtido em uma tabela de distribuição de F,
considerando o nível de significância adotado, os graus de liberdade do numerador (n1-1) e o graus de
Comparação de duas populações - André Moreno Morcillo
Construindo o teste de hipóteses
A hipótese nula afirma que as variâncias das amostras são iguais; enquanto a hipótese alternativa, que elas
são diferentes. Assim:
s
s22
2
2
2
1
:H1
:0H
ss≠
=
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 120/133
s21 :H1 s ≠
Calculamos o valor de F e procuramos o valor crítico de F na sua tabela. Se o valor de F é menor que o
encontrado na tabela, não podemos rejeitar a hipótese H0 (significa que a probabilidade de F é maior que
o nível de significância adotado), concluindo que as amostras têm variâncias iguais. Quando o valor de Ffor maior ou igual ao valor da sua tabela rejeitamos H0, concluindo que as variâncias comparadas são
diferentes.
Exemplo I.1 - Um grupo de crianças com idades entre 7 e 7,5 anos foi submetido a um exame antropométrico e oresultados encontrados são apresentados abaixo:
n Média Variância
Sexo masculino 174 123,9 34,81
Sexo feminino 239 123,3 31,36
Desejando saber se a diferença observada entre as variâncias das amostras é significativa e considerando
o nível de significância de 5% (α=0,05), calculamos o valor de F:
F = 34,81 / 31,36 = 1,11
A seguir calculamos os graus de liberdade do numerador e do denominador:
Graus de liberdade do numerador = 174 – 1 = 173
Graus de liberdade do denominador = 239 – 1 = 238
P t b l d F f t 0 05 l íti d F 173 238 d lib d d
Comparação de duas populações - André Moreno Morcillo
COMPARAÇÃO DAS MÉDIAS – TESTE T DE STUDENT
Quando temos duas amostras com variâncias iguais e que foram tomadas ao acaso de um população comdistribuição normal, a comparação de suas médias pode ser realizada usando o Teste t de Student.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 121/133
( ) EP x x
x x
t
21
21
−
−=
Onde o numerador é a diferença entre as médias das duas amostras e ( EP x x 21− ) é o Erro Padrão ou
Erro Standard da diferença entre as médias.
Uma maneira bastante adequada para calcular o Erro Padrão das Diferenças entre as médias é:
n
S2
n
S2
2
p
1
p
)x2x( 1+=
− EP
e
( ) ( )2nn
.1n.1n
21
2
222
112
p
sss −+
−+−=
Considera-se a melhor estimativa da variância da população (σ s p
22).
O valor de t obtido deve ser comparado ao valor de tcrítico obtido na tabela de distribuição de t de Student,
considerando (n1+n2-2) graus de liberdade e o tipo de teste de hipótese (unilateral ou bilateral).
Construindo o teste de hipóteses
A hipótese nula inclui a igualdade das médias das amostras, enquanto a hipótese alternativa, que elassejam diferentes, ou ainda que m1>m2 ou m1<m2.
Assim:
Comparação de duas populações - André Moreno Morcillo
Nos testes unilaterais do tipo m1>m2, se o valor de t é menor que o encontrado na tabela, não rejeitamos
a hipótese H0 (significa que a probabilidade de t é maior que o nível de significância adotado). Quando t
for maior ou igual ao valor da tabela rejeitamos H0 (Figura 2).
Nos testes unilaterais do tipo m1<m2, se o valor de t é maior que o encontrado na tabela, não rejeitamos a
hipótese H0 (significa que a probabilidade de t é maior que o nível de significância adotado). Quando t
f i l l d t b l j it H0 (Fi 3)
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 122/133
for menor ou igual ao valor da tabela rejeitamos H0 (Figura 3).
Figura 1 – Áreas de rejeição de H0 no teste t de Student bilateral. H1: m1#m2
Área de não rejeição de H0
- t
Área de rejeição de H0
+t
-t
Área de rejeição de H0
Comparação de duas populações - André Moreno Morcillo
Área de rejeição de H0
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 123/133
Figura 2 – Área de rejeição de H0 no teste t de Student unilateral. H1: m1>m2
Área de rejeição de H0
+ t
Exemplo I.2 - Um grupo de crianças com idades entre 8 e 8,5 anos foi submetido a um exameantropométrico e os resultados encontrados são apresentados abaixo. O pesquisador deseja saber se as
diferenças observadas entre as médias das amostras são estatisticamente significantes.
n Média Variâncias
Sexo masculino 111 126,0 33,64
Sexo feminino 137 125,2 32,49
Desejando saber se a diferença observada entre as variâncias das amostras é significativa, considerando o
nível de significância de 5% (α=0,05), calculamos o valor de F:
F = 33,64 / 32,49 = 1,035
A seguir calculamos os graus de liberdade do numerador e do denominador:
Graus de liberdade do numerador = 111 – 1 = 110
Comparação de duas populações - André Moreno Morcillo
A seguir, considerando que as amostras foram tomadas ao acaso de uma população com distribuição
normal e que têm variâncias iguais, aplicamos o Teste t de Student.
a) calculando o( ) ( ) ( ) ( )
2137111
49,32.113764,33.1111
2
.1.12
22
2
112
+
−+−=
+
−+−=
nn sn sn
s p = 33,004
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 124/133
2137111221
−+−+nnp
b) calculando o137
004,33
111
004,33
2
2
1
2
21
+=+=−
n
s
n
s EP
p p
x x = 0,7336
c) calculando o
( ) 7336,0
2,125126
21
21 −=
−=
− EP x x
x x
t = 1,090
d) calculando os graus de liberdade = 111 + 137 –2 = 246
f) analisando as hipóteses. Como o teste de hipóteses é bilateral temos:
H0 : m1 = m2
H1 : m1 ≠ m2
Procuramos o valor crítico de t para testes bilaterais t0,05,246 = 1,960. Comparamos o t calculado com os
tcríticos +1,960 e –1,960. Como o valor do t calculado cai na área de não rejeição de H0 concluímos que m1
= m2 ou que as amostras são procedentes de uma mesma população.
Por outro lado, se H1= m1>m2 (teste unilateral) o t0,05,246 = 1,644; o t calculado também cairia na área de
não rejeição de H0 e, portanto, rejeitaríamos H1.
♦ Teste t de Student quando as variâncias são diferentes
Um situação especial é aquela em que temos duas amostras com variâncias diferentes tomadas ao acaso
de uma população com distribuição normal Esta situação é conhecida como problema de Behrens-Fisher
Comparação de duas populações - André Moreno Morcillo
11 2
2
2
2
2
1
1
2
1
2
2
22
1
21
2
−+
−
=
+
n
n
n
n
n
S
n
S
gl
s s
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 125/133
Tomamos sempre o menor inteiro obtido pela fórmula acima.
Exemplo I.3: realizar o teste t comparando as médias de duas amostras A e B com as seguintes
características:
Amostra A: n=10 média= 10 variância= 2,0
Amostra B: n=10 média= 12 variância= 2,0
Desejamos saber se a média de A é estatisticamente menor que a de B, portanto, temos um teste unilateral
com:
H0: m1 > m2
H1: m1 < m2
a) calculamos o erro padrão da diferença: 0,6324
b) calculamos o valor de t = (10-12) / 0, 6324= -3,162c) verificamos que o t crítico para α = 0,05; 18 graus de liberdade e teste unilateral é 1,734
d) atribuimos o sinal negativo ao t crítico = -1,734
Como o t calculado é menor que o tcrítico rejeitamos H0 e aceitamos H1.
Uma maneira matematicamente mais elegante de calcular o t nestes casos seria trabalharmos com omódulo da diferença entre m1 e m2 e compararmos o valor do t obtido diretamente com o t da tabela.
Comparação de duas populações - André Moreno Morcillo
b) quando a hipótese alternativa é m1<m2 o valor de t é negativo (menor que 0). Como pode ser
observado, os valores na tabela de distribuição de t são todos maiores que 0. Na verdade os valores
negativos não foram colocados na tabela para economizar espaço. Como a distribuição de t é simétrica,
basta achar o valor positivo de t considerando o nível de significância desejado e os graus de liberdade e
atribuir-lhe o sinal negativo.
Quando o t calculado é menor que o valor de t crítico, rejeitamos H0 e aceitamos H1.
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 126/133
VIOLAÇÃO DAS CONDIÇÕES IDEAIS PARA APLICAÇÃO DO TESTE T DE STUDENT
Do ponto de vista teórico é necessário que as duas amostras que estão sendo comparadas tenham sido
tiradas ao acaso de uma população que tenha distribuição normal e que as duas amostras tenham
variâncias iguais. Estas condições dificilmente são conseguidas em pesquisas na área da Biologia.
Vários estudos têm demonstrado que o Teste t é pouco alterado quando as condições acima descritas não
são obtidas, especialmente quando as amostras têm o mesmo tamanho ou são aproximadamente iguais em
testes bilaterais; por outro lado, o Teste t torna-se mais resistente quanto maior for o tamanho das
amostras, especialmente quando elas têm o mesmo tamanho (n1 = n2). Deveremos ser muitos prudentesem teste unilaterais quando há assimetria evidente.
Pode-se dizer que o Teste t bilateral é muito pouco afetado pela assimetria em amostras que foram
tomadas ao acaso, porém o mesmo não ocorre se usarmos o teste unilateral.
Com relação à curtose, o poder do teste é menor nas distribuições platicúrticas e maior na leptocúrticas,
especialmente quando as amostras são pequenas.
Comparação de duas populações - André Moreno Morcillo
COMPARAÇÃO DE DUAS POPULAÇÕES CORRELATAS
TESTE T DE STUDENT PAREADO
Considera-se duas amostras correlatas quando os elementos do grupo de estudo são comuns a ambas.
Na prática esta situação ocorre quando um conjunto de pacientes é submetido a um procedimento em dois
t dif t l d d i t di b t b
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 127/133
momentos diferentes, como por exemplo, quando um grupo de pacientes com diabetes recebe uma
determinada modificação na dieta e o médico deseja avaliar o seu efeito sobre o estado nutricional.
Assim, realiza-se um exame antropométrico inicial que é repetido após três meses. Em outro caso, um
grupo de crianças com asma atópica é avaliada ao chegar ao serviço, passando a usar corticoesteróidesconforme um protocolo pré-estabelecido que prevê uma avaliação da estatura no início e após seis meses
de tratamento.
Nestes dois casos há somente um grupo de estudo, porém cada elemento tem duas medidas, ou seja cada
criança foi avaliada duas vezes, portanto, há dois conjuntos de medidas.
O teste t de Student para grupos independentes compara as médias das duas amostras. Se tratarmos cada
conjunto de informações (a inicial e a final) como amostras diferentes e realizarmos o teste t para
amostras não pareadas, perderíamos a oportunidade de estudar uma informação muito importante: a
variação ou modificação observada em cada indivíduo que pertence ao estudo.
O objetivo fundamental no teste t para amostras pareadas é avaliar o comportamento das diferenças
observadas em cada elemento.
Neste caso a única exigência é que a variável tenha distribuição normal e que cada elemento tenha sido
avaliado no início e no final do estudo.
A hipótese inicial ou de trabalho em geral afirma que não ocorreu diferença entre a primeira e a segunda
avaliação. A hipótese alternativa contesta a inicial: ocorreu diferença estatisticamente significante.
O principio básico do teste é calcular a diferença observada entre as medidas de cada elemento do estudo
(D = Medidafinal – Medidainicial). A seguir, calcular a média ( D ) e o erro padrão da média das diferenças
( EP D ).
Comparação de duas populações - André Moreno Morcillo
• CONSTRUINDO O TESTE DE HIPÓTESES
Quando não há diferença importante entre as medidas inicial e final de cada elemento a média das
diferenças e o valor de t tendem a zero. Nos casos em que o procedimento aplicado tem forte impacto as
diferenças individuais passam a ser mais expressivas, com média e valor de t se afastando de zero.
Há três possibilidades para H1:
a) só interessa ao pesquisador saber se há diferença entre o início e o final do estudo
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 128/133
0D :1H
0 :0H
≠
= D
Trata-se de um teste bilateral com dois valores críticos de t ( -tα e +tα ) que são obtidos na tabela de t de
Student considerando-se o nível de significância adotado (α) e o número de graus de liberdade (n-1).
Se o valor de t < -tα ou t > +tα, t está na zona de rejeição de H0 , portanto, aceita-se H1. Quando o t <
+tα e t > -tα , está na zona de não rejeição de H0 (Figura 1).
b) Se interessa ao pesquisador saber se os valores no final do estudo são maiores que no início.Calculando D = Medidafinal – Medidainicial:
0D :1H
0 :0H
>
≤ D
Trata-se de um teste unilateral, sendo que o valor crítico de t ( +t ) é obtido na tabela de t de Student
considerando o nível de significância adotado (α) e o número de graus de liberdade. Se o t < t crítico nãose rejeita H0, caso contrário rejeita-se H0 (Figura 2).
c) Se interessa ao pesquisador saber se os valores no final do estudo são menores que no início.
Calculando D = Medidafinal – Medidainicial:
0D :1H
0 :0H
<
≥ D
Trata-se de um teste unilateral, sendo que o valor crítico de t ( -t
) é obtido na tabela de t de Student
Comparação de duas populações - André Moreno Morcillo
Exemplo I.4 - Um grupo de 10 crianças com asma grave, do sexo masculino e 4 anos de idade, que receberamtratamento com prednisona durante 6 meses. Com o objetivo de avaliar o impacto do tratamento no escore z da altura,os pacientes foram medidos no início e no final do período de estudo.
escore z da altura Diferenças
CriançaInicial Final Final - Inicial
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 129/133
n. 1 -0,807 -0,799 0,008
n. 2 0,302 0,305 0,003
n. 3 0,001 -0,023 -0,024
n. 4 1,234 1,089 -0,145
n. 5 -1,111 -1,099 0,012
n. 6 2,010 2,005 -0,005
n. 7 0,222 0,219 -0,003
n. 8 0,123 0,144 0,021
n. 9 -0,199 -0,05 0,149
n. 10 -0,155 -0,087 0,068
Média das diferenças ⇒ 0,008
Desvio padrão das diferenças ⇒ 0,073343
As 10 crianças apresentaram diferenças cuja média é igual a 0,008 e desvio padrão 0,073343. A seguir
calcula-se o Erro Padrão da Média.
023,010
073343,0== EP D
A partir da média e de seu erro padrão calcula-se o valor de t
Comparação de duas populações - André Moreno Morcillo
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 130/133
Comparação de duas populações - André Moreno Morcillo
BIBLIOGRAFIA
1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall, 1991.2. A NDERSON DR, SWEENEY DJ, WILLIAMS TA – Estatística aplicada à administração e economia.
2ª ed. São Paulo: Pioneira, 2002.
3. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação de Pesquisas
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 131/133
Científica de Ribeirão Preto, 2002.
4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.
5. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.6. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.
7. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.
8. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,
2003.
9. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:
John Wiley & Sons, Inc., 1995.10. GUIMARÃES RC, CABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.
11. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.
12. MARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.
13. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.
14. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e Científicos
Editora Ltda, 1999.
15. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.
ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.
Comparação de duas populações - André Moreno Morcillo
♦ Tabela de distribuição de t
Unilateral 40% 25% 10% 5% 2,5% 1% 0,5% 0.05%
Bilateral 80% 50% 20% 10% 5% 2% 1% 0,1%
1 0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192 2 0 288675 0 816497 1 885618 2 919986 4 30265 6 96456 9 92484 31 5991
8/19/2019 Morcillo - Estatisticas
http://slidepdf.com/reader/full/morcillo-estatisticas 132/133
2 0.288675 0.816497 1.885618 2.919986 4.30265 6.96456 9.92484 31.5991 3 0.276671 0.764892 1.637744 2.353363 3.18245 4.54070 5.84091 12.9240 4 0.270722 0.740697 1.533206 2.131847 2.77645 3.74695 4.60409 8.6103 5 0.267181 0.726687 1.475884 2.015048 2.57058 3.36493 4.03214 6.8688
6 0.264835 0.717558 1.439756 1.943180 2.44691 3.14267 3.70743 5.9588 7 0.263167 0.711142 1.414924 1.894579 2.36462 2.99795 3.49948 5.4079 8 0.261921 0.706387 1.396815 1.859548 2.30600 2.89646 3.35539 5.0413 9 0.260955 0.702722 1.383029 1.833113 2.26216 2.82144 3.24984 4.7809 10 0.260185 0.699812 1.372184 1.812461 2.22814 2.76377 3.16927 4.5869 11 0.259556 0.697445 1.363430 1.795885 2.20099 2.71808 3.10581 4.4370 12 0.259033 0.695483 1.356217 1.782288 2.17881 2.68100 3.05454 4.3178 13 0.258591 0.693829 1.350171 1.770933 2.16037 2.65031 3.01228 4.2208 14 0.258213 0.692417 1.345030 1.761310 2.14479 2.62449 2.97684 4.1405
15 0.257885 0.691197 1.340606 1.753050 2.13145 2.60248 2.94671 4.0728 16 0.257599 0.690132 1.336757 1.745884 2.11991 2.58349 2.92078 4.0150 17 0.257347 0.689195 1.333379 1.739607 2.10982 2.56693 2.89823 3.9651 18 0.257123 0.688364 1.330391 1.734064 2.10092 2.55238 2.87844 3.9216 19 0.256923 0.687621 1.327728 1.729133 2.09302 2.53948 2.86093 3.8834 20 0.256743 0.686954 1.325341 1.724718 2.08596 2.52798 2.84534 3.8495 21 0.256580 0.686352 1.323188 1.720743 2.07961 2.51765 2.83136 3.8193 22 0.256432 0.685805 1.321237 1.717144 2.07387 2.50832 2.81876 3.7921 23 0.256297 0.685306 1.319460 1.713872 2.06866 2.49987 2.80734 3.7676 24 0.256173 0.684850 1.317836 1.710882 2.06390 2.49216 2.79694 3.7454 25 0.256060 0.684430 1.316345 1.708141 2.05954 2.48511 2.78744 3.7251 26 0.255955 0.684043 1.314972 1.705618 2.05553 2.47863 2.77871 3.7066 27 0.255858 0.683685 1.313703 1.703288 2.05183 2.47266 2.77068 3.6896 28 0.255768 0.683353 1.312527 1.701131 2.04841 2.46714 2.76326 3.6739 29 0.255684 0.683044 1.311434 1.699127 2.04523 2.46202 2.75639 3.6594 30 0.255605 0.682756 1.310415 1.697261 2.04227 2.45726 2.75000 3.6460
∞ 0.253347 0.674490 1.281552 1.644854 1.95996 2.32635 2.57583 3.2905
top related