introducciónaloscontrastesdehipótesis. límites ...inferenciaestadística contrastesdehipótesis...
TRANSCRIPT
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción a los contrastes de hipótesis. Límitesde confianza y pruebas estadísticas
Métodos de contraste de hipótesis y diseño de experimentos
00RTeam
Marzo 2020
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
1 Inferencia estadística
2 Contrastes de hipótesis
3 Prueba t de Student
4 Comparación de medias: no paramétricos
5 Referencias y bibliografía
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Inferencia estadística
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Introducción. Simulación e inferencia
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Lanzamiento de una moneda. Simulación
Moneda p=0.5B(1, 0.5)
Lanzamientos(esperado 50% caras)
simulación
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Lanzamiento de una moneda. Simulación
# 100 lanzamientos con p = 0.5table( rbinom( 100, 1, 0.5 ) )
#### 0 1## 47 53
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Lanzamiento de una moneda. Inferencia
Moneda p=?B(1, ?)
Lanzamientos
inferencia
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Lanzamiento de una moneda. Inferencia
moneda <- c( 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1,1, 0, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0 )
table( moneda ) # 8 / 25 = 0.32
## moneda## 0 1## 8 17
# binom.test( table(moneda), p = 0.5)
¿Es razonable pensar que la moneda no está trucada, es decir, quep=0.5? Contraste de hipótesis
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Objetivo de la inferencia
La idea básica de las estadística es extrapolar, desde losdatos recogidos, para llegar a conclusiones más generalessobre la población de la que se han recogido los datos.
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Población y muestra
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Población y muestra
Población: Conjunto de referencia sobre el cual van a recaer lasobservaciones
Muestra: Subconjunto de elementos de la población. Se suelentomar muestras cuando es difícil o costosa laobservación de todos los elementos de la poblaciónestadística
Censo: Decimos que realizamos un censo cuando se observantodos los elementos de la población estadística
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Parámetros y estadísticos
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Parámetros y estadísticos
Parámetro: Medida o característica de una poblaciónEstadístico: Medida sobre una muestra cuyo objetivo es estimar o
inferir características de una población (parámetro)
Si un estadístico se usa para aproximar un parámetro también sele suele llamar estimador1.
1Diferentes test estadísticos aquí, Wikipedia.00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Teorema central del límite
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
Teorema central del límite
Si tenemos muestras independientes de una población, detamaños suficientemente grandes, entonces las medias deestas muestras seguirán una distribución normal con lamisma media que la de la población.
1 Dada una población con una distribución cualquiera2 Aleatoriamente obtenemos varias muestras de esa población y
calculamos sus medias3 Construimos un histograma de la distribución de frecuencias de
las medias4 Esta distribución de medias sigue una distribución normal2
2Ver vídeo, Barón López (2010)00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
TCL sobre una población normal
0 5 10
0.00
0.10
0.20
Normal de media 5 y desviación típica 2
0 5 10
0.0
0.4
0.8
Histograma de la distribución de medias de 100 muestras de tamaño 30
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Introducción. Simulación e inferenciaPoblación y muestraParámetros y estadísticosTeorema central del límite
TCL sobre una población χ2
0 2 4 6 8 10 12
0.00
0.10
0.20
Chi^2 con 3 grados de libertad (media = 3)
0 2 4 6 8 10 12
0.0
0.2
0.4
Histograma de la distribución de medias de 100 muestras de tamaño 10
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contrastes de hipótesis
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Definición
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste de hipótesis
H0 : hipótesis nulaH1 : hipótesis alternativa
1 Planteamos una hipótesis por defecto, que suele serconservadora
2 Calculamos un valor a partir de los datos obtenidos (muestra)3 Si el valor es razonable cuando la hipótesis nula es cierta, no
hay razón para pensar que es falsa3
3pág. 108, Grima (2010)00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste sobre una media: ejemploQuiero saber si la media de un conjunto de valores normales x esdiferente a 0.
H0 : µ = 0H1 : µ 6= 0
norm <- c( 3.2005, 0.2608, 1.5324, 1.92, 1.4173, 0.0164,-0.9709, 1.8213 )
med <- mean(norm); sd <- sd(norm)c( med, sd )
## [1] 1.149725 1.311472
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste sobre una media: ejemplo
Teorema: Si X ∼ N(µ, σ2) y X y S2 son la media y la varianza enuna muestra (X1, X2, ..., Xn) de tamaño n entonces se cumple:
t = X − µS/√n∼ tn−1.
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste sobre una media: ejemplo
tstat <- (med - 0) / (sd/sqrt(8)) # estadístico tgl <- length(norm) - 1 # grados de libertadtstat; gl
## [1] 2.47959
## [1] 7
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste sobre una media: ejemplo
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
Distribución t con 7 grados de libertad
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
P-valor
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
P-valor
p-valor: Probabilidad de observar una diferencia igual o mayorentre las medias muestrales, si suponemos que laspoblaciones tienen la misma media realmente.
Si el p-valor es pequeño, podemos suponer que la diferencia no sedebe al azar ⇒ Concluiríamos que las medias son distintas.
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
P-valor
La hipótesis nula H0 es contraria a la experimental.
p-valor: Probabilidad de observar una diferencia igual o mayorque la observada, si la hipótesis nula fuera cierta.
Si el p-valor es menor que 0.05 se suele considerar un resultado rarobajo la hipótesis nula, así que, se rechaza esta hipótesis.
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste sobre una media: ejemplo
pval <- 2 * pt( -abs(tstat), gl ) # p-valorpval
## [1] 0.04223546
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste sobre una media: ejemplo
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
Distribución t con 7 grados de libertad
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Intervalos de confianza
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Intervalos de confianza
Un intervalo de confianza es un rango de valores (calculado en unamuestra) en el cual se encuentra el verdadero valor del parámetrocon una probabilidad determinada.
Nivel de confianza 1− α: probabilidad de que el verdaderovalor del parámetro se encuentre en el intervaloNivel de significación α: probabilidad de equivocarnos
Normalmente 1− α = 0.95 (α = 0.05)
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Intervalos de confianza
P
(−tα/2 ≤
X − µS/√n≤ tα/2
)= 1− α
P
(X − tα/2
S√n≤ µ ≤ X + tα/2
S√n
)= 1− α
Se dice que(X − tα/2
S√n, X + tα/2
S√n
)es un intervalo de
confianza al nivel 1− α del parámetro µ.
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Intervalos de confianza
4 5 6
020
4060
8010
0
Muestras normales con mu=5 y sd=2
ICs
Núm
ero
de m
uest
ra
5 /100
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste sobre una media: ejemplo
norm <- c( 3.2005, 0.2608, 1.5324, 1.92, 1.4173, 0.0164,-0.9709, 1.8213 )
med <- mean(norm); sd <- sd(norm)c( med, sd )
## [1] 1.149725 1.311472
tt <- qt( 1 - 0.05/2, gl )cint <- med + c(-tt, tt) * sd/sqrt(8)cint
## [1] 0.05330683 2.24614317
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contraste sobre una media: ejemplo
t.test( norm )
#### One Sample t-test#### data: norm## t = 2.4796, df = 7, p-value = 0.04224## alternative hypothesis: true mean is not equal to 0## 95 percent confidence interval:## 0.05330683 2.24614317## sample estimates:## mean of x## 1.149725
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Potencia y errores
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Potencia y errores
Si p > 0.05 se concluye diciendo que no se ha encontrado una‘diferencia significativa’ pero esto no implica que no haya diferencia;simplemente no la hemos encontrado.
Error de tipo II o β: Cuando ‘afirmamos’ que no hay diferencias(p > 0.05) y, en realidad, sí las hay. Falso negativo.
Error de tipo I o α: Cuando ‘afirmamos’ que sí hay diferencias(p < 0.05) y, en realidad, no las hay. Falso positivo.
Posibles causas:
Tamaño de la muestraAlta variabilidad
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Potencia estadística y tabla de errores
La potencia estadística de un test es la probabilidad de encontrardiferencias cuando realmente existen. Es el complementario del errortipo II, 1− β.
H0 Verdadera H1 Verdadera
Aceptar H0 Verdadero positivo(1− α)
Error de tipo II (β ofalso negativo)
Rechazar H0 Error de tipo I (α ofalso positivo)
Verdadero negativo(1− β)4
4Más información aquí, McDonald (2014)00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contrastes paramétricos y no paramétricos
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contrastes paramétricos y no paramétricos
Contrastes paramétricosNecesitan (o asumen) cierta información sobre la distribuciónde probabilidad de la población. Se decide sobre los parámetros.
Contrastes no paramétricosNo necesitan información sobre la distribución de probabilidadde la población (libres de distribución).
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
¿Cuándo usar unos y otros?
Cuando sí hay normalidad:Paramétricos: más potentesNo paramétricos: casi tan potentes para detectar las diferencias
Cuando no hay normalidad:Paramétricos: algunos funcionan bien si solo podemos suponerla normalidad aproximadamente.No paramétricos: más potentes.
Muestras grandes: paramétricos y no paramétricos.Muestras pequeñas: no paramétricos.Datos ordinales o categóricos: no paramétricos.
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
DefiniciónP-valorIntervalos de confianzaPotencia y erroresContrastes paramétricos y no paramétricos
Contrastes paramétricos y altenativas no paramétricas
Table 2: Pruebas paramétricas y no paramétricas
Grupos Paramétricos Ordinales Categóricos
2 independientes t independiente Mann-Whitney Exacto de Fisher2 dependientes t dependiente Wilcoxon McNemar2 o más independientes ANOVA de 1 vía Kruskal-Wallis Chi-cuadrado2 o más dependientes ANOVA medidas repetidas Friedman Q de Cochran
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t de Student
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Introducción
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t de Student
Contraste paramétrico para comparar las medias entre dos grupos.
Tres tipos:
Prueba t para una muestraPrueba t para dos muestras dependientesPrueba t para dos muestras independientes (con corrección deWelch si las varianzas son diferentes)
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Supuesto de normalidadLa normalidad se puede visualizar con los gráficos Q-Q (qqnorm(),qqline()). Para contrastarla podemos utilizar:
El test de Shapiro-Wilk con shapiro.test(). Funciona biencon muestras pequeñas (menores a 50)El test de Kolmogorov-Smirnov con ks.test(). Contrastadistribuciones (no solo la normal)Corrección de Lillefors en KS, lillie.test() del paquetenortest.El test de Jarque-Bera con jarque.bera.test() del paquetetseries.
La hipótesis nula es la hipótesis de normalidad, esto es, no haydiferencias entre nuestra distribución y una distribución normal conesa media y esa desviación típica.
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Supuesto de homocedasticidad (HOV)
También llamada homogeneidad de varianzas. La hipótesis nula es:la varianza es constante (no varía) en los diferentes grupos. Paracontrastarla podemos utilizar:
El test F de Snedecor con var.test(). Solo dos gruposEl test de Levene con leveneTest() del paquete carEl test de Bartlett con bartlett.test(). Es mejor queLevene si los datos son normales (más robusto)El test de Fligner-Killen con fligner.test(). De los másrobustos a la falta de normalidad
Reglilla: Balanceadas y no HOV: ok si S2Max
S2Min
< 3 (si no hay
balanceo, cambiar por un dos)00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t para una muestra
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t para una muestra: hipótesis
Utilizado cuando tenemos una variable de medida y un valoresperado para la media. Se supone normalidad de los datos (omuestra grande)5.
H0 : µ = µ0
H1 : µ 6= µ0
t.test( x, mu = 0, alternative = "two.sided" )
5Más información aquí, McDonald (2014).00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t para una muestra: ejemplo
Un veterinario, basado en su experiencia, cree que la concentraciónde adrenalina en la sangre de un perro aumenta un promedio de un10% al aplicar cierta dosis de droga. Para comprobarlo, somete altratamiento a una muestra de 16 perros y observa el aumento de laconcentración en cada uno de ellos. ¿Podemos concluir con un nivelde significación de 0.05 que el promedio de aumento es 10?
x <- c( 9.87, 9.81, 9.76, 9.83, 9.95, 9.88, 9.65, 9.78,9.84, 9.78, 9.80, 9.72, 9.89, 9.98, 9.82, 10.00 )
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo para una muestra: normalidad
qqnorm( x )qqline( x )
shapiro.test( x )
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo para una muestra: t-test
t.test( x, mu = 10, alternative = "two.sided" )
#### One Sample t-test#### data: x## t = -7.117, df = 15, p-value = 3.524e-06## alternative hypothesis: true mean is not equal to 10## 95 percent confidence interval:## 9.785584 9.884416## sample estimates:## mean of x## 9.835
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t dependiente
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t dependiente: hipótesis
Utilizado cuando tenemos dos variables dependientes (p.e. sobre losmismos individuos). Es equivalente al de una muestra si tomamos lavariable diferencia. Se supone normalidad de las diferencias (omuestra grande)6
H0 : µ1 = µ2 H0 : µ1 − µ2 = 0H1 : µ1 6= µ2 H1 : µ1 − µ2 6= 0
t.test( x, y, paired = TRUE )
6Más información aquí, McDonald (2014)00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo freshman: conjunto de datos para trabajar
¿Se modifica el BMI de los estudiantes de primer año entreseptiembre y abril?
freshman <- read.table("http://people.sc.fsu.edu/~jburkardt/datasets/triola/freshman_15.csv",header = TRUE, sep = ",",col.names = c("Sex", "SeptWeight", "AprWeight", "SeptBMI", "AprBMI"))
head( freshman )
## Sex SeptWeight AprWeight SeptBMI AprBMI## 1 M 72 59 22.02 18.14## 2 M 97 86 19.70 17.44## 3 M 74 69 24.09 22.43## 4 M 93 88 26.97 25.57## 5 F 68 64 21.51 20.10## 6 M 59 55 18.69 17.40
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo freshman: normalidad
qqnorm( freshman$SeptBMI - freshman$AprBMI )qqline( freshman$SeptBMI - freshman$AprBMI )
shapiro.test( freshman$SeptBMI - freshman$AprBMI )
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo freshman: test t dependiente
# t.test(freshman$SeptBMI - freshman$AprBMI)t.test( freshman$SeptBMI, freshman$AprBMI, paired = TRUE )
#### Paired t-test#### data: freshman$SeptBMI and freshman$AprBMI## t = -2.9516, df = 66, p-value = 0.004374## alternative hypothesis: true difference in means is not equal to 0## 95 percent confidence interval:## -0.7614044 -0.1469539## sample estimates:## mean of the differences## -0.4541791
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t independiente
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Prueba t independiente: hipótesis
Utilizado cuando tenemos dos variables independientes. Esequivalente a un ANOVA de una vía con dos categorías. Se suponenormalidad (o muestra grande) y homocedasticidad u homogeneidadde varianzas (en caso contrario, corrección de Welch)7
H0 : µ1 = µ2 H0 : µ1 − µ2 = 0H1 : µ1 6= µ2 H1 : µ1 − µ2 6= 0
t.test( x, y, paired = FALSE, var.equal = TRUE )
7Más información aquí, McDonald (2014).00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo 2 freshman: conjunto de datos para trabajar¿Difiere el BMI de abril de los estudiantes de primer año entrehombres y mujeres?
head( freshman, 6 )
## Sex SeptWeight AprWeight SeptBMI AprBMI## 1 M 72 59 22.02 18.14## 2 M 97 86 19.70 17.44## 3 M 74 69 24.09 22.43## 4 M 93 88 26.97 25.57## 5 F 68 64 21.51 20.10## 6 M 59 55 18.69 17.40
# boxplot( freshman$AprBMI ~ freshman$Sex )
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo 2 freshman: normalidad
table( freshman$Sex ) # tamaños muestrales > 30 => Okshapiro.test( *vector BMI de abril de las mujeres* )# p = 0.2042shapiro.test( *vector BMI de abril de las hombres* )# p = 6.063e-0
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo 2 freshman: homocedasticidad
fligner.test( freshman$AprBMI, freshman$Sex )# leveneTest( freshman$AprBMI ~ freshman$Sex )
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
IntroducciónPrueba t para una muestraPrueba t dependientePrueba t independiente
Ejemplo 2 freshman: prueba t independiente
t.test( freshman$AprBMI ~ freshman$Sex, var.equal = T )
#### Two Sample t-test#### data: freshman$AprBMI by freshman$Sex## t = -1.2802, df = 65, p-value = 0.205## alternative hypothesis: true difference in means is not equal to 0## 95 percent confidence interval:## -2.873888 0.628638## sample estimates:## mean in group F mean in group M## 21.94800 23.07062
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Comparación de medias: no paramétricos
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Tests no paramétricos en R
Comparación de dos medias independientes (U-test):
wilcox.test( x, y )wilcox.test( variable ~ factor, data = df ) #Con fórmula
Comparación de dos medias dependientes (Prueba de losrangos con signo de Wilcoxon):
wilcox.test( x, y, paired = TRUE)wilcox.test( variable ~ factor, paired = TRUE, data = df )
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Referencias y bibliografía
Referencias y bibliografía
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Referencias y bibliografía
Referencias y bibliografía
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas
Inferencia estadísticaContrastes de hipótesis
Prueba t de StudentComparación de medias: no paramétricos
Referencias y bibliografía
Referencias y bibliografía
Referencias y bibliografía
Barón López, F. J. (2010). Bioestadística. teorema del límite central -youtube. Retrieved fromhttps://www.youtube.com/watch?v=FcDcJnw00hk
Grima, P. (2010). La certeza absoluta y otras ficciones: Los secretos de laestadística. RBA.
Maurandi-López, A., Balsalobre R, C., & Río-Alonso, L. del. (2013).Fundamentos estadísticos para investigación. introducción a r. BubokPublishing SL. Retrieved from http://www.bubok.es/libros/223207/Fundamentos-estadisticos-para-investigacionIntroduccion-a-R
McDonald, J. (2014). Handbook of biological statistics (3rd ed.). SparkyHouse Publishing, Baltimore, Maryland. Retrieved fromhttp://www.biostathandbook.com/
00RTeam Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas