¿por qué resumir?
TRANSCRIPT
26/1/2021
1
Consideraciones éticas
Diseño
Participantes
Entorno
Intervenciones
Análisis estadístico
¿Cómo se hizo?
Objetivos de la Clase:
- Definir qué es la estadística descriptiva y diferenciarla con estadística inferencial.
- Cómo se reportan las variables categóricas: Frecuencias Absolutas y Relativas (porcentaje)
- Cómo se reportan las variables numéricas: Media, mediana, moda, desvío estandar,
percentiles (cuartiles).
- Tipos de distribución (Normal) Test de Normalidad.
- Concepto de estadistica inferencial, estimación por intervalos de confianza.
Estadística
Descriptiva Inferencial
Presentación, organización y
resumen de la información.
Generar Hipótesis.
Sacar conclusiones de la
población a partir de lo
observado en una muestra.
Probar Hipótesis.
¿ cuál es el valor más frecuente en este conjunto de datos?
¿ cuál es el valor mínimo en este conjunto de datos?
¿ cuál es el valor máximo en este conjunto de datos?
¿ cuál es valor promedio?
¿Por qué resumir?
Definición:
Rama de la matemática que trata de los métodos para organizar y presentar datos numéricos para que se haga fácil su interpretación. Sus recursos suelen ser cálculos, tablas, gráficos.
Estadística descriptiva
1 2
3 4
5 6
26/1/2021
2
¿Cómo se resume?Términos… • Media = Promedio = mean • Desvío Estándar (DE) = Standard Desviation (SD)• Mediana o Percentil 50 o segundo cuartil (C2) = Median (Med)
• Percentil 25 - Percentil 75 (25 -75) o Primer y tercer cuartil (C1 –C3) first and third quartiles (Q1-Q3)
• Rango Intercuartílico (RIQ, diferencia entre Q3-Q1) = IQR (Interquartile Range)
• Rango (diferencia entre máximo y mínimo) • Mínimo - Máximo (Min - Max) = Min - Max • Tamaño muestral (N) = sample size
• Frecuencia absoluta (n) = Cantidad de eventos• Frecuencia relativa (%)= cantidad de eventos con respecto a total
Materiales y Métodos
• Redacción del apartado estadístico:
• El objetivo de esta sección de materiales y métodos es detallar que técnicas o herramientas estadísticas se utilizaron para describir o analizar los resultados del estudio.
• Subtitulo: Análisis Estadístico
7 8
9 10
11 12
26/1/2021
3
13 14
15 16
17 18
26/1/2021
4
Ejemplo de sección “Análisis estadístico”…
Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje.
Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.
Se utilizó la prueba de Shapiro Wilk para evaluar la parametricidad(normalidad) de las variables numéricas.
Se estableció como significativo un valor de p < 0,05.
“Dime en que escala mides y te diré como la representas…”
Análisis estadístico:
Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje del total.
Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.
Se utilizó la prueba de Shapiro Wilk para evaluar la normalidad de las variables numéricas.
Se estableció como significativo un valor de p < 0,05.
Frecuencia absoluta o
número de veces en que
dicho evento se repite
durante un experimento o
muestra.
n
¿Qué es “número absoluto de presentación”?
Frecuencia
Absoluta Frecuencia
Relativa(%)
19 20
21 22
23 24
26/1/2021
5
Frecuencias Absolutas: número de veces que aparece un determinado
valor. La suma de las frecuencias absolutas es igual al número total de
datos (se representa por la letra “n”).
Frecuencias Relativas: es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos para esa categoría. Se
puede expresar en porcentaje. La suma de las frecuencias relativas es
igual a 1 (100%).
n o FA = 8
¿Cuál es la frecuencia absoluta de masculinos?
Sexo femenino=0
Sexo masculino=1
¿Cuál es la frecuencia relativa de femeninos?
FR de femeninos = 4/12= 0,333
Id Apellido Edad sexo
1 García 34 1
2 Gimenez 45 0
3 Pérez 32 1
4 Maradona 28 1
5 Gutierrez 49 0
6 Diaz 41 1
7 Silva 32 0
8 García 25 1
9 Gonzalez 40 1
10 Andreu 37 0
11 Sanguinati 50 1
12 Tevez 38 1
% de femeninos = 0,333 x 100 = 33,3%
Excluyente: Sexo
- Masculino (66,1)
- Femenino (43,9)
No Excluyente: a)Servicio que lo ingresó
- Medicina (19,4)
- Cirugía (?)
- Trauma(?)
- Podría haber más(?)
b) Tipo de TQT
-Percutanea
-Quirurgica
-?
Ejemplo:
TQT Percutanea
-Si (77,2)
-No (22,8)
?
25 26
27 28
29 30
26/1/2021
6
Análisis estadístico:
Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje del total.
Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.
Se utilizó la prueba de Shapiro Wilk para evaluar la parametricidad(normalidad) de las variables numéricas.
Se estableció como significativo un valor de p < 0,05.
Reportando Variables Contínuas
• Medidas para reportar el centro de la información = Media (x) y Mediana (Med o P50)
• Medidas para reportar la disperción (variabilidad) de los datos = Desvío Estándar (DE) Varianza (σ2), Rango (R), Rango intercuartil (RIC)
• Otras medidas de Ubicación de los datos = Maximo y Mínimo (Máx- Min), Percentiles (P25 - P75), Cuartiles (Q1 – Q3)
Media muestral
Sumar datos y dividir por el número total de datos (tamaño muestral)
31 32
33 34
35 36
26/1/2021
7
ID VAS
1 5
2 7
3 9
4 8
5 7
6 7
7 6
8 6
5 + 7 + 9 + 8 + 7 + 7 + 6 + 6 = 55/8 = 6,88 5 + 7 + 9 + 8 + 7 + 7 + 6 + 6 + 1 + 1 = 57/10 = 5,7
La media es sensible a datos extremos
[(5 + 7 + 9 + 8 + 7 + 7 + 6 + 6)x3] + 1 + 1 = 167/26 = 6,42
A ↑ tamaño muestral ↑ la estabilidad a datos extremos Mediana (percentil 50)
Valor del medio que es menor
a una mitad de la muestra y
mayor a la otra mitad de la
muestra
5 + 6 + 6 + 7 + 7 + 7 + 8 + 9 = 14/2 = 7
5 + 7 + 9 + 8 + 7 + 7 + 6 + 6 = 55/8 = 6,88
La mediana es más estable a datos extremos
1+1+ 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9 = 13/2 = 6,5
Percentil
Percentil 25 =
1 2 3 4 5 6 7 8 9 10
25
100(10+1)
Percentil 25 = 25/100 x 11
Percentil 25 = 2,75
1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9
2,75
El valor por debajo del cual se encuentra un porcentaje de los datos
37 38
39 40
41 42
26/1/2021
8
Percentil
Percentil 25 = 2,75º ≈ 3º = 5
Percentil 50 = 5,5º = 6,5 (6+7/2 )
Percentil 75 = 7,25 ≈ 7º = 7
Med (p25 - p75) = 6,5 (4 – 7,25)
6,5 (5 - 7)
1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9 Los Percentiles dividen a la muestra en 100 partes
Percentil 25 = 1º Cuartil
Percentil 50 = 2º Cuartil
Percentil 75 = 3º Cuartil
Los cuartiles la dividen en 4 partes
Entre cada cuartil queda el 25% de la muestra
25%25%25%25%
1º Cuartil 2º Cuartil 3º Cuartil
Percentil 25 (P25) o 1º cuartil (Q1) y Percentil 75 (P75) o 3º cuartil (Q3)
1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9
Rango intercuartil (RIC)
Rango intercuartil = 3,25
1ºQ = 4
3ºQ = 7,25
3ºQ - 1ºQ = 7,25 - 4
50% 50%
10 días
14 días
17 días
25%25% 50%
43 44
45 46
47 48
26/1/2021
9
Valor Mínimo y Máximo
1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9
Rango
Rango = 8
Mínimo = 1
Máximo = 9
1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9
50% 50%
41 días
100%
16 días 235 días
Rango = 219
DE (desvío estándar)
¿Qué tan lejos están los números del promedio (media)?
Raíz Cuadrada del promedio de los
cuadrados de las desviaciones de la media.
6,88Media VAS: 6,88 puntos
49 50
51 52
53 54
26/1/2021
10
6,88
IDVAS
basal (Valor – Media) (Desviación)2
1 5 -1.88 3,53
2 7 0,12 0,01
3 9 2,12 4,49
4 8 1,12 1,25
5 7 0,12 0,01
6 7 0,12 0,01
7 6 -0,88 0,77
8 6 -0,88 0,77
6,88 0 10,84/7 = 1,55 DE= √1,55 = 1,25 puntos
¿Que tan lejos están los números del promedio (media)?
Análisis estadístico:
Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje del total.
Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.
Se utilizó la prueba de Shapiro Wilk para evaluar la parametricidad(normalidad) de las variables numéricas.
Se estableció como significativo un valor de p < 0,05.
• 1 sola mmoda y media = mediana
• Valores simétricamente
distribuidos a ambos lados de la
media (50% y 50%)
• Valores cercanos a la media son
mas frecuentes que los valores
alejados de la media
Propiedades de la Distribución NormalDistribución Normal
ID VAS basal
1 5
2 7
3 9
4 8
5 7
6 7
7 6
8 6
Media VAS: 6,88 puntos
DE ± 1,25 puntos
Mediana VAS = 7 puntos
Media VAS 6,88 puntos
DE ± 1,25 puntos
55 56
57 58
59 60
26/1/2021
11
¿ Cómo puede explicarse esto ?
72,1 + 2DE = 72,1 + (2x67,7) = 72,1 + 135,4 = 207,5 días
72,1 - 2DE = 72,1 - (2x67,7) = 72,1 - 135,4 = -63,3 días
Todo muy lindo… pero ... ¿cómo sabemos qué
utilizar?
Análisis estadístico:
Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje del total.
Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.
Se utilizó la prueba de Shapiro Wilk para evaluar la parametricidad(normalidad) de las variables numéricas.
Se estableció como significativo un valor de p < 0,05.
Prueba de NormalidadLos resultados de la prueba indican si rechazamos o aceptamos la
hipótesis nula de que los datos provienen de una población distribuida
normalmente.
Ho = Los datos tienen una distribución aprox normal
Ha = Los datos NO tienen una distribución aprox normal
p < 0.05 >>>>> Rechazamos Ho
p ≥ 0.05 >>>>> No Rechazamos Ho
61 62
63 64
65 66
26/1/2021
12
Ho = La distribución de los datos es aproximadamente normal.
Nivel de significancia 5%
Valor p < 0.05 = Ho >>>> No puedo asumir normalidad
Entonces ... Mediana (RIQ) o Mediana (Mín-Máx)
Medidas de Forma
- Asimetría o Skewness
- Curtosis o Kurtosis
Histograma
Es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra
es proporcional a la frecuencia de los valores
representados.
Asimetría: Es una medida de la forma de una distribución.
Negativa (Izquierda): la media es menor que la mediana.
Simétrica: la media es similar a la mediana.
Positiva (Derecha): la media es mayor a la mediana.
Curtosis: determina el grado de concentración que presentan los valores en la
región central de la distribución.
Leptocúrtica: Existe una gran concentración.
Mesocúrtica: Existe una concentración normal.
Platicúrtica: Existe una baja concentración.
67 68
69 70
71 72
26/1/2021
13
Resumen Test de Normalidad
p ≥ 0.05 Distribución Normal ➞ media (DE)
p < 0.05 ➞ mediana (p25 – p75)
➞ mediana (min – max)
Shapiro-Wilk hasta 50
Kolmogorov-Smirnov ≥ 51
73