Felipe Sepúlveda LópezBiólogo Marino
Estadística Biología Marina 2003
Estadística (Bioestadística)
Estadística (Bioestadística)
Sobre mi…Sobre mi…
• No soy un estadístico.»Tesis 2002 en…»Magíster en Cs. del Mar…
• El énfasis del curso esta en la práctica de la herramienta estadística y no en los teoremas y demostraciones.
Estadística Biología Marina 2003
¿Porque deberíamos saber ¿Porque deberíamos saber “algo” de estadistica?“algo” de estadistica?
• Es necesario aprender las propiedades de la estadística, para utilizarla en diseños experimentales y análisis de datos.
• Como biólogos debemos desarrollar nuestra habilidad para discriminar argumentos científicos (o pseudo-científicos).
Estadística Biología Marina 2003
Que es lo que espero de Uds.Que es lo que espero de Uds.
• ATENCIÓN en la clases y Ayudantías
• Retroalimentación hacia mi con respecto a lo que les gusta y no les gusta del curso.
(criticas constructivas)
Estadística Biología Marina 2003
Objetivos del CursoObjetivos del Curso
• Entender los principales fundamentos de la estadística descriptiva e inferencial.
• Entender los principios generales sobre los cuales están basados los test estadísticos más comunes utilizados en biología.
Estadística Biología Marina 2003
• Conocer los principales supuestos (pre-requisitos), de los test más comunes y entender el impacto de sus violaciones.
• Ser capaz de desarrollar variados análisis estadísticos utilizando las herramientas de Excel y SYSTAT.
Estadística Biología Marina 2003
Clases y AyudantíaClases y Ayudantía• Cátedra:
» Lunes 14:00 - 15:30 (Sala 12).» Martes 14:00 – 15:30 (Sala 10).
• Ayudantía:1) Miércoles 14:00 – 15:30 (Sala 1).
2) Miércoles 9:55 – 11:25 (Sala 1).
Laboratorio de Computación
Lunes – 14 – Abril Miércoles - 16 – Abril
Lunes – 12 – Mayo Miércoles 14 – Mayo
Lunes – 9 – Junio Miércoles 11 – Junio
Lunes – 14 – Julio Miércoles 16 – Julio
EvaluaciónEvaluación
Estadística Biología Marina 2003
1° prueba = 30% 13 – Mayo – 2003
2° prueba = 30% 1 – Julio – 2003
Seminario = 40% 8 – Julio – 2003
TextosTextos
Estadística Biología Marina 2003
• Guía del curso estadística de biología marina. UCN, 2003.
• Zar, J.H. 2000. Biostatistical Analysis (4th edition), Prentice-Hall, Upper saddle River, New Jersey.
• Spiegel, M.R. 1991. Estadística. McGrawHill.
• STEEL, R.G.D. and TORRIE, 1980, J.H. Principles and procedures of statistics: a biometrical approach. 2.ed. New York : McGraw-Hill,. 631p.
• Sokal, R.L. & F.J. Rohlf. 1995. Biometry (3rd edition), W.H. Freman & Co., New York, or
Preparación de clases.Preparación de clases.
• Leer el capítulo apropiado desde los textos mencionados y traer las preguntas clases.
• Si tienen alguna pregunta…¡Preguntar inmediatamente!. No existen las preguntas estupidas.
• Para las ayudantías, se debe manejar los contenidos para practicar con ejercicios.
Estadística Biología Marina 2003
• Siempre venir a clases y ayudantías con:
– Guía de clases, con tablas
– CALCULADORA
Estadística Biología Marina 2003
• Por favor no sean participantes pasivos de la clase.
• Por favor no sean participantes pasivos de la clase.
• Y si quedan dudas….» Lunes 10:00 – 11:30.
» Martes 10:00 – 11.30.
¿Qué es la Estadística?¿Qué es la Estadística?
• Estadísticas (plural): Datos recogidos de forma sistemática para obtener información sobre un tema (demográfico, social, económico, biológico, etc..)
Ejemplo: Captura de Anchovetas, goles del último clásico.
• Estadística (singular): Disciplina que comprende técnicas de recolección, presentación, análisis e interpretación. Permite poner a prueba de hipótesis y tomar decisiones en base a la teoría de probabilidades.
• Bio-Estadística: aplicación de herramientas de estadística en el área biológica
Estadística Biología Marina 2003
Algunas utilidades de la Algunas utilidades de la EstadísticaEstadística
Descripción Diseño Test de hipótesis
Provee de resúmenes de datos.Ayuda a descubrir patrones o tendencias.Evalúa la magnitud y dirección de los efectos experimentales.
Ayuda al diseño de experimentos y estudios de campo.
Permite tomar decisiones a priori sobre la utilidad de algún experimento.
Evalúa hipótesis biológicas a través de tests, para verificar si los patrones observados son consistentes con las predicciones.
Tipos de estadística (función):Tipos de estadística (función):
• Descriptiva:Analiza una población sin pretender sacar conclusiones generales (conclusiones validas para dicha población)
Ordenamiento y descripción de un conjunto de datos
Estadística Biología Marina 2003
• Inferencial:Tiene como propósito inducir leyes de comportamiento de una población a partir de muestras.
A partir de una muestra se obtienen conclusiones de toda la población
Usos de la estadística: Usos de la estadística: Descripción & Síntesis.Descripción & Síntesis.
• Generar un resumen de los datos.
• Ayuda a descubrir tendencias (inducción) a través de la examinación de resúmenes de patrones estadísticos
Para tener en cuenta: En un resumen estadístico mucha información se pierde. Por lo tanto, ¡SIEMPRE se debe conservar los datos crudos!
Estadística Biología Marina 2003
Usos de la estadística: Inferencial.Usos de la estadística: Inferencial.
• ¿Las diferencias observadas son “reales” o simplemente provocadas por accidente?
• Para responder esta pregunta, necesitamos conocer la probabilidad de que los resultados observados se deban efectivamente a un accidente o coincidencia?
• Los test estadísticos nos permiten calcular esta probabilidad y elaborar conclusiones
Estadística Biología Marina 2003
Usos de la estadística: Diseño Usos de la estadística: Diseño experimental.experimental.
• Focalización del esfuerzo
• Decidir a priori sobre la utilidad de un experimento
Estadística Biología Marina 2003
“Llamar a un estadístico después de que el experimento esta terminado, quizás no va a servir mas que para pedirle que realice una autopsia; seguramente el va a estar capacitado para decir de que murió el experimento”
Sir Ronald Fisher
Toma de muestras o “muestreo”Toma de muestras o “muestreo”
• Población o Universo: Corresponde a todo el grupo de cosas animales o personas sobre las que queremos obtener información. (esta definida en base a nuestros requerimientos)
• Unidad: Miembro individual de la población.
• Muestra: Porción de la población sobre la que tomamos información para obtener conclusiones sobre la población.
• Variable: Característica de una unidad, que es medida en todas la unidades de la muestra.
Estadística Biología Marina 2003
Estadística Biología Marina 200
3
Población Muestra Variable
Mujeres y hombres chilenos, entre 16 a 26 años.
100 hombres y mujeres jóvenes
de todas las capitales
regionales de Chile.
Nivel de nicotina medida en una
muestra sanguínea.
x
Población
muestra
Lo que la estadística puede y no Lo que la estadística puede y no puede hacer:puede hacer:
Estadística Biología Marina 2003
Puede NO Puede
•Proveer de criterios objetivos para evaluar hipótesis.•Ayuda a optimizar esfuerzos•Ayuda a evaluar críticamente argumentos
•Decir la verdad absoluta (solo una verdad probabilística)•Ayudar a un diseño pobre•Indicar significancia biológica: La significancia estadística no significa signifcancia biológica (vice versa)
Tipos de Variables (datos) Biológicas.Tipos de Variables (datos) Biológicas.• Datos en Escala Proporcional:
Existe un tamaño de intervalos constante, entre unidades adyacentes.
Existe un punto “0” que presenta significado físico.Ej: tamaños, conteos, pesos, volúmenes….
Estadística Biología Marina 2003
• Datos en Escala de Intervalos:Poseen un tamaño de intervalos constante, entre unidades
adyacentes.No tienen un punto “0” con valor físico.
Ej: temperatura en °C o °F.
Kelvin [K] Kelvin [K]0 absoluto tiene importancia física
Variables circulares
Estadística Biología Marina 200
3
Tipos de Variables (datos) Biológicas.Tipos de Variables (datos) Biológicas.
• Datos en Escala Ordinal (“orden”):Existe una diferencia relativa entre las magnitudes de
nuestras variables.
Ej: Tamaño celular 1,2 o 3; Color mas oscuro, mas claro, intermedio….
• Datos en Escala Nominal:– La variable se identifica por una cualidad “atributo” de esta.
Ej: Fenotipos como color de ojos, cabello. Machos o Hembras.
Datos Continuos y DiscretosDatos Continuos y Discretos
• Continuas: Permiten cualquier valor entre un determinado rango de mediciones observadas.Ej.: Altura de 35-36cm, entre ellas puede estar 35.2 o 35.1888 o 35.18878456….
• Discretas: Variables que pueden tomar solo valores enteros.Ej: Número de ostiones, personas.
Estadística Biología Marina 2003
Exactitud (accuracy):Exactitud (accuracy):
• ¿Qué tan cerca se encuentra nuestro valor observado del valor real?:
Estadística Biología Marina 2003
yx
observadoesperado
Modelos propuestos:
a) Y es una función lineal de X.
b) Y es una función no lineal de X.
Modelo mas exacto
Modelo menos exacto b es el modelo mas exacto:
Los valores observados están, en promedio, mas cerca de los observados
Precisión:Precisión:• ¿Qué tan cerca se encuentra, una de otra
medición, realizadas sobre una misma variable?– Se encuentra altamente influenciada por la
experiencia y rigurosidad de quien realiza la medición.
Estadística Biología Marina 2003
-5.56cm
-5.60cm
-5.58cm
-5.286cm
-5.749cm
-5.582cm
Precisión v/s Exactitud:Precisión v/s Exactitud:
Pobre
Buena
PobreBuena
Precisión
Exactitud
Tipos de Escalas de Datos:Tipos de Escalas de Datos:
• Escala Proporcional
• Escala Intervalos
• Escala Ordinal
• Escala Nominal
–Datos Continuos
–Datos Discretos
Estadística Biología Marina 2003
Estadística Biología Marina 200
3
Figuras Significativas y Figuras Significativas y Redondeo de Datos:Redondeo de Datos:
• Los dígitos de un número que denotan la exactitud la medición = Fig. Significativa.
Ejemplos:
7 cm = 1
7.04 cm = 3
7.14 cm = 3
7.90 cm = ?
Estadística Biología Marina 2003
21.00 parásitos = ?
321 parásitos = ?
44 parásitos = ?
Estadística Biología Marina 200
3
255
25.5
2.55
0.255
0.0255
2.55 x 102
2.55 x 101
2.55
2.55 x 10-1
2.55 x 10-2
Todos tienen3 cifras
significativas
Todos tienen3 cifras
significativas
En notación científica
Más Casos: Más Casos:
Rangos Implicados:Rangos Implicados:
Estadística Biología Marina 2003
•El largo del ala de una mariposa es de 5.4 cm.
“Esta medición implica una exactitud de 0.1cm”
•Por convención, teóricamente el largo del ala
de la mariposa está entre : 5.35 – 5.455.35 – 5.45
Rango implicado a nuestra exactitud
Otros ejemplos:Otros ejemplos:
Estadística Biología Marina 2003
Valor RangoFiguras
SignificativasExactitu
d
8 7.5 - 8.5 1 1
8.3 8.25 – 8.35 2 0.1
8.328.315 – 8.325
3 0.01
Aproximaciones y Redondeo:Aproximaciones y Redondeo:
78.3 = 79145.6 = 146
Estadística Biología Marina 2003
Pero: 56.5 ?
Si el ultimo digito anterior es par … aproximar hacia abajo
Si el último digito anterior es impar … aproximar hacia arriba
48.5 = 48
57.5 = 58
Distribuciones de Frecuencias:Distribuciones de Frecuencias:
• Tablas de frecuencias: Clasificación, ordenamiento y resumen de una gran cantidad de información.
• Consiste simplemente en:– Una lista de los valores observados en la
variable bajo estudio.– Cuantas veces este valor se repite.
Estadística Biología Marina 2003
Ubicación de nidos de gorriones:Ubicación de nidos de gorriones:
UbicaciónNúmero de
nidos observados
a- Canaletas 56
b- Balcones 60
c- Cavidades de Construcciones
46
d- Ramas de Árboles
49 a b c d
0
10
20
30
40
50
60
Ubicación de Nidos
Estadística Biología Marina 2003
Tabla de FrecuenciasTabla de FrecuenciasDistribución de Distribución de FrecuenciasFrecuencias
Confección de tabla:Confección de tabla:
¿Como construimos una tabla de frecuencias cuando nuestros datos
no son nominales?
¿Como construimos una tabla de frecuencias cuando nuestros datos
no son nominales?
Estadística Biología Marina 2003
Para empezar determinar:
Rango de datos
Número de clases
Amplitud de intervalo de clases
Determinar rango clase
Rango de datosRango de datos
• Distancia entre el dato máximo y mínimo
Estadística Biología Marina 2003
mínmáx XXR mínmáx XXR
Consumo de proteínas de 20 Consumo de proteínas de 20 ostiones de laboratorio.ostiones de laboratorio.
21 25 35 22 1824 21 23 16 2327 17 26 19 2920 19 20 23 22
Rango = 35-16 = 19
Número de ClasesNúmero de Clases
• Número de categorías o intervalos en el que se va a dividir la información
Estadística Biología Marina 2003
Se puede determinar arbitrariamente en base a la variación de nuestros datos.
Generalmente varía entre 5 a 20 categorías
Se puede determinar arbitrariamente en base a la variación de nuestros datos.
Generalmente varía entre 5 a 20 categorías
En este ejemplo se utilizarán 5 clases.En este ejemplo se utilizarán 5 clases.
Amplitud de intervaloAmplitud de intervalo
• Cantidad de datos que están comprendidos en un intervalo de clase.
Estadística Biología Marina 2003
clasesdeNúmero
RangoIntervAmpl ..
Del ejemplo: 19/5 = 3.8 ≈ 4
Solo se aproxima si los datos son discretos o enteros
Rango de claseRango de clase
• Significa hallar los límites inferiores y superiores de cada intervalo– Para ello al dato menor se le suma la
amplitud del intervalo (4 en este caso).
– La marca de clase corresponde al valor medio ubicado en cada rango de clase.
Estadística Biología Marina 2003
21 25 35 22 1824 21 23 16 2327 17 26 19 2920 19 20 23 22
Rango de clase Marca clase
16 19 17.516, 17, 18 y 19 = 4
Amplitud de intervalo
Marca de clase
¿Cómo queda el resto de la
tabla?
Debería quedar así:Debería quedar así:
Rango de clase Marca clase
16 19 17.5
20 23 21.5
24 27 25.5
28 31 29.5
32 35 33.5
Frecuencia AbsolutaFrecuencia Absoluta• Es el número de veces que se repiten los
valores dentro de los diferentes intervalos en que se ha dividido la información
Estadística Biología Marina 2003
Rango de clase
Marca clase
Frecuencia Absoluta
16 19 17.5 5
20 23 21.5
24 27 25.5
28 31 29.5
32 35 33.5
Frecuencia RelativaFrecuencia Relativa• Es el valor que resulta al dividir cada una de las
frecuencias absolutas entre el total de frecuencias o datos y multiplicarlas por 100 para que sean expresadas en porcentaje
Estadística Biología Marina 2003
Rango de clase
Marca clase Frec. Abs. Frecuencia Relativa
16 19 17.5 5 25
20 23 21.5
24 27 25.5
28 31 29.5
32 35 33.5
Frecuencia Absoluta AcumuladaFrecuencia Absoluta Acumulada
• Se obtiene sumando y acumulando los valores absolutos clase por clase en orden ascendente
Estadística Biología Marina 2003
Rango de clase
Marca clase
Frec. Abs.
Frec. Rel.
Frec.Abs. Acumulada
16 19 17.5 5 25 5
20 23 21.5
24 27 25.5
28 31 29.5
32 35 33.5
Frecuencia Relativa AcumuladaFrecuencia Relativa Acumulada
• Se obtiene sumando y acumulando los valores relativos clase por clase en orden ascendente
Estadística Biología Marina 2003
Rango de clase
Marca clase
Frec. Abs.
Frec. Rel.
Frec.Abs. Acumulada
Frec.Rel. Acumulada
16 19 17.5 5 25 5 25
20 23 21.5
24 27 25.5
28 31 29.5
32 35 33.5
¿Cómo queda el resto de la tabla?
Estadística Biología Marina 200
3
Rango de clase
Marca clase
Frec. Abs.
Frec. Rel.
Frec.Abs. Acumulada
Frec.Rel. Acumulada
16 19 17.5 5 25 5 25
20 23 21.5 9 45 14 70
24 27 25.5 4 20 18 90
28 31 29.5 1 5 19 95
32 35 33.5 1 5 20 100
Debería quedar así:Debería quedar así:
Consumo de proteínas (grs.) de 20 ostiones Argopecten purpuratus
Representación gráfica de tablas Representación gráfica de tablas de frecuenciade frecuencia
• Histograma:– Se obtienen al graficar las
marcas de clase (abscisa) versus la frecuencia (ordenada).
Estadística Biología Marina 2003
0
2
4
6
8
10
17.5 21.5 25.5 29.5 33.5Proteinas consumidas
Fre
cu
en
cia
Polígono de FrecuenciasPolígono de Frecuencias
• Se produce fácilmente al conectar con una línea las marcas de clases adyacentes.
Estadística Biología Marina 2003
0
2
4
6
8
10
17.5 21.5 25.5 29.5 33.5Proteinas consumidas
Fre
cue
nci
a
OjivasOjivas• Se obtienen al graficar las frecuencias
acumuladas absolutas o relativas
Estadística Biología Marina 2003
0
20
40
60
80
100
120
17.5 21.5 25.5 29.5 33.5
Proteinas consumidas
Fre
cue
nci
a
Tipos de distribuciones de Tipos de distribuciones de frecuenciafrecuencia
• En función de la forma:
Estadística Biología Marina 2003
En función de la dispersiónEn función de la dispersión
Estadística Biología Marina 2003
Medidas Descriptivas NuméricasMedidas Descriptivas Numéricas
Estadística Biología Marina 2003
““A través de este tipo de estimaciones es posible A través de este tipo de estimaciones es posible hacer generalizaciones del todo a partir de una parte hacer generalizaciones del todo a partir de una parte del todo”del todo”
Conceptos para tener en cuenta:
• Población
• Muestra
• Muestras aleatorias
• Parámetros
• Estadísticos
• Población o Universo: Corresponde a todo el grupo de cosas animales o personas sobre las que queremos obtener información. (esta definida en base a nuestros requerimientos)
• Muestra: Porción de la población sobre la que tomamos información para obtener conclusiones sobre la población.
Estadística Biología Marina 2003
Muestra aleatoriaMuestra aleatoria• Requisito clave:
““Cada miembro de la población debe Cada miembro de la población debe tener una opción igual e independiente tener una opción igual e independiente
de ser elegido”de ser elegido”
Estadística Biología Marina 2003
Asignar número a miembros de la población
Tablas de Números Aleatorios
Pero: En la mayoría de los casos no es posible asignar número aleatorios.
Es necesario tener en cuenta consideraciones biológicas mas que matemáticas.
De esta manera:De esta manera:
• Una muestra tomada aleatoriamente, debe representar a la población.
• Si la muestra es representativa de mi población, entonces podemos “inferir cosas” de la población, con cierto nivel de seguridad y exactitud.
Estadística Biología Marina 2003
Parámetros y EstadísticosParámetros y Estadísticos
• Toda medición o estimación que este caracterizando y describiendo a nuestra población es llamada PARAMETRO.
Raramente es posible calcular parámetros
¿Porque?¿Porque?
Estadística Biología Marina 2003
SoluciónSolución
• Realizar estimaciones de un parámetro poblacional mediante:
ESTADISTICOSESTADISTICOS
Estadística Biología Marina 2003
Todo buen estadístico debe ser:
Insesgado
Consistente
Eficiente
Medidas de Tendencia Central:Medidas de Tendencia Central:
• Representa a la suma de las observaciones divididas por el número de observaciones
Estadística Biología Marina 2003
La MediaLa Media
N
XiX
ni
i
1
N
XiX
ni
i
1
Ejemplo:
52.540.860.058.052.5
62.240.849.252.540.8
= 50.9
• Con datos agrupados se calcula por:
Estadística Biología Marina 2003
921.52320
425.52724
129.53128
133.53532
5
Frec. Abs.
fi
17.5
Marca clase Xi
1916
Rango de
clase
N = 20
= 22.3 grs= 22.3 grs
ni
i
ni
i
fi
fiXiX
1
1
Marca Clase
Frecuencia Absoluta
Comentarios acerca de la media.Comentarios acerca de la media.
• La media es un número ÚNICO
• La media de la muestra ( ), es un buen estimador de
• Es un estadístico poco “resistente”, ya que es fuertemente influenciado por los valores extremos
Estadística Biología Marina 2003
X
Me La MedianaLa Mediana
• Es el valor medio. • Esto es el punto medio de las observaciones cuando estas han
sido ordenas en orden ascendente
Impares ParesMe= X(n+1)/2 Me=(Xn/2 + Xn/2+1)/2
11,13,15,16,17 11,13,15,16,17, 20
Estadística Biología Marina 2003
Me = 15 Me = 15.5
• Con datos agrupados se calcula por:
Me = Límite inferior +0.5n – frec. acum.
ant.x Ancho intervalo
del intervaloNro. Obs en
Intervalo
Estadística Biología Marina 2003
Rango de clase
Marca clase
Frec. Abs.
Frec. Rel.
Frec.Abs. Acumulada
Frec.Rel. Acumulada
16 19 17.5 5 25 5 25
20 23 21.5 9 45 14 70
24 27 25.5 4 20 18 90
28 31 29.5 1 5 19 95
32 35 33.5 1 5 20 100
1.- Calculamos la posición: Me = X(n+1)/2 = X(20+1)/2 = X10.5
2.- Aplicamos la fórmula: Me = (20)+ ((0.5x20)-5)/9 x 4 = 22.2
La ModaLa Moda
• La moda el valor mas frecuente.• Es decir, el valor que más se repite dentro de las
observaciones realizadas.
Estadística Biología Marina 2003
Ejemplo: Datos del coeficiente intelectual de un grupo de alumnos: 100, 95, 105, 110, 100.
Entonces la moda es 100
• Para datos ordenados en una tabla de frecuencia:
• La moda corresponde a la marca de clase más frecuente
Estadística Biología Marina 2003
Rango de clase
Marca clase
Frec. Abs.
Frec. Rel.
Frec.Abs. Acumulad
a
Frec.Rel. Acumulada
16 19 17.5 5 25 5 25
20 23 21.5 9 45 14 70
24 27 25.5 4 20 18 90
28 31 29.5 1 5 19 95
32 35 33.5 1 5 20 100
La Mediana y la Moda no son La Mediana y la Moda no son afectadas por valores extremos.afectadas por valores extremos.
Alemania 59
España 84
Inglaterra 78
Italia 41
Japón 47
Noruega 78
Nueva Zelanda 102
EEUU 61
Somalia 748
Analicemos el siguiente ejemplo:
Tasa de mortalidad infantil en diferentes países (muertes anuales/ 10000 habitantes)
Media = 144 muertes/10000
Mediana = 78 muertes/10000
Moda = 78 muertes/10000
Relaciones entre medidas de Relaciones entre medidas de tendencia centraltendencia central
Estadística Biología Marina 2003
• Ahora que podemos describir nuestra población a partir de una medida central.
• ¿Qué mas sería interesante conocer y estimar?
Estadística Biología Marina 2003
Analicemos la siguiente figura:
Las MEDIAS y las MEDIANAS son iguales.
Pero las DISTRIBUCIONES son diferentes
Medidas de Dispersión o Medidas de Dispersión o VariabilidadVariabilidad
• Adicionalmente a la medición de tendencia central, es recomendable tener una medición de la dispersión de los datos.
– De esta manera es posible tener una idea de cuan esparcidos se encuentran las mediciones en torno al centro de la distribución
Estadística Biología Marina 2003
Existen variados estadísticos de Existen variados estadísticos de dispersión, los más utilizados dispersión, los más utilizados son:son:
• El Rango
• Suma de la desviaciones de la media al cuadrado (SS).
• Varianza (S)
• Desviación estándar (DE ó S2)
• Coeficiente de variación (CV)
• Los Cuantíles
Estadística Biología Marina 2003
El RangoEl Rango
• Corresponde a la diferencia entre el dato mayor y el dato menor.
Estadística Biología Marina 2003
Rango = Xmax – Xmin
S SSuma de las desviaciones de la Suma de las desviaciones de la
media al cuadradomedia al cuadrado
• Este valor entrega una idea de cuán lejos se encuentran los datos con respecto a la media.
• Su compresión es clave para entender el significado de cada una de las demás medidas de dispersión que existen
Estadística Biología Marina 2003
2)( XXiSS
Reflexione con las siguientes preguntas
• ¿Porqué se emplean desviaciones de la media al cuadrado?
• ¿Qué indica una SS grande?• ¿Qué indica una SS pequeño?• ¿Qué indica una SS igual a 0?
•Calcule la media y SS para el peso (grs) del músculo abductor de las siguientes almejas: 7.4, 8.1, 6.3, 8.6, 7.9, 6.9
Media = 7.5 SS = 3.08
Estadística Biología Marina 2003
S2VarianzaVarianza
• Corresponde a la media de la suma de cuadrados (por eso es llamada media cuadrática)
Estadística Biología Marina 2003
N
Xi
22 )(
1
)( 22
n
XXiS
Población
Muestra
¿Cuál es la diferencia entre una y otra?
• La varianza de una muestra esta dividida por n-1 (llamado “grados de libertad” o GL),
• Esto permite una estimación no segada y más conservadora ya que no sobreestima el valor de σ2 que presenta un N desconocido
Estadística Biología Marina 2003
SDesviación EstándarDesviación Estándar
• Simplemente es estimada a través la raíz cuadrada de la varianza.
• Tener en cuenta que este valor tiene las mismas unidades que las mediciones originales.
Estadística Biología Marina 2003
2SS Calcular S2 y S a partir delos datos anteriores
Calcular S2 y S a partir delos datos anteriores
C VCoeficiente de VariaciónCoeficiente de Variación
• Es el cuociente de la desviación estándar y la media aritmética, expresado en porcentaje.
Estadística Biología Marina 2003
100X
DSCV
• La desviación estándar y la varianza tienen magnitudes que son dependientes de los datos.
El Coeficiente de variación NO
Ratones Elefantes
Media 0.78 cm 78.0 cm
DS 0.26 cm 26.0 cm
Estadística Biología Marina 2003
CV 33.3% 33.3%
• El coeficiente de variación expresa la variabilidad de la muestra relativa a la media de la muestra
Tamaño de las orejas de elefantes y ratones
En que especie varia más el
tamaño de orejas
Medidas de posición. Cuantíles
• Son estadísticos que dividen una distribución de frecuencias en cuatro, diez o cien partes iguales
• La mediana es el valor que se encuentra en la mitad de nuestra distribución (es decir es el 50avo percentil),
Estadística Biología Marina 2003
Otros cuantíles son:Cuartíles (4), Quintiles (5),
Decíles (10), Percentíles (100)
• Los cuartíles son estadísticos que dividen en cuatro partes iguales nuestra información, donde cada parte incluye el 25% de las observaciones
Estadística Biología Marina 2003
1er cuartíl
2do cuartíl
3er cuartíl
25% 25% 25% 25%
Mediana
Rango Intercuartílico
• Con la siguiente formula es posible calcular cualquier percentil, determinado la posición de la variable en un set de datos
Estadística Biología Marina 2003
100)1(
pX n
Percentil
buscado
5 5 7 8 9 9 910
12
1414
1517
1825
30
31
6472
88 8990
92
98
Ranking 4
5 6 7 8 9 1011
1213
1415
16
17
1819
20 2122
23
24
Ejemplo:
Calcular la media ± DS 34.6 34.1
¿Son estos los mejores estadísticos para este caso?
• Mediana = ?
Estadística Biología Marina 2003
5 5 7 8 9 9 910
12
1414
1517
1825
30
31
6472
88 8990
92
98
Ranking 4
5 6 7 8 9 1011
1213
1415
16
17
1819
20 2122
23
24
Veamos con el Rango intercuartílico
En posición 12.5.
Valor = 16
• Rango intercuartílico
Primer cuartíl (25avo percentil)
Tercer cuartíl (75avo percentil)
100)1(
pX n
(24 + 1) x 0.25 = 6.25 (24 + 1) x 0.75 = 18.75
X6 y X7 = 9 entonces:
Valor = 9
X18= 64 y X19=72
entonces (72-64)x0.75 = 6
Valor = 64+6 = 70
Percentiles en tablas Percentiles en tablas de frecuenciade frecuencia
• Se procede de la misma forma con la que se calculó la mediana.
• Pero ahora no estamos interesados en 50avo de nuestra distribución.
• Debemos encontrar las posiciones 25avo y 75avo.
Estadística Biología Marina 2003
Cálculo de rangointercuartílico
Volvamos al ejemplo de los ostiones
Consumo de proteínas (grs.) de 20 ostiones Argopecten purpuratus
Estadística Biología Marina 2003
Rango de
clase
Marca de
clase
Frecuencia
Absoluta
Frec. absoluta
acumulada
16 19 17.5 5 5
20 23 21.5 9 14
24 27 25.5 4 18
28 31 29.5 1 19
32 35 33.5 1 20
Per.25 = Límite inferior +0.25n – frec. acum.
ant.x Ancho intervalo
del intervalo Nro. Obs en Intervalo
Per.75 = Límite inferior +0.75n – frec. acum.
ant.x Ancho intervalo
del intervalo Nro. Obs en Intervalo
Q1 (percentil 25): (20+1) (0.25)= 5.25
Q3 (percentil 75): (20+1) (0.75)= 15.75
= 20
= 25
Tener PresenteTener Presente• Si los datos no se distribuyen en forma
normal, no se debe usar la DS y la Media como únicos y exclusivos estimadores.
• Para ello existen dos alternativas.• Usar la mediana y el rango intercuartílico• Mejor todavía, usar los “cinco estimadores“
Estadística Biología Marina 2003
Mínimo 1°cuartil Mediana 3°cuartil máximo
• Una manera de presentar los 5 estimadores son los gráficos de caja o “BOX PLOT”
Estadística Biología Marina 2003
0 10 20 30 40 50 60 70 80 90 100datos