media aritmetica sean n datos de una variable… el promedio de la muestra se denomina dicho...
TRANSCRIPT
MEDIA ARITMETICA
Sean n datos de una variable…
El promedio de la muestra se denomina
1 2 ... nx x x
x
Dicho promedio es un estimador de la media de la población. La media de la población es un parámetro y se denomina
MEDIA ARITMETICA
1 2 ... nx x xx
n
1
ni ix n
xn
if
1
n
ï ix x f
Frecuencia absolutaFrecuencia relativa
MEDIA ARITMETICA PONDERADA
Supongamos que medimos una distancia con 3 instrumentos: cinta métrica, nivel y regla, y estación total. Consideramos que la estación total es 10 veces más exacta que la cinta y que la cinta es 4 veces más exacta que el nivel y regla. Cómo se calcularía la distancia promedio?
10 4
10 4 1et c nrd d d
d
MEDIA ARITMETICA
Siempre es razonable calcular directamente el promedio sin analizar los datos?
Si una distancia es medida 5 veces y los valores en metros son: 10.6510.62 10.6310.63 12.63
Se aplican directamente las fórmulas?????
Más adelante, cuando se vean los distintos tipos de errores, se verá de que forma detectar los errores groseros u outliers.
La idea es detectar esos valores atípicos y eliminarlos para volver poder hacer los cálculos que correspondan
Existen otros tipos de medias que se analizarán en otro momento
Media armónicaMedia geométricaMedia cuadrática
Volviendo al promedio…
1 2 ... nx x xx
n
1
nixxn
Hay que tener presente que el verdadero valor de una magnitud nunca se puede conocer con exactitud total. Para algunos casos, podemos considerar el promedio como el valor más probable (o el que más se aproxima al verdadero valor).
Definimos el concepto de residuo:
i iv x x
Qué sucede si quiero conocer el promedio de los desvíos o residuos de todos mis datos respecto del promedio?????
1
nivvn
1 1
2 2
i iv x x
v x x
v x x
n nv x x
1
n
iv 1
n
ix nx
Recordemos que:
1
n
iv 1
n
ix nx
1
nixxn
nx nx1
n
iv
1
0n
iv
MEDIANA
Si tengo n datos, se ordenan de forma ascendente
Es un número tal que la mitad de las observaciones sean menores y la otra mitad mayores.
Si n es imparM es la observación central
Si n es parM es la media de las observaciones centrales
Mediana y media de una curva de densidad
LA MEDIANA DE UNA CURVA DE DENSIDAD ES EL PUNTO QUE DIVIDE AL AREA POR DEBAJO DE LA CURVA EN DOS PARTES IGUALES
LA MEDIANA Y LA MEDIASON IGUALES EN EL CASO DE CURVAS DE DENSIDAD SIMÉTRICA.
LA MEDIA DE UNA CURVA DE DENSIDAD ES EL PUNTO DE EQUILIBRIO EN EL CUAL LA CURVA SE EQUILIBRARÍA SI ESTUVIERA HECHA DE UN MATERIAL SÓLIDO
También es conocido con el nombre de RECORRIDO
El RANGO podría tener el inconveniente de estar afectado fuertemente por observaciones atípicas
Cuartiles
Ordenar las observaciones de forma creciente
El primer cuartil se sitúa en el primer 25% de las observaciones
El tercer cuartil se sitúa en el primer 75% de las observaciones
El segundo cuartil sería la mediana
Cuartiles
Ordenar datos El primer cuartil Q1 es la mediana
de las observaciones a la izquierda de la mediana de la totalidad
El tercer cuartil Q3 es la mediana de las observaciones situadas a la derecha de la mediana de la totalidad
Grados de libertad
La suma de las desviaciones es siempre 0
La última desviación se puede hallar cuando se conocen las otras n-1. Por tanto sólo n-1 observaciones son independientes
Al número n-1 se le llama grados de libertad de la varianza o desviación estándard
Lo correcto es calcular dividiendo por n-1, para valores de n muy grandes no habrán diferencias apreciables
Curvas de densidadLa curva es más sencilla para trabajar que el histograma
El área por debajo de la curva vale 1
Las áreas por debajo de la curva representan proporciones de observaciones
NINGUN CONJUNTO DE DATOS REALES ES DESCRITO EXACTAMENTE POR UNA CURVA DE DENSIDAD. LA CURVA ES UNA IDEALIZACIÓN DE LA DISTRIBUCIÓN DE DATOS
Mediana y media de una curva de densidad
LA MEDIANA DE UNA CURVA DE DENSIDAD ES EL PUNTO QUE DIVIDE AL AREA POR DEBAJO DE LA CURVA EN DOS PARTES IGUALES
LA MEDIA DE UNA CURVA DE DENSIDAD ES EL PUNTO DE EQUILIBRIO EN EL CUAL LA CURVA SE EQUILIBRARÍA SI ESTUVIERA HECHA DE UN MATERIAL SÓLIDO
LA MEDIANA Y LA MEDIASON IGUALES EN EL CASO DE CURVAS DE DENSIDAD SIMÉTRICA.
LA MEDIA DE UNA CURVA DE DENSIDAD ES EL PUNTO DE EQUILIBRIO EN EL CUAL LA CURVA SE EQUILIBRARÍA SI ESTUVIERA HECHA DE UN MATERIAL SÓLIDO
Notación importante
La notación habitual de una media de una distribución idealizada es m
La notación habitual de la desviación estandar de
una distribución idealizada es s
Dado que la curva de densidad es una descripción idealizada de una distribución de datos, se debe distinguir entre la media y desviación típica de una curva de densidad, y la media y la desviación estándar s calculadas a partir de observaciones reales
x
Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace-Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación con la teoría de los errores de observación astronómica y física .
Distribución normal
Porque son tan importantes las distribuciones normales en estadística?
Las distribuciones normales dan buenas descripciones de algunas distribuciones de datos reales
Las distribuciones normales son buenas aproximaciones a los resultados de muchos fenómenos aleatorios
Muchos procedimientos de inferencia estadística dan buenos resultados cuando se aplican a distribuciones aproximadamente simétricas
+
Características de la distribución Normal
, Mo, Mn
- +
Tiene forma de campana, es asintótica al eje de las abscisas (para x = )
Los puntos de inflexión tienen como abscisas los valores .
Simétrica con respecto a la media () donde coinciden la mediana (Mn) y la moda (Mo).
Puntos de
inflexión
33
N(μ, σ): Interpretación probabilista
Entre la media y una desviación típica tenemos siempre la misma probabilidad: aproximadamente el 68%.
• Si tomamos intervalos centrados en μ, y cuyos extremos están…– a distancia σ, tenemos probabilidad 68%– a distancia 2 σ, tenemos probabilidad 95%– a distancia 2’5 σ tenemos probabilidad 99%
• Entre la media y dos desviaciones típicas aprox. 95%
34
Problema… Un estudiante A obtuvo 680 puntos en
la prueba P1 de matemáticas. La distribución de las notas de P1 es normal con media 500 y desviación estandar 100.
Un estudiante B obtuvo 27 puntos en la prueba P2 de matemáticas. La distribución de notas es normal con media 18 y desviación estándar 6. Si las pruebas son similares, ¿cuál estudiante obtuvo mejor nota?
¿Cómo calcular probabilidades asociadas a una curva normal específica?
Dado que tanto como pueden asumir infinitos valores, es impracticable tabular las probabilidades para todas las posibles distribuciones normales. Para solucionarlo, se utiliza la distribución normal reducida o tipificada.
Se define una variable z = x -
Es una traslación , y un cambio de escala de la variable original.
36
La nueva variable z se distribuye como una
NORMAL con media = 0 y desviación típica = 1
-3 -2 -1 0 1 2 3
z
Recordemos de nuevo que en cualquier distribución normal las probabilidades delimitadas entre :
68 % 2 95 % 3 99 %
68%
99%
95%
37
Ejemplo
La distribución de alturas de mujeres es aproximadamente normal con 1.64
0.06
m
m
Cual es la altura estandarizada?
Ejemplo
La altura estandarizada de una mujer es el número de desviaciones estándar que su altura difiere de la media de la altura de todas las mujeres
Cual es la altura estandarizada de una mujer que mide 1.72 m?
Cual es la altura estandarizada de una mujer que mide 1.56 m?