especialización en métodos estadísticos (eme) · sean a y b dos conjuntos. si todo elemento de a...
TRANSCRIPT
CURSO PROPEDÉUTICO ESTADÍSTICA BÁSICA
Especialización en
Métodos Estadísticos (EME)
Enrique Rosales Ronzón, Patricia Díaz Gaspar, mayo 2015
2
Estadística ???
• Ciencia, Técnica, Arte… Reunir, Organizar, presentar, analizar e
interpretar datos con el fin de obtener determinados resultados que
dan pauta a ciertas conclusiones para posteriormente determinar
decisiones.
4
La unidad de análisis es
el elemento del cual se
predica una propiedad y
característica
La variable es la
característica,
propiedad o atributo
que se predica de la
unidad de análisis
La categoría es cada
una de las posibles
variaciones de una
variable
5
Subconjunto de la
población que se
selecciona
aleatoriamente para su
respectivo análisis.
Muestra
Parámetro
Estadísticos
Población
Total de sujetos,
amínales, objetos,
plantas, etc., con
características similares
para su estudio.
Unidad de medida
desconocida de la
población
Unidad de medida de
la muestra y se
utiliza para realizar
inferencias acerca
de la población
6
Formulación del Problema Hipótesis, objetivos, alcance población
Diseño de Experimento Seleccionar técnica -mínimo costo y tiempo
Tamaño de muestra, Solución
Recolección de Datos Calidad de obtención
Proceso de Datos y su descripción Tablas de estadísticas
Gráficas
Inferencia Estadística Y Conclusiones Definición confianza y significancia
Toma de decisiones
Sugerencias
7
Descriptiva
Inferencial
Estadística
Describir la
muestra
Infiere
conclusiones a
partir de los datos
que describen la
muestra
La diferencia radica en que la estadística
descriptiva procede a resumir y organizar
esos datos para facilitar su análisis e
interpretación, y la estadística inferencial
procede a formular estimaciones y probar
hipótesis acerca de la población a partir de
esos datos resumidos y obtenidos de la
muestra.
Estadística univariada (estudia una sola
variable), bivariada (estudia la relación entre
dos variables), y multivariada (estudia tres o
más variables).
9
NIVEL DE
MEDICIÓN
NIVEL NOMINAL NIVEL ORDINAL NIVEL
CUANTITATIVO
DISCRETO
NIVEL
CUANTITATIVO
CONTINUO
DATO
UNIDAD DE
ANÁLISIS
VARIABLE
CATEGORÍA O
VALOR
12
• Estadística
• Población y Muestra
• Parámetro y Estadístico
• Unidad de Análisis, Variable y Categoría
• Proceso de investigación
• Estadística Descriptiva e inferencial
• Estadística uni, bi y multivariada
• Variable nominal, ordinal, discreta y continua
14
Prueba chi-cuadrada
Fundamentalmente se pretende estudiar la dependencia y/o
independencia entre dos variables cualitativa.
Pretende determinar si existe una relación entre dos variables
No indica el grado o tipo de relación entre las variables.
16
Conceptos Básicos de Probabilidad
Conjunto: es una colección de objetos bien definida que tiene
algo en común
Elemento: Son los objetos comprendidos en un conjunto
Notación básica A = { 0, 2, 4, 6, 8}
Conjunto de números dígitos pares
17
Número Finito
A = {Domingo, Lunes, Martes, Miércoles, Jueves, sábado}
Infinito Numerable
B = {1, 3, 5, 7, 9, 11,…..}
Infinito no Numerable
C = { x | 0 ≤ x ≥ 1 }
Conceptos Básicos de Probabilidad
Método de Extensión
A = {0, 1, 2, 3, 4, ….}
Método de Comprensión
A = {X | x es un número dígito }
18
Conceptos Básicos de Probabilidad
Subconjuntos:
Sean A y B dos conjuntos. Si todo elemento de A es también elemento de B,
diremos que A es subconjunto de B. Simbólicamente se escribe A B
Dos conjuntos A y B son iguales (A=B) si y solo si A B y B A
El conjunto Vacío es aquel que no tiene elementos y se representa por φ
El conjunto vacio es un subconjunto del cualquier otro conjunto
20
Operaciones con conjuntos
Unión
Intersección
Conjuntos mutuamente excluyentes
Complemento
Diferencia
22
Propiedades de la Definición
Clásica de Probabilidad
a) P(S) = 1
b) P(O)= 0
c) 0 ≤ P(A) ≤ 1
d) P (AUB) = P(A) + P(B) sí AB = O
e) P(AUB) =P(A) + P(B) – P(AB)
f) SI A ‹ B, P(A) ≤ P(B)
g) P (ABC) = P(A) – P(AB)
23
Variable Aleatoria
Experimento aleatorio Espacio Muestral
Variable Aleatoria: Una Variable Aleatoria (VA) es
una función en la que a cada
resultado posible de un
experimento aleatorio le
asocia un número real
27
Distribución Normal
Fue desarrollada por Jakob Bernoulli (Suiza, 1654-1705)
es la principal distribución de probabilidad discreta
Algunos experimentos consisten en la observación de una serie de
pruebas idénticas e independientes, las cuales pueden generar uno de
dos resultados posibles, los cuales por conveniencia se denotan como
éxito (e) o fracaso (f).
ensayo Bernoulli
Un evento A relacionado con el experimento podría ser considerado
como éxito y su complemento como fracaso.
28
El experimento consta de n pruebas idénticas e independientes
(llamados ensayos de Bernoulli).
Cada prueba tiene dos resultados posibles. A uno de ellos se le llama
éxito y al otro fracaso.
La probabilidad de tener éxito en una sola prueba es igual a p y
permanece constante de prueba en prueba. La probabilidad de un
fracaso es igual a 1-p .
La variable aleatoria bajo estudio es X, que representa el número de
éxitos observados en las n pruebas.
Características de la Distribución
Binomial
29
Si repetidas pruebas idénticas e independientes pueden resultar en un
éxito con una probabilidad y en un fracaso con una probabilidad de ,
entonces la distribución de probabilidad de la variable aleatoria X, que
representa el número de éxitos observados en las n pruebas, está dada
por:
Los parámetros de la distribución son n y p.
nxqpx
npnxb xnx ,,1,0,,,
30
La media y la varianza de la distribución binomial están
dadas por:
pnxb ,,
npXE npqXVar 2
Media y varianza de la
distribución binomial
Ejemplos…
31
Distribución Normal
Fue reconocida por primera vez por el francés Abraham de Moivre (1667-
1754)
Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y
formuló la ecuación de la curva; de ahí que también se le conozca, más
comúnmente, como la "campana de Gauss“
La distribución de una variable normal está completamente determinada
por dos parámetros, su media y su desviación estándar
La distribución continua de probabilidad más importante de toda la
estadística es la distribución de probabilidad normal.
Es de vital importancia para la estadística debido a que existe un número
elevado de variables cuya distribución se parece o se aproxima a una
curva normal, sobre todo, variables de poblaciones relativamente
homogéneas
La curva normal es la representación gráfica de la distribución normal, que
es una distribución con mayor densidad en el centro de la distribución la
que luego disminuye gradual y simétricamente
33
Las curvas normales varían entre sí con respecto a su media
y/o a la desviación estándar . La media determina la posición
de la curva sobre el eje de las abscisas y la desviación
estándar determina la variabilidad de los datos alrededor de la
media
Distribución Normal
La notación que usaremos para
identificar a una variable normal
X cualquiera es, X~N (µ, σ2).
34
Si X~N (µ, σ2), entonces:
La distribución es simétrica alrededor de la media.
Los valores correspondientes a la media, mediana y moda son
iguales y constituyen el punto central o de equilibrio de la
distribución.
La distancia horizontal entre la línea vertical erigida sobre la media
µ y el punto de inflexión de la curva es la desviación estándar σ de
la distribución.
El área total bajo la curva es igual a uno.
Propiedades de la
Distribución Normal
36
Propiedades…
La media de los valores z es igual a cero.
La varianza y consecuentemente la desviación estándar de los valores
z es igual a uno.
Nota!
La distribución de probabilidad normal asociada al valor de Z recibe el
nombre de distribución normal estándar
Ejemplos…
37
Aproximación de la distribución
normal a la binomial
Las probabilidades que se asocian con experimentos binomiales pueden
obtenerse fácilmente cuando n es pequeña, de la formula b(x, n, p) de la
distribución binomial. Si n es grande, resulta conveniente calcular las
probabilidades binomiales por procedimientos de aproximación a una
distribución discreta cuando esta última tiende a comportarse de manera
simétrica. Así, para utilizar áreas bajo la curva normal para aproximar
propiedades binomiales cuando n es suficientemente grande se tiene el
siguiente hecho:
42
Propiedades deseables de los
estimadores puntuales
Estimador insesgado
Estimador consistente
Estimador eficiente
Estimador suficiente
45
La prueba de hipótesis comienza con una suposición, denominada
hipótesis, que hacemos en torno a un parámetro de la población.
Posteriormente se reúnen los datos muéstrales, se calculan las estadísticas
de la muestra y en base a estos valores, con cierto grado de probabilidad,
decidimos que el parámetro supuesto de la población sea razonablemente el
aproximado.
Prueba de Hipótesis
46
Prueba de Hipótesis
No podemos "aceptar" ni rechazar una hipótesis
referente a un parámetro de la población por
mera intuición. Por el contrario, necesitamos
aprender a decidir con objetividad, basándonos
en la información de la muestra.
47
Prueba de Hipótesis
¿Cuál es el valor de la estadística en este procedimiento de prueba de
hipótesis?
¿Cómo se decide si una muestra no concuerda con la hipótesis del
investigador?
¿Cuándo debe rechazarse la hipótesis, cuándo debe aceptarse y cuándo
no debe emitirse la decisión?
¿Cuál es la probabilidad de tomar una decisión equivocada y en
consecuencia sufrir una perdida?, y en particular, ¿qué función de las
mediciones muéstrales debe utilizarse para tomar una decisión
48
Elementos de una prueba
de hipótesis estadística
1. Hipótesis nula H0.- Es la hipótesis por probar. Generalmente es una
aseveración en el sentido de que un parámetro poblacional tiene un valor
específico. Esta hipótesis nula recibe tal nombre debido a que es el "punto de
partida" de la investigación. Comúnmente se utiliza en su interpretación la frase
"no existe diferencia significativa para rechazar H0".
2. Hipótesis alterna H1.- Es la hipótesis sobre la cual se enfoca la atención, es
una aseveración sobre el mismo parámetro poblacional que se utiliza en la
hipótesis nula. Generalmente se especifica que el parámetro poblacional tiene un
valor diferente de alguna manera, al establecido en la hipótesis nula. El rechazo
de la hipótesis nula implicará la "aceptación" de la hipótesis alterna.
3. Estadístico de prueba.- Variable aleatoria utilizada para tomar la decisión "no
se rechaza H0" o bien "se rechaza H0".
4. Región de rechazo.-Conjunto de valores de la estadística de prueba que
causan el rechazo de la hipótesis nula.