presentación1

18
INTER V ALOS DE CONFI A NZA NOMBRE ALUMNA: CLAUDIA AZUCENA ÁVILA HERNÁNDEZ LIC. EDGAR MATA. MATERIA ESTADÍSTIC A GRADO: 2° D.

Upload: azucena-avila-hernandez

Post on 17-Jun-2015

1.710 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Presentación1

INTE

RVALOS D

E

CONFIANZA

NO

MB

RE

AL U

MN

A:

CL A

UD

I A A

ZU

CE

NA

ÁV

I LA

HE

RN

ÁN

DE

Z

L I C.

ED

GA

R M

AT A

.

MA T

ER

I A E

ST A

DÍ S

T I CA

GR

AD

O:

2° D

.

Page 2: Presentación1

INTERVALOS DE CONFIANZA.

I- Concepto de Intervalo de Confianza. En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.

La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1- . La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . Generalmente se construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o =1%.

Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1:

P(−1.96 < z < 1.96) = 0.95

Page 3: Presentación1

Luego, si una variable X tiene distribución N(,), entonces el 95% de las veces se cumple:

Despejando  en la ecuación se tiene:

El resultado es un intervalo que incluye al  el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media cuando la variable X es normal y  es conocido.

II- Intervalo de confianza para un promedio:Generalmente, cuando se quiere construir un intervalo de confianza para

la media poblacional , la varianza poblacional  es desconocida, por lo que el intervalo para  construido al final de II es muy poco práctico.

Si en el intervalo se reemplaza la desviación estándar poblacional por la desviación estándar muestral s, el intervalo de confianza toma la forma:

Page 4: Presentación1

La cual es una buena aproximación para el intervalo de confianza de 95% para  con  desconocido. Esta aproximación es mejor en la medida que el tamaño muestral sea grande.

Cuando el tamaño muestral es pequeño, el intervalo de confianza requiere utilizar la distribución t de Student (con n-1 grados de libertad, siendo n el tamaño de la muestra), en vez de la distribución normal (por ejemplo, para un intervalo de 95% de confianza, los límites del intervalo ya no serán construidos usando el valor 1,96).

Ejemplo:Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión)

2 5 6 8 8 9 9 10 1111 11 13 13 14 14 14 14 1414 15 15 16 16 16 16 16 1616 16 17 17 17 18 18 18 1919 19 19 19 19 19 19 20 20

Page 5: Presentación1

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida. Como es desconocido, lo estimamos por s=18,7. Luego, un intervalo de confianza aproximado es:

Luego, el intervalo de confianza para es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

Page 6: Presentación1

III. INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN.

En este caso, interesa construir un intervalo de confianza para una proporción o un porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensión, fumadoras, etc.)

Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:

O BIEN:

Page 7: Presentación1

Luego, procediendo en forma análoga al caso de la media, podemos construir un intervalo de 95% de confianza para la proporción poblacional p.

Page 8: Presentación1

EJEMPLO: 

En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 años en la Región Metropolitana, se encontró que el 17.6% eran hipertensas. Un intervalo de 95% de confianza para la proporción de mujeres hipertensas en la Región Metropolitana está dado por:

Luego, la proporción de hipertensas varía entre (0,139 , 0,212) con una confianza de 95%.

Page 9: Presentación1

IV. USO DE INTERVALOS DE CONFIANZA PARA VERIFICAR

HIPÓTESIS.Los intervalos de confianza permiten verificar hipótesis

planteadas respecto a parámetros poblacionales.

Por ejemplo, supongamos que se plantea la hipótesis de que el promedio de peso de nacimiento de cierta población es igual a la media nacional de 3250 gramos.

Al tomar una muestra de 30 recién nacidos de la población en estudio, se obtuvo:

x= 2930s= 450n= 30

Al construir un intervalo de 95% de confianza para la media poblacional, se obtiene:

Page 10: Presentación1

Luego, el peso de nacimiento varía entre 2769 y 3091 gramos, con una confianza de 95%. Como el intervalo no incluye el valor =3250 gramos planteado en la hipótesis, entonces esta es rechazada con confianza 95% (o un valor p menor a 0,5).

La distribución Normal estándar es una distribución normal con media =0 y varianza,=1. Una variable distribuida N(0,1) generalmente se denota con la letra “z”.

En particular, si X~N (, ), entonces z = (X-)/ tiene distribución normal estándar.

Page 11: Presentación1

CONCEPTOS CLAVES DE INTERVALOS DE CONFIANZA.

1. Un intervalo de confianza aporta más información que un estimador puntual cuando se quiere hacer inferencias sobre parámetros poblacionales.2. Existen intervalos de confianza bilaterales y unilaterales.3. La amplitud de un intervalo de confianza está determinado por: el nivel de confianza establecido ;la variabilidad de los datos; el tamaño de la muestra.4. En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente deseable) construir intervalos de confianza para Odds Ratios y Riesgos Relativos.5. Un intervalo de confianza permite verificar hipótesis planteadas acerca de parámetros poblacionales.

Page 12: Presentación1
Page 13: Presentación1

EJERCICIOS

1.- El índice de resistencia a la rotura, expresado en kg, de un determinado tipo de cuerda sigue una distribución Normal con desviación típica 15.6 kg. Con una muestra de 5 de estas cuerdas, seleccionadas al azar, se obtuvieron los siguientes índices: 280, 240, 270, 285, 270.

a) Obtenga un intervalo de confianza para la media del índice de resistencia a la rotura de este tipo de cuerdas, utilizando un nivel de confianza del 95%.

b) Si, con el mismo nivel de confianza, se desea obtener un error máximo en la estimación de la media de 5 kg, ¿será suficiente con elegir una muestra de 30 cuerdas? (Propuesto para selectividad Andalucía 2005)

Respuesta.

X = Índice de resistencia a la rotura ; X → N(µ ; 15,6) ; es decir σ = 15,6 ;

n = tamaño muestral = 5

La media muestral es x = 280 + 240 + 270 + 285 + 270 = 269

5

a) Nivel de confianza = 1 – α = 0,95 ; α = 0,05; Intervalo de confianza I = ( x - E , x +E) , siendo E= Za/z x σ

n√م

Sabemos que φ(z ) = p(Z < zzzz ) = 1-- --

2

α

= 1

Page 14: Presentación1

ESTIMACIÓN POR INTERVALOS DE CONFIANZA

X Vamos a dar un intervalo para el parámetro

³ Escogemos α próximo a 0; p.ej., α = 0’05

³ 1 –α es el coeficiente de confianza; p.ej., 0’95

³ El nivel de confianza es [(1 –α)×100]%; p.ej., 95%

X Buscamos un intervalo cuya probabilidad de contener el

verdadero valor del parámetro sea 1 –α

X Cuanto mayor es 1 –α, mayor ha de ser el intervalo

³ Si α = 0, es decir, 1 –α = 1, entonces el intervalo debe contener

todos los valores posibles del parámetro

• Para la tasa de supervivencia, IC100% = [0,1]

• Para la concentración de X en sangre, IC100% = [0, concentración-máxima]

X Hay que buscar un compromiso entre certeza y precisión

Page 15: Presentación1

INTERVALOS DE CONFIANZA

X Estudio sobre la relación entre la vitamina X y el síndrome Y

X Concentración de X para personas sanas:

128 μg/cm3

(desviación estándar 20 μg/cm3 )

X Objetivo: ¿cuál es μ (concentración de X en enfermos)?

X Datos: análisis de sangre en 25 pacientes con síndrome Y

Promedio de concentración de X: 117 μg/cm3

³Es de esperar que el intervalo de confianza para μ esté en

torno a 117

X Vamos a fijar el nivel de confianza en el 95%

Page 16: Presentación1

CONSTRUCCIÓN DEL INTERVALO DE CONFIANZADistribución poblacional: normal, N(μ,σ =20), con μ desconocido

X Tamaño de la muestra: n = 25

Distribución muestral para el estadístico X: X ~ N(μ′,σ′)

μ′ = μ (desconocido) σ = σ = 20

= 4

√ n √25

Z= X – μ’ = x- μ’

σ 4

Z se denomina pivote.

X Su distribución no depende de los parámetros del modelo.

Distribución normal: Z ~ N(0,1) (independientemente de cuál sea μ)

Cada investigador obtiene un x: el promedio de X en su muestra

(No puede conocer z porque no conoce μ)

Page 17: Presentación1

CÁLCULO DEL INTERVALO DE CONFIANZA

Distribución

poblacional

Tamaño de la

muestra

Nivel de confianza

Resultado experime

ntal

Elección del

pivote, Z

Distribución de Z

Intervalo para z

Intervalo de

confianza

Page 18: Presentación1

INTERPRETACIÓN DE LOS INTERVALOS DE CONFIANZA

X Supongamos que el intervalo de confianza al 95% es [μ1 , μ2]

X Afirmación: “Hay un 95% de probabilidad de que el verdadero

valor de μ esté entre μ1y μ2.” ¿Cómo debe entenderse?

X En una probabilidad siempre hay algo aleatorio

X Lo aleatorio, en este caso, es el intervalo que cada investigador obtiene

X El parámetro μ no varía

X Por eso hay quien prefiere decir: “La probabilidad de que el

intervalo [μ1, μ2] contenga el verdadero valor de μ es el 95%”

³ Puede entenderse como equivalente a la afirmación anterior,

pero no se presta tan fácilmente a una interpretación errónea