distribucion t de student, scrib

22
INDICE INDICE 2 INTRODUCCION 3 DISTRIBUCIÓN “t” DE STUDENT 4 Ley de Student 5 Características de la distribución t de student 6 Propiedades de la ley de student 6 Grados de Libertad 7 Intervalos para muestras pequeñas 7 EJERCICIOS RESUELTOS 11 BIBLIOGRAFIA 16 ANEXO 17

Upload: nidia-argueta

Post on 24-Jun-2015

36.908 views

Category:

Documents


0 download

DESCRIPTION

Un breve reporte de las principales caracteristicas y propiedasdes de la distribución t de student, asi como las formulas que se utilizan para la misma

TRANSCRIPT

Page 1: Distribucion T de Student, Scrib

INDICE

INDICE 2

INTRODUCCION 3

DISTRIBUCIÓN “t” DE STUDENT 4

Ley de Student 5

Características de la distribución t de student 6

Propiedades de la ley de student 6

Grados de Libertad 7

Intervalos para muestras pequeñas 7

EJERCICIOS RESUELTOS 11

BIBLIOGRAFIA 16

ANEXO 17

Page 2: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

INTRODUCCION

La distribución t de Student se utiliza cuando nos encontramos con la dificultad de

no conocer la desviación típica poblacional y nuestra muestra es menor de 30. Es

similar a la curva normal, pero la distribución t tiene mayor área a los extremos y

menos en el centro.

Esta fue descubierta por un especialista en estadística de una empresa irlandesa,

este señor cuyo nombre era William S. Gosset, hizo inferencias acerca de la

media cuando la desviación poblacional fuese desconocida; y ya que a los

empleados de dicha entidad no les era permitido publicar el trabajo de

investigación bajo sus propios nombres, Gosset adoptó el seudónimo de

“Student”.

Sus funciones se basan en establecer un intervalo de confianza, utilizando un nivel

de confianza y los grados de libertad, obteniendo valores de una tabla dada con

respecto a estas variables y aplicarla en la formula.

De gran utilidad, reduce tiempo, costo y esfuerzos. Se utiliza para probar hipótesis

y también para saber si dos muestras provienen de la misma población.

Distribución t de Student Página 2

Page 3: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

DISTRIBUCIÓN “t” DE STUDENT

DISTRIBUCION t DE STUDENT

En muchas ocasiones no se conoce  y el número de observaciones en la muestra

es menor de 30. En estos casos, se puede utilizar la desviación  estándar de la

muestra s como una estimación de , pero no es posible usar la distribución Z

como estadístico de prueba. El estadístico de prueba adecuado es la distribución t.

A veces es necesario hacer análisis de muestras pequeñas por razones de tiempo

y reducción de costos, para ello fue descubierta la distribución t por William

Gosset, un especialista en estadística, que la publicó en 1908 con el seudónimo

de Distribución t Student.

Los usos para los cuales es idónea esta distribución son los siguientes:

1) Para determinar el intervalo de confianza dentro del cual se puede estimar

la media de una población a partir de muestras pequeña (n < 30)

2) Para probar hipótesis cuando una investigación se basa en muestreo

pequeño.

3) Para probar si dos muestras provienen de una misma población.

Sus aplicaciones en la inferencia estadística son para estimar y probar una media

y una diferencia de medias (independiente y pareada).

Cuando hicimos la estimación por intervalo, usando la distribución Z, con n ≥ 30,

establecimos el intervalo de confianza para estimar la media poblacional, así

x± zσ

√n dado que conocíamos la desviación típica de la población σ . Sin

embargo, si no la conocemos se puede sustituir por la desviación típica muestral S

quedando así x± zs

√n . Se sabe también que si X es una variable normalmente

distribuida con media µ y variancia σ2, y si una muestra de tamaño n se extrae,

Distribución t de Student Página 3

Page 4: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

entonces x, la media de la muestra es normalmente distribuida con media µ y

variancia σ x2 = σ

2

n.

Asimismo: x – µσx

= z, es una variable aleatoria normal estandarizada, con media

igual a cero y variancia igual a uno. Si σ x se sustituye por

sx = √∑ ¿¿¿¿, para tener x−μsx

, esta nueva variable no es mas normalmente

distribuida, teniendo su propia distribución, llamada t de “Student”

La distribución estadística de prueba:

t = x−μ^sx

=> S=S

√n−1

Entonces la distribución t queda así:

t = x−μσ

√n−1

LEY DE STUDENT

Esta ley se aproxima mucho a la distribución normal cuando el tamaño de la

muestra es grande (por tanto, podemos usar indistintamente una u otra). Cuando

la muestra es pequeña t no se distribuye normalmente, y es imperativo utilizarla.

La expresión para calcular el intervalo de confianza es la misma, en lugar de

buscar z α2 se busca t( α

2,ν ). El elemento ν es un parámetro llamado grados de

libertad y se calcula mediante ν = n – 1.

μ=x ± t(α2, ν)

σ

√nCARACTERÍSTICAS DE LA DISTRIBUCIÓN T DE STUDENT

1. Al igual que la distribución Z, es una distribución continua

Distribución t de Student Página 4

Page 5: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

2. La distribución t tiene una media de cero, es simétrica respecto de la media

y se extiende de -  a  +   la varianza de t   para  > 2. Cuando los

grados de libertad son suficientemente grandes la varianza de la

distribución t tiende a 1.

3. Tiene forma acampanada y simétrica

4. No hay una distribución t, sino una "familia" de distribuciones t. todas con la

misma media cero, pero con su respectiva desviación estándar diferente de

acuerdo con el tamaño de la muestra n, identificada cada una por sus

respectivos grados de libertad. Existe una distribución t para una muestra

de 20, otra para una muestra de 22, y así sucesivamente.

5. La distribución t es más ancha y más plana en el centro que la distribución

normal estándar como resultado de ello se tiene una mayor variabilidad en

las medias de muestra calculadas a partir de muestras más pequeñas. Sin

embargo, a medida que aumenta el tamaño de la muestra, la

distribución t se aproxima a la distribución normal estándar.

PROPIEDADES DE LA LEY DE STUDENT

Fν(t) = A (1+ t2

v)−( v+1

2) es la función de la densidad de la ley. La constante A

hace que el área bajo el gráfico sea igual a la unidad, v=n-1 son los grados

de libertad.

Para cada valor v de grados de libertad, existe una particular distribución de

probabilidad de t, es el parámetro ν, grados de libertad, el que identifica a la

curva respectiva.

El dominio de la función son todos los números reales.

Su media es μ=0, y su varianza es σ 2 = vv−2

para v > 2.

Los valores t (α ,ν¿ se encuentran en tablas de la distribución de t.

GRADOS DE LIBERTAD

Distribución t de Student Página 5

Page 6: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

En la mayoría de los casos, los parámetros de una población son cantidades

desconocidas y para estimarlos es necesario extraer una muestra de la población

y calcular los estadísticos correspondientes.

Existen varias distribuciones t. Cada una de ellas está asociada con los que se

denominan “Grados de libertad” (generalmente denotado por la letra griega nu, ν),

esté se define como el número de valores que podemos elegir libremente, ósea, el

número de observaciones menos uno, ν = n – 1.

A medida que los grados de libertad son más grandes hasta tender al infinito, las

formas de las curvas de t tienden a ser más próximas a la forma de la curva

normal.

Como cada curva de t esta relacionada a sus grados de libertad, no se pueden

usar valores estandarizados únicos, como se hizo en el caso de la normal, por lo

que es necesario, para calcular la probabilidad de un valor de t caiga en un

particular intervalo, computarlo según sean sus grados de libertad. Como es una

tarea difícil, se han elaborado tablas para varios valores de v. Generalmente las

tablas se han construido para pruebas de dos colas, variando v desde 1 hasta

infinito y alfa desde 0.5 hasta 0.001.1

INTERVALOS PARA MUESTRAS PEQUEÑAS

Cuando las observaciones de la muestra x1, x2,…, xn provienen de una ley normal,

el estadístico z = x−μσ

√n es exactamente normal estándar. Sin embargo cuando σ

no se conoce y se estima mediante s = √∑ ¿¿¿¿ , la distribución del estadístico t

= x−μσ

√n no es necesariamente normal.

Ejemplo:

1 Ver anexo

Distribución t de Student Página 6

Page 7: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

Probabilidad de 0.90 de que t esté entre -1.76 y +1.76 ⟹ -0.76 ≤ t ≤ 1.76

Como t = x−μσ

√n−1 , la desigualdad se convierte en

-1.76 ≤ x−μσ

√n−1 ≤ 1.76

x - 1.76 S

√n−1 ≤ μ ≤ x + 1.76

Como determinar el Intervalo de Confianza para la estimación de la Media

Conceptos Previos:

a) Estimador Puntual: Valor que se calcula a partir de la información de la

muestra y que se usa para estimar el parámetro de la población. Ejemplo: la

media de la muestra x es un estimador puntual de la media de la población

μ.

b) Intervalo de Confianza: Es un rango de valores que se construye a partir

de datos de la muestra de modo que el parámetro ocurre dentro de dicho

rango con una probabilidad específica. La probabilidad específica se

conoce como nivel de confianza.

Nos interesa en nuestro caso particular poder establecer el intervalo de confianza

para estimar la media poblacional, para ello haremos uso de la siguiente fórmula:

μ=x ± t(α2, ν)

s

√nDonde: μ = media poblacional

x = media muestral

t( α2,ν ) = valor obtenido de la tabla de la distribución “t”

Distribución t de Student Página 7

Page 8: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

s = desviación típica muestral

n = tamaño de la muestra

α = nivel de confianza

ν = grados de libertad

Para poder utilizar ésta formula es necesario explicar el significado de algunos

conceptos y la manera de cómo calcular su valor así como de conocer el uso de la

tabla “t” de Student. Lo cual haremos a continuación:

1) El nivel de confiabilidad utilizado es:

α = 100 %−Confiabilidad

100 %

La confiabilidad se refiere a la probabilidad específica de estimación del

parámetro, en este caso de la media poblacional.

2) Los grados de libertad: Concepto un tanto difícil de definir pero debe

entenderse como un indicador del grado de acercamiento que cada curva

de la distribución “t” presenta con respecto de la curva normal (obsérvese

que esto pone de manifiesto que la distribución t no es única y existen

tantas como los grados de libertad cumplan la condición ν < 30)

Su valor se obtiene de la formula:

ν = n – 1

3) Los valores de t( α2,ν ) se encuentran en la tabla de la distribución t Student.2

Determinando un intervalo de confianza

Para estimar la media poblacional μ en cualquier intervalo de confianza, utilizamos

x± ts

√n−1

2 Ver anexo

Distribución t de Student Página 8

Page 9: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

Si el tamaño de la muestra fuese de n = 10, los grados de libertad serían 9 y para

un coeficiente de confianza del 80%, el intervalo de confianza para estimar la

media poblacional µ sería:

x±1.38( S

√n−1)

EJERCICIOS RESUELTOS

Los ejercicios se han resuelto en base a la tabla de Distribución t con distintos

grados de libertad.3

3 Ver anexo

Distribución t de Student Página 9

Page 10: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

1. Se realizo un estudio sobre la utilización del agua en una pequeña ciudad.

Para ello se considero una muestra de 25 casa. El número de galones de

agua que utilizan por día (1 galón ≡ 0.0037854 m3) fue el siguiente:

175 185 186 118 158

150 190 178 137 175

180 200 189 200 180

172 145 192 191 181

183 169 172 178 210

Con base en esta información:

a) Hallar un intervalo de confianza del 90%

b) Si el recurso de agua en la ciudad permite una utilización media de 160

galones por día, ¿Podría pensarse que hay un problema de escasez de

agua en la ciudad?

x=175.76; n=25; s=20.79; α=0.1; ν=24; μ=160; t( α

2,ν )=1.711

μ : x± t(α2,ν)

s

√n

μ :175.76±1.71120.79

√25

I μ = [168.65, 182.87]

2. A partir de 860 cuentas, un analista financiero toma una muestra aleatoria

de 16 cuentas. Los saldos observados en la muestra son los siguientes:

165, 150, 300, 240, 250, 150, 300, 200, 140, 240, 260, 180, 190, 230, 350,

360.

Determinar un intervalo de confianza del 90% para estimar el saldo medio de

todas las cuentas.

x=231.56; n=16; s=69.61; α=0.1; ν=15; t( α2,ν )=1.753

Distribución t de Student Página 10

Page 11: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

μ : x± t(α2,ν)

s

√n

μ :231.56±1.75369.61

√16

I μ = [201.05, 262.07]

3. Una muestra de edades de 36 asegurados a una compañía dio valores x =

39.5, y s = 7.77. Hallar los intervalos de confianza para µ del:

a) 90%; x=39.50; n=36; s=7.77; α=0.1; ν=35; t( α2,ν )=1.690

μ : x± t(α2,ν)

s

√n

μ :39.5±1.6907.77

√36

I μ = [37.31, 41.69]

b) 95%; x=39.50; n=36; s=7.77; α=0.05; ν=35; t( α2,ν )=2.030

μ : x± t(α2,ν)

s

√n

μ :39.5±2.0307.77

√36

I μ = [36.87, 42.13]

4. Una maquina se encarga de llenar botes de jalea con µ gramos, pero no

los llena con la cantidad exacta. Suponte que los pesos reales de contenido

siguen una ley normal N (µ, σ 2).

Si de una muestra de 16 botes obtenemos una media de 298g, investiga si un

intervalo de confianza para µ del 95%, contiene la media µ = 300.

Distribución t de Student Página 11

Page 12: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

x=298; n=16; s=20.79; α=0.05; ν=15; μ=300; t( α

2,ν )=2.131

μ : x± t(α2,ν)

s

√n

μ :298±2.13120.79

√16

I μ = [286.92, 309.08]

R/ El intervalo si contiene a la media µ, por lo tanto el error en llenado no es

intencional.

5. Se selecciono una muestra aleatoria de 25 cuentas por cobrar de un

registro que contenía 96 cuentas. La muestra dio una media de x = 2.435

colones y una desviación típica de S = 335 colones. Obténgase un intervalo

de confianza del 90% para estimar la media de las 96 cuentas del registro.

x=2435; n=25; s=335; α=0.1; ν=24; t( α

2,ν )=1.711

μ : x± t(α2,ν)

s

√n

μ :2435±1.711335

√25

I μ = [2320.36, 2549.64]

6. El auditor de una empresa al examinar los registros de facturación mensual,

mediante el análisis de una muestra aleatoria irrestricta de 10 facturas no

pagadas encontró que la media aritmética fue de x = $9500 con una

desviación típica de s = $327. Construir un intervalo de confianza del 95%

para estimar el parámetro poblacional.

x=9500; n=10; s=327; α=0.05; ν=9; t( α2,ν )=2.262

Distribución t de Student Página 12

Page 13: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

μ : x± t(α2,ν)

s

√n

μ :9500±2.262327

√10

I μ = [9266.09, 9733.91]

7. Una muestra aleatoria del proceso de producción de 17 bombillos, dio una

media de x = 128 horas, con una desviación típica s = 15 horas. Construir

un intervalo de confianza del 99% para estimar el promedio de vida útil de

todos los bombillos del proceso.

x=128; n=17; s=15; α=0.01; ν=16; t( α

2,ν )=2.921

μ : x± t(α2,ν)

s

√n

μ :128±2.92115

√17

I μ = [117.37, 138.63]

8. Una empresa constructora desea conocer el promedio de arrendamiento

mensual de casas en cierta ciudad (casas tipo clase media). Una muestra

aleatoria de 26 arrendamientos dio un promedio de x = $280 y una

desviación típica de s = $55. Estime el promedio verdadero con un intervalo

de confianza del 0.99.

x=280; n=26; s=55; α=0.01; ν=25; t( α

2,ν )=2.787

μ : x± t(α2,ν)

s

√n

μ :280±2.78755

√26

I μ = [249.94, 310.06]

Distribución t de Student Página 13

Page 14: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

9. El propietario de una papelería desea estimar la media del valor al

menudeo de las tarjetas de felicitación que la tienda tiene en su inventario.

Una muestra aleatoria de 20 tarjetas de felicitación indica una media de

valor de $1.67 y una desviación estándar de $0.32. Suponiendo una

distribución normal, construya una estimación del intervalo de confianza del

95% para la media del valor de todas las tarjetas de felicitación en el

inventario de la tienda.

x=1.67; n=20; s=0.32; α=0.05; ν=19; t( α

2,ν )=2.093

μ : x± t(α2,ν)

s

√n

μ :1.67±2.0930.32

√20

I μ = [1.52, 1.82]

Distribución t de Student Página 14

Page 15: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

BIBLIOGRAFIA

Libros

Elementos de probabilidad y estadística. José Hernández Salguero. 1ª

Edición, El Salvador. UCA-Editores 2002

Estadística II: Métodos prácticos de inferencia estadística. Gildaberto

Bonilla. 4ª Edición. El Salvador. UCA-Editores 1997

Estadística para administración. David M. Levine; Timothy C. Krehbiel; Mark

L. Berenson. 4ª Edición. México. Prentice Hall 2006

Introducción a la estadística. Wilfredo Caballero. 1ª Edición. Costa Rica.

IICA 1981

Apuntes de Clase de Estadística. El Salvador. ITCA-FEPADE. 2006

Internet

http://www.itchihuahuaii.edu.mx/academico/CB/MEG/documentos/1.8.htm

http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudent.html

Distribución t de Student Página 15

Page 16: Distribucion T de Student, Scrib

FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

ANEXO

Distribución t de Student Página 16