descriptiva

Post on 24-Oct-2014

171 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Prof.: David Becerra Rojas 1

Contenidos

1. Introducción2. Estadística Descriptiva:

Univariante Bivariante3.- Probabilidades4.- Distribución de probabilidades

5.- Distribución en el Muestreo6.- Estimación de Parámetros7.- Dócimas de Hipótesis

Prof.: David Becerra Rojas 2

Bibliografía

1. Murray y Espieges “ Estadística”2. Paul Newbold “ Estadística para los negocios”3. Mario Triola “ Probabilidad y Estadística”4. L. Chao5. R. Levin6. Mongomery7. www.elprisma.com ( Matemática,….)

3

ESTADISTICA

CIENCIA QUE NOS PERMITE TOMAR DECISIONES BAJO CIERTA INCERTIDUMBRE

Prof.: David Becerra Rojas 4

Términos ComunesProceso de realizar una observación o una medición.

Característica o fenómeno, que puede tomar distintos valores.

Resultado de la observación de una variable.

Conjunto total de elementos o individuos, que poseen unacaracterística común, acerca de la cual se quiere información

Subconjunto de la población, seleccionada de acuerdo a una regla o un plan.

Obtención de todos los datos de interés que posee la población

Función o formula que depende de los datos de la muestra

Estimación del parámetro a través del estadístico

Función o formula que depende de los datos de la población

Muestra

CensoEstadísticoParámetroInferencia

Experimento

VariableDatoPoblación

Prof.: David Becerra Rojas 5

Método Científico

1. Planteamiento del Problema2. Diseño del Experimento3. Experimentación y Recolección4. Organización y Descripción de

Resultados5. Inferencia Estadística

Prof.: David Becerra Rojas 6

Muestreo

Notación:

N : Tamaño de la Poblaciónn : Tamaño de la Muestra

Prof.: David Becerra Rojas 7

Tipos de Muestreos Aleatorios

Aleatorio SimpleEstratificadoSistemáticoPor Conglomerado

Prof.: David Becerra Rojas 8

Muestreo Aleatorio Simple

Todos los elementos de la población, tienen la misma oportunidad de estar contenidos en la muestra.

Se enumeran todos los elementos, y luego se extraen de uno en uno, aleatoriamente, hasta completar el tamaño de la muestra.

Cuando la población es muy grande, se puede recurrir a los números aleatorios.

Prof.: David Becerra Rojas 9

Muestreo Estratificado

Método de selección, utilizado cuando la población, está dividida en grupos llamados estratos, cada uno, formado por una gran cantidad de elementos homogéneos.

Se toma una muestra aleatoria simple, en cada estrato.

Los estratos, pueden ser de igual o distinto tamaño, si son distintos, una manera posible de determinar el tamaño de la muestra al interior de cada estrato, es que esta sea proporcional al tamaño del mismo, a este tipo de asignación, se le conoce como Afijación Proporcional, que no siempre resulta la mejor, debido al costo de muestreo en cada estrato.

Prof.: David Becerra Rojas 10

Muestreo Sistemático

Este método, se utiliza cuando la población tiene sus elementos ordenados. Se divide la población (de tamaño N) en tantas sub poblaciones, como sea el tamaño de la muestra (n), todas de igual tamaño (k = N/n).

Se selecciona al azar un elemento de la primera sub población, y de ahí en adelante, de las sub poblaciones siguientes, se extrae el elemento correspondiente.

Prof.: David Becerra Rojas 11

Muestreo por Conglomerado

Se utiliza, cuando la población, está dividida en una gran cantidad de pequeños grupos, llamados Conglomerados, cada uno formado por elementos heterogéneos. Se toma una muestra aleatoria de Conglomerados, y luego se censan todos los conglomerados seleccionados.

Prof.: David Becerra Rojas 12

Tipos (Género) de Variable

1.- Numéricas : a.- Discretasb.- Continuas

2.- Categóricas: a.- Ordinalesb.- Nominales

Prof.: David Becerra Rojas 13

Organización de Datos

Consideremos que la variable X, se divide

En k clases o categorías, denominadas:

C1 , C2 , …………… C i ,……… Ck

Dando origen a la Siguiente tabla de Frecuencia

Prof.: David Becerra Rojas 14

Tablas de Frecuenciai X ni fi Ni Fi

1 C1 n1 f1 N1 F1

2 C2 n2 f2 N2 F2

: : : : : :

i Ci ni fi Ni Fi

: : : : : :

k Ck nk fk Nk Fk

T o t a l n 1 /// ///

Prof.: David Becerra Rojas 15

Tablas de Frecuencias

Frecuencia Absoluta: (ni )

Frecuencia Relativa : ( fi =ni/n )

Frecuencia Acumulada Absoluta: (Ni)

Frecuencia Acumulada Relativa : (Fi =Ni/n )

Prof.: David Becerra Rojas 16

Ejemplo 1:

M MB B B R M MM R MB MB R B B M R B B R MB B B B R M MM B R R B R B R

Tablai X1 MM2 M3 R4 B5 MBTotal

Determine: a.- La variable x:b.- El típo de Variable:c.- Una tabla de frecuencia

ni 2 41012 432

fi

.06

.13

.31

.38

.121.0

Ni

2 6162832//

Fi

.06

.19

.50

.881.0//

Opinión de alumnos por una bebida nueva

d.- Determine e Interprete k= f4=

n3= N3=

n= F3=e.- ¿Cuantos alumnos consideran que

la bebida es al menos regular?

5

1032

.38

16

.50

26 alumnos

Opinión de los alumnos…..

Categórica Ordinal

Prof.: David Becerra Rojas 17

Ejemplo 2:

4 3 5 8 3 6 3 2 2 4 4 3 3 5 8 6 8 3 6 6 4 3 5 2 2 4 6 6 3 5

Tabla

i X

1 22 33 44 55 66 77 8Total

Determine: a.- La variable X:b.- El típo de Variable:c.- Una tabla de frecuencia

ni

485460330

fi

.13

.27

.17

.13

.20

.00

.101.0

Ni

4121721272730//

Fi

.13

.40

.57

.70

.90

.901.0//

Número de artículos defectuosos por día.

d.- Determine e Interprete k= f4=

n3= N4=

n= F3=

e.- ¿En cuantos días el número de artículos defectuosos fue de al

menos 4?

75

30

.1321

.57

18 días

Número de artic. Defec. Por día

Numérica Discreta

f.- ¿Cuál fué el número máximo de artículos def. por día en los 15 días que hubieron menos?

4 artículog.- ¿Cuántos artículos en total, se juntaron en Los 6 días en que hubieron más? 42 art.

Prof.: David Becerra Rojas 18

Tabla de Frecuencia con Intervalos de Clase

1. Rango: R = Valor Máx. – Valor mín. + 1u (1u:

Una unidad de medida)

2. Cantidad de Intervalos, Según Sturger´s: k = 1 + 3.3 log(n) kN

3. Amplitud: a = Rk (a valor superior cuando no es exacto)

Aparentes (XA)

6. Marcas de Clases (Xi)

Ej. Si 1u = 0.01

y a= R/k = 4.571 4.58 ( se expresa en la unidad de medida)4. Adicionales: p = a*k –R5. Intervalos :

Xi = ( Ls + Li ) 2

Características (XA):

1.- Limite inferior del primer intervalo corresponde al valor mínimo menos las p* unidades adicionales correspondientes .

2.- Limite superior del último intervalo corresponde al valor máximo más las p** unidades adicionales correspondientes.3.- Se expresan en la unidad de medida.4.- Están separados por una unidad de medida.

Reales (XR)

Características ( XR):

Se obtienen a partir de los Intervalos Aparentes, ampliando estos en media unidad de medida hacia cada extremo, de tal manera, que el limite superior de un intervalo, corresponda al inferior del intervalo siguiente.

Obs.: La amplitud (a), se puede obtener de la diferencia entre dos limites

inferiores o superiores consecutivos, o entre dos marcas de clases consecutivas

Prof.: David Becerra Rojas 19

Ejemplo

Sea Valor mínimo= 4.7Valor Máximo = 12.6n = 42

Determine los intervalos aparentes y reales con sus respectivas marcas de clase.

Prof.: David Becerra Rojas 20

1. Rango R = 12.6 – 4.7 + 0.1 = 8.02. K = 1 +3.3 log(42) = 6.4 63. a = 8.0 6 = 1.33 1.44. P = 1.4*6 -8.0=0.4

5.=Intervalos : i XA XR Xi

123456

4.5 – 5.8

5.9 – 7.2

7.3 – 8.6

8.7 – 10.0

10.1 – 11.4

11.5 – 12.8

4.45 – 5.855.85 – 7.257.25 – 8.658.65 – 10.0510.05 – 11.4511.45 – 12.85

5.15 6.55 7.95 9.3510.7512.15

Prof.: David Becerra Rojas 21

Ejemplo 2:

Considere los siguientes datos:0.94 1.05 0.86 0.94 0.96 1.03 1.010.78 0.84 0.86 1.04 0.76 0.65 0.70

Confeccione una tabla de frecuencia Con 5 intervalos.

Prof.: David Becerra Rojas 22

1. Rango R = 1.05 – 0.65 + 0.01 = 0.412. K = 53. a = 0.41/5=0.082 0.094. P = 0.09*5 -0.41=0.04

5.=Intervalos : i XA XR Xi ni fi Ni Fi

12345

0.63 – 0.71

0.72 – 0.80

0.81 – 0.89

0.90 – 0.98

0.99 – 1.07

0.625 – 0.715

0.715 – 0.805

0.805 – 0.895

0.895 – 0.9850.985 – 1.075

0.670.760.850.941.03

2 2 3 3 414

0.140.140.210.210.291.00

2 4 71014

0.140.280.490.701.00

Prof.: David Becerra Rojas 23

Complete la siguiente Tabla

1 - 12

2 - 0.20 12.6

3 - 48

4 - 0.80

18.4

5 - 120

Total //// ///// /////

i XR ni fi Ni Fi Xi

24

12

9648

24

9.7

21.3

15.5

8.25

11.15 14.05

14.05 16.95

16.95 19.85

19.85 22.75

36

12

120

Luego como a = 2.9

11.15

Prof.: David Becerra Rojas 24

TIPOS de GRÁFICOS

Gráfico de BarrasGráfico de SectoresHistogramaPolígonoOjiva PíctogramaDiagrama de Caja y Bigote (Tarea)

Categóricas y Numéricas Discretas

Categóricas

Numéricas Continuas

Numéricas Continuas

Numéricas

Numéricas y Categóricas

Principalmente en variables :

Prof.: David Becerra Rojas 25

Gráfico de Barras

0

5

10

15

20

25

30

H A K M B

ni

xi

Prof.: David Becerra Rojas 26

Gráfico de Sectores (ó Circular)

1234

Prof.: David Becerra Rojas 27

Histograma

3.5 5.5 7.5 9.5 11.5 13.5 XR

 

   

     

       

         

         

         

| | | | | | | _________________________

ni

120

100

80

60

40

20

Prof.: David Becerra Rojas 28

0

20

40

60

80

100

120

Polígono

2.5 4.5 6.5 8.5 10.5 12.5 X i

ni

Prof.: David Becerra Rojas 29

Ojiva

,00%

20,00%

40,00%

60,00%

80,00%

100,00%

1 2 3 4 5 6 7 8 9 10

Fi

Prof.: David Becerra Rojas 30

Pictograma

1990199520002005

1000 ejemplares

Consumo de carne de vacuno

Prof.: David Becerra Rojas 31

Ejemplo 1i xi ni fi

1 H 10 .143

2 A 18 .257

3 K 12 .171

4 M 5 .071

5 B 25 .357

To tal 70 1.00

fix360

51.4

92.5

61.6

25.6

128.5

360

Confeccione un gráfico de Barras y uno de Sectores

()ºac

51.4

143.9

205.5

231.1

360.0

/////

Prof.: David Becerra Rojas 32

i 1234

X 4 - 5 6 - 7 8 - 910 - 11T otal

ni407510530250

fi.16.30.42.121.0

Ni40115220250

Fi.16.46.881.0

Xi4.56.58.510.5

Ejemplo 2

Confeccione un: Histograma, un Polígono, y un Ojiva

Prof.: David Becerra Rojas 33

Ejercicio Supongamos que los datos siguientes representan

los tiempos, que demoran unos atletas en terminar una maratón.

1:35 1:28 1:45 1:52 1:40 1:30 1:381:47 1:37 1:30 1:40 1:36 1:29 1:35 1:37 1:36 1:40 1:36 1:48 2:05 1:322:28 1:45 1:50 1:47 2:29 1:44 1:49

1. Identifique la variable2. Indique el género ( tipo)3. Construya una tabla de frecuencia de 5 intervalos4. Confeccione un; Histograma, Ojiva

Prof.: David Becerra Rojas 34

ESTADISTICOS ( o

Estimadores)

CUANTILES ( Estadísticos de Orden)MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE DISPERSIÓN

Prof.: David Becerra Rojas 35

CUANTILES: ( ESTADÍSTICOS DE

ORDEN)

Cuartíles : ( Kk )

Quintíles : (Qq)

Decíles : ( Dd )

Percentíles : ( Pp )

Prof.: David Becerra Rojas 36

Cuartiles:

K1 K2 K3

25%

50%

75%

k = 1, 2, 3

Prof.: David Becerra Rojas 37

Quintiles:

Qq

q x 20%

Q = 1, 2, 3, 4

Prof.: David Becerra Rojas 38

Deciles:

Dd

(10*d)%

d = 1, 2, ….., 9

Prof.: David Becerra Rojas 39

Percentíles:

Pp

p%

p = 1, 2, …., 99

Prof.: David Becerra Rojas 40

EjercicioLa tabla siguiente, representa los años deServicio de los trabajadores de una empresa.

i Xi ni

1 3 152 6 183 9 264 10 385 12 306 18 25Total 152

1.- Calcular : K1 , Q3 , D2 , P45Ni

15335997127152

Fi

0.090.220.390.640.841.00

2.- ¿Cuál es el año de servicio mínimo

de los 30 trabajadores más antiguos

12 años

K1 = 9

P45 = 10

Q3 = 10

D2 = 6

Prof.: David Becerra Rojas 41

Cuantiles:

Li : Limite real inferior del intervalo que contiene el cuantil t, que es aquel donde por primera vez la frecuencia acumulada pasa el (t/Sx100)%.S : 4, 5, 10, 100 ( Cuartil, Quintil, Decíl, Percentil , respectivamente)Nt-1: frec. Acumulada anterior al intervalo que contiene el Ct.nt : frec. Absoluta del intervalo que contiene el Ct.a : Amplitud del intervalo. n : Tamaño de Muestra ( Total de Datos)

ttt n

aN

S

ntLiC *

*1

t : 1,2,3 Cuartiles 1,2,3,4 Quintiles 1,2…..9 Deciles 1,2,……99 PercentilesCuando los datos están ordenados en una tabla de frecuencia

Con intervalos de clase, se puede utilizar la siguiente expresión

Prof.: David Becerra Rojas 42

Ejemplo

8

6.0*4

10

50*195.21

D

5

6.0*37

4

50*375.43

K

i X 1 2.4 - 2.92 3.0 - 3.53 3.6 - 4.14 4.2 - 4.75 4.8 - 5.36 5.4 - 5.9 Total

ni

4 81510 5 850

Ni

41227374250

fi

.08

.16

.30

.20

.10

.161.0

Fi

.08

.24

.54

.74

.841.0

= 4.81

= 3.025

Determine : K3 , D1 , P35, y P74 , Q3

= 3.77

Si la variable X representa la utilidad en M$ por día determine: i.- ¿Cuál fue la utilidad máxima de los 15 días que ganó menos?

ii. ¿En cuántos días la utilidad fue de al menos M$ 5.0? 11 días

P74 = 4.75

M$ 3.67

15

6.0*12

100

50*3555.335

P

Q3 = 4.33

Prof.: David Becerra Rojas 43

MEDIDAS DE TENDENCIA CENTRAL

MODAMEDIANAMEDIA ARITMÉTICAMEDIA ARMÓNICAMEDIA GEOMÉTRICA

Prof.: David Becerra Rojas 44

MODA ( ó MODO)

La denotaremos por : Mo

a.- Está dada por la observación que más se repite ó la de mayor frecuencia.

b.- Es posible calcularla para cualquier tipo de variable.

c.- Pueden existir muchas o ninguna.

Prof.: David Becerra Rojas 45

MODA Ejemplo 1: Sean los siguientes datos:

F D R F T D R U D U U D

i Xi ni

1 F 22 D 43 R 24 T 15 U 3Total 12

Luego; en este caso la Moda es: Mo = D

Prof.: David Becerra Rojas 46

MODAEjemplo 2 : 2 3 5 1 1 5 2 5 4 2 4 2 5 1 6

i Xi ni

1 1 32 2 43 3 14 4 25 5 46 6 1Total 15

En este caso tenemos dos Mo:Mo1= 2 Mo2 = 5

Prof.: David Becerra Rojas 47

MODALa moda para datos tabulados, se obtiene a partir de la siguiente expresión:

Donde: Li : Limite real inferior del intervalo que contiene la Mo que es aquel que tiene mayor frecuencia

1 : Diferencia entre las frecuencias absolutas del intervalo modal y

el intervalo anterior.

2 : Diferencia entre las frecuencias absolutas del intervalo modal y

el intervalo posterior.

a : Amplitud del intervalo.

aLiM o *21

1

Prof.: David Becerra Rojas 48

i 1234

X 4 - 5 6 - 7 8 - 910 - 11T otal

ni

42 68102 38250

Ejemplo :

2*6434

345.7

oM = 8.19

Calcule la Moda

aLiM o *21

1

Prof.: David Becerra Rojas 49

MEDIANALa denotaremos como : MdPuntuación que divide la distribución de los datos (ó la muestra) en dos partes iguales.Es decir nos indica el punto hasta donde se tiene acumulado el 50% de las observaciones.Nota: - Para su determinación, los datos se ordenan previamente. - No tiene sentido cuando la variable es categórica nominal.

Prof.: David Becerra Rojas 50

MEDIANA

Si el número de observaciones impar, entonces la Md estará dada por la observación central.Si el número de observaciones par, entonces la Md estará dada por el promedio de las dos observaciones centrales.

Prof.: David Becerra Rojas 51

MEDIANAEjemplo: 1 2 3 5 7 9 10 27 29 30 38 40 n=11

En este caso la Md = 10

Ejemplo: 2 2,3 2,6 3,6 5,8 6,8 7,9 n=6

Luego ; Md = (3,6+5,8)/2 = 4,7

Prof.: David Becerra Rojas 52

MEDIANALa mediana para datos tabulados, se obtiene a partir de la siguiente expresión:

Donde: Li : Limite real inferior del intervalo que contiene la Md, que es aquel donde por primera vez la frecuencia acumulada pasa el 50%.

n : Tamaño de la muestra

N d-1 : Frec. acumulada anterior al intervalo que contiene la Mediana. n d : Frec. Absoluta del intervalo que contiene la Md

a : Amplitud del intervalo.

ddd n

aN

nLiM *

2 1

Prof.: David Becerra Rojas 53

Ejemplo: dado los siguientes datos:

MEDIANA

i Xi 1 42 53 64 75 86 9 Total

ni

3 2 2 3 4 317

Determine; Md

4 4 4 5 5 6 6 7 7 7 8 8 8 8 9 9 9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Ni

3 5 7101417

Fi

.18

.29

.41

.59

.821.0

Md = 7

Prof.: David Becerra Rojas 54

Ejemplo de Mediana

i X 1 4 - 52 6 - 73 8 - 94 10 - 115 12 - 136 14 - 15 Total

ni

4 81518 2 350

Ni

41227454750

fi

.08

.16

.30

.36

.04

.061.0

Fi

.08

.24

.54

.90

.941.0

Luego la Md = 9.23

y la Moda Mo = 9.82

Determine; Md , Mo

15

2*12

25.7

n

M d

Prof.: David Becerra Rojas 55

Ejercicio.4.8 3.6 5.2 6.1 6.0 2.9 3.5 4.8 4.3 4.24.8 3.1 4.8 2.9 5.55.0 4.8 5.6 6.01.Calcular Mo , Md

2.Construya una tabla de frecuencia3.Calcule de la tabla Mo , Md.4.Comente.

Prof.: David Becerra Rojas 56

MEDIA ARITMÉTICALa media Aritmética también llamada Promedio ó simplemente Media, y esta dada para datos no tabulados por : (Se calcula solamente en variables numéricas)

Donde: Xi : Corresponde a las Observaciones

n : Tamaño de la Muestra

N : Tamaño de la Población

n

XX

n

ii

1

N

XN

ii

1

MuestralPoblacional

Prof.: David Becerra Rojas 57

Donde: Xi : Observación ó Marca de Clase

n : Tamaño de la muestra

ni : Frecuencia Absoluta de la observación o del intervalo

k : Número de intervalos

MEDIA ARITMÉTICA

Para datos Tabulados la Media está dada por :

n

XnX

k

iii

1

k

iiixf

1

Prof.: David Becerra Rojas 58

Ejemplo: La tabla siguiente representa una muestra de los años de servicio de trabajadores.

i12345

Xi 510121520

ni 4 7 8 3 224

Xi*ni 20 70 96 45 40271

fi0.1670.2920.3330.1250.0831.00

fixxi0.8352.9203.9961.8751.66011.286

--------------------------------------------

--------------------------------------------Total

Determine la Media:

5

1iiixfX = 11.286

5

1i

ii

n

xnX

286.1124

271X

Prof.: David Becerra Rojas 59

Ejemplo 2: Se toma una muestra de 21 observaciones, calcule la Media.

807.221

95.58

2.021

1595.2

i X1 2.3 - 2.42 2.5 - 2.63 2.7 - 2.84 2.9 - 3.05 3.1 - 3.26 3.3 - 3.4 Total

ni

4 5 3 2 4 321

xi

2.352.552.752.953.153.35

ni*xi

9.4012.758.255.9012.6010.0558.95

Luego como

ui

-3-2-1012

ni*ui

-12-10 -3 0 4 6-15

= 2.807an

unAX

k

iii

1

6

1i

ii

n

xnX

Prof.: David Becerra Rojas 60

MEDIA PONDERADA _ _ __ n1x1 + n2x2 +….+nkxk

xT = --------------------------------- n1 + n2+ …….+ nk

_ 100x480 + 300x320 + 400x Xc290 = --------------------------------------- 100 + 300 + 400

Ejemplo: En una empresa donde se distinguen tres tipos de trabajadores, el salario medio es de 290. Los 100 trabajadores de la categoría A tienen un salario medio de 480, los 300 de la categoría B tienen un salario medio de 320, ¿ Cuánto es el salario medio de los 400 de la categoría C?

_Luego Xc = 220

k

1i

x*nn

ii

Prof.: David Becerra Rojas 61

Tarea NºVentajas y Desventajas de: Moda, Mediana y Media.Defina y de un ejemplo de :Media Geométrica : (G)Media Armónica : (H)SesgoCurtosis

Prof.: David Becerra Rojas 62

Media Geométrica:

nnn xxxi

n

iG x *.....**

121

Media Armónica:

n

i ix

nH

1

1

Prof.: David Becerra Rojas 63

MEDIDAS DE DISPERSIÓN

Desviación Media: (DM)

Desviación Intercuartílica: (K)

Desviación Típica: ( s )

Varianza: ( s2 )

Rango: (R)

Prof.: David Becerra Rojas 64

MEDIDAS DE DISPERSIÓN

Rango: (R)

R = V. Máximo – V. Mínimo + 1 Unidad de Medida

Prof.: David Becerra Rojas 65

MEDIDAS DE DISPERSIÓN

Desviación Intercuartílica: (K)

213 KKK

Prof.: David Becerra Rojas 66

MEDIDAS DE DISPERSIÓN

Desviación Media: (DM)

Para datos No Tabulados

Para datos Tabulados

n

XX

DM

n

1i

i

n

XXnDM

k

iii

1

Prof.: David Becerra Rojas 67

MEDIDAS DE DISPERSIÓN

Varianza: (s2 ,2)

Poblacional

Muestral : Para datos No Tabulados

1

1

2

2

n

XXS

n

ii

)1n(n

xxn

2n

1i

i

n

1i

2i

21

2

1

2

2

)(

N

x

N

xN

ii

N

ii

Prof.: David Becerra Rojas 68

MEDIDAS DE DISPERSIÓN

1

1

2

2

n

XXnS

k

iii

)1(

2

11

2

nn

xnxnnk

iii

k

iii

Muestral : Para datos Tabulados

Prof.: David Becerra Rojas 69

Ejemplo

65

30X

5.7

4

30

11

2

2

n

XXS

n

ii

25

101

n

XXDM

n

ii

Obs. : x1 x2 x3 x4 x5 TotalXi : 2 5 6 8 9 30

Determinar: Desv Media Varianza

___

xi - x : - 4 -1 0 2 3 0 _ xi - x : 4 1 0 2 3 10 _(xi - x)2: 16 1 0 4 9 30

Sean las edades ( en año) de 5 niños

X2i : 4 25 36 64 81 210

5.7

4*5

30210*5

)1(

2

2

11

2

2

nn

xxn

S

n

ii

n

ii

Prof.: David Becerra Rojas 70

MEDIDAS DE DISPERSIÓNDesviación Típica: (S , σ)

1n

XX

S

n

1i

2i

)1(

2

11

2

nn

xxnn

ii

n

ii

21

2

1

2)(

N

x

N

xN

ii

N

iiPoblacional:

Muestral : Para datos No Tabulados

Prof.: David Becerra Rojas 71

MEDIDAS DE DISPERSIÓN

Para datos Tabulados

1

1

2

n

XXnS

k

iii

)1(

2

11

2

nn

xnxnnk

iii

k

iii

Prof.: David Becerra Rojas 72

COEFICIENTE DE VARIACIÓN

X

SCV

Mide la homogeneidad que existe en los datosRespecto a la variable en estudio.Mientras más pequeño, más homogéneo.

Prof.: David Becerra Rojas 73

Ejemplo 2

75.219

25.52: 1

n

xnXqueSabemos

k

iii

)119(19

25.52)61.145(19 2

i123456

X2.3 - 2.42.5 - 2.62.7 - 2.82.9 - 3.03.1 - 3.23.3 - 3.4

ni

45324119

xi

2.352.552.752.953.153.35

nixxi

9.4012.758.255.9012.603.3552.25

= 0.327

nixxi2

22.09 32.51 22.69 17.41 39.69 11.22145.61

Calcule: la Media , Desv. Típica

)1(

2

11

2

nn

xnxnn

S

n

iii

n

iii

119.075.2

327.0

x

sCV

Prof.: David Becerra Rojas 74

Ejemplo 2

an

unAX

k

iii

1

)119(19

19)67(192.0

2

)1(

2

11

2

nn

ununn

aS

n

iii

n

iii

i123456

X2.3 - 2.42.5 - 2.62.7 - 2.82.9 - 3.03.1 - 3.23.3 - 3.4

ni

45324119

xi

2.352.552.752.953.153.35

ui

-3-2-1012

ni*ui

-12-10 -3 0 4 2-19

= 2.75

ni*ui2

3620 3 0 4 467

= 0.327

Calcule: la Media , Desv. Típica por el Medio Provisorio

2.019

)19(95.2

Prof.: David Becerra Rojas 75

Coeficiente de Asimetría ( Sesgo )

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

de Pearson

de Fisher33

1

331 )(

1

Sxxn

S

k

iii

Prof.: David Becerra Rojas 76

Coeficiente de Curtosisi

caPlaticúrti

aMesocúrtic

caLeptocúrti

:0

:0

:0

2

2

2

33)(

144

1

442

Sxxn

S

k

iii

Prof.: David Becerra Rojas 77

Estadística Descriptiva Bivariante

Prof.: David Becerra Rojas 78

Sean las siguientes variables:

X : A1, A2, ...................Af

Y : B1, B2,.....................Bc

Estas variables, se pueden ordenar en una tabla de doble entrada llamada Tabla de Contingencia:

Estadística Descriptiva Bivariante

Prof.: David Becerra Rojas 79

Tabla de Contingencia

X \ Y B1 B2 ..Bj .. Bc Total A1 n11 n12 : n1. A2 n21 n22 : n2. Ai ……. ……. nij ……. ni. : : : Af : nf. Total n.1 n.2 ... n.j ..... n.c n

Prof.: David Becerra Rojas 80

Frecuencia Absoluta(Conjunta)

Se denota por nij y se define como: Cantidad de elementos que cuentan simultáneamente con la característica Ai de la variable X y Bj de la variable Y

Prof.: David Becerra Rojas 81

Frecuencia AbsolutaMarginal

ni.: Total de la fila i = nij

n.j : Total de la Columna j = nij

n.. : Total General = nij = n ( Tamaño muestra) i=1 j=1

j=1

c

f

f c

i=1

Prof.: David Becerra Rojas 82

Frecuencia RelativaConjunta

Se denota por fij = nij

n

Prof.: David Becerra Rojas 83

Frecuencia Marginal Relativa

fi. = fij =

f.j = fij =

f.. = fij = 1 i=1 j=1

j=1

c

f

f c

i=1

n

n

n.j

ni.

Prof.: David Becerra Rojas 84

Frecuencia Condicional

.. i

ij

i

ij

ij n

n

f

ff

j

ij

j

ij

ji n

n

f

ff

..

De x dado y ( x/y):

De y dado x ( y/x):

Prof.: David Becerra Rojas 85

Independencia de Variables

Diremos que dos variables X e Y son independientes si y solo si, la conjunta es igual al producto de las marginales, para todo i, y para todo j. Es decir;

n

nnno

fff

jiij

jijiij

..

..

*

,*

Prof.: David Becerra Rojas 86

Estadística Descriptiva Bivariante

Ejemplo: Considere una muestra de contenedores en un recinto portuario.

Sea X : Peso (toneladas) Y : País de origen

Determine e Interprete : f = n51 =

f34 =

n.. =n.3 =n2. =

fj=4/i=3 =fi=4/j=3 =f.2 =f4. =

c=5 4 8 27 24 121

10/121 24/121 33/121 7/24 10/25

0.083 0.20 0.27 0.29 0.40

X \ Y Francia Alemania Japón España Total

5 – 10 4 5 4 10 23

10 - 15 8 7 10 2 27

15 - 20 3 9 3 10 25

20 - 25 1 10 7 6 24

25 - 30 8 2 0 12 22

Total 24 33 24 40 121

Prof.: David Becerra Rojas 87

Asociación de Variables Numéricas

i12...n

Xx1

x2

.

.

.xn

Yy1

y2

.

.

.yn

Diagrama de Disperción

Variable X

Y

Prof.: David Becerra Rojas 88

Tipos de Asociación

Favorable :

. .

. . .

....

..

y

x

Inversa:

... ..

....

.

x

y

xi xj xjxi

yj

yi

yi

yj

Prof.: David Becerra Rojas 89

Sea X: Remuneración Y: Cargas

Familiares

1 1 3 4 4 5

2 3 3 5 2 6

-2 -1.5 -2 -0.5 0 -0.5 1 1.5 1 -1.5 2 2.5

123456

Ejemplo:

3 1 0 1.5 -1.5 5

)()( yyxx ))(( yyxx yxi

Total 18 21

Media 3.0 3.5 --------- 1.50 0 9

Prof.: David Becerra Rojas 90

Covarianza ( cov (x,y) )

n

yyxxyxCov

))((

),(

5.16

9),( yxCov

Prof.: David Becerra Rojas 91

Coeficiente de Correlación

-1 r 1r : Se expresa en porcentaje

yx ss

yxCovr

*

),(

))()()(( 2222 yynxxn

yxxynr

Prof.: David Becerra Rojas 92

X11344518

Y23352621

XY 2 3 920 830 72

i 1 2 3 4 5 6Total

X2

1 1 916162568

En nuestro caso tenemos:

Y2

4 9 925 43687

= 0.65)2187*6)(1868*6(

21*1872*622

))()()(( 2222 yynxxn

yxxynr

Prof.: David Becerra Rojas 93

Regresión Lineal

Y = a + bX

Consiste en ajustar a los datos (representados en el diagrama de Dispersión, una línea, que puede ser rectao curvilínea .

En esta oportunidad analizaremos el caso de la línea recta.Esta recta, también sirve para marcar la tendenciaDe los datos, para hacer proyecciones, y para estimaralgún valor de y dado un valor de x.

Prof.: David Becerra Rojas 94

Error: iii yye ˆ

Varianza del Error: (2)cuyo estimador está dado por:

2

)ˆ( 222

n

yySS ii

xye

Oyye iii )ˆ(

Prof.: David Becerra Rojas 95

Debemos minimizar la varianza del Error

Para tal efecto debemos minimizar:

22 )()ˆ( iiii bxayyyA

Es decir derivar A

Prof.: David Becerra Rojas 96

0

0

b

Aa

A

Sistema de Ecuaciones Normales

Prof.: David Becerra Rojas 97

ii

ii

yxbna

bxaya

A0)1()(2

Luego tenemos:

iiii

iii

yxxbxa

xbxayb

A

2

0))((2

Prof.: David Becerra Rojas 98

xyxbxa

yxbna

ii

i

2

Por lo tanto, el sistema de Ecuaciones Normalesqueda de la siguiente forma:

Prof.: David Becerra Rojas 99

Por determinante tenemos;

222 xxn

xx

xn

xyxxy

xxy

xya

22

yxxyn

xyx

ynb

aa

bb

Prof.: David Becerra Rojas 100

Estimadores Mínimos Cuadrado

22

2

)x(xn

xyxxya

22 )x(xn

yxxynb

a

b

XbY

Prof.: David Becerra Rojas 101

X11344518

Y23352621

XY 2 3 920 830 72

i 1 2 3 4 5 6Total

X2

1 1 916162568

En el caso que estamos analizando tenemos:

Y2

4 9 925 43687

^

Y2.22.23.54.14.14.8

( e )

^

Y - Y-0.2 0.8-0.5 0.9-2.1 1.2 0.0

( e2 )

^

(Y – Y)2

0.04 0.64 0.25 0.81 4.41 1.44 7.59

y la varianza del error es 898.14

59.7

2

)ˆ( 22

n

yyS ii

xy

Luego tenemos que;

57.1

18)68(

)72)(18()68)(21(2

n

a 64.0

18)68(

)21)(18()72(62

n

b

Prof.: David Becerra Rojas 102

Error Típico: ( )

38.1898.14

59.7

2

)ˆ( 22

n

yySS ii

exy

2

2

n

xybyaySS

xye

También se puede obtener a partir de:

Prof.: David Becerra Rojas 103

Coeficiente de Determinación

El coeficiente de Determinación, nosindica la variabilidad explicada por la rectade regresión lineal, es decir que tan buenoes el ajuste de la recta.

Esta dado por: r2

0 r2 1

Nota: Referencia para el ajuste, también lo da

el error típico Sy/x

Prof.: David Becerra Rojas 104

Ejemplo:Supongamos que tenemos dos variables: X : Años de servicio de vendedores.

Y : Ventas en M$

Vendedor 1 2 3 4 5 6Total

X22344520

Y1.22.44.13.12.43.817.0

XY2.44.8

12.312.4

9.619.060.5

X2

449

16162574

Y2

1.445.76

16.819.615.76

14.4453.82

1. Confeccione un diagrama de dispersión2. Determine el grado de asociación entre las variables3. Estime a través de una recta de m. c. ¿cuanto debiera vender

un vendedor con siete años de servicio?. 4. Estime a través de una recta de m. c. ¿cuanto años de servicio

debería tener, un vendedor que vende m$ 4.0?.

Prof.: David Becerra Rojas 105

)2.)17(.)82.53(6)(2.)20(.)74(6(

.)17.)(20()5.60(6

)2)y(2yn)(2)x(2xn(

yxxynr

222 )20()74(6

)17)(20()5.60(6

)x(xn

yxxynb

222

2

)20()74(6

)5.60)(20()74)(17(

)x(xn

xyxxya

Luego:

1.09

.523

=.5954

Prof.: David Becerra Rojas 106

Varianza del Error:

Error Típico:

22

)ˆ( 222

n

xybyay

n

yyS ii

xy

22

)ˆ( 22

n

xybyay

n

yyS ii

xy =.9552

=.9124

Prof.: David Becerra Rojas 107

Las propiedades de la media son las siguientes:- La media de una constante es la propia constante.- La media de la suma o diferencia de variables es igual a la suma o diferencia de las medias de dichas variables.- La media del producto de una constante por una variable, es igual a la constante por la media de la variable.- La media de una combinación lineal de dos o más variables es igual a la combinación lineal de las medias de dichas variables.- La media es el centro de gravedad de la distribución, ya que las desviaciones respecto a la media suman 0.

- Mediana: La mediana es el valor del elemento que ocupa el lugar central, si los datos están ordenados, bien de forma creciente o de forma decreciente.- Moda: La moda es el valor más frecuente, es decir es el valor de la variable que se repite un mayor número de veces.En el caso de una distribución totalmente simétrica, la media y la mediana coinciden. Si la media y la mediana difieren mucho significa que hay heterogeneidad entre los datos y que la distribución, por tanto será asimétrica.

Prof.: David Becerra Rojas 108

Las propiedades de la varianza son:- La varianza es siempre positiva o cero.- La varianza de una constante es cero.- La varianza de la suma o diferencia de una variable y una constante es igual

a la varianza de la variable.- La varianza de un producto de una constante por una variable es igual al

cuadrado de la constante por la varianza de la variable.

Las propiedades de la desviación típica son:- La desviación típica es siempre positiva o cero.- La desviación típica de una constante es cero.- La desviación típica de una constante por una variable es igual a la

constante por la desviación típica de la variable.- La desviación típica de la suma o diferencia de una variable y una constante

es igual a la desviación típica de la variable.

Prof.: David Becerra Rojas 109

Teorema 3.5.5. (Propiedades de )   Para una distribución bien definida, el operador de valor esperado cumple:

Escala:

Adición:

Independencia: si X e Y son independientes.

Composición:

No desviado:

Prof.: David Becerra Rojas 110

Teorema 3.5.6. (Propiedades de la varianza)   Para una distribución bien definida, la varianza cumple:

Origen:

Adición: si X e Y son independientes.

Escala:

Prof.: David Becerra Rojas 111

Ejercicio:X \ Y Chilena Argentina Peruana Brasileña Total 5 – 10 4 2 4 10 20 10 – 15 8 3 1 12 24 15 – 20 3 9 3 10 25 20 – 25 0 10 1 10 21 25 - 30 5 2 0 15 22 Total 20 26 9 57 112

Determine:1.- Cuántos turistas chilenos app llevan un peso no superior a 12kr.2.- ¿Podemos decir que el comportamiento del peso que llevan los turistas argentinos , es mas homogéneo del que llevan los brasileros? 3.- Determine e interprete:4.- Determine el grado de asociación respecto al peso de equipaje, entre los turistas chilenos y argentinos.5.- A través de una recta de m. c. estime cuántos turistas deberían llevar un peso 27.5kr

Se toma una muestra de 112 turistas registrando el peso de equipaje y nacionalidad.

fj=1/i=2 =

Prof.: David Becerra Rojas 112

Cuartiles

Li : Limite real inferior del intervalo que contiene el cuartil t, que es aquel donde por primera vez la frecuencia acumulada pasa el (k/4x100)%.

kkk n

aN

nkLiK *

4

*1

Prof.: David Becerra Rojas 113

Quintiles( Qq ) q = 1,…..,99

Li : Limite real inferior del intervalo que contiene el percentil q, que es aquel donde por primera vez la frecuencia acumulada pasa el (q%)

qqq n

aN

nqLiQ *

5

*1

Prof.: David Becerra Rojas 114

Deciles( Dd ) d = 1,….,9

Li : Limite real inferior del intervalo que contiene el decil d, que es aquel donde por primera vez la frecuencia acumulada pasa el (d*10)%

ddd n

aN

ndLiD *

10

*1

Prof.: David Becerra Rojas 115

Percentiles( Pp ) p = 1,…..,99

Li : Limite real inferior del intervalo que contiene el percentil p, que es aquel donde por primera vez la frecuencia acumulada pasa el (p%)

ppp n

aN

npLiP *

100

*1

top related