¿qué es la estadística? originalmente la palabra estadística ha estado asociada al procesamiento...

Post on 25-Jan-2016

218 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

¿Qué es la Estadística?Originalmente la palabra estadística ha estado asociada al procesamiento de datos, entendiéndose por esto la representación gráfica, la tabulación y el cálculo de medidas resumen, que permiten analizar e interpretar un conjunto de datos.

La estadística es una disciplina que se preocupa de desarrollar técnicas y modelos que permitan estudiar la forma como la incertidumbre sobre un fenómeno es es alterada por la información disponible.

¿Qué es Población?

P

Conjunto formado por TODAS las unidades (personas, animales o cosas) que tienen algo en común. La población debe ser listada en lo que llamaremos Marco Muestral.

¿Qué es una muestra?

Una muestra es un subconjunto de la población. Ella debe cumplir con ser REPRESENTATIVA.

M

P

¿Porqué una muestra?• Es de menor costo que un censo.

• Ocupa menos tiempo que un censo.

• Tiene menos error que un censo.

Técnicas de MuestreoLas más comunes son:

• Muestreo Aleatorio Simple.

• Muestreo Estratificado.

¿Qué es una variable?Característica que cambia de sujeto a sujeto.

¿Qué es un dato?

Es una realización de una característica o variable, al ser evaluada en un sujeto.

¿Qué es Información?

Llamaremos información al conjunto de datos.

Tipos de Variables

Continua

Discreta vaCuantitati

Ordinal

Nominal aCualitativ

Variable

TabulaciónLa información que a continuación se muestra representa el nivel de instrucción de 20 personas:

B,M,S,S,B,B,M,M,M,S,S,M,B,B,M,M,B,M,S,B

Nivel de Frecuencia PorcentajeInstrucción Absoluta

Básico 7 35Medio 8 40

Superior 5 25Total 20 100

Marca de Frecuencia PorcentajeCigarros AbsolutaAdvance 22 20,00Belmont 27 24,55

Derby 31 28,18Viceroy 30 27,27

Total 110 100,00

Supongamos que tenemos una muestra de 110 fumadoresy se examina la marca del cigarrillo. Tenemos la siguientetabla:

Gráfico de Barras para la preferencia de marca de cigarrillo

0

5

10

15

20

25

30

35

Advance Belmont Derby Viceroy

Marca de Cigarrillo

Fre

cu

en

cia

Ab

so

luta

Porcentaje de fumadores según marca de cigarro

Advance20%

Belmont25%

Derby28%

Viceroy27%

Tabulación caso contínuoConsidere las notas de 20 alumnos:

6.2; 4.8; 3.8; 4.6; 4.4; 5.7; 6.4; 5.4; 6.3; 4.8; 4.9; 3.1; 3.8; 5.5; 5.1; 6.8; 4.7; 5.5; 7.0; 4.2

Formula de Sturger: nNI 10log*3.31En este ejemplo NI=1+[4.29]=5R=Rango=Máximo - Mínimo=7.0 - 3.1= 3.9

78.05

9.3A

NI

R

Nota Marca de Frecuencia Frecuencia Frec. Absoluta Frec. RelativaClase Absoluta Relativa Acumulada Acumulada

3,10-3,88 3,49 3 0,15 3 0,153,88-4,66 4,27 3 0,15 6 0,304,66-5,44 5,05 6 0,30 12 0,605,44-6,22 5,83 4 0,20 16 0,806,22-7,00 6,61 4 0,20 20 1,00

20 1,00

Tabla de Frecuencia

3 1 8 84 2 4 6 7 8 8 95 1 4 5 5 76 2 3 4 87 0

3 13 8 84 2 44 6 7 8 8 95 1 45 5 5 76 2 3 46 87 0

Diagrama de Tallo y Hoja

0 | 3444455555566666677 2 | 4 | 6 | 8 | 10 | 0

Si a los datos anterioresagregamos un dato másdigamos 100

Medidas ResúmenesLlamaremos medidas resúmenes a aquellas cantidades que resumen la información y en algún sentido sean representativos del conjunto de datos.

M edidas

M odaM ediana

P rom edioP ercen tiles

T endencia C en tral

R angoR ango In tercuartílico

V arianzaC oeficien te de V ariación

D ispersión

A sim etría

F orm a

Medidas de Tendencia CentralMODA (MO): Es la realización que tiene mayor frecuencia. Para datos agrupados en intervalos se adopta como moda la marca de clase del intervalo con mayor frecuencia.

En caso de existir más de una moda hablaremos de multimodalidad. Ejemplo:

Marca de Frecuencia PorcentajeCigarros AbsolutaAdvance 22 20,00Belmont 27 24,55

Derby 31 28,18Viceroy 30 27,27

Total 110 100,00

n

fMCX

n

xXxxX

i

k

ii

n

ii

n

1

11

:que tienese intervalosen agrupados datos de caso elEn

datos los ,,Sean :)( PROMEDIO

PERCENTIL- (P): Llamaremos percentil % a aquel valor (de la característica X), tal que el % de la información es menor o igual a él. Necesariamente no es una medida de tendencia central.

En el caso de datos agrupados en intervalo P lo calculamos por:

1) Multiplique n.

2) Mirar columna Fi y determinar en que intervalo cae

P .

3) Obtener de ese intervalo: cota inferior, f i , y Fi-1.A

f

FnP

i

i

1100infcot )4

La MEDIANA (Me) = P50

En el ejemplo de las notas de los 20 alumnos:

Nota Marca de Frecuencia Frecuencia Frec. Absoluta Frec. RelativaClase Absoluta Relativa Acumulada Acumulada

3,10-3,88 3,49 3 0,15 3 0,153,88-4,66 4,27 3 0,15 6 0,304,66-5,44 5,05 6 0,30 12 0,605,44-6,22 5,83 4 0,20 16 0,806,22-7,00 6,61 4 0,20 20 1,00

20 1,00

Mo=5.05, Me=4.66+(10-6)*0.78/6=5.18

17.520

4*61.64*83.56*05.53*27.43*49.3

X

Cuartiles

755025 3y 2 ,1 PQPQPQ

Medidas de Dispersión

Mín Máx R 23 QQRI

1

)()(

2

12

n

XxSVarianza

n

ii

2SS

X

SCV

Para datos agrupados la varianza es calculada como:

1

)()(

2

12

n

XMCfSVarianza

k

iii

En el ejemplo de las notas de 20 alumnos:

2034.0 0518.1

1063.1 63.1 9.3 2

CVS

SRIR

Cajón con Bigotes

Se realizó un experimento para comparar el efecto de dos dietas (A y B) sobre el aumento de peso en 20 sujetos que son distribuidos al azar en dos grupos. Losdatos fueron:

Dieta A: -1.0 0.0 2.1 3.1 3.3 4.3 5.0 5.2 5.5 6.8Dieta B: 2.5 3.0 4.0 5.7 6.0 6.9 7.0 7.2 7.3 8.1

Dieta A BMin -1.0 2.5Q1 1.05 3.5Me 3.8 6.45Promedio 3.43 5.77Q3 5.1 7.1Máx 6.8 8.1R 7.8 5.6RI 4.05 3.6S2 6.14 3.8CV 0.72 0.33

Medidas de Forma

(-) Izquierda Asimetría 0,

Simetría 0,

)( Derecha Asimetría 0,

3S

MeXCA

En el ejemplo de las notas de los 20 alumnos:

CA= -0.0285 leve asimetría hacia la Izquierda.

top related