Download - Estadística 1
LA ESTADÍSTICA ES LA CIENCIA QUE PROVEE DE MÉTODOS QUE PERMITEN RECOGER, ORGANIZAR ,RESUMIR, PRESENTAR Y ANALIZAR DATOS RELATIVOS A UN CONJUNTO DE INDIVIDUOS U OBSERVACIONES , PARA ASÍ , EXTRAER CONCLUSIONES VÁLIDAS Y TOMAR DECISIONES LÓGICAS BASADAS EN DICHOS ANÁLISIS.
LA ESTADÍSTICA SE DIVIDE EN DOS TIPOS:
A) ESTADÍSTICA DESCRIPTIVA
B) ESTADÍSTICA INFERENCIAL O DEDUCTIVA
LA ESTADÍSTICA DESCRIPTIVA :
SE REFIERE A LA DESCRIPCIÓN NUMÉRICA DE UN GRUPO PARTICULAR.NINGUNA CONCLUSIÓN PUEDE IR MÁS
ALLÁ DEL GRUPO DESCRITO.
LOS DATOS ANALIZADOS , DESCRIBENESTE GRUPO Y SÓLO ÉSTE .
ESTADÍSTICA INFERENCIAL
ES EL EMPLEO DE LA TÉCNICA DE MUESTREO PARA LLEGAR ADETERMINADAS CONCLUSIONES ACERCA DE LA POBLACIÓN DE LA CUAL SE HAN OBTENIDO LAS MUESTRAS
POBLACIÓN
SE LLAMA POBLACIÓN AL CONJUNTO FORMADO POR TODOS LOS
ELEMENTOS CUYO CONOCIMIENTO NOS INTERESA . CADA UNODE ESTOS ELEMENTOS LO
DENOMINAREMOS INDIVIDUO .
MUESTRA
SE LLAMA MUESTRA A UN SUBCONJUNTO FINITO DE LA
POBLACIÓN EN ESTUDIO . SE USA UNA MUESTRA
CUANDO ES IMPOSIBLE ( O POCO PRÁCTICO) ESTUDIAR A TODOS LOS INDIVIDUOS DE UNA
POBLACIÓN .
Población y MuestraPoblación
Muestra
Concepto de Variable
Una variable en estadística corresponde a la o las características que se miden en la muestra. Las variables pueden ser:
a) CUANTITATIVAS (Se pueden medir numéricamente)
b) CUALITATIVAS (No se pueden medir numéricamente)
VARIABLES CUALITATIVAS
Nominales Ordinales
No existe orden Existe orden intuitivo Estado Civil Nivel Educacional
VARIABLES CUANTITATIVAS
Variables discretas Variables continuas
Sólo números naturales Números reales
BUEN MÉTODO ESTADÍSTICO
a) SELECCIÓN Y RECOPILACIÓN DE LOS DATOS A ESTUDIAR EN UNA MUESTRA O POBLACIÓN .
b) CLASIFICACIÓN Y ORDENACIÓN DE LOS DATOS .
c) TABULACIÓN DE LOS DATOS
d) CÁLCULO DE ALGUNOS PARÁMETROS ESTADÍSTICOS QUE
COMPLETEN LA INFORMACIÓN .e) ENTREGA O PUBLICACIÓN DE LA INFOMACIÓN . PARA ELLO ES USUAL UTILIZAR LOS DISTINTOS GRÁFICOS ESTADÍSTICOS .
CONSTRUCCIÓN DE UNA TABLA DEDISTRIBUCIÓN DE FRECUENCIA
REGLAS GENERALES
1 ) LOS DATOS SE ORDENAN DE MENOR A MAYOR
2 ) SE DETERMINA EL CAMPO DE VARIACIÓN (RECORRIDO DE LAVARIABLE) . C.v. = X(max.) - X(min.) SE SELECCIONA LA AMPLITUD DE LOS INTERVALOS
EJEMPLO
EN UN GRUPO DE 50 ALUMNOS EN UNA PRUEBA SE REGISTRARON LOS SIGUIENTES PUNTAJES .
61 70 77 82 63 75 83 62 67 8367 80 77 85 83 76 83 67 78 7672 80 83 72 84 71 77 82 79 8366 88 68 74 84 75 73 75 83 8487 64 83 72 87 77 63 72 84 78
EN PRIMER LUGAR SE ORDENAN LOS DATOS DE MENOR A MAYOR
2 ) CALCULAMOS EL CAMPO DE VARIACIÓN O RANGO
C.V = 88 - 61 C.V = 27
61 62 63 63 64 66 67 67 67 6870 71 72 72 72 72 73 74 75 7575 76 76 77 77 77 77 78 78 7980 80 82 82 83 83 83 83 83 8383 83 84 84 84 84 85 87 87 88
3 ) SE SELECCIONA LA AMPLITUD DE LOS INTERVALOS.
a ) CUANDO SE TIENE UN CONJUNTO DE DATOS Y SE ESPECIFICA EL NÚMERO DE INTERVALOS PARA LA TABLA, LA AMPLITUD “a”, SE TIENE :
intervalosdeNvariacióndeCampo
a°
=
EN CASO DE OBTENER UN NÚMERO DECIMAL PARA “a” , SE APROXIMA AL ENTERO MAS CERCANO.
4 ) SE DETERMINAN LOS INTERVALOS
I ) EL NÚMERO DE INTERVALO RECIBE EL NOMBRE DE CLASE .
II ) LOS INTERVALOS QUEDAN CARACTERIZADOS POR LAS MARCAS DE CLASES QUE SON LOS PUNTOS MEDIOS O SEMISUMA DE LOS LÍMITES SUPERIORES E INFERIORES, ÉSTE NORMALMENTE ES POSITIVA .
CALCULAMOS LA AMPLITUD “a”
TENIENDO EN CUENTA QUE LA CANTIDAD DE DATOS ES PEQUEÑA , LOS AGRUPAREMOS EN SOLO 6 CLASES LUEGO TENEMOS :
SIEMPRE SE APROXIMA LA AMPLITUD AL ENTEROMAS CERCANO
LUEGO :
27a =
6Cv
a =6
a = 4,5
a =5
60 64
65 69
70 7475 7980 8485 89
626772778287
5 ) SE REALIZA LA TABULACIÓN
FRECUENCIA o FRECUENCIA ABSOLUTA:
ES EL NÚMERO DE VECES QUE SE REPITE EL VALOR DE UN DATO , O EL NÚMERO DE INDIVIDUOS QUE PERTENECEN A LA MISMA CLASE. SE SIMBOLIZA POR
if
60 6465 6970 7475 7980 8485 89
626772778287
5 5 81216 4
50
FRECUENCIA ACUMULADA
PARA CADA VALOR ES LA SUMA DE SU FRECUENCIA MAS LAS ANTERIORES,
SE SIMBOLIZA POR acf
60 64
65 69
70 74
75 79
80 84
85 89
62
67
7277
8287
558
1216
4
510
18
30
46
50
50
5
812164
FRECUENCIA RELATIVA
ES EL NÚMERO DE VECES QUE SE REPITE UN DATO O CLASE, REFERIDO AL TOTAL DE INDIVIDUOS. ESTA FRECUENCIA RELATIVA SE SIMBOLIZA POR , Y SECALCULA :
rif
elementosdetotalnúmeroeles,n;nf
f iri =
60 6465 6970 7475 7980 8485 89
626772778287
5 5 81216 4
0,10,10,160,240,320,08
51018304650
1,050
FRECUENCIA PORCENTUAL
ES EXPRESAR LA FRECUENCIA EN FORMA DE PORCENTAJE , PARA TAL EFECTO SE TOMA LA FRECUENCIA RELATIVA Y SE CORRE LA COMA DOS ESPACIOS O SE MULTIPLICA POR 100
SE SIMBOLIZA POR : f%
60 6465 6970 7475 7980 8485 89
626772778287
5 5 81216 4
51018304650
0,10,10,160,240,320,08
1010162432 8
50 1,0 100
FRECUENCIA PORCENTUAL ACUMULADA
ES EXPRESAR EN FORMA ACUMULADA LA FRECUENCIA PORCENTUAL
60 6465 6970 7475 7980 8485 89
59,5- 64,5
64,5-69,5
69,5-74,5,74,5-79,5
79,5-84,5
84,5-89,5
626772778287
5 5 81216 4
51018304650
0,10,10,160,240,320,08
1010162432 8
10 20 36 60 92100
50 1,0 100
59,5- 64,5
64,5-69,5
69,5-74,5,74,5-79,5
79,5-84,5
84,5-89,5
626772778287
0,10,10,160,240,320,08
¿ Cuánto alumnos obtuvieron 69 o menos punto ?¿ Qué % obtuvo 75 o más puntos ? ¿ Cuántos alumnos obtuvieron entre 80 y 84 puntos ?¿ En cuales clases se concentraron la mayoría de los puntajes , entre puntos estuvieron y a que % corresponde ?
64%
10 20 36 60 92100
60 6465 6970 7475 7980 8485 89
30%³ 51018304650
5 5 81216 4
75 y 84 puntos
1010162432 8
56 %
GRÁFICOS
Los gráficos nos permiten obtener información de forma ordenada y resumida sobre las variables en estudio. Los gráficos más utilizados son:
a) Gráfico de barra: Es un diagrama de barras rectangulares, cuya altura de cada barra indica la frecuencia absoluta de cada valor de la variable.
Las barras pueden estar orientadas en forma horizontal o vertical. Estos gráficos se usan para comparar dos o más valores. Este gráfico sirve para representar variables cualitativas y cuantitativas.
Ejemplo 1:
Ejemplo 2:
cantidad de personas arriba de un avión
0
10
20
30
40
50
60
HOMBRES MUJERES
Género
Can
tid
ad
Serie1
b) Gráfico Circular: Es un gráfico formado por un círculo dividido en sectores. Se utiliza para representar cualquier tipo de frecuencias aunque, generalmente, se utiliza para frecuencias relativas porcentuales. Este gráfico sirve para representar variables cualitativas y cuantitativas.
Ejemplo 1:
Deportes Preferidos
41%
12%24%
21%
Bicicleta
Nadar
Trotar
Fútbol
Histograma: Es un gráfico cuya altura es proporcional a la frecuencia absoluta, frecuencia relativa o frecuencia porcentual, y la base está formada por segmentos cuyos extremos representan los extremos de cada intervalo. Este gráfico sirve para representar variables cuantitativas.
5 - 89 - 12
13 - 1617 - 20
05
1015202530354045
1
5 - 8
9 - 12
13 - 16
17 - 20
Polígono de Frecuencias: Se obtiene al unir los puntos medios de los intervalos representados por cada barra de un histograma, es decir, al unir la marca de clase de cada intervalo mediante una línea poligonal.
Edad de los estudiantes
0
5
10
15
20
25
30
35
40
45
5 - 8 9 - 12 13 - 16 17 - 20
Años
N°
de
estu
dia
nte
s
Serie2
Medidas de tendencia central
Las medidas de tendencia central, denominados también PROMEDIOS, ubican el centro de los datos, como la media aritmética, la media geométrica, la media armónica y la mediana.
Las cuales serán calculadas para datos NO agrupados y agrupados (tabla de frecuencia)
MEDIA ARITMÉTICA OPROMEDIO ARITMÉTICO
SE SIMBOLIZA POR X
n321, x,......x,xxSE CALCULA SUMANDO LASOBSERVACIONES
Y SE DIVIDE POR POR EL NÚMERO TOTAL DE ELLAS , O SEA :
nx....xxx
X n321 +++=
MEDIANA
ES EL VALOR CENTRAL DE UNA DISTRIBUCIÓN ORDENADA DE MENOR A MAYOR O VICEVERSA , QUE DEJA SOBRE Y BAJO SI , EL 50 % DE LOS VALORES DE LA DISTRIBUCIÓN, SE SIMBOLIZA POR :
Me
EJEMPLO :
2 4 6 7 9 12 16MENORES MAYORES
ME
DIA
NA
Me = 7
SI EL NÚMERO DE DATOS ES PAR
5 8 10 13 15 18
LA MEDIANA ES IGUAL A LA MEDIA ARITMÉTICA DE LOS DOS VALORES CENTRALES
EJEMPLO :
11,52
1310x =+=ˆ
MODA
EN LENGUAJE COTIDIANO LO QUE ESTÁ DE MODA ES LO QUE MAS SE LLEVA, LOQUE MAS SE USA .
MODA : ES EL VALOR CON MAYOR FRECUENCIA , SE DESIGNA POR : Mo
PUEDE HABER MAS DE UNA MODA ONO HABER MODA
EJEMPLO
1 1 2 2 2 3 3 4 4 4 4 5 5 5 6 6 6 6 7 7 8 8 9
HAY DOS MODAS 4 Y 6
3 3 5 5 6 6 7 7 8 8 9 9EN ESTE CASO NO HAY MODA
EJEMPLO
EN EL CONJUNTO DE LOS DATOS :
5 2 2 2 4 5 6 6 6 6 7 7 8 9
LA MODA ES : Mo = 6
La moda es el promedio menos importante por su ambigüedad
Medidas de tendencia central para datos agrupados.
Media o Media aritmética: Si valores de alguna variable están tabulados en una distribución de frecuencias de intervalos, donde:
nX
son las marcas de clases, luego kyyyy ,...,,, 321
kffff ,...,,, 321 son las frecuencias absolutas respectivas,
Entonces su media aritmética está dada por:
n
mfx
k
iii∑
=
⋅= 1
Mediana para Datos Agrupados
Está dada por la fórmula:
Af
Fn
LMei
i
i ⋅−
+=−12
Dónde
:iLLímite inferior de la frecuencia acumulada, inmediatamente posterior al 50%
:n Cantidad total de datos
:1−iF Frecuencia acumulada anterior a la mediana
:if Frecuencia absoluta del intervalo de la Mediana
Ejemplo
Ingreso de personas a U.C.I coronaria de un determinado Hospital
45182 - 89
44374 – 81
41866 – 73
331658 – 65
171050 – 57
7442 – 49
3234 – 41
1126 – 33
Frecuencia Acumulada
Número de Personas
Edades
Af
Fn
LMei
i
i ⋅−
+=−12
Moda para datos agrupados
Para calcular la moda tabulados por intervalos, primero se determina el intervalo que contiene la moda, esto es, el intervalo que tiene la mayor frecuencia (intervalo modal). Luego se utiliza la fórmula
Add
dLMo i ⋅
+
+=21
1
Donde:
esto es igual a la frecuencia del intervalo modal menos la frecuencia del intervalo inmediatamente anterior
=iL Límite inferior del intervalo modal
11 −−= ii ffd
12 +−= ii ffd Esto es igual a la frecuencia del intervalo modal menos la frecuencia del intervalo inmediatamente posterior
A = Amplitud
Del ejemplo anterior
45182 - 89
44374 – 81
41866 – 73
331658 – 65
171050 – 57
7442 – 49
3234 – 41
1126 – 33
Frecuencia Acumulada
Número de PersonasEdades
61996,60
7429,058
786
658
≈=⋅+
=⋅
++=Mo
Cuartiles, Deciles y Percentiles
Si un conjunto de datos se ordena de acuerdo con su magnitud, el valor central que divide al conjunto en dos partes iguales es la MEDIANA. Extendiendo esta idea, es posible considerar los valores que dividen al conjunto en cuatro, diez o cien partes iguales
Fórmula general
)(% 1
isi
i LLf
NnLi −⋅−⋅+ −
Donde:
: Límite inferior de la clase utilizada
: Porcentaje a utilizar, expresado cómo número racional (Dividir en 100)
: Número total de datos de la muestra
Li
%
n
: Frecuencia acumulada anterior
: Frecuencia absoluta de la clase utilizada
: Límite Superior de la clase utilizada
1−iN
if
sL
Ejemplo 1
583105100 – 109
58
55395 90 - 99
52585 80 - 89
471175 70 - 79
362165 60 – 69
151055 50 – 59
5545 40 – 49
Fr. ac.Fr.M. ClasePeso
13,76)7079(11
365,4370)(
5875,0 175 =−−+=−−⋅+= −
isi
ii LL
f
NLP
Ejemplo 2:
La siguiente tabla muestra una distribución de frecuencia de salarios semanales de 65 empleados de una determinada empresa.
2310.000 – 319.999
5300.000 – 309.999
10290.000 – 299.999
14280.000 – 289.999
16270.000 – 279.999
10260.000 – 269.999
8250.000 – 259.999
N° EmpleadosSalarios
Calcule: el cuartil 3, los deciles 2, 4,7 y 9 y los percentiles 7, 19, 48, 67, 79
Medidas de dispersión
Son números que miden el grado de separación de los datos con respecto a un valor central. (Generalmente la media)
Estudiaremos las dos más importante:
c) Varianza
d) Desviación Estándar
Varianza
Es la media aritmética de los cuadrados de las diferencia de los datos con respecto a su media aritmética. Está dada por la fórmula:
n
xxs
n
ii∑
=
−= 1
2
2
)(
Ejemplo 1: (Datos no agrupados)
Obtener la varianza de los siguientes valores:
1,3,3,5,7,18,10
Varianza para datos AGRUPADOS
n
xxfs
n
iii∑
=
−= 1
2
2
)(