Download - Tema 1. Estadística
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 1 de 39
NDICE
1. ESTADSTICA 3
1.1. Definicin .................................................................................................................................................... 3
1.2. Utilidad ....................................................................................................................................................... 3
1.3. Campos de la estadstica ....................................................................................................................... 3
1.4. Terminologa de un estudio estadstico ............................................................................................ 3
1.5. Pasos que se dan en un estudio estadstico ..................................................................................... 4
1.6. Tipos de variables estadsticas ........................................................................................................... 5
2. TABLA DE FRECUENCIAS 5
2.1. Utilidad ....................................................................................................................................................... 5
2.2. Recuento de datos .................................................................................................................................. 5
2.2.1. Definicin ..................................................................................................................................................... 5
2.2.2. Construccin de una tabla de recuento de datos con datos aislados ............................................. 6
2.2.3. Construccin de una tabla de recuento de datos con datos agrupados en intervalos ................ 6
2.3. Construccin de una tabla de frecuencias ....................................................................................... 9
2.4. Terminologa de una tabla de frecuencias ....................................................................................... 9
2.5. Construccin de una tabla de frecuencias absoluta y relativa ................................................ 10
2.5.1. Con datos aislados .................................................................................................................................... 10
2.5.2. Con datos agrupados en intervalos ...................................................................................................... 11
2.6. Construccin de una tabla de frecuencias absoluta y relativa acumuladas ......................... 12
2.6.1. Con datos aislados .................................................................................................................................... 12
2.6.2. Con datos agrupados en intervalos ...................................................................................................... 13
3. GRFICOS ESTADSTICOS 13
3.1. Utilidad ..................................................................................................................................................... 13
3.2. Tipos de grficas estadsticas .......................................................................................................... 13
3.2.1. Diagrama de barras ................................................................................................................................. 14
3.2.2. Histograma ................................................................................................................................................ 14
3.2.3. Polgono de frecuencias .......................................................................................................................... 15
3.2.4. Diagrama de sectores ............................................................................................................................. 16
3.2.5. Pictograma ................................................................................................................................................. 17
3.2.6. Cartograma ................................................................................................................................................ 18
3.2.7. Serie cronolgica ..................................................................................................................................... 18
3.2.8. Pirmide de poblacin ............................................................................................................................. 19
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 2 de 39
3.2.9. Resumen de grficas estadsticas ....................................................................................................... 19
3.3. Ejemplos de grficas estadsticas .................................................................................................. 20
3.4. Construccin de grficos estadsticos con datos aislados ....................................................... 21
3.5. Construccin de grficos estadsticos con datos agrupados en intervalos ........................ 23
4. PARMETROS ESTADSTICOS 24
4.1. Utilidad .................................................................................................................................................... 24
4.2. Tipos de parmetros estadsticos................................................................................................... 24
4.2.1. Medidas de centralizacin ..................................................................................................................... 24
4.2.1.1. Utilidad .............................................................................................................................................. 24
4.2.1.2. Tipos ................................................................................................................................................... 24
4.2.1.3. Con datos aislados ........................................................................................................................... 26
4.2.1.4. Con datos agrupados en intervalos .............................................................................................. 29
4.2.1.5. Resumen de medidas de centralizacin ...................................................................................... 30
4.2.2. Medidas de posicin ................................................................................................................................ 31
4.2.2.1. Utilidad ............................................................................................................................................... 31
4.2.2.2. Tipos ................................................................................................................................................... 31
4.2.2.3. Con datos aislados .......................................................................................................................... 34
4.2.2.4. Con datos agrupados en intervalos ............................................................................................. 35
4.2.2.5. Resumen de medidas de posicin ................................................................................................. 35
4.2.3. Medidas de dispersin ........................................................................................................................... 37
4.2.3.1. Utilidad .............................................................................................................................................. 37
4.2.3.2. Tipos .................................................................................................................................................. 37
4.2.3.3. Con datos aislados .......................................................................................................................... 38
4.2.3.4. Con datos agrupados en intervalos ............................................................................................. 39
4.2.3.5. Resumen de medidas de dispersin ............................................................................................ 39
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 3 de 39
1. ESTADSTICA
1.1. DEFINICIN
La estadstica es la ciencia que estudia la forma de recopilar, ordenar y analizar datos.
1.2. UTILIDAD
La estadstica se ha convertido en un mtodo efectivo para describir y, sobre todo, para interpretar con exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar, analizar dichos datos y obtener conclusiones.
1.3. CAMPOS DE LA ESTADSTICA
Los tres temas que destacan en la estadstica son:
Estadstica descriptiva: se ocupa del tratamiento sistemtico de sucesos ya acaecidos y su
funcionalidad es recoger informacin, resumirla e interpretarla.
Inferencia estadstica: generaliza a toda una poblacin, la informacin obtenida a partir del
conocimiento de una muestra reducida.
Clculo de probabilidades: se trata de una rama a caballo entre la estadstica descriptiva y la
inferencia estadstica.
1.4. TERMINOLOGA DE UN ESTUDIO ESTADSTICO
Los trminos utilizados ms frecuentemente en los estudios estadsticos son:
Poblacin: es el conjunto formado por todos los elementos del estudio estadstico.
Muestra: es la parte de la poblacin que estudiamos y que nos sirve para deducir las
caractersticas de la poblacin. La muestra se toma cuando la poblacin es muy grande y no
puede realizarse un estudio de todos los individuos.
Individuo: es cada uno de los elementos que forman la poblacin o la muestra.
Tamao de la poblacin: es el nmero de individuos que componen una poblacin.
Tamao de la muestra: es el nmero de individuos que componen una muestra.
Variable estadstica: es cualquier cualidad que estudiamos en los individuos de la muestra o
poblacin.
Ejemplo: Los alumnos/as de 4 de ESO matriculados en Espaa son un total de 136.559. Para
realizar un estudio estadstico sobre su peso, altura y edad, se seleccionan 300 alumnos/as de
diferentes centros escolares.
Poblacin: Los 136.559 alumnos/as matriculados.
Muestra: 300 alumnos/as seleccionados de diferentes centros.
Individuo: Cada alumno/a matriculado en 4 de ESO. 1 alumno/a.
Tamao de la poblacin: 136.559 alumnos/as matriculados.
Tamao de la muestra: 300 alumnos/as.
Variables estadsticas: el peso, la altura y la edad.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 4 de 39
Ejemplo: Se va a realizar un estudio estadstico sobre el porcentaje de personas casadas en
una localidad de 122.594 habitantes. Para ello, se eligen 2.325 habitantes y se extienden las
conclusiones a toda la poblacin.
Poblacin: Los 122.594 habitantes de la localidad.
Muestra: 2.325 habitantes elegidos aleatoriamente de la localidad.
Individuo: Cada persona a la que se pregunta es un individuo de la muestra. Y cada habitante es un individuo de la poblacin. 1 habitante.
Tamao de la poblacin: 122.594 habitantes.
Tamao de la muestra: 2.325 personas.
Variable estadstica: si una persona est casada o no.
Ejemplo: Se quiere realizar una encuesta entre los alumnos/as de 3 de ESO de una ciudad, en
total 6.578 alumnos/as. Para ello, se elige a los 63 alumnos/as de 3 de ESO del IES Cervantes.
Determina la poblacin y la muestra.
Poblacin: Todos los alumnos/as de 3 de ESO de la ciudad.
Muestra: Los alumnos/as de 3 de ESO del IES Cervantes.
Individuo: Cada alumno/a de 3 de ESO de la ciudad es un individuo de la poblacin. Y cada alumno/a de 3 de ESO del IES Cervantes es un individuo de la muestra. 1 alumno/a.
Tamao de la poblacin: 6.578 alumnos/as.
Tamao de la muestra: 63 alumnos/as.
1.5. PASOS QUE SE DAN EN UN ESTUDIO ESTADSTICO
En un proceso estadstico, se siguen los siguientes pasos:
1. Elaboracin de la encuesta, de modo que el encuestado tenga claro lo que se le pregunta y
cules son las posibles respuestas. Elegimos la poblacin que va a ser objeto del anlisis.
Ejemplo: los habitantes de un pas.
2. Recogida de datos. Es decir, se pasa la encuesta y se anotan las respuestas. La recogida de
datos se suele realizar mediante encuestas o cuestionarios. Obtenemos los datos a partir de
una muestra de individuos de la poblacin.
3. Organizacin y clasificacin de las respuestas. El conjunto de los valores que vamos a
estudiar se llama variable estadstica (ejemplos: estatura, color de ojos, nmero de zapatos,
etc.).
4. Elaboracin de tablas de frecuencias. Es decir, se elaboran tablas de frecuencias absolutas,
relativas y porcentuales con el recuento de los resultados obtenidos en la encuesta.
5. Confeccin de grficas estadsticas con los datos de la tabla de frecuencias.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 5 de 39
1.6. TIPOS DE VARIABLES ESTADSTICAS
Las variables estadsticas se clasifican segn los valores que pueden tomar.
Ejemplos
Tipos de
variables
Valor de la
variable Variable Valores
Cualitativas o atributos
Cualidad Color preferido Blanco, rojo, azul,
Sexo Hombre, mujer
Cuantitativas
Discretas Nmero N de libros ledos en un mes 0, 1, 2, 3,
Nmero de pginas de un libro 210, 211, 22, 309,
Continuas Infinitos nmeros Peso
Entre 60 kg y 67 kg,
Altura Entre 1,50 y 1,80,
Las variables estadsticas tambin se pueden clasificar en:
Variables unidimensionales: se tiene una nica variable. Estadstica unidimensional: recopila,
ordena y analiza los datos de una variable. Ejemplo: Calcula el peso medio de la seleccin de
Espaa.
Variables bidimensionales: se tienen dos variables. Estadstica bidimensional: recopila,
ordena y analiza los datos de dos variables. Ejemplo: Un jugador de Espaa que pesara 80 kg,
qu edad tendra?
Variables pluridimensionales: se tienen ms de dos variables. Estadstica pluridimensional:
recopila, ordena y analiza los datos de ms de dos variables.
2. TABLA DE FRECUENCIAS
2.1. UTILIDAD
Una vez que se han recogido los datos de una experiencia estadstica, hay que tabularlos, es
decir, hay que construir con estos datos una tabla (tabla de frecuencias) en la cual se presentan de
manera ordenada:
Los valores de la variable que se est estudiando. variable estadstica
El nmero de veces que aparece cada valor. Recuento de datos. frecuencia
En los estudios estadsticos es necesario organizar los datos para poder trabajar con ellos y sacar conclusiones. Para ello, se utilizan las tablas de frecuencias y a partir de ellas se construyen
diferentes representaciones grficas de esos datos.
2.2. RECUENTO DE DATOS
2.2.1. Definicin
El recuento de datos se har segn sea el tipo de variable estadstica.
Si la variable es cualitativa, se escribe cada valor (modalidad) y se anota el nmero de veces
que aparece cada uno de ellos.
Si la variable es cuantitativa discreta, se ordenan los valores en orden creciente y se anota el
nmero de veces que aparece cada uno.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 6 de 39
Y si la variable es cuantitativa continua, se ordenan los valores en intervalos o clases,
usualmente de la misma amplitud, y como mnimo, 4 intervalos. Para facilitar los clculos, se toma el punto medio del intervalo, que se llama marca de clase.
Las marcas de clase son los puntos medios de cada intervalo.
El recuento de datos segn sean:
Datos aislados:
Variables cualitativas.
Variables cuantitativas discretas. Se anota el nmero de veces que aparece cada dato.
Datos agrupados en intervalos:
Variables cuantitativas continuas. Se ordenan los valores en intervalos y se anota el
nmero de veces que aparece cada dato.
2.2.2. Construccin de una tabla de recuento de datos con datos aislados
Ejemplo: Despus de preguntar a 40 alumnos/as sobre su deporte favorito, obtenemos estos
resultados. Construye una tabla de frecuencias.
F = ftbol T = tenis Bm = balonmano
B = baloncesto A = atletismo
Deporte favorito (Datos) Deporte favorito Recuento
F F F B B T T Bm F 8
A B B B Bm T A F B 12
F B B Bm A Bm B B T 6
F F T A A A A A A 10
T A B B A F B T Bm 4
Total 40
El deporte favorito es una variable cualitativa.
Ejemplo: Anotamos el nmero de hermanos que tienen los 50 alumnos/as de dos clases de 2 de
ESO. Construye una tabla de frecuencias.
N de hermanos (Datos) N de hermanos Recuento
1 3 1 4 2 1 2 1 3 2 0 6
2 1 3 1 0 2 3 2 1 1 1 16
3 2 0 4 2 1 0 1 2 3 2 15
1 1 4 2 1 3 1 2 3 2 3 10
0 1 0 2 3 2 1 0 3 2 4 3
Total 50
El nmero de hermanos es una variable cuantitativa discreta.
2.2.3. Construccin de una tabla de recuento de datos con datos agrupados en intervalos
La distribucin de frecuencias agrupadas o tabla de frecuencias con datos agrupados se
emplea si las variables cuantitativas discretas toman un nmero grande de valores o la variable es cuantitativa continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Cada clase est delimitada por el lmite inferior de la clase (va con un corchete, significa que el nmero entra) y el lmite superior de la clase (va con un parntesis, significa que el nmero no entra).
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 7 de 39
NOTA:
En una tabla de frecuencias con datos agrupados en intervalos, hay libertad para elegir el nmero de clases y los extremos de las mismas (lmites inferior y superior de las clases).
Se forman los intervalos, de modo que el lmite inferior del primero sea algo menor que el dato extremo inferior y el lmite superior del ltimo sea algo superior al dato extremo superior. Es
deseable que los extremos de los intervalos no coincidan con ninguno de los datos. Para ello,
conviene que los extremos de los intervalos tengan una cifra decimal ms que los datos.
Cuando no nos dan la tabla de frecuencias con los datos agrupados en intervalos, los podemos agrupar en intervalos. Hay varias formas para calcular el nmero de intervalos, que son:
1) Hallamos la raz cuadrada entera del nmero total de datos y, adems, no debe ser
inferior a 6 ni superior a 15. O bien, el nmero de intervalos que tomaremos ser el
redondeo hasta las unidades de N .
2) Utilizamos la frmula emprica debida a Sturges: k = 1 + 3,3 log N
Ejemplo: Como los valores extremos de una lista de 30 nmeros son 47,3 y 96,3, calcula el
nmero de clases aconsejado para estos datos.
N = 30
1) 648,530
2) Frmula de Sturges: k = 1 + 3,3 log 30 = 5,87 6
La amplitud de la clase o la amplitud del intervalo es el tamao del intervalo.
Si la amplitud del intervalo es un nmero grande, el nmero de intervalos es menor. Pero si la amplitud del intervalo es un nmero pequeo, el nmero de intervalos es mayor.
Hay varias formas para calcular la amplitud del intervalo, que son:
1) Conocido el nmero de intervalos, hallamos el nmero de elementos que tenemos entre el
dato inferior y el dato mayor, esto es, el rango de elementos. Despus, dividimos el rango de elementos entre el nmero de intervalos y obtenemos la amplitud del intervalo.
Rango = dato mayor dato menor
Amplitud = rango / nmero de intervalos
2) Conocido el nmero de intervalos, hallamos el nmero de elementos que tenemos entre el
dato inferior y el dato mayor, esto es, el rango de elementos. Despus, tomamos el primer mltiplo del nmero de intervalos que sea mayor o igual que el rango de elementos. Por ltimo, dividimos el primer mltiplo del nmero de intervalos entre el nmero de intervalos y obtenemos la amplitud del intervalo.
Rango = dato mayor dato menor
pm = Primer mltiplo del nmero de intervalos rango
Amplitud = pm / nmero de intervalos
Ejemplo: Dada una lista de nmeros del 300 al 3.000, me piden que los agrupe en 7 intervalos,
cul es la amplitud?
Rango = 3.000 300 = 2.700
Nmero de intervalos = 7
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 8 de 39
Amplitud = 2.700 / 7 = 386
Los intervalos son: 300 686 , 686 1.072 , 1.072 1.458 , 1.458 1.844 ,
1.844 2.230 , 2.230 2.6216 , 2.616 3.002
Ejemplo: Como los valores extremos de una lista de 40 nmeros son 149 y 178, calcula la
amplitud.
N = 40
Rango = 178 149 = 29
Nmero de intervalos = 632,640
1) Amplitud = 29 / 6 = 4,83 5
2) Primer mltiplo de 6 29 6 x 5 = 30 Amplitud = 5
Los intervalos son: 148 153 , 153 158 , 158 163 , 163 168 , 168 173 , 173 178 ,
178 183
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros estadsticos.
Una vez que se calcula la primera marca de clase, las siguientes se obtienen de sumar a la
marca de clase anterior la amplitud de la clase. marca de clase anterior + amplitud de la clase
O tambin la marca de clase se podra calcular sumando al lmite inferior de la clase la mitad
de la amplitud de la clase. lmite inferior de la clase + mitad de la amplitud de la clase
Ejemplo: Construye la tabla de frecuencias del peso, en kg, de 20 alumnos/as.
Peso (Datos) Peso Marca de clase Recuento
66,5 59,2 60,1 64,2 70 [36, 42) 39 4
52,2 50,3 42,2 61,9 52,4 [42, 48) 45 4
50 41,6 47,9 42,8 55 [48, 54) 51 5
49,2 41,6 38,7 36,5 45 [54, 60) 57 2
[60, 66) 63 3
[66, 72) 69 2
Total 20
El peso es una variable cuantitativa continua.
Podemos ver que solo dos de los alumnos/as tienen el mismo peso (41,6 kg). Si con estos
datos hacemos una tabla de frecuencias como la anterior, resultara muy poco ilustrativa (19 valores
diferentes, los cuales tendran todos frecuencia 1 excepto el 41,6 que tendra frecuencia 2). Por eso,
en casos como ste, es preferible hacer una tabla de frecuencias acumulando los datos en intervalos.
La amplitud de la clase o la amplitud del intervalo se calcula como:
Rango = 70 36,5 = 33,5
Nmero de intervalos = 6
Amplitud = 33,5 / 6 = 5,58 6
Podemos tomar 6 intervalos de amplitud 6. amplitud = 6
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 9 de 39
2.3. CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS
Para construir una tabla de frecuencias para variables cuantitativas (discretas o continuas), se
colocan los datos ordenados, de menor a mayor, en la primera columna (variable estadstica), las
frecuencias absolutas en la segunda y las frecuencias relativas en la tercera.
Y en el caso de variables cualitativas, colocamos en la tabla aquellos valores que son
independientes del lugar en que se pongan las modalidades.
Distribucin de frecuencias
ix if iF rif riF Porcentaje
100rif (%)
1x Valor 1 1f 1F N
f1 N
FFr
11 1001 rf
2x Valor 2 2f 2F N
f 2 N
FFr
22 1002 rf
3x Valor 3 3f 3F N
f3 N
FFr
3
3 1003 rf
4x Valor 4 4f 4F N
f 4 N
FFr
44 1004 rf
nx Valor n nf nF N
f n N
FF nrn 100rnf
Total N 1 100 %
2.4. TERMINOLOGA DE UNA TABLA DE FRECUENCIAS
Los trminos utilizados ms frecuentemente en una tabla de frecuencias son:
X variable estadstica. Puede tomar n valores.
ix valores que puede tomar la variable X.
Para cada ix le corresponde un if , iF , rif y riF .
if frecuencia absoluta de un dato, suceso o valor. Es el nmero de veces que se repite
un valor iX . Nmero de individuos correspondiente a cada valor de la variable estadstica.
n
i
ifN1
suma de todas las if . Es el tamao del colectivo o de la poblacin o de la
muestra. Total de individuos. Nmero total de elementos de la poblacin o de la muestra.
i
j
ji fF1
frecuencia acumulada absoluta (o frecuencia absoluta acumulada) de un dato.
Es la suma de la frecuencia absoluta de ese dato con las frecuencias absolutas de todos los anteriores.
N
ff iri frecuencia relativa de un dato o suceso. Es el cociente entre la frecuencia
absoluta y N.
1i
ri
N
f suma de todas las rif Representa la unidad. 100 %.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 10 de
39
N
FF iri frecuencia acumulada relativa (o frecuencia relativa acumulada) de un dato. Es
la suma de la frecuencia acumulada absoluta de ese dato con las frecuencias acumuladas absolutas de
todos los anteriores.
100rif (%) frecuencia porcentual de un dato. Es la frecuencia relativa de ese dato
multiplicada por 100.
100100 i
rif suma de todas las 100rif Representa el 100 %.
2.5. CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS ABSOLUTA Y RELATIVA
2.5.1. Con datos aislados
Ejemplo: En el curso de 2 ESO, los deportes favoritos de los alumnos/as son:
Deportes Ftbol Baloncesto Tenis Atletismo Balonmano
Frecuencia 10 14 8 12 6
Construye una tabla de frecuencias.
Deportes
ix
Frecuencia
absoluta
if
Frecuencia
relativa
rif
Porcentaje
100rif (%)
Ftbol 10 20,050
10 20 %
Baloncesto 14 28,050
14 28 %
Tenis 8 16,050
8 16 %
Atletismo 12 24,050
12 24 %
Balonmano 6 12,050
6 12 %
Total N = 50 50
501 100 %
El deporte favorito es una variable cualitativa.
65 f , 12,05 rf , 6 alumnos/as o el 12 % de los alumnos/as tiene como deporte
favorito el balonmano.
Ejemplo: Construye una tabla de frecuencias con la talla de calzado de 20 personas.
43 42 41 39 41 38 40 43 44 40
39 39 38 41 40 39 38 39 39 40
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 11 de 39
Talla de
calzado
ix
Frecuencia
absoluta
if
Frecuencia
relativa
rif
Porcentaje
100rif (%)
38 3 15,020
3 15 %
39 6 30,020
6 30 %
40 4 20,020
4 20 %
41 3 15,020
3 15 %
42 1 05,020
1 5 %
43 2 10,020
2 10 %
44 1 05,020
1 5 %
Total N = 20 20
201 100 %
La talla de calzado es una variable cuantitativa discreta.
43 f , 20,03 rf , 4 personas o el 20 % de las personas tiene un 40 de talla de
calzado.
2.5.2. Con datos agrupados en intervalos
Ejemplo: Obtn la tabla de las frecuencias de los pesos, en kg, de 20 alumnos/as.
36,5 46,2 41,6 55 42,2 49,2 36,5
59,2 46 47,9 52,2 55,9 36,6 45
39,1 38 42,8 50,3 52,4 38,7
Peso
Marca
de clase
ix
Frecuencia
absoluta
if
Frecuencia
relativa
rif
Porcentaje
100riF (%)
[35, 40) 37,5 6 30,020
6 30 %
[40, 45) 42,5 3 15,020
3 45 %
[45, 50) 47,5 5 25,020
5 70 %
[50, 55) 52,5 3 15,020
3 85 %
[55, 60) 57,5 3 15,020
3 100 %
Total N = 20 20
201
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 12 de
39
El peso es una variable cuantitativa continua.
La amplitud de la clase o la amplitud del intervalo se calcula como:
Rango = 59,2 36,5 = 22,7
Nmero de intervalos = 5
Amplitud = 22,7 / 5 = 4,54 5
Podemos tomar 5 intervalos de amplitud 5. amplitud = 5
[35, 40) , 61 f , 30,01 rf , 6 alumnos/as o el 30 % de los alumnos/as pesan entre 35
y 40 kg.
2.6. CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS ABSOLUTA Y RELATIVA ACUMULADAS
Para construir una tabla de frecuencias para variables cuantitativas (discretas o continuas), se
colocan los datos ordenados, de menor a mayor, en la primera columna (variable estadstica), las
frecuencias absolutas en la segunda y las frecuencias relativas en la tercera.
Y en el caso de variables cualitativas, colocamos en la tabla aquellos valores que son
independientes del lugar en que se pongan las modalidades.
2.6.1. Con datos aislados
Ejemplo (continuacin): Construye una tabla de frecuencias acumuladas con la talla de calzado
de 20 personas.
43 42 41 39 41 38 40 43 44 40
39 39 38 41 40 39 38 39 39 40
Talla de
calzado
ix
Frecuencia
absoluta
if
Frecuencia
absoluta
acumulada
iF
Frecuencia
relativa
rif
Frecuencia
relativa
acumulada
riF
Porcentaje
100riF (%)
38 3 3 15,020
3 0,15 15 %
39 6 9 30,020
6 0,45 45 %
40 4 13 20,020
4 0,65 65 %
41 3 16 15,020
3 0,80 80 %
42 1 17 05,020
1 0,85 85 %
43 2 19 10,020
2 0,95 95 %
44 1 20 05,020
1 1 100 %
Total N = 20 20
201
164 F , 80,04 rF , 16 personas o el 80 % de las personas tienen menos de un 41 de
talla de calzado.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 13 de
39
2.6.2. Con datos agrupados en intervalos
Ejemplo (continuacin): Obtn la tabla de las frecuencias acumuladas de los pesos, en kg, de 20
alumnos/as.
36,5 46,2 41,6 55 42,2 49,2 36,5
59,2 46 47,9 52,2 55,9 36,6 45
39,1 38 42,8 50,3 52,4 38,7
Peso
Marca
de clase
ix
Frecuencia
absoluta
if
Frecuencia
absoluta
acumulada
iF
Frecuencia
relativa
rif
Frecuencia
relativa
acumulada
riF
Porcentaje
100riF (%)
[35, 40) 37,5 6 6 30,020
6
0,30 30 %
[40, 45) 42,5 3 9 15,020
3
0,45 45 %
[45, 50) 47,5 5 14 25,020
5
0,70 70 %
[50, 55) 52,5 3 17 15,020
3
0,85 85 %
[55, 60) 57,5 3 20 15,020
3
1 100 %
Total N = 20 20
201
El peso es una variable cuantitativa continua.
La amplitud de la clase o la amplitud del intervalo se calcula como:
Rango = 59,2 36,5 = 22,7
Nmero de intervalos = 5
Amplitud = 22,7 / 5 = 4,54 5
Podemos tomar 5 intervalos de amplitud 5. amplitud = 5
[45, 50) , 53 F , 70,03 rF , 14 alumnos/as o el 70 % de los alumnos/as pesan menos
de 50 kg.
3. GRFICOS ESTADSTICOS
3.1. UTILIDAD
Las grficas estadsticas permiten visualizar la informacin contenida en las tablas de
frecuencias de manera rpida y sencilla.
Cada da en los telediarios o en los peridicos tienes ocasin de encontrar grficas. Y es que por
medio de un grfico puedes representar muchos datos y ofrecer una visin ms global de todos ellos. A
continuacin, vas a ver los ms usuales.
3.2. TIPOS DE GRFICAS ESTADSTICAS
Existen muchos tipos de grficas estadsticas. Unas se emplean con variables cuantitativas y
otras con variables cualitativas.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 14 de
39
Pueden ser:
Diagrama de barras.
Histograma.
Polgonos de frecuencias.
Diagrama de sectores.
Pictograma.
Cartograma.
Serie cronolgica.
Pirmide de poblacin.
3.2.1. Diagrama de barras
El diagrama de barras se emplea para representar tablas de frecuencias de variables,
cualitativas o cuantitativas (discretas), que tomen pocos valores. Est formado por barras cuya altura
es proporcional a la frecuencia absoluta correspondiente.
En el eje horizontal, representamos los valores de la variable, y en el eje vertical, las
frecuencias absolutas.
Ejemplo:
Ejemplo:
3.2.2. Histograma
El histograma se emplea para representar variables cuantitativas (continuas) que tomen muchos
valores. Est formado por rectngulos anchos que se adosan unos a otros.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 15 de
39
Ejemplo:
Ejemplo:
3.2.3. Polgono de frecuencias
El polgono de frecuencias es una lnea poligonal que se construye uniendo los puntos medios de
los lados superiores de las barras o de los rectngulos en un diagrama de barras o en un histograma. Se emplea para representar variables cualitativas o cuantitativas (discretas y continuas).
Ejemplo:
Ejemplo:
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 16 de
39
3.2.4. Diagrama de sectores
El diagrama de sectores se emplea para representar variables de cualquier tipo, cualitativas o
cuantitativas (discretas y continuas). La superficie total de un crculo se reparte en tantos sectores
circulares como modalidades (valores) tiene la variable, correspondiente a cada sector un nmero de
grados directamente.
Los datos se representan en un crculo, dividido en sectores. Cada sector representa un valor
de la variable. Y la amplitud de un sector, su ngulo, es proporcional a la frecuencia absoluta del dato
que representa o a la frecuencia relativa.
El ngulo del sector circular se obtiene aplicando la siguiente frmula:
ngulo del sector circular: rii
i fN
ff
N
360
360
O aplicando la regla de 3 directa:
N 360
xf
N
i
360 ;
N
fx i
360
if x
En el diagrama de sectores, se escriben los valores de la variable y a veces el tanto por ciento
que representa.
Ejemplo:
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 17 de
39
Ejemplo:
El grfico que representa las notas obtenidas en un examen sobre Estadstica que realiz un
grupo de 3 de ESO.
Esta representacin permite darse cuenta enseguida de muchas caractersticas de la
distribucin de notas aunque no se conozcan exactamente los datos.
Aqu se ve que suspendieron menos de la mitad del curso. Tambin que ms de la mitad obtuvo
notas superiores a suficiente. Y que, exactamente, la cuarta parte fue puntuada con un bien.
Ejemplo:
3.2.5. Pictograma
El pictograma es un grfico en el que se emplean figuras cuyas dimensiones son proporcionales
al dato que representan, es decir, la imagen es proporcional a su frecuencia. La figura que se utiliza es
un dibujo relacionado con el tema. Se emplea para representar variables cualitativas o cuantitativas
(discretas y continuas).
Ejemplo:
En la figura ves que las longitudes de los lpices son proporcionales a las cantidades de dinero
que quieren representar.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 18 de
39
3.2.6. Cartograma
El cartograma es un grfico que se emplea cuando se realiza un estudio donde quieren
manifestarse las diferencias entre regiones geogrficas. Representan variables geogrficas,
econmicas, demogrficas, etc. Se trata de un mapa en el que por medio de colores o tramas se marcan
los distintos valores de una cierta caracterstica. Se emplea para representar variables cualitativas o
cuantitativas (discretas y continuas).
Ejemplo:
En este mapa se ha representado la renta familiar disponible en Espaa.
Cada color indica un nivel de renta diferente. Con esta representacin percibimos de forma muy
rpida multitud de informaciones, como:
Andaluca y Murcia son las comunidades con menos ingresos por familia.
Baleares presenta la mejor renta familiar del pas.
Adems, podemos plantearnos las siguientes preguntas:
Cul es la renta familiar en Melilla?
Cul es la diferencia de renta familiar entre el Pas Vasco y Cantabria?
Cul es la renta media de tu comunidad?
3.2.7. Serie cronolgica
La serie cronolgica se emplea cuando se quiere destacar la evolucin en el tiempo de cierto
dato, que suele llamarse series temporales. Permiten comparar los cambios de una variable a travs del
tiempo. Se emplea para representar variables cualitativas o cuantitativas (discretas y continuas).
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 19 de
39
Ejemplo: El valor de un euro en dlares ha sufrido muchas variaciones desde que se implant. Su
evolucin durante 1999 puedes verla en el siguiente grfico.
Observamos que su valor al comienzo del ao estaba en torno a los 1,13 dlares, que fue bajando
durante el primer semestre hasta Julio, cuando se cambiaba por 1,02 dlares. Se recuper durante los
meses de Agosto y Septiembre llegando a alcanzar el valor de 1,09 dlares. Pero el final del ao fue
muy malo para nuestra moneda, el 13 de Diciembre tuvo el peor cambio del ao: 1 euro por 1,0128
dlares.
3.2.8. Pirmide de poblacin
La pirmide de poblacin es muy utilizada en Economa, Geografa, Sociologa, etc. Se emplea
para representar variables cualitativas o cuantitativas (discretas y continuas).
Ejemplo: El concejal de cultura y deportes de un ayuntamiento present el siguiente grfico
sobre las edades de los vecinos del pueblo que se hallaban inscritos en la Federacin de Ftbol.
Observamos que, sin disponer de una excesiva cantidad de nmeros, seramos capaces de
describir muchas caractersticas de ese conjunto de personas. As, interpretamos que la mayora son
hombres, que el mayor nmero de federados se da entre los 10 y los 29 aos, que es raro encontrar
personas con ms de 40 aos que tengan carnet de la Federacin de Ftbol, etc.
3.2.9. Resumen de grficas estadsticas
En la tabla siguiente, se presentan los tipos de grficas estadsticas con las variables
estadsticas que se suelen usar.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 20 de
39
Tipos de grficas estadsticas Tipos de variables
Diagrama de barras Variables cualitativas.
Variables cuantitativas discretas.
Histograma Variables cuantitativas continuas.
Polgonos de frecuencias Variables cualitativas.
Variables cuantitativas discretas y continuas.
Diagrama de sectores Variables cualitativas.
Variables cuantitativas discretas y continuas.
Pictograma Variables cualitativas.
Variables cuantitativas discretas y continuas.
Cartograma Variables cualitativas.
Variables cuantitativas discretas y continuas.
Serie cronolgica Variables cualitativas.
Variables cuantitativas discretas y continuas.
Pirmide de poblacin Variables cualitativas.
Variables cuantitativas discretas y continuas.
3.3. EJEMPLOS DE GRFICAS ESTADSTICAS
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 21 de
39
3.4. CONSTRUCCIN DE GRFICOS ESTADSTICOS CON DATOS AISLADOS
Ejemplo (continuacin): Representa los datos mediante un diagrama de barras, un polgono de
frecuencias y un diagrama de sectores para los deportes favoritos de los alumnos/as.
Diagrama de barras
0
2
4
6
8
10
12
14
16
Ftbol Baloncesto Tenis Atletismo Balonmano
Deportes
Fre
cu
en
cia
ab
so
luta
Diagrama de barras y Polgono de frecuencias
0
2
4
6
8
10
12
14
16
Ftbol Baloncesto Tenis Atletismo Balonmano
Deportes
Fre
cu
en
cia
s a
bso
luta
s
Diagrama de sectores
20%
28%
16%
24%
12%
Ftbol
Baloncesto
Tenis
Atletismo
Balonmano
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 22 de
39
Ejemplo (continuacin): Representa los datos mediante un diagrama de barras, un polgono de
frecuencias y un diagrama de sectores para la talla de calzado de 20 personas.
Diagrama de barras
0
1
2
3
4
5
6
7
38 39 40 41 42 43 44
Talla de calzado
Fre
cu
en
cia
ab
so
luta
Diagrama de barras y Polgono de frecuencias
0
1
2
3
4
5
6
7
38 39 40 41 42 43 44
Talla de calzado
Fre
cu
en
cia
ab
so
luta
Diagrama de sectores
15%
30%
20%
15%
5%
10%5%
38
39
40
41
42
43
44
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 23 de
39
3.5. CONSTRUCCIN DE GRFICOS ESTADSTICOS CON DATOS AGRUPADOS EN INTERVALOS
Ejemplo (continuacin): Representa los datos mediante un histograma, un polgono de
frecuencias y un diagrama de sectores para los pesos, en kg, de 20 alumnos/as.
Histograma
0
1
2
3
4
5
6
7
[35, 40) [40, 45) [45, 50) [50, 55) [55, 60)
Peso (kg)
Fre
cu
en
cia
ab
so
luta
Histograma y Polgono de frecuencias
0
1
2
3
4
5
6
7
[35, 40) [40, 45) [45, 50) [50, 55) [55, 60)
Peso (kg)
Fre
cu
en
cia
ab
so
luta
Diagrama de sectores
30%
15%
25%
15%
15%
[35, 40)
[40, 45)
[45, 50)
[50, 55)
[55, 60)
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 24 de
39
4. PARMETROS ESTADSTICOS
4.1. UTILIDAD
Las variables cuantitativas se pueden resumir mediante las medidas estadsticas o parmetros estadsticos.
Por tanto, los parmetros estadsticos son nmeros que resumen datos.
4.2. TIPOS DE PARMETROS ESTADSTICOS
Pueden ser de tres tipos:
Medidas de centralizacin.
Medidas de posicin.
Medidas de dispersin.
4.2.1. Medidas de centralizacin
4.2.1.1. Utilidad
Las medidas de centralizacin nos permiten conocer el valor alrededor del cual se agrupan
todos los datos. Se utilizan para resumir la informacin de la muestra.
4.2.1.2. Tipos
Las ms utilizadas son la media aritmtica, la mediana y la moda.
Media aritmtica: es el cociente de la suma de todos los valores y el nmero de datos. Es la
suma de todos los datos divididos por el nmero total de datos. Se denota por x .
Cuando el nmero de datos es grande, la media aritmtica se obtiene a partir de la
tabla de frecuencias absolutas y se calcula como:
N
fx
f
fx
ff
fxfxx
n
i
ii
n
i
i
n
i
ii
n
nn
1
1
1
1
11
......
......
La media de una distribucin representa el centro de gravedad de los datos.
Esta medida es nica y puede no coincidir con ninguno de los datos de estudio. Slo se
puede calcular para variables cuantitativas (discretas y continuas).
En las variables cuantitativas continuas, tomamos como valor ix la marca de clase de
cada intervalo.
Mediana: es el valor ix de la variable que ocupa el lugar central cuando se ordenan los datos. Es
el valor que ocupa la posicin central una vez ordenados los datos, de menor a mayor. Se denota
por Me.
Para calcular la mediana, ordenamos los datos de menor a mayor.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 25 de
39
Si el nmero de datos es impar, la mediana es el valor que ocupa el lugar central.
1 cxMe donde c el cociente entero que resulta al dividir N entre 2, y c+1
es el valor de la variable que ocupa el lugar c+1.
Y si el nmero de datos es par, la mediana es el promedio de los dos valores centrales.
2
1 ccxx
Me
Otra forma de calcular, es observando la frecuencia absoluta acumulada iF . Para ello,
tomamos aquel valor de la variable ix cuyo primer valor de la variable iF sea mayor o igual que
2
N. En resumen,
Buscamos la primera 2
NFi que es ii xMenF
Esta medida es nica y puede no coincidir con ninguno de los datos de estudio. Slo se
puede calcular para variables cuantitativas (discretas y continuas).
En las variables cuantitativas continuas, tomamos como valor ix la clase mediana o
intervalo mediana, que corresponde al intervalo que contiene al valor central si N es impar y a los dos valores centrales si N es par. Luego, el valor aproximado de la clase mediana ser la
marca de clase del intervalo. Para calcular el valor exacto, usamos la frmula siguiente:
i
i
if
FN
cLMe1
2
Donde, iL es el lmite inferior de la clase mediana, c es la amplitud de los intervalos,
N es nmero total de datos, 1iF es la frecuencia absoluta acumulada de la clase anterior a la
clase mediana y if es la frecuencia absoluta de la clase mediana.
Moda: es el valor ix de mayor frecuencia absoluta. Es el valor de la variable con ms
frecuencia. Un conjunto de datos puede tener una moda o ms de una. Se denota por Mo. En
resumen,
Buscamos la if mayor ixMo
Cuando existen 2 valores con mxima frecuencia absoluta, se llama bimodal; con 3
valores, se llama trimodal, etc. As cuando existen varias modas, se llama multimodal.
Esta medida puede no ser nica y coincide siempre con alguno de los datos de estudio.
Se puede calcular para variables de cualquier tipo, cualitativas o cuantitativas (discretas y
continuas).
En un diagrama de barras, la moda es el dato correspondiente a la barra de mayor
altura.
Y en un diagrama de sectores, la moda es el dato correspondiente al sector de mayor
amplitud.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 26 de
39
En las variables cuantitativas continuas, tomamos como valor ix la clase modal o
intervalo modal, que corresponde al intervalo de mayor frecuencia absoluta. Luego, el valor
aproximado de la clase modal ser la marca de clase del intervalo. Para calcular el valor exacto, usamos la frmula siguiente:
21
1
DD
DcLMo i
Donde, iL es el lmite inferior de la clase mediana, c es la amplitud de los intervalos,
1D es la diferencia entre la frecuencia absoluta de la clase modal if y la de la clase anterior
1if , y 2D es la diferencia entre la frecuencia absoluta de la clase modal if y la de la clase
siguiente 1if .
4.2.1.3. Con datos aislados
A continuacin, presentamos varios ejemplos para variables cuantitativas discretas.
Ejemplo (continuacin). Datos pares: Calcula las medidas de centralizacin para la talla de
calzado de 20 personas.
Talla de
calzado
ix
Frecuencia
absoluta
if
Frecuencia
absoluta
acumulada
iF
ii fx
38 3 3 114
39 6 9 234
40 4 13 160
41 3 16 123
42 1 17 42
43 2 19 86
44 1 20 44
Total N = 20 803
Media aritmtica: 15,4020
803x
Con este dato podemos deducir que la talla de calzado normal perteneciente a este
grupo de personas es 40.
Mediana: Hay dos formas:
1) Ordenamos los datos de menor a mayor.
38 38 38 39 39 39 39 39 39 40 40 40 40 41 41 41 42 43 43 44
102
20
2
N
Como N = 20 es par, cogemos los dos valores centrales 40 y 40 y calculamos la media de
estos dos: 402
80
2
4040
.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 27 de
39
2) Buscamos en la frecuencia absoluta acumulada el valor inmediatamente superior a
102
20
2
N. Por lo que es 133 F , que se corresponde con la talla de calzado 40.
Me = 40 porque la talla de calzado es 40, que es el valor central.
Con este dato podemos deducir que el valor central para la talla de calzado
perteneciente a este grupo de personas es 40.
Moda: Mo = 39 porque la frecuencia absoluta mayor es 62 f (es el valor que ms se repite).
Con este dato podemos deducir que la talla de calzado ms usada por este grupo de
personas es 39.
Ejemplo. Datos impares: Calcula las medidas de centralizacin para el nmero de hermanos/as
de 7 personas.
1 3 2 4 3 2 3
N de
hermanos/as
ix
Frecuencia
absoluta
if
Frecuencia
absoluta
acumulada
iF
ii fx
1 1 1 1
2 2 3 4
3 3 6 9
4 1 7 4
Total N = 7 18
Media aritmtica: 57,27
18x
Con este dato podemos deducir que el nmero de hermanos normal perteneciente a
este grupo de personas es 3.
Mediana: Hay dos formas:
1) Ordenamos los datos de menor a mayor.
1 2 2 3 3 3 4
5,32
7
2
N
Como N = 7 es impar, cogemos el valor central 3.
2) Buscamos en la frecuencia absoluta acumulada el valor inmediatamente superior a
5,32
7
2
N. Por lo que es 63 F , que se corresponde con el nmero de hermanos 3.
Me = 3 porque el nmero de hermanos es 3, que es el valor central.
Con este dato podemos deducir que el valor central para el nmero de hermanos
perteneciente a este grupo de personas es 3.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 28 de
39
Moda: Mo = 3 porque la frecuencia absoluta mayor es 33 f (es el valor que ms se repite).
Con este dato podemos deducir que el nmero de hermanos ms usado por este grupo de
personas es 3.
Ejemplo. Datos pares: La siguiente tabla resume los resultados obtenidos en una encuesta
realizada entre 10 parejas a las que se les preguntaba sobre el nmero de hijos que tenan. Calcula las
medidas de centralizacin e interprtalas.
N de
hijos/as
ix
Frecuencia
absoluta
if
Frecuencia
absoluta
acumulada
iF
ii fx
0 2 2 0
1 4 6 4
2 3 9 6
3 1 10 3
Total N = 10 13
Media aritmtica: 3,110
13x
Con este dato podemos deducir que por trmino medio las parejas tienen entre 1 y 2
hijos/as.
Mediana: Hay dos formas:
1) Ordenamos los datos de menor a mayor.
0 0 1 1 1 1 2 2 2 3
52
10
2
N
Como N = 10 es par, cogemos los dos valores centrales 1 y 1 y calculamos la media de
estos dos: 12
2
2
11
.
2) Buscamos en la frecuencia absoluta acumulada el valor inmediatamente superior a
52
10
2
N. Por lo que es 62 F , que se corresponde con el nmero de hijos/as 1.
Me = 1 porque el nmero de hijos/as es 1, que es el valor central.
Con este dato podemos deducir que el valor central para el nmero de hijos/as
perteneciente a este grupo de personas es 1. Esto es, la mediana indica que hay tantas parejas
que tienen 1 ms hijos/as como parejas que tienen 1 hijo/a o menos.
Moda: Mo = 1 porque la frecuencia absoluta mayor es 42 f (es el valor que ms se repite).
Con este dato podemos deducir que lo ms frecuente es tener 1 hijo.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 29 de
39
4.2.1.4. Con datos agrupados en intervalos
A continuacin, presentamos varios ejemplos para variables cuantitativas continuas.
Ejemplo (continuacin). Datos pares: Calcula las medidas de centralizacin para los pesos, en
kg, de 20 alumnos/as.
Peso
Marca
de clase
ix
Frecuencia
absoluta
if
Frecuencia
absoluta
acumulada
iF
ii fx
[35, 40) 37,5 6 6 225
[40, 45) 42,5 3 9 127,5
[45, 50) 47,5 5 14 237,5
[50, 55) 52,5 3 17 157,5
[55, 60) 57,5 3 20 172,5
Total N = 20 920
Media aritmtica: 4620
920x
Con este dato podemos deducir que el peso normal perteneciente a este grupo de
alumnos/as es 46 kg.
Mediana: Hay dos formas:
1) Ordenamos los datos de menor a mayor.
36,5 36,5 36,6 38 38,7 39,1 41,6 42,2 42,8 45
46 46,2 47,9 49,2 50,3 52,2 52,4 55 55,9 59,2
102
20
2
N
Como N = 20 es par, cogemos los dos valores centrales 45 y 46 y calculamos la media de
estos dos: 5,452
91
2
4645
2) Buscamos en la frecuencia absoluta acumulada el valor inmediatamente superior a
102
20
2
N. Por lo que es 143 F , que se corresponde con el peso entre 45 y 50 kg.
Me = [45, 50)
Luego, el valor aproximado de la clase mediana es Me = 47,5.
Para calcular el valor exacto, usamos la frmula siguiente:
461455
910545
Me
Con este dato podemos deducir que el valor central para el peso perteneciente a este
grupo de alumnos/as es 46 kg.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 30 de
39
Moda: Mo = [45, 50) porque la frecuencia absoluta mayor es 53 f (es el valor que ms se
repite).
Con este dato podemos deducir que el peso ms usado por este grupo de alumnos/as
est entre 45 y 50 kg.
Luego, el valor aproximado de la clase modal es Mo = 47,5.
Para calcular el valor exacto, usamos la frmula siguiente:
45
2
90
2
545
4
2545
3535
35545
Mo
4.2.1.5. Resumen de medidas de centralizacin
En la tabla siguiente, se presentan los tipos de medidas de centralizacin con las variables
estadsticas que se suelen usar.
Tipos de medidas de centralizacin Tipos de variables
Media aritmtica Variables cuantitativas discretas y continuas.
Mediana Variables cuantitativas discretas y continuas.
Moda Variables cualitativas.
Variables cuantitativas discretas y continuas.
En la tabla siguiente, se presenta un resumen de los tipos de medidas de centralizacin.
Tipos Cmo se calcula Variables cuantitativas continuas
Media aritmtica
N
fx
x
n
i
ii
1 ix marca de clase de cada intervalo.
Mediana
1) Ordenamos los datos de menor
a mayor.
Si N es impar 1 cxMe
Si N es par 2
1 ccxx
Me
Donde: 2
Nc
2) Buscamos la primera 2
NFi
que es ii xMenF
),[ 1 iii LLxMe clase mediana o
intervalo mediana.
Valor aproximado Me = marca de clase
del intervalo.
Valor exacto i
i
if
FN
cLMe1
2
Donde:
iL lmite inferior.
c amplitud de los intervalos.
1iF frecuencia absoluta acumulada de
la clase anterior.
if frecuencia absoluta.
Moda Buscamos la if mayor ixMo
),[ 1 iii LLxMo clase modal o
intervalo modal.
Valor aproximado marca de clase del
intervalo.
Valor exacto
111
iiii
ii
iffff
ffcLMo
Donde:
iL lmite inferior.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 31 de
39
c amplitud de los intervalos.
4.2.2. Medidas de posicin
4.2.2.1. Utilidad
Las medidas de posicin dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Las medidas de posicin son valores de la variable que informan del lugar que ocupa un dato
dentro del conjunto ordenado de valores.
Slo se puede calcular para variables cuantitativas (discretas y continuas).
4.2.2.2. Tipos
Las ms utilizadas son los cuartiles, los deciles y los percentiles.
Cuartiles: son tres valores Q1, Q2 y Q3 de la variable estadstica que dividen a los individuos de la poblacin en cuatro partes iguales, es decir, en cada tramo est el 25 % de los datos recogidos en el estudio. Los cuartiles son los puntos de separacin.
25 % 25 % 25 % 25 %
Q1 Q2 Q3
N
44:
kNk
NQk con K = 1, 2, 3
Buscamos la primera kN
Fi 4
que es iki xQnF
- Primer cuartil Q1: es el valor de la variable que deja la cuarta parte de las observaciones menores o iguales a l y las tres cuartas partes superiores a l. Es decir, deja por debajo de l al 25 % de la poblacin y por encima al 75 %.
14
:4
125,0%25: 11
NQNNNQ
Buscamos la primera 14
NFi que es ii xQnF 1
- Segundo cuartil Q2: es el valor de la variable que deja las dos cuartas partes inferiores o iguales a l, es decir, la mitad de las observaciones. Este cuartil coincide con la mediana.
24
:2
150,0%50: 22
NQNNNQ
Buscamos la primera 24
NFi que es ii xQnF 2
- Tercer cuartil Q3: es el valor de la variable que deja las tres cuartas partes de las observaciones inferiores o iguales a l y la cuarta parte de stas superior a l. Es decir, deja por debajo de l al 75 % de la poblacin y por encima al 25 %.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 32 de
39
34
:4
375,0%75: 33
NQNNNQ
Buscamos la primera 34
NFi que es ii xQnF 3
- Recorrido intercuartlico RIQ: es la diferencia entre el tercer y el primer cuartil de una
distribucin.
13 QQRIQ
As pues,
Q1 25 %
Q2 = Me 50 %
Q3 75 %
Deciles: son 9 valores de la variable estadstica que dividen a los individuos de la poblacin en 10 partes iguales.
Decil k (Dk) es el valor de la variable estadstica que deja k observaciones por debajo.
10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 %
D1 D2 D3 D4 D5 D6 D7 D8 D9
N
kN
DNk
NkD kk 10
:10
%:
Buscamos la primera kN
Fi 100
que es iki xPnF
As pues,
D1 10 %
D2 20 %
D5 = Q2 = Me 50 %
D9 90 %
Percentiles: son 99 valores de la variable estadstica que dividen a los individuos de la poblacin en 100 partes iguales.
Percentil k (Pk) es el valor de la variable estadstica que deja k observaciones por debajo. Tambin se denomina centil K.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 33 de
39
1 % 1 % 1 %
P1 P2 P30 P50 P80 P90 P99
N
kN
PNk
NkP kk 100
:100
%:
Buscamos la primera kN
Fi 100
que es iki xPnF
Los percentiles ms usados son:
- Percentil 15 (P15) deja por debajo al 15 % de las observaciones y por encima al 85 %.
15100
:100
1515,0%15: 1515
NPNNNP
Buscamos la primera 15100
N
Fi que es ii xPnF 15
- Percentil 50 (P50) es la mediana y el segundo cuartil Q2, que deja por debajo al 50 % de las
observaciones y por encima al 50 %.
- Percentil 25 (P25) es el primer cuartil Q1, que deja por debajo al 25 % de las observaciones
y por encima al 75 %.
- Percentil 75 (P75) es el tercer cuartil Q3, que deja por debajo al 75 % de las observaciones
y por encima al 25 %.
As pues,
Q1 = P25 25 %
Q2 = D5 = P50 = Me 50 %
Q3 = P75 75 %
D1 = P10 10 %
D2 = P20 20 %
D9 = P90 90 %
P1 1 %
P2 2 %
P30 30 %
P99 99 %
NOTA:
Cuando se calculan los cuartiles, percentiles y deciles, hay que tener en cuenta si el nmero de
datos es impar o par.
Si el nmero de datos es impar, el cuartil, percentil y decil es el valor que ocupa el lugar
central.
13,2,1 cxQ , 199,...,3,2,1 cxP , 190,...,30,20,10 cxD donde c el cociente entero que
resulta al dividir N entre 2, y c+1 es el valor de la variable que ocupa el lugar c+1.
Y si el nmero de datos es par, el cuartil, percentil y decil es el promedio de los dos valores
centrales.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 34 de
39
2
1
3,2,1
ccxx
Q , 2
1
99,...,3,2,1
ccxx
P , 2
1
90,...,30,20,10
ccxx
D
Otra forma de calcular los cuartiles, los deciles y los percentiles, es cuando los datos vienen
datos en una tabla de frecuencias, pues se necesita la columna de la frecuencia absoluta acumulada iF .
Tomamos aquel valor de la variable ix cuyo primer valor de la variable iF sea mayor o igual que
el cuartil o el percentil pedido.
4.2.2.3. Con datos aislados
A continuacin, presentamos varios ejemplos para variables cuantitativas discretas.
Ejemplo: Para comprar zapatillas a los miembros de una pea de bolos, se les ha preguntado por
la talla de calzado que usan y los resultados se presentan en esta tabla. Calcula las medidas de posicin.
Talla de
calzado
ix
Frecuencia
absoluta
if
Frecuencia
absoluta
acumulada
iF 35 7 7
36 13 20
37 20 40
38 37 77
39 42 119
40 50 169
41 23 192
42 8 200
Total N = 200
Para calcular el primer cuartil Q1 , tendremos que calcular el 25 % del nmero total de datos,
200 200 0,25 = 50
Luego, Q1 tiene 50 datos por debajo y el resto por encima. En la columna de frecuencias
absolutas acumuladas, el primer nmero mayor o igual que 50 es 77, que corresponde al dato 38. Por
tanto, Q1 = 38 Es decir, la cuarta parte de los miembros de la pea utilizan una talla de calzado menor
o igual que 38.
50:14
200:200
4
120025,0200%25: 111 QQQ
Buscamos la primera 50iF que es 3877 1414 QxQF
El segundo cuartil Q2 , tiene el 50 % de los datos por debajo y el 50 % por encima. Es decir,
coincide con la mediana. Tendremos que calcular el 50 % del nmero total de datos, 200
200 0,50 = 100
Como el primer nmero mayor o igual que 100 en las frecuencias absolutas acumuladas es 119,
entonces Q2 = 39 Es decir, la mitad de los miembros de la pea utilizan una talla de calzado menor o
igual que 39.
100:24
200:200
2
120050,0200%50: 222 QQQ
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 35 de
39
Buscamos la primera 100iF que es 39119 2525 QxQF
Y el tercer cuartil Q3 , tiene el 75 % de los datos por debajo y el 25 % por encima, tendremos
que calcular el 75 % del nmero total de datos, 200 200 0,75 = 150
Como el primer nmero mayor o igual que 150 en las frecuencias absolutas acumuladas es 169,
entonces Q3 = 40 Es decir, las dos terceras partes de los miembros de la pea utilizan una talla de
calzado menor o igual que 40.
150:34
200:200
4
320075,0200%75: 333 QQQ
Buscamos la primera 150iF que es 40169 3636 QxQF
Para calcular los percentiles, se hara lo mismo:
P15 tiene el 15 % de los datos por debajo y el 85 % por encima, tendremos que calcular
el 15 % del nmero total de datos, 200 200 0,15 = 30
Luego, P15 tiene 30 datos por debajo y el resto por encima. En la columna de frecuencias
absolutas acumuladas, el primer nmero mayor o igual que 30 es 40, que corresponde al dato 37. Por
tanto, P15 = 37 Es decir, el 15 % de los miembros de la pea utilizan una talla de calzado menor o igual
que 37.
30:15100
200:200
100
1520015,0200%15: 151515 PPP
Buscamos la primera 30iF que es 3740 153153 PxPF
En resumen,
P25 = Q1 = 38
P50 = D5 = Q2 = Me = 39
P75 = Q3= 40
4.2.2.4. Con datos agrupados en intervalos
A continuacin, presentamos varios ejemplos para variables cuantitativas continuas.
4.2.2.5. Resumen de medidas de posicin
En la tabla siguiente, se presentan los tipos de medidas de posicin con las variables
estadsticas que se suelen usar.
Tipos de medidas de posicin Tipos de variables
Primer cuartil Q1 Variables cuantitativas discretas y continuas.
Segundo cuartil Q2 Variables cuantitativas discretas y continuas.
Tercer cuartil Q3 Variables cuantitativas discretas y continuas.
Decil k (Dk) Variables cuantitativas discretas y continuas.
Percentil k (Pk) Variables cuantitativas discretas y continuas.
En la tabla siguiente, se presenta un resumen de los tipos de medidas de posicin.
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 36 de
39
Tipos Cmo se calcula Variables cuantitativas
continuas
Primer cuartil
Q1
14
:4
125,0%25: 11
NQNNNQ
Buscamos la primera 14
NFi que es
ii xQnF 1
),[ 11 iii LLxQ
Valor aproximado 1Q =
marca de clase del
intervalo.
Valor exacto
i
i
if
FN
cLQ1
14
1
Segundo cuartil
Q2 = Me
24
:2
150,0%50: 22
NQNNNQ
Buscamos la primera 24
NFi que es
ii xQnF 2
),[ 12 iii LLxQ
Valor aproximado 2Q =
marca de clase del
intervalo.
Valor exacto
i
i
if
FN
cLQ1
24
2
Tercer cuartil
Q3
34
:4
375,0%75: 33
NQNNNQ
Buscamos la primera 34
NFi que es
ii xQnF 3
),[ 13 iii LLxQ
Valor aproximado 3Q =
marca de clase del
intervalo.
Valor exacto
i
i
if
FN
cLQ1
34
3
Recorrido intercuartlico
RIQ 13 QQRIQ
Decil k Dk
kN
DNk
NkD kk 10
:10
%:
Buscamos la primera kN
Fi 100
que es
iki xPnF
),[ 1 iiik LLxD
Valor aproximado kD =
marca de clase del
intervalo.
Valor exacto
i
i
ikf
FN
k
cLD1
10
Percentil k Pk
kN
PNk
NkP kk 100
:100
%:
Buscamos la primera kN
Fi 100
que es
iki xPnF
),[ 1 iiik LLxP
Valor aproximado kP =
marca de clase del
intervalo.
Valor exacto
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 37 de
39
i
i
ikf
FN
k
cLP1
100
4.2.3. Medidas de dispersin
4.2.3.1. Utilidad
Dos distribuciones pueden tener las mismas medidas de centralizacin y ser muy diferentes si
los valores de las variables se distribuyen o dispersan de forma diferente.
Las medidas de dispersin pretenden medir lo agrupados que se encuentran los datos en torno
a la media aritmtica. Es decir, se utilizan para conocer en qu medida los datos de una muestra se
encuentran ms o menos alejados de su media.
Las medidas de dispersin permiten conocer el grado de agrupamiento de los datos en torno a
las medidas de centralizacin, fundamentalmente, la media aritmtica.
4.2.3.2. Tipos
Las ms utilizadas son el rango, la desviacin media, la varianza, la desviacin tpica y el
coeficiente de variacin.
Rango o recorrido: es la diferencia entre el mayor y el menor valor de la variable ix . Indica el
grado de dispersin de los datos. Se denota por R.
1xxR n
Cuanto mayor es el rango, ms dispersos estn los datos.
Desviacin media: es la media aritmtica de los valores absolutos de las desviaciones de cada
dato. Se halla calculando el promedio de todas las diferencias de los valores con la media.
N
fxx
f
fxx
DM
n
i
ii
n
i
i
n
i
ii
1
1
1
Es el promedio de las desviaciones a la media. Indica el grado de dispersin (alejamiento) de los datos respecto a su media.
Varianza: es la media aritmtica de los cuadrados de las desviaciones respecto a la media. Se
denota por 2 .
21
2
2
1
1
2
2
1
2
1
2
12
......
......x
N
fx
x
f
fx
xff
fxfx
n
i
ii
n
i
i
n
i
ii
n
nn
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 38 de
39
Desviacin tpica: es la raz cuadrada de la varianza. Se denota por .
2
Mide el grado de dispersin. Dice cmo de alejados de la media, cmo de dispersos, se
encuentran los datos.
Coeficiente de variacin: es el cociente de la desviacin tpica y la media aritmtica. Se
denota por CV.
xCV
Se suele dar en porcentajes e indica la variacin relativa.
NOTA:
En las variables cuantitativas continuas, tomamos como valor ix la marca de clase de cada
intervalo.
Para comparar la dispersin de dos poblaciones heterogneas (con distinta media aritmtica), se
utiliza el coeficiente de variacin, pues indica la variacin relativa.
Cuando dos distribuciones tienen la misma media, la diferencia entre ambas viene dada a travs
de la desviacin tpica, que nos indica lo alejados que se encuentran los datos con respecto de la
media aritmtica.
La varianza y la desviacin tpica de una distribucin son siempre positivas o nulas. Es nula
cuando todos los datos son iguales a la media.
Cuanto menor es la varianza o la desviacin tpica, mayor es el grado de representatividad de
los valores centrales.
Cuando la desviacin tpica toma valores mayores que uno, hay bastante dispersin.
Si las medidas de dispersin son pequeas, se puede concluir que los datos estn agrupados
alrededor de la media aritmtica. Es decir, cuanto menores son las medidas de dispersin, ms
concentrados estn los datos.
Y si las medidas de dispersin son grandes, significa que los datos estn bastante dispersos.
4.2.3.3. Con datos aislados
A continuacin, presentamos varios ejemplos para variables cuantitativas discretas.
Ejemplo: Calcula las medidas de dispersin del grupo para las notas de 5 alumnos/as de 3 ESO.
1 1 5 9 9
Notas de
alumnos/as
ix
Frecuencia
absoluta
if ii fx xxi ii fxx 2xxi ii fxx
2
1 2 2 4 8 16 32
5 1 6 0 0 0 0
9 2 18 4 8 16 32
Total N = 5 26 16 64
-
Tema 1: Estadstica.
Gema Isabel Marn Caballero Pgina 39 de
39
Media aritmtica: 52,55
26x
Rango o recorrido: 819 R
Desviacin media: 2,35
16DM
Varianza: 8,125
642
Desviacin tpica: 578,38,12
Coeficiente de variacin: 716,05
578,3CV
En este caso, las medidas de dispersin son bastante grandes. Esto indica que, aunque la media
aritmtica sea 5, este valor no es muy representativo de los datos.
4.2.3.4. Con datos agrupados en intervalos
A continuacin, presentamos varios ejemplos para variables cuantitativas continuas.
4.2.3.5. Resumen de medidas de dispersin
En la tabla siguiente, se presentan los tipos de medidas de dispersin con las variables
estadsticas que se suelen usar.
Tipos de medidas de dispersin Tipos de variables
Rango o recorrido Variables cuantitativas discretas y continuas.
Desviacin media Variables cuantitativas discretas y continuas.
Varianza Variables cuantitativas discretas y continuas.
Desviacin tpica Variables cuantitativas discretas y continuas.
Coeficiente de variacin Variables cuantitativas discretas y continuas.
En la tabla siguiente, se presenta un resumen de los tipos de medidas de dispersin.
Tipos Cmo se calcula Variables cuantitativas continuas
Rango o recorrido 1xxR n 1LLR n
Desviacin media
N
fxx
DM
n
i
ii
1
ix = marca de clase del intervalo.
Varianza
N
fxxn
i
ii
1
2
2
Desviacin tpica 2
Coeficiente de variacin x
CV