gobierno de canarias - tema 1 estadÍstica descriptiva · 2020. 2. 17. · los diagramas de tallos...

11
Tema 1 Pg. nº 1/11 ESTADÍSTICA DESCRIPTIVA 1.- DISTRIBUCIONES UNIDIMENSIONALES. CONCEPTOS GENERALES. La estadística se puede dividir en dos partes: Estadística descriptiva o deductiva. Estadística inferencial o inductiva. La estadística descriptiva o deductiva trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones. Se construyen tablas y se representan gráficos que permiten simplificar en gran medida, la complejidad de todos los datos que intervienen en la distribución. Asimismo se calculan parámetros estadísticos que caracterizan la distribución. En esta parte de la estadística no se hace uso del cálculo de probabilidades, y únicamente se limita a realizar deducciones directamente a partir de los datos y parámetros obtenidos. La estadística inferencial o inductiva plantea y resuelve el problema de establecer previsiones y conclusiones generales sobre una población a partir de los resultados obtenidos de una muestra. Utiliza resultados obtenidos mediante la estadística descriptiva y se apoya fuertemente en el cálculo de probabilidades. La población es el conjunto de todos los elementos, que cumpliendo una condición, deseamos estudiar (por ejemplo: los habitantes de una ciudad, los alumnos de un colegio, las gallinas de una granja, etc.). Un individuo es cada uno de los elementos de la población. Una muestra es cualquier subconjunto de la población (por ejemplo: 100 alumnos del colegio, 1.000 habitantes de una ciudad, 300 gallinas de una granja, etc.). El saber seleccionar una muestra suficientemente representativa de la población a estudiar es fundamental para que los resultados del estudio sean fiables. Sobre cómo seleccionar una muestra existen todo un tratado llamado “Teoría de las muestras”, al cual haremos una aproximación más adelante. Cada una de las propiedades que se pueden estudiar se llama carácter estadístico (por ejemplo: talla, peso, sexo, estado civil, etc). Pueden ser cuantitativos si se pueden medir numéricamente (por ejemplo: la talla, el peso, etc) o cualitativo si no se puede medir numéricamente (por ejemplo: sexo, estado civil, etc). Al conjunto de valores que toma un carácter se le llama variable estadística que podrá ser cualitativa o cuantitativa, dependiendo de si el carácter es cualitativo o cuantitativo, respectivamente. Una variable será discreta si sólo puede tomar determinados valores (ej: número de hermanos, número de aprobados, etc). Una variable será continua si puede tomar todos los valores posibles de un intervalo (ej: altura de una persona, peso, etc). Tablas de frecuencias: Son tablas donde se reflejan los datos obtenidos y las diferentes frecuencias: La frecuencia absoluta ( f i ) es el número de veces que se repite un valor (si están agrupados en intervalos de clase, la frecuencia absoluta del intervalo será el número de veces que aparece un valor cualquiera de ese intervalo).

Upload: others

Post on 01-Mar-2021

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 1/11

ESTADÍSTICA DESCRIPTIVA

1.- DISTRIBUCIONES UNIDIMENSIONALES. CONCEPTOS GENERALES.

La estadística se puede dividir en dos partes:

Estadística descriptiva o deductiva. Estadística inferencial o inductiva.

La estadística descriptiva o deductiva trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones. Se construyen tablas y se representan gráficos que permiten simplificar en gran medida, la complejidad de todos los datos que intervienen en la distribución. Asimismo se calculan parámetros estadísticos que caracterizan la distribución. En esta parte de la estadística no se hace uso del cálculo de probabilidades, y únicamente se limita a realizar deducciones directamente a partir de los datos y parámetros obtenidos. La estadística inferencial o inductiva plantea y resuelve el problema de establecer previsiones y conclusiones generales sobre una población a partir de los resultados obtenidos de una muestra. Utiliza resultados obtenidos mediante la estadística descriptiva y se apoya fuertemente en el cálculo de probabilidades. La población es el conjunto de todos los elementos, que cumpliendo una condición, deseamos estudiar (por ejemplo: los habitantes de una ciudad, los alumnos de un colegio, las gallinas de una granja, etc.). Un individuo es cada uno de los elementos de la población. Una muestra es cualquier subconjunto de la población (por ejemplo: 100 alumnos del colegio, 1.000 habitantes de una ciudad, 300 gallinas de una granja, etc.). El saber seleccionar una muestra suficientemente representativa de la población a estudiar es fundamental para que los resultados del estudio sean fiables. Sobre cómo seleccionar una muestra existen todo un tratado llamado “Teoría de las muestras”, al cual haremos una aproximación más adelante. Cada una de las propiedades que se pueden estudiar se llama carácter estadístico (por ejemplo: talla, peso, sexo, estado civil, etc). Pueden ser cuantitativos si se pueden medir numéricamente (por ejemplo: la talla, el peso, etc) o cualitativo si no se puede medir numéricamente (por ejemplo: sexo, estado civil, etc). Al conjunto de valores que toma un carácter se le llama variable estadística que podrá ser cualitativa o cuantitativa, dependiendo de si el carácter es cualitativo o cuantitativo, respectivamente. Una variable será discreta si sólo puede tomar determinados valores (ej: número de hermanos, número de aprobados, etc). Una variable será continua si puede tomar todos los valores posibles de un intervalo (ej: altura de una persona, peso, etc). Tablas de frecuencias: Son tablas donde se reflejan los datos obtenidos y las diferentes frecuencias:

La frecuencia absoluta ( fi ) es el número de veces que se repite un valor (si están agrupados

en intervalos de clase, la frecuencia absoluta del intervalo será el número de veces que aparece un valor cualquiera de ese intervalo).

Page 2: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 2/11

La frecuencia relativa (ih ) de un valor es el cociente entre la frecuencia absoluta del valor y

el número total de datos N

fh i

i

La frecuencia absoluta acumulada ( Fi ) de un valor es la suma de todas las frecuencias

absolutas de los valores menores o iguales al valor.

La frecuencia relativa acumulada (iH ) de un valor es la suma de todas las frecuencias

relativas de los valores menores o iguales al valor. Propiedades de la frecuencia relativa:

1 .2

10 .1

n

1=i

i

i

h

h

A continuación vamos a estudiar el tratamiento de la información, es decir, cómo debemos proceder para analizar ordenadamente una muestra. Los pasos a seguir son:

1. Recogida de datos. Consiste en la toma de datos numéricos procedente de la muestra. 2. Ordenación de datos. Una vez recogidos los datos los colocaremos en orden creciente. 3. Agrupación de los datos en clase. En caso de que la variable sea continua o bien

discreta pero con número muy elevado de datos, es necesario agrupar los datos en intervalos, a los cuales llamaremos intervalos de clases. Respecto a cómo agruparlos y qué número de intervalos elegir, podemos decir que no existe una contestación tajante y hay varios criterios para dar respuesta a esta cuestión. Una de las teorías establece que debemos hacer un número de intervalos aproximadamente igual a la raíz cuadrada del número de datos, pero nosotros vamos a seguir otros criterios. Intentaremos hacer un número de intervalos comprendido entre 8 y 12. Llamaremos marca de clase al punto medio del cada intervalo. Una vez elegido el número, es aconsejable escoger los límites de los intervalos, de modo que sean múltiplos, pares, divisibles, etc., para lograr que la marca de clase no nos dé un número fraccionario o con muchos decimales. Esto nos facilitará luego el trabajo de cálculo. También tenemos que lograr que los intervalos sean de la misma amplitud y que el límite superior de uno coincida con el inferior del siguiente. Y por último adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha, esto quiere decir que si un valor de la variable queda justo en el límite de dos intervalos, siempre lo pondremos en el superior.

4. Recuento de frecuencia. Efectuaremos el recuento de los datos obtenidos. 5. Construcción de la tabla. Calcularemos las frecuencias absolutas, relativas,

acumuladas, porcentuales representaciones gráficas y todos aquellos datos que nos hagan falta para el estudio estadístico.

Page 3: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 3/11

Veamos unos ejemplos de tabulación de datos. Ejemplo 1: Un profesor tiene anotadas en su cuaderno las notas de 30 alumnos de una clase. Construir la tabla sabiendo que son las siguientes: 5 3 4 1 2 8 9 8 7 6 6 7 9 8 7 7 1 0 1 5 9 9 8 0 8 8 8 9 5 7

Xi Recuento fi Fi hi Hi pi Pi

0 // 2 2 2/30 2/30 2/30*100 2/30*100

1 /// 3 5 3/30 5/30 3/30*100 5/30*100

2 / 1 6 1/30 6/30 1/30*100 6/30*100

3 / 1 7 1/30 7/30 1/30*100 7/30*100

4 / 1 8 1/30 8/30 1/30*100 8/30*100

5 /// 3 11 3/30 11/30 3/30*100 11/30*100

6 // 2 13 2/30 13/30 2/30*100 13/30*100

7 ///// 5 18 5/30 18/30 5/30*100 18/30*100

8 ///// // 7 25 7/30 25/30 7/30*100 25/30*100

9 ///// 5 30 5/30 30/30 5/30*100 30/30*100

∑ 30 1 100

Ejemplo 2: Construir la tabla estadística de las edades de las personas que acuden a un logopeda a lo largo de un mes, sabiendo que son: 3 2 11 13 4 3 2 4 5 6 7 3 4 5 3 2 5 6 27 15 4 21 12 4 3 6 29 13 6 17 6 13 6 5 12 26

Clases

Marcas de

clases xi

fi Fi hi Hi

[0 5) 2,5 13 13 13/36 13/36

[5 10) 7,5 11 24 11/36 24/36

[10 15) 12,5 6 30 6/36 30/36

[15 20) 17,5 2 32 2/36 32/36

[20 25) 22,5 1 33 1/36 33/36

[25 30) 27,5 3 36 3/36 36/36=1

∑ 36 1

Page 4: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 4/11

2.- DIAGRAMA DE TALLOS Y HOJAS Una moderna técnica de recogida de datos es la que se conoce como diagrama de tallos y hojas Veamos a continuación con un ejemplo en qué consiste. Las puntuaciones obtenidas por 40 alumnos en un test han sido las siguientes: 41, 53, 72, 62, 81, 93, 81, 74, 56, 62, 45, 47, 62, 58, 88, 76, 77, 63, 43, 56, 76, 63, 78, 73, 65, 66, 91, 82, 61, 72, 36, 50, 91, 32, 60, 80, 51, 68, 61, 71. Para construir el diagrama de tallos y hojas, procedemos del siguiente modo:

Paso 1º

Se observa entre qué valores están las

cifras de las decenas de todos los datos, y

se tiene que van de 3 a 9.

Tallo

3

4

5

6

7

8

9

Paso 2º

Se va leyendo uno a uno cada dato,

anotando las cifras de las unidades en la

fila correspondientes.

Tallo

3 6 2

4 1 5 7 3

5 3 6 8 6 0 1

6 2 2 2 3 3 5 6 1 0 8 1

7 2 4 6 7 6 8 3 2 1

8 1 1 8 2 0

9 3 1 1

Así se obtiene una figura como esta.

Paso 3º

Por último se vuelve a escribir la tabla

ordenando de menor a mayor las unidades

dentro de cada fila.

Tallo

3 2 6

4 1 3 5 7

5 0 1 3 6 6 8

6 0 1 1 2 2 2 3 3 5 6 8

7 1 2 2 3 4 6 6 7 8

8 0 1 1 2 8

9 1 1 3

Al final obtenemos el diagrama.

Page 5: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 5/11

Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una línea poligonal que una los últimos números de cada fila.

Podemos sacar muchas conclusiones a la vista del diagrama:

o Hay dos alumnos con puntuaciones entre 30 y 39, y así sucesivamente. o Se puede observar que es una distribución ligeramente asimétrica a la derecha. o La clase con mayor frecuencia es la de 60-69 o Etc.

3.- GRÁFICOS ESTADÍSTICOS

Aun cuando las tablas estadísticas contienen toda la información, es conveniente expresarla mediante gráficos adecuados a la variable, con el fin de resaltar los aspectos más significativos y hacer la distribución más clara y evidente. Diagramas de barras Los diagramas de barras o bastones son especialmente útiles cuando se desea comparar datos cualitativos o cuantitativos de tipo discreto, no agrupados en intervalos. Para trazarlos se representan sobre el eje de abscisas los valores de la variable, y sobre el eje de ordenadas la frecuencia que se vaya a representar; o viceversa. A continuación, se levantan trazos gruesos de longitud igual a la frecuencia correspondiente a cada valor de la variable. Ejemplo.

Xi fi Fi

0 2 2

1 3 5

2 1 6

3 1 7

4 1 8

5 3 11

6 2 13

7 5 18

8 7 25

9 5 30

Page 6: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 6/11

Polígonos de frecuencias Los polígonos de frecuencia son especialmente útiles cuando se desea comparar datos cualitativos o cuantitativos de tipo discreto, no agrupados en intervalos. Se forman siguiendo el mismo procedimiento que para los diagramas de barras, pero no se trazan las barras, sino que se unen los puntos de las frecuencias mediante una línea. Se puede representar sobre el mismo diagrama de barras o incluso sobre un histograma (como veremos más adelante. Ejemplo.

Diagrama de Sectores Los diagramas de sectores representan las distintas modalidades de un carácter mediante sectores circulares. Cada valor viene representado por un sector circular de amplitud proporcional a su frecuencia. Normalmente se utilizan tantos por ciento para reflejar las frecuencias y la amplitud se calcula mediante una simple regla de tres. Ejemplo.

Page 7: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 7/11

Pictogramas Los pictogramas son dibujos alusivos a las distribuciones que se pretenden estudiar y que mediante su forma, tamaño, etc., ofrecen una descripción lo más expresiva posible de la distribución. Son gráficos poco precisos pero fáciles de interpretar a simple vista. Ejemplo.

Cartogramas Se llama cartogramas a los gráficos que se realizan sobre un mapa, señalando sobre determinadas zonas, con distintos colores o rayados lo que se trate de poner de manifiesto. Se suelen utilizar para representar renta per cápita, densidad de población, horas de sol, recursos hídricos, etc. Ejemplo.

Page 8: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 8/11

Histogramas Los histogramas se utilizan para distribuciones de variables agrupadas en intervalos. Se construyen representado en el eje de abscisa los límites de cada clase y en el eje de ordenadas la frecuencia que queramos representar. Luego se levantan los rectángulos correspondientes, con una base igual a las amplitudes de los intervalos y una altura igual a la frecuencia.

Ejemplo.

Como se observa, también se puede construir el polígono de frecuencia. Diagramas lineales o series temporales Los diagramas lineales son muy utilizados para mostrar las fluctuaciones de un determinado carácter estadístico con el paso del tiempo. Lo que interesa en el gráfico es la altura de la línea referida a la base del diagrama. Con frecuencia se aprovecha para representar sobre la misma escala varios diagramas lineales. Como por ejemplo ingresos y gastos; nacimientos y defunciones; etc.

Clases

Marcas de

clases xi

fi

[0 5) 2,5 13

[5 10) 7,5 11

[10 15) 12,5 6

[15 20) 17,5 2

[20 25) 22,5 1

[25 30) 27,5 3

∑ 36

Page 9: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 9/11

Pirámides de población Las pirámides de población se utilizan para estudiar conjuntamente la variable edad y el atributo sexo. El gráfico se obtiene representando en la ordenada el grupo de edad, y en la abscisa el sexo. Para la modalidad mujer se toma el semieje positivo, y para la modalidad hombre el semieje negativo. El estudio detallado de las pirámides de población aporta datos sobre aspectos sociológicos ligados a dicha población, cómo por ejemplo, catástrofes, guerras, control de natalidad, desarrollo de la población. Asimismo se pueden realizar previsiones para el futuro, como es el caso del estudio de las necesidades de las futuras pensiones.

Ejemplos de distintos tipos de gráficos.

Page 10: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 10/11

Resumen:

Estadística: Estadística descriptiva. Estadística inferencial. Población. Muestra. Individuo. Variables o carácter estadístico. Variables cualitativas. Variables cuantitativas. V. cuantitativas discretas. V. cuantitativas continuas. Tablas estadísticas. Intervalos o clases. Marcas de clase. Frecuencias absolutas, fi. Frecuencia absoluta acumulada, Fi.

Frecuencia relativa, hi.

Frecuencia relativa acumulada, Hi.

Diagrama de tallos y hojas Gráficos Para variables cualitativas o cuantitativas discretas. Diagramas de barras. Polígonos de frecuencias. Diagramas de sectores. Pictogramas. Para variables cuantitativas continuas. Histogramas. Polígonos de frecuencias (sobre el histograma). Diagramas de sectores. Pictogramas. Otros Cartogramas. Diagramas lineales. Pirámides de población.

Page 11: Gobierno de Canarias - Tema 1 ESTADÍSTICA DESCRIPTIVA · 2020. 2. 17. · Los diagramas de tallos y hojas son, en sí mismos, diagramas de frecuencias, pues basta con trazar una

Tema 1

Pg. nº 11/11

Ejercicio. Se ha pasado un test de 80 preguntas a 600 personas. El de respuestas correctas se refleja en la siguiente tabla. Se pide:

1. Elaborar la tabla con todas las frecuencias. 2. Representar de todas las formas posibles.

Respuestas [0 10) [10 20) [20 30) [30 40) [40 50) [50 60) [60 70) [70 80)

correctas

Numero de 40 60 75 90 105 85 80 65

personas

Respuestas Marca de

correctas clase xi fi Fi hi Hi pi Pi

[0 10) 5 40 40 0,06667 0,06667 6,6667 6,6667

[10 20) 15 60 100 0,10000 0,16667 10,0000 16,6667

[20 30) 25 75 175 0,12500 0,29167 12,5000 29,1667

[30 40) 35 90 265 0,15000 0,44167 15,0000 44,1667

[40 50) 45 105 370 0,17500 0,61667 17,5000 61,6667

[50 60) 55 85 455 0,14167 0,75833 14,1667 75,8333

[60 70) 65 80 535 0,13333 0,89167 13,3333 89,1667

[70 80) 75 65 600 0,10833 1,00000 10,8333 100,0000

∑ 600 1,00000 100