virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · web view2.1...

17
Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas 2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas. El proceso de tabulación consiste en el recuento de los datos que están contenidos en los cuestionarios. En este proceso incluimos todas aquellas operaciones encaminadas a la obtención de resultados numéricos relativos a los temas de estudio que se tratan en los cuestionarios. Se requiere una previa codificación de las respuestas obtenidas en los cuestionarios. Realizamos tabulación, codificación y diseño de gráficos con datos biográficos, de consumo o de opinión. Los resultados serán presentados en tablas y/o mapas gráficos que expliquen las relaciones existentes entre las diversas variables analizadas. Esta presentación se adecuará a la petición de nuestros clientes mediante análisis estadísticos de datos, grabados por nosotros o por terceros, análisis 18

Upload: others

Post on 02-Apr-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

2.1 Tabulación

La palabra tabular significa expresar u ordenar unos datos en forma de tablas.

El proceso de tabulación consiste en el recuento de los datos que están contenidos en los cuestionarios. En este proceso incluimos todas aquellas operaciones encaminadas a la obtención de resultados numéricos relativos a los temas de estudio que se tratan en los cuestionarios. Se requiere una previa codificación de las respuestas obtenidas en los cuestionarios. Realizamos tabulación, codificación y diseño de gráficos con datos biográficos, de consumo o de opinión. Los resultados serán presentados en tablas y/o mapas gráficos que expliquen las relaciones existentes entre las diversas variables analizadas. Esta presentación se adecuará a la petición de nuestros clientes mediante análisis estadísticos de datos, grabados por nosotros o por terceros, análisis bivariantes, análisis multivariantes, tests de contraste de hipótesis

2.2 ¿Qué es una distribución de frecuencia?

Una distribución de frecuencias es un conjunto de puntuaciones ordenadas en sus respectivas categorías.

18

Page 2: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

VARIABLE: CONDUCTOR REFERIDO

CATEGORÍAS CÓDIGOS FRECUENCIAS

AMT 1 50LEM 2 88FGI 3 12MML 4 3

TOTAL 153

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

2.3 El elemento clase de la distribución de frecuencia.

2.3.1 Frecuencia de clase

Se llama frecuencia de clase a la reunión de grandes cantidades de datos sueltos distribuidos en clases o categorías, determinando el número de individuos que pertenecen a cada categoría.

Estatura(pulg)

Número de estudiantes

60 - 6263 - 6566 - 6869 - 7172 - 74

51842278

Total 100

2.3.2 Distribución de frecuencia o tabla de frecuencia

Se conoce como distribución de frecuencias o tablas de frecuencias a una disposición tabular de los datos por clases con su correspondiente frecuencias de clase.

2.3.3 Datos agrupados

A los datos así organizados y reunidos, como en la anterior distribución de frecuencias, se llama datos agrupados. Esto proporciona una visión amplia y clara, además de que se obtienen relacionados evidentes.

2.3.4 Intervalos de clase y límites de clase

Intervalo de clase Símbolo que define una claseEjemplo:

19

Page 3: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

60 - 62 , 72 - 74

límite inferior límite superior

Aun intervalo de clase que, por lo menos teóricamente no tiene límite de clase inferior o superior se le llama intervalos abierto.

Ejemplo:

65 años o más

2.3.5 Fronteras de clase

En el ejemplo anterior el intervalo 60 – 52 incluye todas las medidas desde 59.5 pulg. y 62.5 pulg., a estos números se les llaman frontera de clase o límites verdaderos de clase.

De aquí:

59.5 es la frontera inferior de clase62.5 es la frontera superior de clase

2.3.6 Tamaño o amplitud de un intervalo

Es la diferencia entre las fronteras de clase inferior y superior. Si todos los intervalos de una distribución de frecuencias son de las misma amplitud, a esta amplitud común se la denota por c.

Ejemplo:

62.5 - 59.5 = 365.5 – 62.5 = 3

2.3.7 Marca de clase

La marca de clase, que es el punto medio del intervalo de clase, se obtiene promediando los límites inferior y superior de la clase. De este modo:

Del ejemplo anterior tenemos el intervalo 60 - 62 Marca de la clase: (60 + 62)/2 = 61

La marca de clase es, en definitiva, el valor que representa a la información contenida en el intervalo.

2.3.8 Rango

20

Page 4: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

Es la diferencia entre el número mayor y el número menor de os datos sueltos.

Ejemplo:

Supongamos que las alturas de plantas, en una clase de botánica son las siguientes:

64 73 68 68 76 70 62 67 71 6968 60 65 68 66 68 67 71 66 72

Luego el rango de estos datos es:

R = 76 – 60 = 16

2.4 Reglas generales para construir distribución de frecuencias

1. Determinación del Rango.- Es conveniente primero determinar el rango de los datos obtenidos.

2. Determinación del número de clase.- Cosiste en dividir el rango en un número conveniente de intervalos de clase, generalmente del mismo tamaño. Es conveniente tener entre 5 y 20 intervalos de clase. Entre más datos se tengan, más intervalos de clase deben considerarse. No hay fórmula exacta para calcular el número de intervalos de clase. Este número es determinado por tentativas y aproximaciones. Sin embargo se puede, en principio tomar en cuenta lo siguiente:

a) Número de clases = K = 5, si n = tamaño de la muestra <= 5 y K = √n , si n > 20

b) Fórmula de Sturges:

K = 1 + 3.22 log(n)

Cuando los resultados para obtener K en a) y b) son números reales con decimales, entonces se redondearán al entero inmediato mayor.

3. Determinación del tamaño de los intervalos.- Como regla general para encontrar la longitud de los intervalos (del mismo tamaño), divídase el rango de las observaciones entre el número de intervalos de clase, esto es, Amplitud de clase = C = R/K.

4. Determinación de los límites de la clase.- Se debe tomar el resultado numérico más bajo de los datos originales como el límite inferior del primer intervalo de clase. Agregar C para obtener el límite superior de dicha clase.

21

Page 5: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

5. Determinación de la frecuencia de clase.- Consiste en determinar el número de observaciones que caen en cada intervalo de clase.

Técnicas de recuento

El proceso manual de recuento se puede hacer por:

2.5 Frecuencias absoluta simple

Frecuencia absoluta de un dato (fi)

Llamaremos frecuencia absoluta de un valor x i de la variable estadística x, al número de veces que aparece repetido dicho valor en el conjunto de las observaciones realizadas.

Ejemplo

Se quiere saber el número de hijos por matrimonio de un pequeño poblado. Para este propósito, se elige una muestra representativa de  50  matrimonios de ella se obtienen los siguientes datos:

2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 , 7 , 4 , 2 , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5, 2 , 1 , 2 , 4 , 0 , 3 , 3 , 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1

x i f i

0 41 92 123 104 85 46 27 1

Frecuencia absoluta acumulada de un dato (Fi)

22

Page 6: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

La frecuencia absoluta acumulada indica cuantos elementos de la lista de datos son menores o iguales a un valor dado. Es la suma de las frecuencias absolutas desde la primera fila hasta la fila elegida.

Por ejemplo anterior, sabemos que hay  25  matrimonios de la muestra que tienen 2 o más hijos.

x i f i F i

0 4 41 9 132 12 253 10 354 8 435 4 476 2 497 1 50

2.6 Frecuencia  relativa

Frecuencia relativa de un dato ( hi )

La frecuencia relativa es el cociente entre la frecuencia absoluta  ( fi )  y  el número total de datos ( n ).

hi = fi /nEn nuestro ejemplo:

 

x i f i F i h i

0 4 4 0,081 9 13 0,182 12 25 0,243 10 35 0,204 8 43 0,165 4 47 0,086 2 49 0,047 1 50 0,02

Frecuencia relativa acumulada de un dato ( Hi )

La frecuencia relativa acumulada es el cociente entre la frecuencia absoluta acumulada  ( F i )  y el número total de datos  ( n ).En nuestro ejemplo:

 

23

Page 7: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

x i f i F i h i H i

0 4 4 0,08 0,081 9 13 0,18 0,262 12 25 0,24 0,503 10 35 0,20 0,704 8 43 0,16 0,865 4 47 0,08 0,946 2 49 0,04 0,987 1 50 0,02 1,00

2.7 Representación grafica de variables cuantitativas

Las más usadas son:

1. Diagrama de barras.

Esta forma de representación gráfica es propia de las distribuciones que tienen muchas observaciones pero pocos valores distintos de la variables.

Dicho diagrama se elabora colocando en el eje de las abscisas los distintos valores de la variable y sobre cada una de ellas se levanta una línea perpendicular, cuya altura es la frecuencia (absoluta o relativa) de dicho valor.

24

Page 8: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

2. Histogramas.

Es una representación gráfica de una distribución de frecuencia agrupaciones en intervalos de clase, mediante una serie de rectángulos contiguos que tienen:

a) Sus bases sobre un eje horizontal (eje de las X) con centros en las marcas de clase y longitud igual al tamaño de los intervalos de clase.

b) Las alturas proporcionales a la frecuencia (absoluta o relativa) tomados sobre el eje de las Y.

A veces conviene más graficar en el histograma las frecuencias relativas en lugar de las frecuencias absolutas. En este caso, la altura correspondiente a cada rectángulo que habrá que levantar sobre el eje de ordenadas será el cociente entre la frecuencia relativa del mismo y la amplitud del intervalo. El único cuidado que debe tenerse es que el área total del histograma sea igual a 1, correspondiente a la suma total de áreas de cada rectángulo.

Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

25

Page 9: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

PuntajesX

frecuencia absoluta Marca de Clase

11 – 17 6 1417 – 23 4 2023 – 29 15 2629 – 35 13 3235 – 41 1 3841 – 47 1 44

Total 40

3. Polígono de frecuencia

a) Si la variable es discreta, el polígono de frecuencia se obtienen uniendo los extremos superiores de las barra en el diagrama de barras

26

Page 10: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

b) Si la variable está agrupada en intervalos de clase, el polígono de frecuencia se obtiene uniendo los puntos medios de las bases superiores de cada rectángulo en el histograma.

4. Polígono de frecuencia acumuladas u ojiva

Esta representación es válida para variables estadísticas agrupadas en intervalo clase.

27

Page 11: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

En el eje de las abscisas representamos los distintos intervalos de clase que han de estar naturalmente traslapados. En el extremo superior de cada intervalo se levanta una vertical con altura igual a la frecuencia (absoluta y relativa) acumulada, luego se unen los extremos superiores de las verticales con segmentos rectilíneos. Así por ejemplo el polígono de frecuencia acumuladas absolutas alcanzará su máxima altura en el último intervalo.

2.8 Representación de variables cualitativas

a) Diagrama de rectángulos o de Barras

Se representa en el eje de las abscisas los distintos caracteres cualitativos y se levantan sobre ellos rectángulos de bases iguales que no tiene porque estar traslapados y cuya altura será igual a la frecuencia absoluta correspondiente.

Ejemplo:

FACULTAD NUMERO DE ALUMNOSIngeniería Metalúrgica 200Economía 1500Ingeniería Industrial 3000Contabilidad 800Derecho 700Ciencias de la Comunicación 900Ingeniería de Sistemas 400Ciencias Administrativas 600

28

Page 12: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

Ejemplo:

Causa del AccidenteSexo

TotalMasculino Femenino

Accidentes de transporte 1145 232 1377

Sumersión accidental 346 92 438

Caída 242 101 343Envenenamientos 58 43 101Otros accidentes 653 311 964

TOTAL 2444 779 3223

29

Page 13: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

b) Diagramas de sectores o Gráfico Sectorial

Es una representación de un conjunto de datos estadísticos, en un círculo, por medio de sectores circulares. Es utilizado principalmente cuando se pretende comparar cada valor de la variable con el total.

Causa del AccidenteSexo

TotalMasculino Femenino

Accidentes de transporte 1145 232 1377

Sumersión accidental 346 92 438

Caída 242 101 343Envenenamientos 58 43 101Otros accidentes 653 311 964

TOTAL 2444 779 3223

30

Page 14: virtual.usalesiana.edu.bovirtual.usalesiana.edu.bo/web/conte/archivos/1917.docx · Web view2.1 Tabulación La palabra tabular significa expresar u ordenar unos datos en forma de tablas

Universidad Salesiana de Bolivia Ejecución del Trabajo Estadístico Carrera de Ingeniería de Sistemas

c) Pictogramas

Es un gráfico con dibujos alusivos al carácter que se está estudiando y cuyo tamaño es proporcional a la frecuencia que representan; dicha frecuencia se suele indicar.

¿En qué mes se plantaron menos árboles?, ¿y en cuál se hicieron más plantaciones?

31