estadistica descriptiva tema 05 tablas y datos agrupados
Post on 18-Jul-2015
37.670 Views
Preview:
TRANSCRIPT
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
ÍNDICE.
TABLAS DE DATOS. ........................................................................................................................... 2
TABLAS DE FRECUENCIAS ............................................................................................................... 2
DATOS AGRUPADOS. ........................................................................................................................ 4
BIBLIOGRAFÍA .................................................................................................................................. 11
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
TABLAS DE DATOS.
El fin principal de un cuadro o tabla estadística es presentar datos de tal manera que el
lector pueda encontrar fácilmente las diferencias. Sirve para condensar la información
obtenida.
Las tablas por tanto permiten organizar la información para que esta pueda comprenderse de
manera clara. Si por ejemplo deseamos analizar los resultados de una votación, podemos
organizar los datos en una tabla de la de la siguiente forma:
Ejemplo 1:
CANDIDATO TOTAL
CANDIDATO 1 3
CANDIDATO 2 5
CANDIDATO 3 8
CANDIDATO 4 3
Ejemplo 2.
COLOR TOTAL
ROJO 2
AZUL 4
AMARILLO 2
VERDE 6
TABLAS DE FRECUENCIAS
Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo si
tenemos una muestra de las edades de 5 personas, solo organizamos las edades de manera
ascendente ó descendente.
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
Edad de los 5 miembros de una familia: 5, 8, 16, 38, 45
Por el contrario, cuando el tamaño de la muestra es grande y el recorrido de la variable es
pequeño (Recorrido se define como la resta entre el dato superior y el inferior), y
adicionalmente los datos se repiten podemos hacer una tabla de frecuencias (también
conocida como datos no agrupados).
Por ejemplo, si preguntamos el número de personas que trabajan en un grupo de 50 familias
obtenemos la siguiente tabla:
Personas Activas en 50 familias
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Podemos observar que la variable X toma valores comprendidos entre 1 y 4, por lo que
podemos realizar una tabla en la que resumamos y agrupemos estos datos de la siguiente
forma:
Personas
Activas
Número de Familias
1 16
2 20
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
3 9
4 5
Total Personas 50
La tabla también puede ser presentada como:
Xi fi
1 16
2 20
3 9
4 5
Total 50
Donde Xi representa la variable que se ha medido y fi el número de veces que esta se repite,
a esta connotación le llamamos también Frecuencia absoluta, la cual es el número de veces
que aparece un determinado valor en un estudio estadístico. Debe prestarse mucha
atención al uso de fi pues esta expresión debe contener la letra en minúscula.
DATOS AGRUPADOS.
Cuando el tamaño de la muestra y el recorrido de la variable son grandes, los datos se
organizan en tablas de datos agrupados. Suponga que se tiene la siguiente información
recopilada de una muestra cualquiera
207 165 340 206 155 178 171 149 135 419 268 413 456
218 499 322 168 126 131 214 138 329 402 469 123 423
385 269 121 214 326 222 224 212 123 193 442 219 272
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
230 294 257 362 418 473 144 182 337 353 182 343 430
233 313 346 432 171 227 322 480 278 243 168 465 187
297 226 343 459 213 392 205 345 431 298 371 307 156
381 350 365 324 423 381 431 360 166 363 386 381 354
196 472 159 181 309 120 481 263 142 454 363 146 337
414 469 250 252 493 296 240 138 364 214 238 364 135
180 268 268 382 386 458 351 393 158 141 125 140 306
185 307 284 395 445 439 388 500 407 316 491 439 299
Si organizáramos la información en una tabla de frecuencias tendríamos:
Xi fi
120 1
121 1
123 2
125 1
126 1
131 1
135 2
138 2
140 1
141 1
142 1
144 1
146 1
149 1
155 1
156 1
158 1
159 1
Xi fi
165 1
166 1
168 2
171 2
178 1
180 1
181 1
182 2
185 1
187 1
193 1
196 1
205 1
206 1
207 1
212 1
213 1
214 3
Xi fi
218 1
219 1
222 1
224 1
226 1
227 1
230 1
233 1
238 1
240 1
243 1
250 1
252 1
257 1
263 1
268 3
269 1
272 1
Xi fi
278 1
284 1
294 1
296 1
297 1
298 1
299 1
306 1
307 2
309 1
313 1
316 1
322 2
324 1
326 1
329 1
337 2
340 1
Xi fi
343 2
345 1
346 1
350 1
351 1
353 1
354 1
360 1
362 1
363 2
364 2
365 1
371 1
381 3
382 1
385 1
386 2
388 1
Xi fi
392 1
393 1
395 1
402 1
407 1
413 1
414 1
418 1
419 1
423 2
430 1
431 2
432 1
439 2
442 1
445 1
454 1
456 1
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
Xi fi
458 1
459 1
Xi fi
465 1
469 2
Xi fi
472 1
473 1
Xi fi
480 1
481 1
Xi fi
491 1
493 1
Xi fi
499 1
500 1
Evidentemente, la variable estadística tiene un recorrido muy grande, lo cual dificulta el
análisis de la información, por ello debemos organizar la información de manera tal que nos
permita realizar un análisis adecuado de la información.
Para ello vamos a organizar los datos agrupándolos en intervalos definidos, de igual
amplitud.
PASO 1.
Hallar el recorrido ó rango de los datos, esto se hace restando el dato mayor con el menor.
Rango= 500 – 120 = 380
PASO 2.
Determinar el numero de intervalos ó marcas de clase de los datos. Para ello existen varios
métodos
Método 1.
2� ≥ � ; donde K es el numero de marcas de clase (ó intervalos a definir), y n el
número total de datos.
Para nuestro caso n=143, por tanto necesitamos un numero K, tal que al elevar 2 a
este numero el resultado sea mayor ó igual a 143. El valor de K seria 8 puesto que
2� = 256 ≥ 143.
Método 2.
√� Cuando el valor de n no es grande. Para nuestro caso: √143 = 11,96
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
Método 3.
� = 1 + 3,22 × log �; resolviendo: � = 1 + 3,22 × log 143 = 7,94
De los tres métodos distintos podemos observar que el valor más adecuado será 8,
por tanto el numero de marcas de clase será 8.
PASO 3.
Hallar el ancho del intervalo de las marcas de clase. El calculo lo realizamos dividiendo el
rango (dato mayor menos dato menor) entre el numero de marcas de clase calculado (K).
� =�����
�=380
8= 47,5
Se aconseja que el valor del ancho de la marca de clase, en este caso 47,7 tenga el mismo
numero de decimales que los datos. Para nuestro ejemplo entonces, aproximamos 47,5 a 48.
PASO 4.
Determinar los nuevos limites.
Cuando se ha modificado el ancho del intervalo debemos también modificar los limites
reales, pues la ecuación expuesta en el paso 3 debe nuevamente coincidir.
� =��� !
�= 48 × 8 = 384=Nuevo rango
Pero el rango anterior es 380, por tanto debemos modificar los limites para que el nuevo
rango sea igual a 384, para debemos analizar cada uno de los limites.
Calculo de Limite inferior.
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
Nuevo limite inferior (NLI)
"#$ =%&
';
donde LI es el limite inferior.
"#$ =%&
'=
()*
�= 15
cuando esta división es exacta, no hacemos modificación alguna en el limite, por tanto el este
seguirá siendo 120.
Calculo de limite superior
Al igual que el calculo del limite inferior.
"#+ =#+
,=500
8= 62,5
Cuando tenemos estos datos, donde la división no es exacta, debemos:
Para el limite inferior aproximarlo a un dato más bajo, y cuando es el limite superior
aumentarlo al dato superior más próximo.
Para este caso, sabemos que el rango aumento de 380 a 384, es decir aumento una
diferencia de 4 unidades. Sabiendo que el limite inferior no lo modificaremos, solo nos queda
aumentar en 4 unidades el limite superior, decir aumentarlo de 500 a 504.
Calculamos nuevamente:
"#+ =#+
,=504
8= 63
Observemos una forma de comprobar nuestros cálculos:
El nuevo rango (384) debes ser resultado de la diferencia de los nuevos limites 504-120=384,
por tanto se cumple.
El ancho del intervalo debe ser igual a 48, resultado del nuevo rango sobre el numero de
marcas de clase.
� =�����
�=384
8= 48
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
Una vez analizada esta información, podemos realizar nuestra tabla de datos agrupados.
PASO 5.
Seleccionamos el limite inferior, 120 para nuestro ejemplo y le sumamos 48:
120+48=168
Nuestra primera marca de clase será
xi
120 ≤ xi < 168
Si continuamos con este proceso tendremos
xi
120 ≤ xi < 168
168 ≤ xi < 216
216 ≤ xi < 264
264 ≤ xi < 312
312 ≤ xi <
360
360 ≤ xi <
408
408 ≤ xi < 456
456 ≤ xi < 504
Por ultimo solo queda contar el número de datos existentes entre los intervalos.
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
Ejemplo 2:
Calcule la tabla de datos agrupados teniendo en cuenta los siguientes datos.
Limite inferior: 34
Limite superior: 235
Numero de datos: 156.
PASO 1:
Calculo del rango: 235 − 34 = 201
PASO 2:
Calculo del numero de marcas de clase
2� ≥ �; para este caso K=8
Con otro método
� = 1 + 3,22 × log 156 = 8,06
Por tanto utilizaremos el valor de 8
PASO 3.
Calculo del ancho del intervalo.
� =�����
�=201
8= 25,125
Si hacemos que a sea igual a 26, entonces el nuevo rango tendrá que ser igual a 208.
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
PASO 4.
Calculo de los nuevos limites.
"#+ =%&
'=
./
�= 4,25;
como el resultado debe dar como residuo cero, tenemos que aproximar, hacia abajo, el limite
inferior a el numero que permite una división exacta. El numero que mejor se aproximará
será 32, por tanto:
"#+ =#$
,=32
8= 4
Para el limite superior.
"#+ =#+
,=235
8= 29,375
Igual que el calculo anterior, aumentamos el limite superior hasta un numero que nos permita
obtener una división exacta, aumentamos de 235 a 240.
"#+ =#+
,=240
8= 30
Probamos
Rango = 240 – 32 = 208
� =�����
�=208
8= 26
Los dos resultados son favorables.
BIBLIOGRAFÍA
ANDERSON, D. R., SWEENEY, D. J., & WILLIAMS, T. A. (2008). ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA (10a Edición ed.). (S. R. CERVANTES GONZÁLEZ, Ed.) México D.F., México: CENGAGE Learning. CIRO MARTÍNEZ, B. (2001). ESTADÍSTICA BÁSICA APLICADA. Santa Fe de Bogotá: Eco ediciones. LIND, D. A., MARCHAL, W. G., & MASON, R. D. (2004). ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA (11 ed.). (F. D. CASTRO PEREZ, M. CUPA LEÓN, Edits., & M. D. HANO ROA, Trad.) Bogotá D.C., Colombia: ALFAOMEGA.
ESTADISTICA I
TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS
Iván Fernando Suarez Lozano
MENDENHALL, W. (1990). ESTADISTICA PARA ADMINISTRADORES (1era ed.). (N. GREPE P, Ed., & D. VALCKX VERBEECK, Trad.) México D. F., México: Grupo Editorial Iberoamérica S.A. de CV. Muñoz, D. R. (s.f.). http://www.eumed.net/cursecon/libreria/drm/1a.htm. Ramis, M. D. (s.f.). http://www.monografias.com/trabajos10/esta/esta.shtml.
top related