introducción a la estadística informática 2015 - 1
TRANSCRIPT
Introducción a la Estadística Informática
2015 - 1
Estadística descriptiva
La mayor parte de la información estadística que aparece en los diarios, revistas, informes y demás publicaciones consiste de datos resumidos y presentados en forma comprensible para el lector.
Estos resúmenes de datos, que pueden ser tablas, gráficos o indicadores, se llaman estadísticas descriptivas.
El objetivo de este capítulo es presentar algunos procedimientos usados para resumir datos cualitativos y cuantitativos.
Tablas y gráficos para datos cualitativos
Tablas de distribución de frecuencias Una tabla de distribución de frecuencias
muestra el número de unidades (frecuencia absoluta simple) que pertenece a cada una de las diferentes categorías de la variable.
El objetivo es proporcionar un resumen de datos que indique cómo se distribuyen las unidades en cada una de las categorías.
Se pueden utilizar, además de la frecuencia absoluta simple, la frecuencia relativa simple y la frecuencia porcentual simple.
Distribución de frecuencias Stat → Tables → Tally Individual Variables
…
Tally for Discrete Variables: Tipo de local
Tipo de local Count Percent Bodega 84 35.00 Farmacia 69 28.75 Ferreteria 27 11.25 Grifo 60 25.00 N= 240
Gráfico de barras Es una forma gráfica de representar datos
cualitativos que se han resumido en una distribución de frecuencias.
En el eje horizontal se encuentran las diferentes categorías de la variable.
En el eje vertical se grafican las frecuencias absolutas relativas o porcentuales usando barras verticales de ancho fijo cuya altura corresponde a la frecuencia utilizada.
Las barras se separan a fin de señalar que cada categoría es independiente.
Gráfico de barras Graph → Bar Chart → Simple …
Gráfico de barras agrupadas Graph → Bar Chart → Cluster …
Gráfico de sector circular
Es un método gráfico para representar distribuciones de frecuencias porcentuales para datos cualitativos.
Se divide un círculo en sectores, uno por cada categoría de la variable.
El ángulo central de cada sector circular es directamente proporcional a la frecuencia porcentual de la categoría a la que pertenece.
Gráfico de sector circular Graph → Pie Chart …
Diagrama de Pareto
Es usado ampliamente en los esfuerzos por incrementar la calidad.
Las categorías representan, por lo general, tipos distintos de defectos que se encuentran ordenados de acuerdo a su frecuencia absoluta o relativa.
Por lo general exhiben la ley de Pareto, “pocos vitales, muchos triviales”, es decir, la mayor parte de los defectos aparecen solo en unas cuantas categorías.
Diagrama de Pareto Stat → Quality Tools → Pareto Chart …
Tablas y gráficos para datos
cuantitativos discretos
Distribución de frecuencias
Tally for Discrete Variables: Personal
Personal Count Percent 1 30 12.50 2 66 27.50 3 98 40.83 4 46 19.17 N= 240
Stat → Tables → Tally Individual Variables …
Gráfico de Bastones Graph → Bar Chart …
Tablas y gráficos para datos
cuantitativos continuos
Tabla de distribución de frecuencias Los datos se encuentran agrupados en
intervalos de clase. Rango o amplitud de los datos (A):
• A = Valor máximo – Valor mínimo Cantidad de intervalos de clase (k):
• Regla de Sturges: k = 1+3.3 log10 n (se redondea al entero más cercano)
Tamaño del intervalo de clase (C):• C = A / k (se redondea por exceso a la misma
cantidad de decimales que tiene los datos)
Distribución de frecuenciasLímites Marca de
Clase
[ 25.0 – 28.9 [
26.95
[ 28.9 – 32.8 [
30.85
[ 32.8 – 36.7 [
34.75
[ 36.7 – 40.6 [
38.65
[ 40.6 – 44.5 [
42.55
[ 44.5 – 48.4 [
46.45
[ 48.4 – 52.3 [
50.35
[ 52.3 – 56.2 [
54.25
[ 56.2 – 60.1 ]
58.15
Histograma de frecuencias
Es una forma gráfica de representar datos cuantitativos que se han resumido en una distribución de frecuencias absolutas o porcentuales.
En el eje horizontal se encuentra la variable de interés y sobre el eje vertical se utilizan barras cuya base corresponde a la amplitud del intervalo de clase y cuya altura es la frecuencia correspondiente.
Las barras adyacentes se tocan entre si.
Histograma de frecuencias Graph → Histogram …
Polígono de frecuencias
Es la representación gráfica por medio de una figura poligonal cerrada.
Se obtiene uniendo, con segmentos de recta, el punto de intersección de cada marca de clase con su frecuencia correspondiente.
Este tipo de gráfico es adecuado para comparar el comportamiento de una variable analizada en dos muestras o investigaciones similares.
Polígono de frecuencias Graph → Histogram …
Ojiva Es la representación gráfica para las
frecuencias acumuladas absolutas o porcentuales.
Se obtiene uniendo con segmentos de recta el punto de intersección del límite superior de cada intervalo de clase con su frecuencia acumulada correspondiente.
Con este tipo de gráfico se puede obtener aproximadamente el porcentaje o proporción de datos que pertenecen a un intervalo determinado.
Ojiva Graph → Histogram …
Sturges con dos o más grupos de datos Para aplicar la regla de Sturges a dos o más grupos
de datos se debe trabajar con intervalos comunes. Rango o amplitud de todos los datos (A):
• A = Valor máximo – Valor mínimo Cantidad de intervalos de clase (k):
• k = 1+3.3 log10 n* (se redondea al entero más cercano) donde n* es el mayor en todos los grupos.
Tamaño del intervalo de clase (C):• C = A / k (se redondea por exceso a la misma
cantidad de decimales que tiene los datos)