agrupaciÓn de datos para variables discreta y continua
DESCRIPTION
AGRUPACIÓN DE DATOS PARA VARIABLES DISCRETA Y CONTINUA. Prof. Romy Culí Zavala. La Estadística se preocupa de la ordenación y sistematización de datos para poder apoyar el proceso de toma de decisiones: La forma en que se ordenan los datos varía de acuerdo al tipo de variable de que se trata. - PowerPoint PPT PresentationTRANSCRIPT
AGRUPACIÓN DE DATOS PARA VARIABLES DISCRETA Y
CONTINUA
Prof. Romy Culí Zavala
La Estadística se preocupa de la ordenación y sistematización de datos para poder apoyar el proceso de toma de decisiones: La forma en que se ordenan los datos varía de acuerdo al tipo de variable de que se trata.
A) Estadística de Variable Discreta: Se analiza el siguiente ejemplo:
Preocupada por las metas planteadas por el nuevo Gobierno, la Ministra de Salud se decide investigar el número de pacientes diarios que atiende la atención Primaria en la actualidad. Para ello la Ministra solicita al Jefe de la Dirección Regional Sur del Ministerio, le entregue la información con respecto a la información básica, que presta el Hospital Sótero del Río. El funcionario le despacha la siguiente información:
40 42 45 38 45
41 42 45 42 41
39 37 35 40 43
40 44 35 42 41
37 38 37 42 41
39 43 45 45 37
40 41 43 35 45
El total de las observaciones de la variable es de 35 y se simboliza con la letra n; n: 35.
Tal como fueron enviados los datos no prestan mucha utilidad para efectos de poder tomar las decisiones necesarias, que permitan eliminar las filas en los consultorios. Es necesario ordenar la información.
Cada uno de los números escritos en la tabla representa el número de pacientes atendidos en un día cualquiera, o sea representan un valor para la variable, siendo el total 35, (35 días). Por convención le asignaremos la letra X.
X: número de pacientes atendidos en un día determinado.
35 35 35 37 37
37 37 38 38 39
39 40 40 40 40
41 41 41 41 41
42 42 42 42 42
43 43 43 44 45
45 45 45 45 45
Ordenados los datos, se concluye lo siguiente:
La variable asume un total de nueve valores
El menor dato es 35 y el mayor es 45. Cada uno de los datos que asume la
variable se denomina CLASE y se denomina m, en este caso m= 10.
Se dispondrá un mejor ordenamiento a través de un Cuadro de Distribución de Frecuencias.
Val. Variable
Frec. Absol.
Frec. Relat.
Frec abs. Acumulada
Frec. Relat.Acumulada
xi ni hi Ni Hi
35
36
37
38
39
40
41
42
43
44
45
∑ni= 35 ∑hi = 1 = 100%
La primera columna contiene las clases (pacientes)
La segunda columna corresponde a la Frecuencia absoluta (días)
Cualquier Frecuencia absoluta tiene las siguientes propiedades:
0 ≤ ni ≤ n ∑ ni =n
La Frecuencia Relativa Hi = ni/n Al realizar una investigación, los
valores de esta columna se entregan en porcentaje.
Por ejemplo, se puede afirmar que el 8,57% de los días, el consultorio atiende 35 consultas.
Propiedades: ∑hi = 1 0≤ hi ≤ 1
En relación a la cuarta columna: Frecuencia absoluta acumulada.
Si a la Ministra de la Salud le interesara saber en cuantos días se atendió al menos 40 pacientes, sólo debe remitirse a la tabla y observar la frecuencia absoluta acumulada de ese valor de la variable, en el ejemplo es 15.
Las variables continuas también requieren ser ordenadas para ser adecuadamente analizadas. El Ministerio de Educación realiza un estudio para determinar el monto de las subvenciones anuales entregadas a colegios de Iquique. Para ello se selecciona una muestra de 40 de ellos, los montos de subvención son los que a continuación se detallan (expresados en millones de pesos):
8,5 9,3 10,4 6,6 7,9
7,6 8,4 9,3 7,6 10,1
13,3 12,1 10,6 12,4 11,5
11,3 13,1 13,5 14,6 12,3
9,4 7,8 8,3 9,1 7,9
10,2 11,3 11,7 12,8 13,4
11,3 12,1 13,6 14,1 13,2
14,4 11,8 13,8 11,3 10,6
Dada la gran cantidad de valores que adopta la variable continua, es prudente definir intervalos para efectos prácticos
a) Buscar el menor y el mayor valor de la variable en las observaciones
b) Escoger una amplitud de intervalo adecuada, la amplitud del intervalo se denota con la letra c. Esta amplitud debe ser la misma para todos los intervalos.
c) Para efectos de facilitar la tabulación, debe procurarse que el límite inferior de los intervalos debe ser un número entero.
Ni Marca de Clase
Frec. Absoluta
Frec. Relativa
Frec. Absol.Acumulada
Frec. Relat. Acumulada
Xi-1 – x`i xi ni hi Ni Hi
6 – 6,99
7 – 7,99
8 – 8,99
9 – 9,99
10 – 10,99
11 – 11,99
12 – 12,99
13 – 13,99
14 - 15