-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
1/12
ANÁLISIS DESCRIPTIVO DE LOS DATOS TOMADOS EN EL PATIODE COMIDAS DEL TERMINAL TERRESTRE DE LA CIUDAD DE RIOBAMBA
INTRODUCCIÓN:
INTRODUCCION:
Después del análisis cuantitativo y cualitativo del patio de comida de la ciudad de
Riobamba, en el presente proyecto procedimos a describirlos y analizarlos mediante las
principales medidas de centralización y dispersión, tanto para datos agrupados como para
datos no agrupados y para esto es necesario conocer cuáles son las medidas de
centralización y dispersión y su utilización.
Medidas de Centralización o de Tendencia Central
Al desear describir grupos de observaciones, con frecuencia es conveniente resumir la
información con un solo número. Este número que, para tal fin, suele situarse hacia el centrode la distribución de datos se denomina medida o parámetro de tendencia central o de
centralización. Cuando se hace referencia únicamente a la posición de estos parámetros
dentro de la distribución, independientemente de que ésta esté más o menos centrada, se
habla de estas medidas como medidas de posición como los cuantiles.
Existen tres medidas comunes para identificar el centro de un conjunto de datos: la media,mediana y moda. En cada caso, se ubican alrededor del punto en donde se aglomeran losdatos.
Media: Medida de tendencia central usualmente llamada promedio, se define como ladivisión de la suma de todos los valores entre el número de datos.Esta medida también se llama media aritmética o media muestral.
Mediana: La mediana representa el valor de la variable de posición central en un conjuntode datos ordenados.En un conjunto de datos ordenados de manera creciente es el valor para el cual, la mitad deéstos es menor que éste valor y la otra mitad mayor. De modo que el 50% de datos sonmayores y 50% son menores que la mediana
Moda: Es el valor con una mayor frecuencia en una distribución de datos. Puede existir enuna muestra más de una moda. Por ejemplo, consideremos las siguientes observaciones se
dice que la muestra es bimodal ya que encontremos dos modas, es decir que estos dos datosque tengan la misma frecuencia absoluta máxima.
Si todas las variables tienen la misma frecuencia diremos que no hay moda.
Media ponderada: es una media aritmética, en la cual se considera a cada uno de losvalores de acuerdo con su importancia en el grupo.
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
2/12
RELACION DE MEDIA, MEDIANA Y MODA EN TÉRMINOS DE LAFORMA DE LA DISTRIBUCION.
Si la media y la mediana coinciden en valor la distribución es asimétrica.
Si, además, los datos tienen una sola moda esto es, son unimodales, entonces lamoda, la mediana y la media coinciden.
Si la moda < mediana < media con una larga entonces si la distribución está sesgadaa la derecha es decir es una Distribución Asimétrica negativa.
Si la media< mediana < moda la distribución está sesgada hacia la izquierda es decires una distribución asimétrica positiva.
Cuartiles: Los cuartiles son los valores de la variable que dividen los datos en cuatro partes,una vez ordenados de menor a mayor.Los cuartiles son:
Primer cuartil el 25% de los datos son menores, segundo cuartil o cuartil intermedio, el50% de los datos son menores que él. Coincide con la mediana, D5 y P50 y tercer cuartil ocuartil superior, deja el 75% de los datos de debajo. Coincide con P75.
Deciles: Los deciles son los nueve valores que dividen la serie de datos en diez partesiguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de losdatos. D5 coincide con la mediana.
Percentiles: Los percentiles son los 99 valores que dividen la serie de datos en 100 partesiguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de losdatos.
P50 coincide con la mediana
Medidas de dispersión.
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de ladistribución.
Una de las medidas de dispersión más elemental es el rango de una muestra.
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
3/12
El rango :Es la diferencia entre el valor máximo y el valor mínimo de las observaciones.
Varianza: La varianza es el promedio del cuadrado de las distancias s respecto a la mediade una distribución estadística.
La desviación estándar de un conjunto de observaciones es la raíz cuadrada positiva de la
varianza.Coeficiente de variación: CV es una medida de dispersión relativa expresada en porcentajede un conjunto de datos, que se obtiene dividiendo la desviación estándar entre la media.
OBJETIVO:
Objetivo General: Analizar las principales medidas de centralización y dispersión para datos
agrupados de valores anotados que fueron de interés del patio de comidas del
terminal de Riobamba
Objetivos Específicos:
Calcular e interpretar las medidas de centralización y dispersión para los precios delmenú que se encuentran en el patio de comidas de la ciudad de Riobamba.
Estudiar e interpretar las medidas de centralización y dispersión que se encuentran
en los valores cuantitativos de las horas pico de clientes.
Analizar e interpretar las medidas de centralización y dispersión en las edades tanto
de dueños como personal de los locales del patio de comidas.
Determinar e interpretar valores de las variables cualitativas que se puedan
encontrar en lo que corresponde a la atención del cliente.
Calcular e interpretar valores de las variables que se puedan determinar en el lugar
de procedencia de las personas que atienden el patio de comidas del terminal.
METODOLOGIA:
Para llevar a cabo nuestro trabajo de investigación realizamos lo siguiente:
1) En vista de que este trabajo es la continuación del anterior, y ya que nuestras
variables fueron bien seleccionadas se nos facilitara bastante.
2) Lo primero que hicimos fue realizar un análisis en conjunto de nuestro trabajo
anterior y corregimos los mínimos errores que teníamos.
3) Igual en conjunto elaboramos la respectiva introducción y objetivos.
4) Luego seleccionamos las medidas de centralización y dispersión, para nuestras
variables cualitativas.
5) De la misma forma seleccionas las medidas de centralización y dispersión para las
variables cuantitativas.
6) Luego realizamos el análisis e interpretación de cada una de las medidas.
7) Por ultimo realizamos las conclusiones de nuestro trabajo.
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
4/12
RESULTADOS Y DISCUSION:
APLICACIÓN DE MEDIDAS DE CENTRALIZACIÓN Y DISPERSIÓN PARA ELANALISIS DE DATOS:
PRECIOS DEL MENU
LOCAL A LOCAL B LOCAL C LOCAL D LOCAL E
Desayunos: 1.00 1.25 1.00 1.00 1.25
Batidos, Jugos: 0.75 0.75 0.50 1.00 0.75
Secos: 1.75 1.50 1.75 1.50 1.50
Almuerzos: 3.00 3.00 3.00 2.50 2.50
Encebollados: 2.00 1.75 2.50 2.00 2.50
TABLA DE FRECUENCIAS:
1.00 0.75 1.75 3.00 2.00 1.25 0.75 1.50 3.00 1.75 1.00 0.50 1.75 3.00 2.50 1.00 1.00 1.50
2.50 2.00 1.25 0.75 1.50 2.50 2.50
# de locales: 25
n=√25 = 5 I= 3.00- 0.5/5 = 0.5
PRECIOS DEL MENU F Fr
0.50 - 1.0 8 0.32
1.01-
1.51 5 0.2
1.52- 2.02 5 0.2
2.03- 2.53 4 0.16
2.54- 3.05 3 0.12
Los precios del menú del pato de comidas de mayor frecuencia se encuentran entre 50
centavos y un dólar y en menor frecuencia entre 2.53 y 3.04.
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
5/12
MEDIA:
X= ∑F.XC/n
X=8(0.75) + 5(1.26) + 5(1.77) + 4(2.28) + 3(2.78)/25
X=1.5444
MEDIANA
Me= Li+ (n/2-Fa)xW/F
Me= 1.01+(12.5-8/5)0.6
Me= 1.26
MODA:
Mo= Li+ (d1/d1+d2).w
Mo= 0.5+ (8/8+3)x0.6
Mo= 0.93
VARIANZA Y DESVIACIÓN ESTÁNDAR
S2= ∑F(XC-X)/n-1
S2=8(0.75-1.544)2+ 5(1.26-1.544)2+5(1.77-1.544)2+ 4(2.28-1.544)2+ 3(2.78-1.544)2/24
S2= 0.5188
S= 0.7203
COEFICIENTE DE VARIACIÓN
C.V= (S/X) x 100%
C.V= (0.7203/1.5444) x 100%
C.V= 46.63%
INTERPRETACIÓN
El Promedio de los precios que se encuentran en el patio de comidas del terminal de
Riobamba es de 1.54$, esto nos quiere decir que es un valor muy accesible para la
gente que desea comer bien y no con mucho dinero, es por esto una de las razones
que es muy frecuentado este lugar en la ciudad.
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
6/12
Los valores de los precios son menores a 1.26 y los mayores a este valor.
La dispersión es del 46.63% por lo que tiene una distribución algo uniforme y por lo
tanto es considerablemente confiable, es decir que los valores en la distribución son
en promedio casi homogéneos por lo cual nuestros datos nos pueden brindar mucha
información en lo que quieren expresar nuestro análisis, los precios son muyaccesibles en cuanto a comida se refiere y casi no varian mucho por lo cual el patio
de comidas es un lugar en el que se pueden comprar platos con valores aproximados
al dólar y medio.
HORA DE INGRESO DE CLIENTES:
Para el análisis de la variable cuantitativa ´´hora de ingreso de clientes´´ vamos a basarnos
en que el horario donde más se vende es de las 20:00 pm hasta 05:00am, y que el ingreso de
los clientes varia cada hora, a lo largo de la noche y madrugada. De la siguiente manera:
20:00; 21:00; 22:05; 23:05; 23:59; 00:55; 02:15; 03:29; 04:25; 20:45; 22:49; 02:15; 04:45;
20:30; 00:20; 02:35; 03:10; 00:45; 22:05; 02:35; 23:25; 20:30; 04: 35; 03:40; 02:35; 01:15;
00:14; 23:19; 22:18; 21:15; 20:10; 20:30; 21: 25; 22:29; 23:25; 00:20; 01:35; 02:52; 03:50;
04:45; 21:50; 01:35; 03:10; 22:38; 01:15; 03:18; 20:45; 21:40; 22:38; 23:33; 00:32; 01:43;
03:10; 04:05; 05:00; 22:05; 01:43; 03:40; 23:05; 01:35; 03:50; 04:15; 01:50; 23:25; 04:05;
01:50; 22:29; 04:15; 03:18; 01:50; 00:45; 23:42; 22:49; 21:50; 20:55
Ingreso de
clientes(hora) F Fr F% Fa Xc Fra20:00 – 21:00 10 0.13 13 10 20.5 0.13
21:01 – 22:00 4 0.05 5 14 21.5 0.18
22:01 – 23:00 10 0.13 13 24 22.5 0.31
23:01 – 00:00 9 0.12 12 33 23.5 0.43
00:01 – 01:00 7 0.09 9 40 00.5 0.52
01:01 – 02:00 10 0.13 13 50 01.5 0.65
02:01 – 03:00 6 0.08 8 56 02.5 0.73
03:01 – 04:00 10 0.13 13 60 03.5 0.86
04:01 – 05:00 9 0.12 12 75 04.5 0.98
75 0.98 98%
MEDIA (X):
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
7/12
1020.5 + 421.5 + 1022.5 + 923.5 + 7 0.5 +10 1.5 + 62.5 + 10 3.5 + 9 4.575 X= 11.15 = 23:15pm
Con este resultado de la media podemos decir que la clase que la contiene se encuentra
entre las 23:01 pm – 00:00am
MEDIANA (Me):
+ 2
0.01 + 75 2 337 2
1.3 → 1:30 Según el resultado de la mediana podemos interpretar que el 50% de los clientes ingresaron
en horas inferiores a la 1:30 am y el otro 50% ingresaron en horas superiores a 1:30 pm.
CUARTIL 1
1 + 4
1 22.01 + 18.75 4 1424 2 C1= 22:40pm
Según el cuartil 1 el 25% de los clientes ingresan a horas inferiores a 22:40pm.
RANGO
>
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
8/12
EDADES DE LOS EMPLEADOS Y DUEÑOS DE LOS LOCALES DECOMIDA.
Para el análisis de la variable cuantitativa las “Edades de los empleados y dueños queforman de los puestos de comida del terminal terrestre de Riobamba” vamos a basarnos en
las siguientes edades:
Análisis de 35, 36, 42 39, 48, 52, 31, 37, 40, 41, 48, 46, 29, 33, 37, 45, 58, 60, 52, 54, 55,
28, 29, 48, 42, 43, 50, 39, 45, 47, 46, 39, 34, 58, 54, 52, 51, 56, 57, 44, 33, 58, 29, 26, 45,
27, 38, 49, 47, 35, 36, 41, 31, 38, 45, 52, 49, 44, 36, 37, 28, 40, 30.
EdadesF Fr F% Fa Xc Fra
26-30 8 0.127 12.7 8 28 0.127
31-34 7 0.111 11.1 15 33 0.238
36-40 13 0.206 20.6 28 38 0.44441-45 11 0.175 17.5 39 43 0.619
46-50 10 0.159 15.9 49 48 0.778
51-55 8 0.127 12.7 57 53 0.905
56-60 6 0.095 9.50 63 58 1
63 1.000 100
En esta variable podemos observar que la edad de los dueños y empleados que forman
parte del patio de comida del terminal terrestre de Riobamba se encuentra con mayorfrecuencia entre personas que están entre los 36 y 40 años mientras que con menor
frecuencia se encuentran personas mayores que están entre los 56-60 años.
Media
∗
=
̅ 8 ∗ 28 + 7 ∗ 33 + 13 ∗ 38 + 11 ∗ 43 + 10 ∗ 48 + 8 ∗ 53 + 6 ∗ 58
63
̅ 42.44 Que las edades de los empleados y dueños que conforman los puestos de comida del
terminal terrestre de Riobamba se encuentran en una edad media de 42.44 años
mostrándonos que la mayoría de las personas son adultas.
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
9/12
Mediana
+ ⁄ − ∗ ≥ ≥ ≥ 31.5
+ ⁄ −
∗
. Que la mitad de las edades de los dueños y empleados que conforman los puestos de
comida del terminal terrestre de Riobamba se encuentran en edades menores a 47.79 y la
otra mitad en edades mayores a 47.79 años
Moda
+ (
+ ) ∗
36 + ( 66 + 2) ∗ 5 39.75
Encontramos con mayor frecuencia que los dueños y empleados están en edad de 39.75
años es decir que en la muestra hay un mayor número de individuos con esta edad.
Cuartil
+ ∗
3 36 + 3 ∗ 6 3 10 1513 ∗ 5
3 37.5
El 75% de los dueños y empleados se encuentran en edades mayores a 37.5 años de edad.
Es decir que una cuarta parte de los dueños y empleados tienen edad superior a los 37.5
años y el resto una edad inferior.
Desviación media
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
10/12
| |
=
|.| + |.| + |.| + |.| + |.| + |.| + |.|
. Que las edades de los dueños y empleados que conforman los puestos de comida del
terminal terrestre de Riobamba de de 42.44 años se desvía en un promedio de 7.61 años.
Varianza y desviación estándar
∑ − −
= √ ∑ − −
=
. +. + . + . + . +. + .
. . Nos muestra que las edades de los dueños y empleados se encuentran dispersas en un 9.16
es decir que las edades varían significativamente. En los dueños y empleados que
conforman los puestos de comida del terminal terrestre de Riobamba.
Coeficiente de variación
. ∗
. 9.1642.44 ∗ 100
. 21.58%
Se puede decir que las edades de los empleados y dueños de los puestos de comida en el
terminal terrestre de Riobamba son homogéneos, debido a que hay menor variabilidad en
las edades.
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
11/12
APLICACIÓN DE VARIABLES CUALITATIVAS PARA EL ANALISIS DEDATOS:
ATENCIÓN AL CLIENTE:
Atención Frecuencia Frecuencia
R.
Excelente 10 0.4
Bueno 7 0.28
Regular 3 0.12
Malo 5 0.2
Moda
La moda correspondiente a la calidad de servicio dada en el patio de comidas del
terminal terrestre es excelente ya que en esta se obtuvo una mayor frecuencia con un
dato igual a 10.
LUGAR DE PROCEDENCIA DE LAS PERSONAS QUE TRABAJAN EN ELPATIO DE COMIDAS DEL TERMINAL TERRESTRE DE RIOBAMBA:
Moda
La moda en la variable lugar de procedencia de las personas que trabajan en el terminal
terrestre del patio de comidas del Terminal terrestre de la ciudad, es Riobamba debido a
que es el lugar que tiene la mayor frecuencia (33)
CONCLUSIONES:
Al calcular las medidas de centralización y dispersión de los precios del patio de comida se
obtiene que 1.54 es el valor promedio de los precios, el 50% de los precios son menores a
1.26 por lo tanto el restante 50% es mayor a este valor. La dispersión es del 46.63% por lo
Cantones F Fr
Riobamba33 0,52
Colta 7 0,11
Guano 11 0.17
Chambo 9 0.14
Esmeraldas 3 0,05
63 0.99
-
8/17/2019 Trabajo de Investigacion de Bioestadistica(2)
12/12
que tiene una distribución algo uniforme y por lo tanto es considerablemente confiable, por
lo que los datos casi homogéneos.
Al calcular las medidas de centralización y dispersión de los valores cuantitativos de las
horas pico de los clientes se obtiene que el promedio de mayor visita de las personas al
patio de comidas se da entre 23:01 pm – 00:00am; el 50% de los clientes ingresaron a
horas mayores a la 1:30 am por lo tanto el 50% restante de clientes ingresaron ahoras menores de la indicada anteriormente, el 25% de los clientes ingresan a horas
inferiores a 22:40pm. El valor que se obtuvo del rango es 1:50 am lo que indica que
la dispersión es menor y los datos son confiables.
Al calcular las medidas de centralización y dispersión de las edades de dueños de locales y
de su respectivo personal se obtiene que el promedio de las edades es de 42.44 años; el
50% de las personas que se encuentran trabajando en el patio de comidas se
encuentran en edades menores a 47.79 por lo que el restante 50% tienen edades
mayores a la ya dicha anteriormente; la edad más frecuente es 39.75. Se encontró
que el 75% de los dueños y empleados se encuentran en edades mayores a 37.5 años
de edad. La media se desvía en un promedio de 7.61 años; la varianza se obtiene un
valor de edades de 9.16, es decir que las edades varían significativamente. El
coeficiente de variación es igual a 21.58%, es decir que los datos son homogéneos.
La moda correspondiente a la calidad de servicio dada en el patio de comidas del
terminal terrestre es excelente ya que en esta se obtuvo una mayor frecuencia con un
dato igual a 10.
Al estudiar la moda correspondiente al lugar de procedencia de los trabajadores se
obtuvo que la mayoría proviene de la ciudad de Riobamba ya que esta posee la
mayor frecuencia con un dato igual a 33
BIBLIOGRAFIA:
Días, Yolanda. “Medidas de Centralización y de Dispersión”. Bioestadística.Escuela Superior Politécnica de Chimborazo. 15 de Octubre 2013.
Días, Yolanda. “Organización y Representación de datos ”. Bioestadística. EscuelaSuperior Politécnica de Chimborazo. 17 de septiembre de 2013
David S. Moore, Estadística aplicada básica, 8va edición ,2008.
ESTADISTICA
www.vitutor.com/estadistica/descriptiva/a_1.htm
BIOESTADISTICA www.seh-lelha.org/stat1.htm
http://www.google.es/search?hl=es&tbo=p&tbm=bks&q=inauthor:%22David+S.+Moore%22http://www.vitutor.com/estadistica/descriptiva/a_1.htmhttp://www.vitutor.com/estadistica/descriptiva/a_1.htmhttp://www.vitutor.com/estadistica/descriptiva/a_1.htmhttp://www.google.es/search?hl=es&tbo=p&tbm=bks&q=inauthor:%22David+S.+Moore%22