portafolio estadistica descriptiva
TRANSCRIPT
PORTAFOLIO ESTADISTICA DESCRIPTIVA
PRIMER CORTE
LIZETH NATALIA SAENZ ROAALISON SAMANTA BERNAL TORRES
CAMILA ANDREA TUMAY GOMEZ
CONTADURIA PÚBLICA
GRUPO 501-III SEMESTRE
UNIVERSIDAD COOPERATIVA DE COLOMBIA
https://www.examtime.com/es-ES/p/2199928
https://www.examtime.com/es-ES/p/2200913-Estad-stica---contaduria-publica--mind_maps
SOLUCION GUIA COMPENDIO #1
Ejercicio para practicar en R:
A. y= x2
x2+1
B. y=ln( x2
x2+1 )
C. y=2x4−5 x3+3
FRECUENCIAS:
Para comprender el concepto de frecuencia partimos de una situación real
que a diario sucede en las aulas de clase con un grupo de estudiantes de
educación primaria.
Un Profesor de geografía tiene registrado en su informe de logros la
información de 20 estudiantes con los siguientes resultados.
E S A S D I A S E D
A I S E D A S A D I
Los datos de los logros obtenidos se pueden registrar en la siguiente tabla.
La tabla muestra en forma organizada los resultados de los logros y la
cantidad de estudiantes que alcanzaron una determinada valoración. Al
respecto podemos decir:
4 estudiantes obtuvieron D en geografía
3 estudiantes obtuvieron I en geografía
5 estudiantes obtuvieron A en geografía
5 estudiantes obtuvieron S en geografía
3 estudiantes obtuvieron E en geografía
Logro
s
No de estudiantes
DIASE
43553
CLASES DE FRECUENCIAS
FRECUENCIA ABSOLUTAS: (f)
Resultan del conteo directo, de los datos que se repiten en una distribución.
La suma de todas las frecuencias absolutas es el tamaño de la muestra.
fi = n
f = f1 + f2 + f3 + ... + fn = n; n es el tamaño de la muestra.
Para nuestro ejemplo la tabla de frecuencias absolutas quedaría.
Logro
s
f
DIASE
43553
20
Algunos datos de esta tabla tienen la siguiente lectura:
3 Estudiantes reaprobaron el examen con una valoración de I (Insuficiente)
5 Estudiantes aprobaron el examen con una valoración de A (Aceptable)
3 Estudiantes aprobaron el examen con una valoración de E (Excelente)
FRECUENCIAS ACUMULADAS:(F)
Se obtiene de la acumulación sucesiva de las frecuencias absolutas. El
último dato acumulado es el tamaño de la muestra.
Su cálculo se obtiene así:
F1 = 4
F2 = f1+f2 = 4 + 3 =7
F3 = f1 + f2 +f3 =4 + 3 + 5 = 12
F4 = f1 + f2 + f3 + f4 = 4 + 3 + 5 + 5 = 17
F5 = f1 + f2 + f3 + f4 + f5 = 4 + 3 + 5 + 5 + 3 = 20
En una tabla de frecuencias se observaría así:
Logro
s
f F
DIASE
43553
47
121720
20
Algunos datos de esta tabla para las frecuencias acumuladas tienen la
siguiente lectura:
12 Estudiantes reprobaron el examen con una valoración inferior a A
7 Estudiantes presentan valoraciones inferiores a A.
FRECUENCIA ABSOLUTA RELATIVA: (h)
Corresponde a una porción de distribución. Se obtiene dividiendo la
frecuencia absoluta de cada dato entre el total de elementos que conforman
la muestra.
hi=fn
La suma de todas las frecuencias relativas representa al 100% de la
población y equivale a 1 (Uno).
h = 100% = 1
En nuestro ejemplo de referencia.
h1 = 4 / 20 = 0.2 = 20%
h2 = 3 /20 = 0.15 = 15%
h3 = 5 /20 = 0.25 = 25%
h4 = 5 /20 = 0.25 = 25%
h5 = 3/20 =0.15 = 15%
En una tabla de frecuencias se observaría así:
Logro
s
f F h
DIASE
43553
47
121720
0.20.15
0.25
0.25
0.15
20 1
Algunos datos de esta tabla tienen la siguiente lectura:
El 15% de los Estudiantes reaprobaron el examen con una valoración de I
(Insuficiente)
El 25% de los Estudiantes aprobaron el examen con una valoración de A
(Aceptable)
El 15% de los Estudiantes aprobaron el examen con una valoración de E
(Excelente)
FRECUENCIAS RELATIVA ACUMULADAS: (H).
Se obtiene de la acumulación sucesiva de las frecuencias relativas. El último
dato acumulado es el 100% de la muestra.
Su cálculo se obtiene así:
H1 = 0.2
H2 = h1+h2 = 0.2 + 0.15 =0.35
H3 = h1 + h2 +h3 =0.2 + 0.15 + 0.25 = 0.6
H4 = h1 + h2 + h3 + h4 = 0.2 + 0.15 + 0.25 + 0.25 = 0.85
H5 = h1 + h2 + h3 + h4 + h5 = 0.2 + 0.15 + 0.25 + 0.25 + 0.15 = 1
El último dato acumulado equivale al 100% de la muestra. En una tabla de
frecuencias se observaría así:
Logro
s
f F h H
DIASE
43553
47
121720
0.20.150.250.250.15
0.20.35
0.60.851
20 1
Algunos datos de esta tabla para las frecuencias relativas acumuladas
tienen la siguiente lectura:
El 60% de los estudiantes reprobaron el examen con una valoración inferior
a A
El 35% de los estudiantes presentan valoraciones inferiores a A.
EJEMPLO DE APLICACIÓN:
La siguiente distribución de datos representa los salarios de 40 trabajadores
de un colegio privado de la ciudad de Villavicencio en donde se requiere que
el docente trabaje bajo la figura de docente catedrático. Para el caso se
asigna un valor por la hora trabajada de acuerdo a un grado de escalafón
emitido el ministerio de educación nacional.
Los valores de los salarios corresponden en miles de pesos.
30 25 20 40 28
35 40 25 45 20
40 30 15 30 25
20 50 50 50 30
50 15 30 45 40
15 20 28 35 40
30 15 20 45 50
15 10 20 28 30
La siguiente tabla muestra los datos organizados con su respectiva
frecuencia. La interpretación de algunos datos queda como tarea para el
estudiante.
SALARIOS(En miles de $)
f F h H
10 1 1 0,025 0,02515 5 6 0,125 0,1520 6 12 0,15 0,325 3 15 0,075 0,37528 3 18 0,075 0,4530 7 25 0,175 0,62535 2 27 0,05 0,67540 5 32 0,125 0,845 3 35 0,075 0,87550 5 40 0,125 1
40 1
Solución compendio #2
EJERCICIOS DE APLICACIÓN:
1. En un estudio relacionado con el turismo en el Meta se realizó la
siguiente pregunta
Cuál es el principal motivo por el cual usted visita al departamento
del Meta?
Las opciones se clasifican así:
Se aplicó la pregunta a 100 turistas y se obtuvieron los siguientes
resultados
1 4 4 2 5 3 3
2 4 5 1 6 2 3
2 6 1 1 6 3 4
2 6 2 1 6 3 2
3 6 2 1 3 4 1
3 6 2 1 3 6 2
3 6 3 4 3 6 3
5 3 3 4 5 6 3
5 3 3 4 5 5 3
5 3 4 4 5 5 6
1 3 4 4 4 4
1 3 1 4 4 4
1 2 1 5 4 3
1 2 1 5 3 2
4 2 5 5 3 2
Elabore en R una tabla de frecuencias para la información obtenida.
barplot(f,col=c(2,3,4,5,6,7),names.arg=c(" "),main="DIAGRAMA DE TURISMO", ylab="TURISTAS",xlab=" ")
legend(5,25,c("calorhumano","clima","descanso","diversion","gastronomia","paisaje"), fill = c(2,3,4,5,6,7))
barplot(f,space=5,col="pink",ylim=c(0,25),ylab="f",main="Gráfico de Líneas: turismo")
> abline(h=0)
plot.ecdf(H,main="distribución acumulada")
pie(h,col=c(2,3,4,5,6,7),main="GRAFICO CIRCULAR")
En una encuesta aplicada a microempresarios de la ciudad de
Villavicencio se desea indagar sobre su formación de acuerdo a
la siguiente información:
La encuesta se aplicó a 150 microempresarios y los resultados fueron
los siguientes
4 3 2 4 4
2 2 4 2 4
4 4 3 2 4
3 2 4 3 4
2 3 4 4 4
2 1 3 3 3
2 4 2 3 4
3 4 3 4 4
2 4 4 4 4
4 3 3 3 4
3 3 3 4 4
4 4 2 3 3
4 3 3 3 4
3 5 4 4 4
4 2 3 4 4
4 3 3 3 3
2 2 3 4 4
4 3 4 2 4
1 3 3 4 3
4 5 4 3 4
4 4 4 4 3
4 3 3 4 4
4 3 3 3 4
4 4 4 2 3
4 5 2 4 4
3 4 3 4 4
4 3 2 3 2
4 4 2 4 4
4 4 4 4 2
4 3 4 3 3
SOLUCION COMPENDIO #4
GRAFICAS PARA DATOS NO AGRUPADOS
Códigos en R Resultados
Ingresando datos:
datos=c(200,1
90,150,148,152,158,100
,174,187,188,160,178,1
53,151,128,137,174,199
,103,168,188,127,150,1
30,175)
[1] 200 190 150 148 152 158 100 174
187 188 160 178 153 151 128 137 174
199 103
[20] 168 188 127 150 130 175
Calculando el rango:
Rang= max(datos)-
min(datos)
> Rang
[1] 100
Calculando el número de
intervalos
m=round(1+3.3*log10(25
)) La función Round, redondea
al entero más cercano.
> m
[1] 6
Longitud del intervalo:
C=Rang/m
> C
[1] 16.66667
Este resultado se redondea al entero más cercano, por
exceso en este caso 17.
Redefinir=102-100=2
2 Xmin-1=99
Xmax +1=201
Ahora le damos forma a los
intervalos
intervalos=cut(datos,
breaks=c(99,116,133,15
0,167,184,201))
Intervalos
[1] (184,201] (184,201] (133,150]
(133,150] (150,167] (150,167]
(99,116] (167,184] (184,201]
(184,201] (150,167] (167,184]
[13] (150,167] (150,167] (116,133]
(133,150] (167,184] (184,201]
(99,116] (167,184] (184,201]
(116,133] (133,150] (116,133]
[25] (167,184]
Levels: (99,116] (116,133] (133,150]
(150,167] (167,184] (184,201
Ahora se forma las frecuencias
absolutas
f=table(intervalos)
f
intervalos
(99,116] (116,133] (133,150]
(150,167] (167,184] (184,201]
2 3 4 5
5 6
Calculando el número de
elementos de la muestra
n=sum(f)
>> n
[1] 25
Construimos las frecuencias
absolutas
h
h=f/n
h
intervalos
(99,116] (116,133] (133,150]
(150,167] (167,184] (184,201]
8 12 16 20
20 24
Construyendo frecuencias
absolutas acumuladas
F
(99,116] (116,133] (133,150]
F=cumsum(f) (150,167] (167,184] (184,201]
2 5 9 14
19 25
Construyendo las frecuencias
relativas acumuladas.
H=cumsum(h)
H
(99,116] (116,133] (133,150]
(150,167] (167,184] (184,201]
8 20 36 56
76 100
Ahora se arman la tabla de
frecuencias
cbind(f,h,F,H)
f h F H
(99,116] 2 8 2 8
(116,133] 3 12 5 20
(133,150] 4 16 9 36
(150,167] 5 20 14 56
(167,184] 5 20 19 76
(184,201] 6 24 25 100
Construyendo marcas de clase
LimSup=c(116,133,150,167,18
4,201)
LimInf=c(99,116,133,150,167
,184)
Marca= (LimSup+LimInf)/2
Marca
[1] 107.5 124.5 141.5 158.5 175.5
192.5
La tabla con las frecuencias y la
marca de clase
tabla=cbind(f,Marca,h,F,H)
f Marca h F H
(99,116] 2 107.5 8 2 8
(116,133] 3 124.5 12 5 20
(133,150] 4 141.5 16 9 36
(150,167] 5 158.5 20 14 56
(167,184] 5 175.5 20 19 76
(184,201] 6 192.5 24 25 100
Taller de Aplicación:
Basándose en los anteriores procedimientos construir intervalos y gráficos para los siguientes
datos que corresponden a la edad de 50 microempresarios de la ciudad de Villavicencio
48 39 35 29 30
38 42 37 40 38
22 37 34 55 48
35 50 36 48 42
53 35 38 38 35
40 50 23 32 45
35 42 59 28 38
34 38 44 46 23
40 48 34 30 35
43 32 36 32 46