modulo estadistica descriptiva 9 feb 2014.docx
TRANSCRIPT
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
1/60
ESTADISTICAS DESCRIPTIVA
Docente:
LEONEL DELGADO ERASO
Especialista en Estadstica
UNIVERSIDAD DE NARIO
DEPARTAMENTO DE MATEMATICAS ESTADISTICA
PASTO! "#$%
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
2/60
PRIMERA UNIDAD
ESTADISTICA DESCRIPTIVA.
Conceptos generales sobre estadstica
Distribuciones de frecuencias.
Medidas de tendencia central.
Medidas de dispersin.
Grficos Estadsticos
Aplicaciones de las herramientas computacionales estadsticas (Excel !tatgraphics
!"!!#.
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
3/60
Conceptos Gene&ales
DE'INICION DE ESTADISTICA
La estadstica es (na ciencia )(e est(dia los *+todos! no&*as! &e,las!le-es pa&a la &ecolecci.n! o&,ani/aci.n - an0lisis de datos! pa&a saca&concl(siones 10lidas - to*a& decisiones ace&tadas2
PO3LACION: Es el con4(nto (ni1e&sal! el con4(nto de &e5e&encia! elc(al est0 con5o&*ado po& todos los ele*entos )(e tienen laca&acte&stica de est(dio2 Una po6laci.n p(ede se& 7nita! 8de ta*a9oN o in7nita2
MUESTRA: Es (n s(6con4(nto de la po6laci.n2 Es (na pa&te de lapo6laci.n! la c(al de6e c(*pli& con dos &e)(isitos 5(nda*entales: se&aleato&ia - &ep&esentati1a2 La p&i*e&a ;ace &e5e&encia a )(e s(sele*entos de6en selecciona&se al a/a&! - la se,(nda ;ace &e5e&enciaal ta*a9o de la *(est&a2
DATO: Es la *edida de la o6se&1aci.n2
VARIA3LES ESTADISTICAS2
Una 1a&ia6le estadstica es (na ca&acte&stica la c(al al se& o6se&1adaen di5e&entes indi1id(os nos ,ene&a &es(ltados distintos2
Las 1a&ia6les estadsticas p(eden clasi7ca&se en: CUANTITAVAS -CUALITATIVAS2
Las 1a&ia6les CUANTITATIVAS se clasi7can en: Contin
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
4/60
(tilidades dia&ias de (n ne,ocio! la p(nt(aciones en (n e=a*en! elcociente intelect(al! etc2
Las 1a&ia6les c(antitati1as disc&etas son a)(ellas )(e ad*iten!
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
5/60
SEGUNDA UNIDAD
DISTRIBUCIONES DE FRECUENCIAS
Dist&i6(ciones de 5&ec(encias pa&a 1a&ia6le c(antitati1a disc&eta -1a&ia6les c(alitati1as
Si tenemos una variable cuantitativa discreta o una variable cualitativa, la
podemos resumir en una tabla ue recibe el nombre de distribuciones de
!recuencias" #ara ellos revisemos las si$uientes de%niciones&
Frecuencias absolutas"fi
'as !recuencias absolutas es el n(mero de veces ue se repite un dato" 'as
simboli)aremos con la letra *e!e+ min(scula& fi
'a suma de las !recuencias absolutas es i$ual al n(mero de datos n -"
n f1 ? f2 ? f3 ? >> ? fm
fi
Observe ue .emos tomado un sub/ndice
m
, debido a ue los valores ue
toma la variable, por lo $eneral son menores ue el n(mero de datos n -
#ara determinar las !recuencias absolutas se utili)a el conteo o recuento" Se
escriben los valores ordenados de la variable sin repetirlos" 'ue$o se .ace una
marca !rente a cada valor tantas veces el dato se encuentre en la lista de
datos, se recomienda .acer $rupos de cinco marcas" #ara e0plicarlo m1s
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
6/60
claramente, consideremos los si$uientes datos los cuales podr/an corresponder
al n(mero de .i2os de 34 !amilia observadas& 5, 6, 7, 8, 5, 8, 5, 7, 5, 8, 6, 5,7,5,
8, 5, 5
El conteo o recuento se reali)ar/a as/&
8 IIII 9 7
5 IIII III 9 :
7 III 9 ;
6 II 9 5
#or lo tanto, las !recuencias absolutas son 7, :, ;, 5, respectivamente"
'as Frecuencias Absolutas AcumuladasFi
'as !recuencias absolutas acumuladas se obtienen mediante sumas sucesivas
de las !recuencias absolutas" 'as simboli)aremos con la letra *EFE+
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
7/60
'as !recuencias relativas se calculan dividiendo cada !recuencia absoluta fi
-, entre el n(mero de datos n -" >eneralmente se las e0presa en porcenta2e
para su !1cil interpretaci?n" Se denotan @ de%nen as/&
hi
fi
n
fi
n100
'a suma de las !recuencias relativas es i$ual a 3 o al 388"
h
1+h
2+h
3++hm h i 3 9 388"
'as Frecuencias Relativas Acumuladas"
Hi
'as !recuencias relativas acumuladas se calculan dividiendo cada !recuencia
absoluta acumulada Fi -, entre el n(mero de datos n -" >eneralmente se
las e0presa en porcenta2e para su !1cil interpretaci?n" Se denotan @ de%nen
as/&
Hi Fi
n
Fi
n100
Otra !orma de calcular las !recuencias relativas acumuladas es mediante las
sumas sucesivas de las !recuencias relativas"
H1 h1
H2 h2+h1
H3 h3+h2+h1
>>>>>>>>>>>>>
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
8/60
Hm hm++h3+h2+h1 $ $##@
Observe ue la (ltima !recuencia relativa es el 388 o uno"
Con cada valor calculado procedemos a construir la distribuci?n de !recuencias,
la cual es una tabla ue contiene& la variable de estudio, las !recuencias
absolutas, las !recuencias relativas, las !recuencias absolutas acumuladas @
!recuencias relativas acumuladas" 'a !orma $eneral de una distribuci?n de
!recuencias es la si$uiente"
x i fi Fi hi Hi
x1
f1
F1 h1=
f1
n
H1
x2
f2
F2h2=
f2
n
H2
x3 f3 F3h3=
f3
n
H3
" " " " "" " " " "
xm fm Fm=n
hm=
fm
n
Hm=100=1
TOTAL n $$##@
donde,
xi : ariable de estudio
fi : Frecuencias absolutas"
Fi : Frecuencias absolutas acumuladas"
hi : Frecuencias relativas"
Hi : Frecuencias relativas acumuladas"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
9/60
E2emplo&
'as pesuera m1s $rande del #uerto de Tumaco, tiene en su n?mina a 78
empleados" #or le@es del $obierno toda empresa debe dar un subsidio de
educaci?n a cada .i2o de los traba2adores" El $erente para .acer a2ustes en elpresupuesto de la empresa determina el n(mero de .i2os de los traba2adores
ue estn estudiando @ obtiene los si$uientes resultados&
5, ;, 3, 8, ;, 5, 8, 3, ;, 5, ;, 7, ;, 3, 3, 5, ;, 5, 7, 3, 8, 8, 3, 5, ;, 5, 3, 8, ;, 7, 5,
;, ;, ;, 7, 5, 3, 3, 8, 5
Construir una distribuci?n de !recuencias"
Soluci?n&
'a variable es el n(mero de .i2os de los empleados de la pesuera los cuales
estn actualmente estudiando, esta variable es cuantitativa discreta @ toma
valores de 8, 3, 5, ;, 7"
El conteo se indica a continuaci?n"
de .i2os Conteo8 IIII I 9 3 IIII IIII 9 5 IIII IIII 9 38
; IIII IIII I 9 337 IIII 9 7
Aplicando las de%niciones @ las !?rmulas respectivas se obtiene la si$uiente
distribuci?n de !recuencias"
B de;i4os
B dee*plea
dosFi hi Hi
8 36 36
3 36 55,6 ;4,6
5 38 56 56 5,6
; 33 ; 54,6 8
7 7 78 38 388
TOTA' 78 388
Anali)ando los resultados del tercer ren$l?n tenemos ue&
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
10/60
38empleados de la pesuera, euivalentes al 56 del total, tienen 5 .i2os
estudiando"
56empleados de la pesuera, euivalentes al 5,6del total, tienen 5 o
menos de dos .i2os estudiando"
Dist&i6(ciones de 5&ec(encias pa&a (na 1a&ia6le c(antitati1a contin(a2
Si tenemos una variable cuantitativa continua, $eneralmente los datos
repetidos van .acer mu@ pocos, @ al calcular sus !recuencias absolutas estas,
tomar1n valores de 3 o 5, en su $ran ma@or/a" En estos casos para anali)ar
este tipo de variables se recomienda a$ruparla en intervalos, clases o
cate$or/as" #or e2emplo, al clasi%car a los .abitantes de una re$i?n por su
edad, podr/amos .acer $rupos de bebes edades .asta el aGo @ medio-, de
niGos edades .asta los 38 o 35 aGos-, de adolescentes edades .asta los 3: o
53 aGos-, 2?venes edades .asta los 56 o ;8 aGos-, adultos edades .asta los
68 aGos-, ma@ores edades .asta los 8 aGos-, tercera edad edades despus
de los 8-"
#ara construir una distribuci?n de !recuencias para este tipo de variables,
consideremos las si$uientes de%niciones&
Ran$o o recorrido" Es la di!erencia entre el valor m10imo de los datos @ el valor
m/nimo"
Rango 9 R Vmximo Vmnimo
N(mero de intervalos, clase o cate$or/as& A pesar de ser un criterio delinvesti$ador el de ele$ir con cu1ntos intervalos va a traba2ar, la &e,la deSt(&,es, propuesta por Herbert Stur$es, su$iere una !?rmula para determinarcu1ntos intervalos, clases o cate$or/as se debe utili)ar"
m 1+3,3log (n) ! 'a apro0imaci?n se la .ace sin decimales @
por e0ceso-
Nota& 'os intervalos ue se !orman se consideran semiabiertos por derec.a, es
decir tienen la !orma& J a , b -, este intervalo contiene todos los valores
comprendidos entre a @ b , inclu@endo a a @ e0clu@endo a b "
Al$unos autores de%nen de manera di!erente los intervalos, por e2emplo, al
considerarlo cerrado, es decir de la !orma, Ja,bK al si$uiente intervalo se debe
iniciar por lo menos 3 milsima m1s $rande ue b"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
11/60
Amplitud del intervalo" c -" Es la distancia ue .a@ entre el l/mite superior @
el l/mite in!erior de cada intervalo" No necesariamente todos los intervalos
deben tener la misma amplitud" Se aconse2a usar la si$uiente !?rmula
c
rango
nmerodeintervalos
R
m , 'a apro0imaci?n se la .ace
por e0ceso" Se puede usar decimales-"
Construcci?n de los intervalos
El l/mite in!erior Linf1 -, del primer intervalo es el valor m/nimo de los datos,
@ el l/mite superior del primer intervalo L
1 -, se obtiene sumando al valor
m/nimo la amplitud" Este l/mite superior ser1 el l/mite in!erior del se$undo
intervalo, de au/ en adelante el proceso se repite .asta !ormar el (ltimointervalo"
Supon$amos ue deseamos traba2ar con 6intervalos de amplitud 7@ ue el
valor m/nimo de los datos es de 5;" 'os intervalos se !orman as/&
#rimerintervalo J5;, 5;L 7- 9 J5; , 54-
Se$undointervalo J54 , 54L 7- 9 J54 , ;3-
Tercerintervalo J;3 , ;3L 7- 9 J;3 , ;6-
Cuartointervalo J;6 , ;6L 7- 9 J;6 , ;-
Muintointervalo J; , ;L 7- 9 J; , 7;-
Conteo o recuento&
Construidos los intervalos empe)amos a ubicar cada dato en uno de ellos,
.aciendo una marca !rente al intervalo ue lo conten$a" Se recomienda .acer
$rupos de cinco marcas"
#ara e0plicarlo m1s claramente, consideremos los intervalos anteriores @ lossi$uientes datos& 56, 78, ;;, ;3, 73, 5:, ;, 75, "
El conteo o recuento comen)ar/a as/& por !acilidad utili)amos una l/nea como
marca-
J5; , 54- I
J54 , ;3- I
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
12/60
J;3 , ;6- II
J;6 , ;- I
J; , 7;- III
Observemos ue el dato ;3 se ubic? en el tercer intervalo@ NO en else$undo, debido a ue el se$undo intervalo contiene los datos ma@ores o
i$uales a 54 @ *eno&esue ;3" Esto debido a ue los intervalos son dela !orma Ja,b-"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
13/60
donde,
Linf . & '/mite in!erior de cada intervalo
L . & '/mite superior de cada intervalo"
xi &
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
14/60
En la serie de datos podemos observar ue el peso m/nimo es 76P$" @ el peso
m10imo es de 385 P$", entonces
Rango 9 R Vmximo Vmnimo 385Q 76 64
N(mero de intervalos"
Aplicando la re$la de Stur$es, tenemos
m 1+3,3log (n) 1+3,3log (40) !"FF> 7
'a amplitud de cada intervalo es
c
rango
nmerodeintervalos
R
m
57
7
!$"H> :,5
'os intervalos @ el conteo o recuento se indican en la si$uiente tabla" Recuerde
ue el l/mite in!erior del primer intervalo es 76 @ su l/mite superior se obtiene
sum1ndole la amplitud de :,5" Una manera de observar r1pidamente el conteo
es ordenando los datos, as/"
76, 7, 65, 67, 66, 64, 6, 8, 3, 5, 5, 7, , , :, , 48, 48, 45, 4;, 4;,
47, 46, 46, 4, 4, 44, 4:, :8, :5, :7, :, :4, ::, :, 8, ;, 7, 4, 385"
Peso 8,ConteoLinf . L.
76 6;,5 III %6;,5 3,7 IIII I 3,7 , IIII II , 44,: IIII IIII I $$44,: : IIII
: 7,5 IIII II 7,5 385,7 II "
Con las de%niciones @ !?rmulas correspondientes construimos la si$uiente
distribuci?n de !recuencias
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
15/60
$istograma
%& && '& (& )& *& + ,&
peso
,
&
+,
+&
-,
-&
.,
p
o
rce
n
ta
/e
"ogono de 0recuencias para "E!1
%& && '& & )& *& +,&
peso
,
&
+,
+&
-,
-&
,
p
o
rce
n
ta
/e
Peso8J,2 Ma&cas de clasexi
B e*pleadosfi Fi
hi HiLinf . L .
76 6;,5 7,3 ; ; 4,6 4,6
6;,5 3,7 64,; 36 55,63,7 , 6,6 4 3 34,6 78, 44,: 4;,4 33 54 54,6 4,644,: : :3, 7 ;3 38 44,6: 7,5 8,3 4 ;: 34,6 6
7,5 385,7 :,; 5 78 6 388TOTAL # 388
El an1lisis de los resultados en la tabla se .ace tal como se indican para el
tercer ren$l?n, as/&
4de los empleados de la pesuera, euivalentes al 34,6tienen pesos entre
los 3,7 P$" @ , P$" #odr/amos decir ue el peso promedio de estos siete
traba2adores es apro0imadamente de 6,6 P$"
3de los empleados de la pesuera, euivalentes al 78tienen pesos entre
los 76 P$" @ , P$"
Estos resultados los podr/amos observar $r1%camente en un HISTO>RA
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
16/60
TERCERA UNIDAD
MEDIDAS DE TENDENCIA CENTRAL! MEDIDAS DE POSICION MEDIDASDE DISPERSION
MEDIDAS DE TENDENCIA CENTRAL
'as medidas de tendencia central son valores ue en una serie ordenada de
datos *tienden+ a ubicarse en el centro" Tambin, se las conoce con el nombre
de promedios" Entre ellas tenemos&
'a media aritmtica o promedio aritmtico"'a media aritmtica ponderada"'a media $eomtrica"'a mediana"'a moda2
Media A&it*+tica o P&o*edio A&it*+tico2
Es el cociente entre la suma de los datos @ el n(mero de datos n -" Una
venta2a de este promedio es ue considera la in!ormaci?n de todos los datos, @
una desventa2a es ue es mu@ sensible a valores e0tremos"
x x in
x1+x
2+x
3++xn
n ! para datos
NO a$rupados
x (xifi )
n
x1f
1+x
2f
2++xmfm
n ! para datos
a$rupados"
Nota& De a.ora en adelante los datos NO a$rupados ser1n auellos ue se
vienen dados en una lista de datos" 'os datos A$rupados son los ue vienen
dados en una distribuci?n de !recuencias"
E2emplo"
Un clientes de un local ue vende accesorios para computador& una USB en
58"888 pesos, un mouse en 35"888 pesos, un protector de pantalla "888 pesos
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
17/60
@ un teclado en 34"888 pesos" El precio promedio de los cuatro productos es de
37"688" Se calcula as/&
x x in
x
1+x
2+x
3++xn
n
x 20.000+12.000+9.000+17.000
4
58.000
4 $2H##
E2emplo"
El dueGo del local del e2emplo anterior re$istr? la cantidad de los productos de
las ventas del d/a de .o@" En la si$uiente tabla se resume los precios de cadaart/culo @ las cantidades vendidas de cada producto"
#roducto #recio CantidadUSB 58"888 7
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
18/60
x ifix i fi
USB 58"888 7 :8"888
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
19/60
Como cada prueba tiene di!erente importancia *ponderaci?n o peso+, no
podemos aplicar la media aritmtica o promedio aritmtico para calcular el
punta2e de cada aspirante" Au/ debemos utili)ar la media aritmtica
ponderadaxp "
#ara calcular el punta2e promedio ponderado ue obtuvo Roberto debemos
calcularlo as/&
xp (xi i)
i
x1
1+x
2
2++xmm
1+2+3++m
680,70+720,20+800,10
0.70+0,20+0,10
70
1 48 puntos"
En la tabla se muestran los punta2es promedios ponderados xp -, para los
dem1s aspirantes"
No*6&easpi&ante
Conoci*ientos8#@
o4a de 1ida8"#@
Ent&e1ista8$#@ xp x
Roberto : 45 :8 48 4;,;'uis 46 7 4: 4;,3 45,;
os 4 43 4: :, 45
Ana 45 4; 43,6 43,;Rosa 4; 6 :: 45, 46,;
#or lo tanto, 'uis es el seleccionado para el car$o director del 1rea contable en
la alcald/a de #asto, con un punta2e promedio de 4;,3puntos"
Observemos ue calculado la media aritmtica 8 x , Rosa ser/a la
seleccionada con un punta2e de 46,; puntos, cometiendo el error de darle una
ponderaci?n de ;;,; a la entrevista @ a las otras dos pruebas cambiando as/
las re$las de selecci?n"
CorrectoIncorrec
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
20/60
Media Geo*+t&ica2
Se la utili)a cuando los datos crecen en pro$resi?n $eomtrica, es decir, los
datos aumentan r1pidamente"
'as !?rmulas de c1lculo son las si$uientes&
!g n
(x1x2x3xn ) n
(xi ) ! para
datos NO a$rupados
!g n
(x1f1x
2
f2x3
f3xmfm)
n
(xifi ) ! para datos
a$rupados
'os productos dentro de la ra/) suelen ser mu@ $randes, una !orma de traba2ar
con valores peueGos es utili)ando los lo$aritmos en base 38, as/&
!g antilog ( log xin ) ! para datos NO a$rupados
!g antilog( (filogxi)n ) ! para datos a$rupados
E2emplo&
Calcular la media $eomtrica de los si$uientes datos& 5, 6, 3:, "68,
Soluci?n&
!g n
(x1x2x3xn )
4
(2561989.650 )
4213"998.400 358,6
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
21/60
Usando lo$aritmos en base 38 se calcular/a as/&
!g antilog
(
log xi
n
)
antilog ( log2+ log56+log 198+log9.6504 )
antilog ( 0,3010+1,7482+2,2967+3,98454 ) antilog ( 8,33044 ) antilog (2,0826 ) 120,9484
Mediana
'a mediana de una serie de datos ordenadoses el valor ue se encuentra en el
centro de los datos" Otra !orma es, un valor ma@or al 68 de los datos @ es
menor ue el otro 68" 'a mediana se la utili)a cuando e0iste un valor
e0tremo o dato at/pico, en in$ls *outlier+"
El lu$ar donde se encuentra la mediana se obtiene as/&
L!e n+1
2
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
22/60
Soluci?n&
'a serie de datos ordenados es& 5, ;3, ;6, ;4, 8"
El lu$ar de la mediana esL!e
n+1
2=
5+1
2 ;" Esto indica
ue el tercer dato es la mediana" Es decir, la mediana es ;6"
'a interpretaci?n de la mediana es& El 68 de los planes tur/sticos cuestan
menos de ;6 d?lares @ el otro 68 cuesta i$ual o m1s de ;6 d?lares"
E2emplo&
'os pesos de los instrumentos de seis cient/%cos ue inspeccionaron al olc1n>aleras son& 76;8, 7638, 888, 7488, 788, 778 $ramos" Calcular @ anali)ar
la mediana"
Soluci?n&
'a serie de datos ordenados es& 778, 7638, 76;8, 788, 7488, 8882
El lu$ar de la mediana esL!e
n+1
2=
6+1
2 ;,6" Esto indica
ue la mediana se encuentra entre el tercer dato @ el cuarto" Es decir, la
mediana es4530+4600
2
9130
2 766" Esto si$ni%ca ue el
68 de los instrumentos vulcanol?$icos pesa menos de 766 $ramos @ el otro
68 pesa m1s de 766 $ramos"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
23/60
:8 !amilias via2aron al puerto de Tumaco por una semana" El or$ani)ador @ $u/a
pre$unto cu1ntas personas por !amilia est1n de acuerdo ue la dieta para
esa semana sea a base de mariscos" 'os resultados se resumen en la
si$uiente tabla"
x i fi 8 383 575 ;8; 354 7
donde, x i : N(mero de personas ue respondieron a%rmativamente
fi : N(mero de !amilias"
Calcular @ anali)ar la mediana"
Soluci?n&
Antes de calcular la mediana complementemos la tabla con las !recuencias
absolutas acumuladas, como se observa en la si$uiente tabla"
x i fi Fi
8 38 383 57 ;75 ;8 7; 35 44 7 :8
#otal #
#ara determinar el lu$ar de la mediana aplicamos la !?rmula&
L!e n+12
80+1
2
81
2 40,5 , lo cual indica
ue la mediana se encuentra entre el dato de lu$ar 78 @ el dato de lu$ar 73"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
24/60
El valor de las !recuencias absoluta acumuladas8 Fi ! inmediatamente
ma@or a 78,6 es 7 ver tabla anterior-, el cual se encuentra en el tercer
ren$l?n" #or tanto el dato ue ocupa el lu$ar 78 es 5 @ el dato ue ocupa el
dato de lu$ar 73 es 5, promediando los dos valores se obtiene ue la mediana
es 5"
'a interpretaci?n es& En el 68 de las !amilias, nin$una, una o m10imo 5
personas si desean la dieta a base de mariscos @ en el otro 68 de las
!amilias, 5 o m1s de dos personas pre%eren la dieta a base de mariscos"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
25/60
4 5Calcular @ anali)ar la mediana"
Soluci?n&
Complementado la tabla, con las !recuencias absolutas acumuladas tenemos
Sala&ios *ni*os )(ese in1e&ti&an en tecnolo,a N
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
26/60
!e Linf . ? [(n
2Fa)fo
]c 6 L [ (26
212)12
]2 5 L [(
1312 )12 ]2 6,34 6,5 sm"
Es decir, la mediana es 6,5 salarios m/nimos2 'o cual si$ni%ca ue el 68 delas personas invertir/an anualmente en tecnolo$/a 6,5 salarios m/nimos, @ el
otro 68 de las personas invertir/an m1s de 6,5 salarios m/nimos anualmente
en tecnolo$/a"
La *oda o *odo2
!o
'a moda o modo se de%ne como el dato de ma@or !recuencia o el dato ue m1s
se repite" Si una serie de datos tiene una moda se dice ue es unimodal, si
tiene dos modas se dice ue es bimodal @ si tiene m1s de dos modas se dice
ue es multimodal"
E2emplo"
'a moda de los datos& ;, , 5, 5, 6, , 5, 4, 5, 7, 6, 5, 5 es!o=2 , el cual es
el dato de ma@or !recuencia"
E2emplo"
Una aerol/nea est1 planeando descuentos para los .i2os de sus clientes" Se
reali)? un estudio a un $rupo de 78 clientes, en el cual la variable de inters
!ue el n(mero de .i2os por cliente" Se obtuvo la si$uiente in!ormaci?n
N
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
27/60
'a moda es!o=2 , @a ue es el n(mero de .i2os ue se repite con ma@or
!recuencia, en este caso se presenta en 36 clientes"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
28/60
56 ;8 35;8 ;6 3:;6 78 3678 76 38
Calcular @ anali)ar la moda"
Soluci?n&
'a ma@or !recuencia es 3: @ corresponde al tercer ren$l?n" Este intervalo
recibe el nombre de clase modal, en el cual se tiene ue&
Linf . ;8
&1 3: Q 35 9
&2
3: Q 36 9 ;c ;6;8 9 6
Rempla)ando en la !?rmula de la moda tenemos&
!o Linf . ? ( &1&1+&2 )
c 30 L ( 66+3 )
5
30 L ( 69 )5 ;;,; aGos"
'o cual indica ue la edad ue m1s se repite entre los empleados de la
empresa de turismo es de ;;,; aGos"
Nota& Se debe aclarar ue en la construcci?n de datos a$rupados con
intervalos se pierde in!ormaci?n, esto implica ue si tuviramos la lista de
datos posiblemente la edad ue m1s se repite podr/a ser otro valor, puesto ue
si los 3: empleados de la clase modal todos tienen edades di!erentes @ los 6
empleados del primer intervalo tiene la misma edad, entonces la moda
cambiar/a"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
29/60
'AS
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
30/60
Son tres valores (: 3, 5, ;- ue dividen al ran$o o recorrido en cuatro
partes i$uales, cada una de ellas euivalente al 56"
El lu$ar de cada cuartil se calcula con la si$uiente !?rmula"
L'( (( n+1 )
4
El cuartil se calcula as/&
'( Linf . ? [ (n(
4Fa)
fo]c
donde,
Linf . : '/mite in!erior de la clase cuartil ( Intervalo donde se
encuentra el cuartil(
-"Fa & Frecuencia absoluta acumulada anterior a la clase cuartil (
fo : Frecuencia absoluta de la clase cuartil (
c : Amplitud de la clase cuartil ( Di!erencia entre el l/mite
superior @ l/mite in!erior de cada intervalo-
Como las !?rmulas son mu@ similares a las de la mediana se procede @ anali)a
de manera euivalente"
Deciles 8 )(
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
31/60
Son nueve valores (: 3, 5, ;, 7, 6, , 4, :, "- ue dividen al ran$o o
recorrido en die) partes i$uales, cada una de ellas euivalente al 38"
El lu$ar de cada decil se calcula con la si$uiente !?rmula"
L) ( ((n+1 )10
El decil ( se calcula asi&
)( Linf . ? [ (n(
10Fa)
fo]c
Linf . : '/mite in!erior de la clase decil ( Intervalo donde se encuentra
el decil ( -2
Fa : Frecuencia absoluta acumulada anterior a la clase decil (
fo : Frecuencia absoluta de la clase decil (
c : Amplitud de la clase decil ( Di!erencia entre el l/mite
superior @ l/mite in!erior de cada intervalo-
Como las !?rmulas son mu@ similares a la mediana @ los curtiles, se procede @anali)a de manera euivalente"
Pe¢iles
Son noventa @ nueve valores (: 3, 5, ;, , - ue dividen al ran$o o
recorrido en cien partes i$uales, cada una de ellas euivalente al 3"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
32/60
El lu$ar de cada percentil se calcula con la si$uiente !?rmula&
L*( ((n+1 )
100
El percentil ( se calcula as/&
*( Linf . ? [(n(100
Fa)fo
]cdonde,
Linf . : '/mite in!erior de la clase percentil ( Intervalo donde se
encuentra el percentil ( -2
Fa : Frecuencia absoluta acumulada anterior a la clase percentil (
fo : Frecuencia absoluta de la clase percentil (
c : Amplitud de la clase percentil ( Di!erencia entre el l/mite
superior @ l/mite in!erior de cada intervalo-
Como las !?rmulas son mu@ similares a la mediana, los cuartiles @ los deciles,se procede @ anali)a de manera euivalente"
E2emplo&
Se reali)? un estudio en el cual se pre$untaba de las utilidades mensuales ue
ten/an 76 empresas catalo$adas como las m1s $randes del pa/s" #or convenio
con las empresas no se debe publicar sus nombres ni muc.o menos
directamente el valor in!ormado, por lo tanto se constru@? una distribuci?n de
!recuencias con intervalos" 'os resultados se muestran en la si$uiente tabla"
Utilidad *ens(al8*illones de pesos B de e*p&esas
Linf . L . fi Fi
5 6 7 76 : 38 37: 33 36 5
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
33/60
33 37 3; 7537 34 ; 76
#$#%L H
Calcular @ anali)ar '3 , )4 , *29 2
Sol(ci.n2
C0lc(lo del c(a&til %2 Euivalente al 46 de los datos-"
'u$ar del cuartil 3
L'3 ((n+1 )4 3(45+1 )4 1384 ;7,6" Esto
indica ue el'
3 se encuentra entre el dato de lu$ar ;7 @ el dato de lu$ar
;6" Adem1s, la !recuencia absoluta acumulada inmediatamente ma@or a ;7,6
es 75, correspondiente al cuarto intervalo"
Utilidad *ens(al8*illones de pesos B de e*p&esas
Linf . L . fi Fi
5 6 7 76 : 38 37: 33 36 533 37 3; 7537 34 ; 76
#$#%L H
#or lo tanto
Linf . 33
Fa 5
fo 3;
c 37 Q 33 ;
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
34/60
Rempla)ando en la !?rmula tenemos,
'3
Linf . ?
[(n(4 Fa
)fo ]c
11 L
[ (453
429
)13 ]V;
35,8367
Esto si$ni%ca ue el 46 de las empresas m1s $randes del pa/s, tienenutilidades mensuales in!eriores a 35W8"367 pesos @ el 56 de las empresas
m1s $randes del pa/s tienen utilidades mensuales superiores a 35W8"367"
C0lc(lo del decil 2 Euivalente al 78 de los datos-"
'u$ar del decil 4
L) 4 ((n+1)
10
4(45+1 )10
184
10 3:,7" Esto
indica ue el)
4 se encuentra entre el dato de lu$ar 3: @ el dato de lu$ar
3" Adem1s, la !recuencia absoluta acumulada inmediatamente ma@or a 3:,7
es 5, correspondiente al tercer intervalo"
Utilidad *ens(al8*illones de pesos B de e*p&esas
Linf . L . fi Fi
5 6 7 76 : 38 37: 33 36 533 37 3; 7537 34 ; 76
#$#%L H
Po& lo tanto
Linf . :
Fa 37
fo 36
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
35/60
c 33 Q : ;
Rempla)ando en la !?rmula tenemos,
)4 Linf . ? [(
n(
10Fa)
fo]c 8 L [ (
45410
14 )15 ] V;
:,:
Esto si$ni%ca ue el 78 de las empresas m1s $randes del pa/s, tienen
utilidades mensuales in!eriores a :W:88"888 pesos @ el 8 de las empresas
tienen utilidades mensuales superiores a :W:88"888"
C0lc(lo del pe¢il "F2 8Euivalente al 5 de los datos-"
'u$ar del percentil 5
L*29 ((n+1)
100
29(45+1 )100
1334
100 3;,;7"
Esto indica ue el*29 se encuentra entre el dato de lu$ar 3; @ el dato de
lu$ar 37" Adem1s, la !recuencia absoluta acumulada inmediatamente ma@or a3;,;7 es 37, correspondiente al se$undo intervalo"
Utilidad *ens(al8*illones de pesos B de e*p&esas
Linf . L . fi Fi
5 6 7 76 : 38 37: 33 36 533 37 3; 7537 34 ; 76
#$#%L H
#or lo tanto
Linf . 6
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
36/60
Fa 7
fo 38
c : Q 6 ;
Rempla)ando en la !?rmula tenemos,
*29 Linf . ? [ (
n(
100Fa)
fo]c 5 ? [ (
4529100
4)10 ] %
!$H
Esto si$ni%ca ue el 5 de las empresas m1s $randes del pa/s, tienen
utilidades mensuales in!eriores a 4W436"888 pesos @ el 43 de las empresas
tienen utilidades superiores a 4W436"888"
RANGO PERCENTIL 8 (
En el e2emplo anterior nos podr/amos pre$untar Mu porcenta2e de las
empresas tienen utilidades in!erior a 38W688"888 pesos mensuales"
Estas pre$untas se resuelven calculando el ran$o percentil ( , mediante la
si$uiente !?rmula, ue se obtiene al despe2ar ( de la !?rmula de los
percentiles"
(
[(*(Linf .
c
)fo+Fa
]100
n
donde!
*( : #ercentil ( , este valor se ubica en los intervalos @ me determina
la clase ran$o percentil
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
37/60
Linf . : '/mite in!erior de la clase ran$o percentil"
Fa : Frecuencia absoluta acumulada anterior a la clase ran$o percentil"
fo : Frecuencia absoluta de la clase ran$o percentil"
c : Amplitud de la clase ran$o percentil" Di!erencia entre el l/mite
superior @ l/mite in!erior de la clase ran$o percentil-
E2emplo&
Resolvamos la pre$unta& Mu porcenta2e de las empresas m1s $randes del
pa/s tienen utilidades in!erior a 38W688"888 pesos mensuales"
Soluci?n"
Se$(n la in!ormaci?n del problema los 38W688"888 pesos, euivalentes a 38,6
millones de pesos, corresponde a*( 38,6 el cual se encuentra en el
tercer ren$l?n de la tabla"
Utilidad *ens(al8*illones de pesos B de e*p&esas
Linf . L . fi Fi
5 6 7 76 : 38 37
: 33 36 533 37 3; 7537 34 ; 76
#$#%L H
De donde se tiene ue&
*( 38,6
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
38/60
Linf . :
Fa 37
fo 36
c 33 Q : 9 ;
Rempla)ando en la !?rmula del ran$o percentil se tiene
( [(*(Linf .
c )fo+Fa]100n
= [(
10,58
3 )15+14]10045
[(2,5
3)15+14]10045
[26,5 ]100
45 6:,
Es decir, ue el 6:, de las empresas m1s $randes del pa/s tienen unas
utilidades in!eriores a 38W688"888 pesos mensuales @ el 73,3 de las empresas
tienen utilidades superiores a 38W688"888 pesos mensuales"
LAS MEDIDAS DE DISPERSION! VARIACION oDESVIACION
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
39/60
'as medidas de tendencia central, NO indican ue caracter/stica tienen los
datos en cuanto a si son parecidos, .omo$neos o tienen poca variabilidad- o
si son mu@ distintos .etero$neos o tienen variabilidad considerable-" 'as
medidas de dispersi?n son las ue me indican ue tanta variabilidad tienen los
datos"
'as medias de dispersi?n, variaci?n o desviaci?n ue estudiaremos ser1n& El
ran$o o recorrido, la desviaci?n media, la varian)a, la desviaci?n est1ndar @ el
coe%ciente de variaci?n"
El &an,o o &eco&&ido
Es la di!erencia entre el valor m10imo de los datos @ el valor m/nimo"
Rango R Vmximo Vmnimo Vmx.
Vmn.
Si el ran$o es mu@ $rande @ tenemos mu@ pocos datos, se puede decir, ue los
datos tienen muc.a variabilidad" #ero si el ran$o es peueGo @ tenemos
muc.os datos, estos tienen poca variabilidad o son .omo$neos"
Aunue esta medida es mu@ !1cil de calcular su interpretaci?n es mu@
sub2etiva, adem1s, (nicamente utili)a los valores e0tremos @ no considera los
otros datos"
Des1iaciones con &especto a la *edia2
Estas no son medidas de dispersi?n, pero se las utili)a para las calcular la
desviaci?n media @ la varian)a las cuales las estudiaremos a continuaci?n"
'as desviaciones respecto a la media es la di!erencia entre cada dato @ la
media aritmtica de los datos, se pueden simboli)ar como& (xix ) ! indican
ue tan distante se encuentra cada dato con respecto a la media aritmtica" Si
la di!erencia es ne$ativa el dato se encuentra a la i)uierda de la media @ si espositiva el dato se encuentra a la derec.a de la media, si es cero el dato es
i$ual a la media"
Una propiedad de las desviaciones respecto a la media es ue la suma de
todas ellas es i$ual a cero, es decir,
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
40/60
(x ix ) #! para datos NOa$rupados
[(xix)fi ] #! para datos a$rupados
E2emplo&
Calcular las desviaciones respecto a la media de los si$uientes datos& , 7, ;, 4,
5"
Soluci?n&
'a media aritmtica de los cinco datos es,
x
xin
x1+x
2+x
3++xn
n
6+4+3+7+2
5
22
5
!
En la si$uiente tabla se calculan las desviaciones respecto a la media @ se
comprueba la propiedad"
x i xix
Q 7,7 9 L3,7 7 Q 7,7 9 8,7
; ; Q 7,7 9 3,74 4 Q 7,7 9 L5,5 5 Q 7,7 9 5,7TOTAL (xix ) #
Des1iaci.n *edia
'a desviaci?n media es el promedio de los valores absolutos de las
desviaciones respecto a la media aritmtica" Dic.o de otra manera, es elcociente entre la suma de los valores absolutos de las desviaciones respecto a
la media @ el n(mero de datos" 'as !?rmulas correspondientes son:
)! |xix|
n
|x1x|+|x2x|+|x3x|++|xnx|n !
para datos NO a$rupados"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
41/60
)! [|x ix|fi ]
n
|x1x|f1+|x2x|f2+|x3x|f3++|xmx|fmn ! para datos a$rupados"
E2emplo&
Calcular la desviaci?n media de los si$uientes datos& , 7, ;, 4, 5"
Soluci?n&
'a media aritmtica de los cinco datos es,
x xi
n
x1+x
2+x
3++xn
n
6+4+3+7+25
22
5
7,7
En la si$uiente tabla se calculan las desviaciones respecto a la media, sus
valores absolutos @ los totales"
x i x ix |xix|
Q 7,7 9 L3, 3,7 7 Q 7,7 9 8,7 8,7; ; Q 7,7 9 3,7 3,74 4 Q 7,7 9 L5, 5,5 5 Q 7,7 9 5,7 5,7#$#%L (x ix ) # |xix| !
De la tabla se obtiene ue&)!
|xix|n
8,4
5
3,:"
Otra manera de calcularla es
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
42/60
)! |xix|
n
|x1x|+|x2x|+|x3x|++|xnx|n
|64,4|+|44,4|+|34,4|+|74,4|+|24,4|5
1,6+0,4+1,4+2,6+2,4
5
8,4
5 3,:"
Este valor indica ue la distancia promedio a cada uno de los datos con
respecto a la media aritmtica es de 3,: unidades" Es decir, ue en promedio,
los datos se separan de la media en 3,: unidades.Adem1s, podr/amos
ase$urar ue en distribuciones normalesestas distribuciones se estudiar1n en
las unidades de probabilidad-, ue la ma@or/a de los datos se encuentran entre
x)!+ x+)!
VARIANA
Se podr/a de%nir la varian)a como un promedio de los cuadrados de las
desviaciones respecto a la media, o como el cociente entre la suma de los
cuadrados de las desviaciones respecto a la media @ el n(mero de datos" 'as
unidades de la variable de estudio uedan elevadas al cuadrado @ carecen de
si$ni%cado real, por tanto, la varian)a no tiene interpretaci?n" 'a varian)a es el
medio para calcular la desviaci?n est1ndar"
'as !?rmulas respectivas para el c1lculo de la varian)a son&
Va&ian/a co&&e,ida
s2
(xix )
2
n1
(x1x )2+(x2x )
2+(x3x )
2++ (xmx )
2
n1 !
para datos NO a$rupados"
s2
[(xix )
2
fi ]n1
(x1x )2f
1+(x2x )
2f
2+(x3x )
2f
3++(xmx )
2fm
n1! para datos a$rupados2
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
43/60
'a varian)a corre$ida es la m1s utili)ada para calcular la varian)a de una
muestra"Se divide entre n1 , porue se est1 estimando un par1metro ue
es la media poblacional"
Va&ian/a SIN co&&e,i&
s2
(xix )2
n
(x1x )2+(x2x )
2+(x3x )2++ (xmx )
2
n!
para datos NO a$rupados
s2
[(xix )2fi ]
n
(x1x )2f1+(x2x )
2f2+(x3x )2f3++(xmx )
2fmn
! para datos a$rupados
DESVIACION ESTANDAR o TPICA
'a desviaci?n est1ndar o desviaci?n t/pica es la ra/) cuadrada positiva de la
varian)a" 'as unidades de la desviaci?n est1ndar son las mismas de la variable
de estudio, @ por este .ec.o tiene interpretaci?n" Nos indica cu1nto pueden
ale2arse los datos respecto a la media aritmtica, dic.o de otra manera, ladesviaci?n est1ndar es una medida del $rado de dispersi?nde los datos conrespecto al valor promedio" Esta medida es m1s estable ue el ran$o o
recorrido @ toma en consideraci?n el valor de cada dato"
Des1iaci.n est0nda& co&&e,ida
s s2
varianacorregida (xix )
2
n1!
para datos NO a$rupados
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
44/60
s s2
varianacorregida [(xix )2fi ]
n1!
para datos a$rupados
Des1iaci.n est0nda& SIN co&&e,i&
s s2
variana sincorregir (x ix )
2
n!
para datos NO a$rupados"
s
s2
variana sincorregir
[(xix )2fi ]
n! para datos a$rupados"
COE'ICIENTE DE VARIACION
El coe%ciente de variaci?n es una medida de dispersi?n @ se de%ne como el
cociente entre la desviaci?n est1ndar @ la media aritmtica" Este carece deunidades @ por tanto se puede e0presar en porcenta2e" Su !?rmula de c1lculo
es&
-V s
x
s
x100
El-V indica ue tan dispersos se encuentran los datos con respecto a la
media aritmtica" Este es m1s preciso ue la desviaci?n est1ndar"
El Coe%ciente de variaci?n mide la dispersi?n en trminos de porcenta2e,seGala u tan $rande es la ma$nitud de la desviaci?n est1ndar respecto al
promedio del con2unto de datos ue se e0amina"
Si el-V es menor o i$ual al 58 se dice ue el promedio es representativo,
o ue los datos son .omo$neos
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
45/60
Si el-V es ma@or al 58, el promedio NO es representativo, o ue los datos
NO son .omo$neos
Otra interpretaci?n mu@ similar a la anterior se muestra en la si$uiente tabla
-V Interpretacin
Menos del 11% Muy homogneos
11% al 16% Homogneos
16% al 26% Heterogneos
Ms del 26% Muy heterogneos
E2emplo"
De los si$uientes datos calcular la media, la desviaci?n media, la varian)a, la
desviaci?n est1ndar @ el coe%ciente de variaci?n"
3:, 348, 3, 3:8, 34;"
Soluci?n"
Calculemos la media aritmtica
x x in
x
1+x
2+x
3++xn
n
168+170+196+180+173
5
887
5 344,7
Calculemos la desviaci?n media
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
46/60
)! |xix|
n
|x1x|+|x2x|+|x3x|++|xnx|n
|168177,4|+|170177,4|+|196177,4|+|180177,4|+|173177,4|
5
9,4+7,4+18,6+2,6+4,45
42,4
5 9 :,7:
Este valor indica ue la distancia promedio a cada uno de los datos con
respecto a la media aritmtica es de :,7:" Es decir, ue en promedio, los datos
se separan de la media en :,7: unidades.
Calc(le*os la Va&ian/a 8co&&e,ida
s2
(xix )2
n1
(x1x )2+(x2x )
2+(x3x )2++ (xmx )
2
n1
(168177,4 )2+(170177,4 )2+(196177,4 )2+(180177,4 )2+ (173177,4 )2
51
88,36+54,76+345,96+6,76+19,36
4
515,2
4=
35:,:
Este valor no tiene an1lisis, es el proceso para calcular la desviaci?n est1ndar"
Calculemos la desviaci?n est1ndar corre$ida-
s s2
varianacorregida (x ix )
2
n1
128,8 33,;6
Nos indica ue los datos pueden ale2arse de la media aritmtica 33,;6
unidades o ue los datos se encuentran desviados con respecto del promedio
en 33,;6 unidades"
Calculemos el coe%ciente de variaci?n"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
47/60
-V s
x
s
x100
11,35
177,4 8,8;4"" ,7
Este valor es menor ue el 58, concluimos ue los datos son .omo$neos"
Se$(n la tabla de an1lisis del-V
, el ,7 es menor de 33 @ se conclu@eue los datos son mu@ .omo$neos"
E2emplo"
Un campesino del municipio del Encano, NariGo 'u$ar donde se encuentra uno
de los sitios m1s tur/sticos de NariGo, 'a 'a$una de la Coc.a o 'a$o >uamue)-,
tiene en uno de sus criaderos truc.as arco iris, a las cuales las alimenta con un
producto e0tra/do de v/sceras de las mismas truc.as sacri%cadas, dic.o
alimento es rico en prote/nas"
#ara el control de peso @ tamaGo .a instalado una tecnolo$/a (nica en el
Departamento de NariGo, en el cual con un so!tXare especial obtiene
autom1ticamente el peso @ tamaGo de cada una de ellas" El anterior %n de
semana, tomo mediciones sobre el peso en $ramos- de las truc.as de este
criadero @ obtuvo los si$uientes resultados"
Peso8,&2 B t&(c;asfiLinf . L .
346 3:6 3:6 36 ;836 586 64586 536 38;536 556 5556 5;6 36
5;6 578 38TOTAL "H#
Calcular @ anali)ar el peso promedio de las truc.as, la varian)a, la desviaci?n
est1ndar @ el coe%ciente de variaci?n"
Soluci?n&
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
48/60
#ara empe)ar .acer los c1lculos necesitamos determinar las marcas de clase
xi " 'ue$o reali)ando las operaciones indicadas @ las sumatorias ue
aparecen en las !?rmulas obtenemos la si$uiente tabla"
Peso8,&2 Bt&(c;as
fi
xi x ifi xix (x2x )2 (x2x )
2fi
Linf . L .
346 3:6 3:8 3"58 54,: 4,3:57 ":6,733:6 36 ;8 38 6"488 34,: ;35,6:57 ";44,74536 586 64 588 33"788 4,: 6:,:57 ;";3,:586 536 38; 538 53";8 5,;5 6,;:57 667,;:45536 556 5 558 6"458 35,;5 363,4:57 ;"7,;757556 5;6 36 5;8 ;"768 55,;5 7:,3:57 4"745,4;
5;6 57638
578 5"788 ;5,;53"877,6:5
7 38"776,:57TOTAL "H# 63"58 75"867,7
Nota& Esta tabla se constru@e !1cilmente en la .o2a electr?nica, usando las
operaciones como !?rmulas de E0cel"
Calc(le*os la *edia a&it*+tica
x xifi
n
51.920
250 584,:
Esto si$ni%ca ue el peso promedio de las 568 truc.as ue .a@ en el criadero
es de 584,: $ramos"
Calc(le*os la Va&ian/a corre$ida-
s2 (xix )
2
fin1 42.054,42501 3:,:
Este valor no tiene an1lisis porue las unidades de este valor son $ramos al
cuadrado"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
49/60
Calc(le*os la des1iaci.n est0nda&corre$ida-
s s2
varianacorregida (x ix )
2fi
n1
168,89 35,64 3;
Nos indica ue los pesos de las truc.as pueden ale2arse del peso promedio 3;
$ramos, o ue los pesos de las truc.as se encuentran desviados con respecto
del peso promedio en 3; $ramos"
Nota: Si el peso de las truc.as se distribu@en normalmente consultardistribuci?n normal- se puede a%rmar ue apro0imadamente un :,5 de las
truc.as tiene pesos entre 584,: Q 3; @ 584": L 3;, es decir, .a@ un $ran
porcenta2e de truc.as cu@os pesos se encuentran entre 37,: $ramos @
558,: $ramos"
Calculemos el coe%ciente de variaci?n"
-V s
x
s
x100
13
207,68 8,85 ,5
Este valor es menor ue el 58, concluimos ue los pesos de las truc.as arco
iris del criadero son .omo$neos, es decir, los pesos de las 568 truc.as del
criadero tienen poca variabilidad" Se$(n la tabla de an1lisis del -V , el
,5 es menor de 33 @ se conclu@e ue los pesos de las truc.as son mu@
.omo$neos"
CUARTA UNIDAD
GRA'ICOS ESTADISTICOS
Una manera de representar la in!ormaci?n es mediante los $r1%cos
estad/sticos" Estos a@udan de manera r1pida a revisar la descripci?n de los
datos"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
50/60
'os $r1%cos m1s comunes son&
El $r1%co o dia$rama de barras .ori)ontales, verticales o en componentes-El $r1%co o dia$rama de l/neas o tra)os"El $r1%co o dia$rama de sectores, circular, de torta o de pastel"'os #icto$ramas"
El dia$rama de Ca2as @ Bi$otes"El Histo$rama"El pol/$ono de !recuencias'as o2ivas o pol/$ono de !recuencias acumuladas"
Ha@ otros $r1%cos ue se utili)an se$(n la disciplina, tales como los
carto$ramas ue se utili)an en las ciencias sociales, la curva de 'oren) ue
e0plica el Coe%ciente de >ini, el cual lo utili)an los economistas" EYCE',
STAT>RA#HICS @ S#SS, en la $aler/a de $r1%cos presenta una $ran variedad
de $r1%cos e incluso en ;D" Otros pauetes estad/sticos presentan $r1%cos
especiales como las caras de C.ernoZ @ estrellas utili)ados para an1lisis de
datos multivariados"
Cada tipo de $r1%co est1 destinado para una labor espec/%ca" Con la pr1ctica
@ de acuerdo a tus necesidades determinar1s cual utili)ar se$(n tus datos"
El $r1%co o dia$rama de barras .ori)ontales, verticales o en componentes-
Es un $r1%co ue utili)a rect1n$ulos .ori)ontales o verticales llamados barras"
El anc.o de cada barra es arbitrario, pero se debe tener en cuenta ue nin$unade ellas se debe cru)arse o *solaparse+ con otra" El alto de cada barra dependede las !recuencias de los datos" >eneralmente los valores de las variables seubican en el e2e Y, @ las !recuencias en el e2e = $r1%co vertical-" Cuando sevan a anali)ar dos o m1s variables el $r1%co recibe el nombre de $r1%co debarras en componentes, tambin se pueden comparar la misma variable endos periodos distintos con este tipo de $r1%cas"
E2emplo&
Se re$istr? en el primer semestre del aGo 5833, la cantidad de USB ue sevendieron en un local donde se comerciali)a accesorios para #C, estos re$istrosse reali)aron en cada uno de los meses" 'a in!ormaci?n se observa en lasi$uiente tabla"
Mes Cantidad de US3 1endidas8*iles
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
51/60
enero 56!ebrero 35mar)o ;:abril 7ma@o 35
2unio 5:
Construir un dia$rama de barras"
Soluci?n"
El $r1%co de barras verticales es el si$uiente" Si ueremos las barras.ori)ontales, ubicamos los meses en el e2e =, @ la cantidad de USB vendidas enel e2e Y-"
enero !ebrero mar)o abril ma@o 2unio
5635
;:
7
35
5:
Cantidad de US3 1endidas
E2emplo&
Se re$istr? en el primer semestre de los aGos 5833 @ 5835, la cantidad de USBue se vendieron en el mismo local del e2emplo anterior, estos re$istros sereali)aron en cada uno de los meses" 'a in!ormaci?n se presenta en lasi$uiente tabla"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
52/60
Mes Cantidad de US3 1endidas"#$$
Cantidad de US3 1endidas"#$"
enero 56 46!ebrero 35 7mar)o ;: 68abril 7 :7ma@o 35 58
2unio 5: 65
Construir un dia$rama de barras en componentes
Soluci?n"
El $r1%co de barras en componentes es el si$uiente" Observa ue si tenemosdos variables en cada valor del e2e Y, se $ra%can dos barras" Si se tienen trescomponentes se deber1n $ra%car tres barras, etc"
El $r1%co o dia$rama de l/neas o tra)os"
Es un $r1%co ue para tra)arlo se ubican puntos en el plano cartesiano @ lue$ose los une mediante se$mentos de recta, llamados tra)os"
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
53/60
E2emplos" eamos la in!ormaci?n de los dos e2emplos anteriores en undia$rama de l/neas"
Cantidad de US3 1endidas "#$$
El $r1%co o dia$rama de sectores, circular, de torta o de pastel"
Se utili)a cuando la unidad se puede subdividir" 'a in!ormaci?n la podemosrepresentar en un c/rculo en el cual se muestra la proporci?n o porcenta2eeuivalente a cada parte"
#ara determinar dic.o porcenta2e .acemos corresponder el total al 388 @mediante regla de tres simple directadeterminamos el porcenta2e ue euivalecada parte"
#otal 388
parte x
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
54/60
De !orma similar .aciendo corresponde el total a ;8[ del c/rculo @ aplicandoregla de tres simple directadeterminamos cu1ntos $rados le corresponde acada parte"
#otal ;8[
parte x
E2emplo"
'a !acultad de Econom/a de una universidad est1 compuesta por& estudiantes,docente, administrativos @ servicios $enerales" Si las cantidades de personasen cada estamento son las ue aparecen en la si$uiente tabla, representemosesta in!ormaci?n mediante un dia$rama circular"
Esta*entos CantidadEstudiantes :88Administrativos 388Docente ;78Servicios >enerales :8
TOTAL $%"#
Soluci?n"
Calculando los porcenta2es @ los $rados para cada estamento, @ poder tra)ar el
$r1%co sin usar .erramientas in!orm1ticas tenemos los si$uientes resultados"
Esta*entos CantidadPo¢
a4es G&ados
G&adosAc(*(la
dosEstudiantes :88 8, 53: 53:
Administrativos 388 4, 54 576
Docente ;78 56,: ; ;;:
Servicios>enerales
:8,3 55
;8
TOTAL $%"# $##@ %#
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
55/60
El dia$rama circular es el si$uiente, presentado en tres dimensiones
3:
5
Pe&sonal 'ac2 Econo*a
Estudiantes Administrativos Docente
Servicios >enerales
'os #icto$ramas"
Es una manera de representar la in!ormaci?n, mediante ob2etos o %$uras" Acada %$ura completa se le asi$na un valor al inicio del $r1%co" Esta debee0plicarse por s/ sola"
El si$uiente $r1%co es un picto$rama ue representa la cantidad de turistasue visitaron la 'a$una de la Coc.a 'a$o >aume), NariGo- los primeros cuatromeses del aGo"
9 6"888 turistas
Enero& """"""36"888 turistas
Febrero&""38"888 turistas
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
56/60
Si se necesitar1 $ra%car 3;"888 turistas en el mes de !ebrero se $ra%car/a 5%$uras de un turista completas @ una parte de otra"
El dia$rama de Ca2as @ Bi$otes"
Este $r1%co se utili)a para anali)ar variabilidad de los datos @ simetr/a, adem1sme determina datos at/picos *outlier+"
NOTA" #ara comprender los trminos usados en este $r1%co, remitirse a lasesi?n de medidas de posici?n"
En una serie ordenada de datos o en datos a$rupados podemos calcular los
tres cuartiles los cuales dividen al ran$o en cuatro partes i$uales" Se aclara ueel se$undo cuartil es i$ual a la mediana" Calculados estos valores construimos
una ca2a entre el cuartil 3 '
1 - @ el cuartil ; '
3 -, con un anc.o
arbitrario, en medio de la ca2a se ubica el se$undo cuartil '2 - o mediana"
'ue$o se encuentran dos valores1 @
2 de la si$uiente !orma&
1 '11,5('3'1 )
2
'3+1,5('3'1 )
En el medio del anc.o de la ca2a se tra)a una se$mento de recta .asta lle$ar a
1 @ otro se$mento de recta al otro lado de la ca2a .asta lle$ar a 2 2
Estos se$mentos de recta reciben el nombre de bi$otes"
E2emplo"
Construir un dia$rama de ca2as @ bi$ote para representar los si$uientes datos&
76, 7, 65, 67, 66, 64, 6, 8, 3, 5, 5, 7, , , :, , 48, 48, 45, 4;, 4;,
47, 46, 46, 4, 4, 44"
Soluci?n&
El lu$ar de un cuartil viene dado por&
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
57/60
L'( ((n+1 )
4 ! el cual representa la posici?n del cuartil(
Entonces tenemos
L'1 ((n+1)
4
1(27+1 )4
4, el sptimo dato es el cuartil
3,'
1= HF
L'2 ((n+1 )
4
2(27+1 )4
37, el dato de lu$ar 37 es el
cuartil 3,'1=
L'3 ((n+1)
4
3(27+1 )4
53, el dato de lu$ar 53 es el
cuartil 3,'1= %
Nota& Si los lu$ares de los cuartiles no son e0actos, se promedian los dosvalores o m1s correctamente se interpolan para encontrar el valor del cuartil"#or e2emplo si el lu$ar del cuartil 3 !uera 4,56 indicar/a ue este cuartil seencuentra entre el dato de lu$ar siete @ el dato de lu$ar :, lo cual indica ue elcuartil 3, se calcular/a promediando as/& 6L8-\5 9 6,6" #ero siinterpolamos se calcular/a as/& 6L8,56V86- 9 6,56" #odemos observarue el (ltimo resultado es el m1s correcto"
A.ora calculemos los bi$otes,
1 '11,5('3'1 ) HF Q $!H8% Q HF %
2 '3+1,5('3'1 )= % ? $!H8%HF F
Como los bi$otes sobrepasan al valor m/nimo 76- @ al valor m10imo 44- delos datos, los bi$otes toman estos valores& 76 @ 44" Esto si$ni%ca ue no
e0isten valores at/picos"
El $r1%co apro0imado es el si$uiente
-
7/25/2019 MODULO ESTADISTICA DESCRIPTIVA 9 feb 2014.docx
58/60
GrficodeCa/a 23igotes
%& && '& & )&
peso45g
GrficodeCa/a23i gotes
6nter7alos deconfian8a del *&9para la mediana: ;'+++,% ,))*'