modulo de estadística_n°5
TRANSCRIPT
-
8/16/2019 Modulo de Estadística_N°5
1/21
Módulo deEstadística 2016Prof. Alan Navarro C.
-
8/16/2019 Modulo de Estadística_N°5
2/21
Unidad Nº2: ESTADÍSTICOS BÁSICOS
• Las medidas de tendencia central para datos noagrupados
Co !n ente " edidas son usadas #ara descri$ir el %centro& o%locali'ación central& de un con(unto de datos:La moda La mediana La media (o
promedio)Cada una de estas edidas inter#reta la idea de %centro& en
diferentes aneras )* la elección de una a#ro#iada edida #aracual+uier con(unto de datos* de#ender, de al enos dos factores:
-os as#ectos de la %locali'ación central& +ue #retenden ca#turarse.
El ti#o de datos de +ue se dis#on a* es decir* si los datos sonno inales* ordinales o nu /ricos.-a se unda consideración es i #ortantísi a* #or+ue* de#endiendo
del ti#o de datos* ser, #osi$le calcular todas o solo al unas de lasedidas de tendencia central reci/n encionadas*
-
8/16/2019 Modulo de Estadística_N°5
3/21
• i los datos son nu /ricos entonces la edia* ediana ) edia#ueden ser calculados*
• i los datos son ordinales* la edia no de$ería ser calculada*• i los datos son no inales* entonces* la !nica edida de
locali'ación central seria la oda.
Medidas detendencia central
Tipos de datosNu /ricos rdinales No inales
Moda i i iMediana i i NoMedia i No No
-
8/16/2019 Modulo de Estadística_N°5
4/21
La moda para datosnuméricos
• -a oda inter#reta el si ni cado de %centro& co o el valor +ueocurre ,s a enudo en los datos. El valor de la oda se #uedecalcular de la si uiente for a:
• Arre lar los datos en for a creciente*• Contar el n! ero de veces +ue cada valor ocurre*• 3denti car el valor 4o valores* si 5a) ,s de uno +ue ocurre con
a)or frecuencia. Este valor es la oda.
Ejemplo 1. -os si uientes datos re#resentan la duración* en 5oras*de 17
#ilas el/ctricas.2"8 292 2"2 292 272 2"2 299 292 2 9262 2"9 220 22 296 2"2 217 227 290
-
8/16/2019 Modulo de Estadística_N°5
5/21
Ejemplo 2. Considere os los valores diarios. En días 5,$iles* del#recio del dólar 4transfor ado a #eso c5ileno en el es de fe$rero
de 2001. estos valores se #resentan en la ta$la si uiente:
Valor deldólar
Frecuencia
8 1; "
61 162 96" 969 1
6 268 167 282 1
-
8/16/2019 Modulo de Estadística_N°5
6/21
Pro#iedades de la oda•
El c,lculo de la oda no usa toda la infor ación en lauestra* es decir* no involucra todos los valores o$tenidosen la uestra* sólo usa el valor +ue ocurre ,s a enudo.Este 5ec5o #odría considerarse de$ilidad si #ensa os +uetoda la infor ación dis#oni$le en la uestra de$ería serusada.
• =e$ido a lo anterior* la oda #odría no ser u) descri#tivade lo +ue ocurre en al uestra. Por e(e #lo* si las notas deun alu no en la asi natura de estadística fuesen:
"*1* "*9 "*9 *6 *7 *; 6*0 6*2 6* 6*6
$tendría os +ue la oda es la nota "*9 #or lo +ue al (u' arel rendi iento de ese alu no en estadística* #or edio dela oda* #arece #oco adecuado.
-
8/16/2019 Modulo de Estadística_N°5
7/21
-a oda #uede no ser !nica 4co o lo vi os en e(e #los#revios . Es co !n lla ar distri$ución $i odal al caso +ue losdatos tienen dos odas.
-a oda es una edida vol,til* esto si ni ca +ue es sensitiva a#e+ue>os ca $ios de los valores u/strales.
-a oda no es #articular ente afectada #or valores e?tre osen la uestra 4estos valores e?tre os son conocidos co o#untos aislados ,s co !n ente lla ados outliers . on esosvalores +ue resultan uc5o as randes o uc5o as#e+ue>os +ue el resto de los datos. -a inclusión de un valoroutlier #uede deter inar +ue una edida de locali'ación central
sea #oco re#resentativa de los datos.-a oda es sie #re i ual a uno de los valores #resentes en la
uestra 4en el caso de datos no a ru#ados
-
8/16/2019 Modulo de Estadística_N°5
8/21
La moda para datos nonuméricos• El #rocedi iento es el is o +ue en el caso de datos nu /ricos.
-a oda es el valor 4cate oría +ue ocurre ,s frecuente enteen la uestra.
Ejemplo 1. Una compañía telefónica realiza entre susclientes de telefonía mó il! una encuesta acerca de su
ser icio! entreg"ndole como opciones# mu$ satisfec%o&satisfec%o& insatisfec%o $ mu$ insatisfec%o.La ta'la siguiente resume la información de 1 clientes.
Categoría FrecuenciaMu)satisfec5o
1
atisfec5o 63nsatisfec5o 2Mu)insatisfec5o
1
-
8/16/2019 Modulo de Estadística_N°5
9/21
La mediana para datosnuméricos
• -a ediana identi ca el valor central de los valores#rovenientes de una uestra. -a ediana es entonces una
edida de centralidad. -a itad de los valores de lauestra ser,n as randes +ue la ediana ) la otra itad
ser,n as #e+ue>os.
-
8/16/2019 Modulo de Estadística_N°5
10/21
• Ejemplo 1 Los índices diarios de calidad del aire registradosen al zona *uda%uel+,erro -a ia+Lo *rado durante el mes dea'ril 2 se presenta en la ta'la siguiente#
=ía @ndice1 22 "" 689 9
866 98 ;7 7; 6810 911 ;12 621" 6619 681 80
=ía @ndice16 6618 ;17 91; 10"20 221 8622 ;2" 10"29 10"2 926 628 10"27 682; 10""0 2
El diagrama de tallo y hoja con los datosordenados de menor a mayor resulta
4 5 55 2 2 2 3 4 4 4 8 9 9 9 96
2 5 6 6 7 7 7 77 0 6 68 9
10 3 3 3 3 3
Como la cantidad de datos es par 30!"entonces e#isten dos lugares centrales estosson el $5 y $6% la mediana se de&ine como elpromedio de estos 'alores" es decir" 5,63
26562
=+
-
8/16/2019 Modulo de Estadística_N°5
11/21
*rocedimiento para calcular la mediana
rdena os los datos de enor a a)or.
e calcula el valor . e usa #or+ue se +uiere encontrarel valor +ue de(e a#ro?i ada ente el 0 de los datos $a(o el )a#ro?i ada ente el 0 de datos so$re el.
i es entero 4ocurre cuando n es i #ar * se u$ica el dato +ue est,en el lu ar . Este valor corres#onde a l a ediana.En el caso +ue no sea entero 4ocurre cuando n es #ar * seu$ican los datos +ue est,n en los lu ares as #ró?i os* )a sea a lai'+uierda o a la derec5a de . En este caso los lu ares ,s#ró?i os son
) . -a ediana corres#onde al #ro edio entre estos dos datos.
)1(21
+n
)1(21)1(
10050 +=+ nn
12
+n
2n
)1(21
+n
)1(21 +n
)1(21
+n
-
8/16/2019 Modulo de Estadística_N°5
12/21
• Considere os nueva ente los valores diarios del#recio del dólar en el es de fe$rero de 2001.
Valor del dólar Frecuencia8 1; "
61 1
62 96" 969 16 268 167 282 1
-
8/16/2019 Modulo de Estadística_N°5
13/21
ugar deordena!iento
Valordeldólar
1 8
2 ;
" ;9 ;
61
6 62
8 62
7 62
; 62
"# $%&
Para calcular la mediana de estos datos, los ordenamos en formaascendente, como se p resenta la siguiente t abla:
ugar deordena!iento
Valordeldólar
"" $%&
12 6"
1" 6"19 69
1 6
16 6
18 68
17 67
1; 67
20 82
Como n = 20, los lugarescentrales son . Los datosubicados en los l ugares 10y 11 corresponden a losvalores 5 63 y 563. así, lamediana res ulta i gual a
-
8/16/2019 Modulo de Estadística_N°5
14/21
Pro#iedades de laediana
• -a ediana no es vol,til co o la oda* de$ido a +ue resultara'ona$le ente esta$le frente a B#e+ue>os& ca $iosreali'ados a los datos.
• -a ediana* co o la oda* es #articular ente no sensitivaa valores e?tre os 4outliers .
•Para un con(unto de n datos e?iste una !nica ediana.• i n es i #ar* la ediana resulta ser uno de los datos de la
uestra. En el caso en +ue n es #ar* la ediana resultai ual a uno de los datos de la uestra* solo si los datosu$icados en los lu ares son i uales.
• Co o en el caso de la oda* la ediana no usa toda lainfor ación #resente en la uestra* desde +ue el valornu /rico de la ediana es calculado usando sola ente elvalor central de los datos* el resto de los datos sondesesti ados.
-
8/16/2019 Modulo de Estadística_N°5
15/21
a !ediana para datos cualitati'os
• El #rocedi iento #ara calcular la ediana cuando los datosson ordinales nu /ricos es e?acta ente el is o +ue eldescrito #ara el caso de datos nu /ricos* esto es* se calculaa #artir de la ta$la de frecuencias.
-
8/16/2019 Modulo de Estadística_N°5
16/21
Ejemplo. La ta'la muestra el puntaje del test de pgar! parauna muestra de /0 recién nacidos.
(unta)e *+!ero dereci,n nacidos
Frecuenciaacu!ulada
0 0 01 1 12 1 2" 89 7 1
12 286 19 918 17 67 1; 87; 11 7;10 ; ;7
-
8/16/2019 Modulo de Estadística_N°5
17/21
-
8/16/2019 Modulo de Estadística_N°5
18/21
• Ejemplo 2. Consideremos los 'alores del d lar en pesos chilenos!registrados en el mes de &e*rero del a o 200$%
Valor deldólar Frecuencia Frecuenciarelati'a8 1 0*0; " 0*1
61 1 0*062 9 0*206" 9 0*2069 1 0*06 2 0*10
68 1 0*067 2 0*1082 1 0*0
-
8/16/2019 Modulo de Estadística_N°5
19/21
Pro#iedades de la ediaarit /tica
• El c,lculo de la edia involucra todos los valores de lauestra* es decir* usa toda la infor ación dis#oni$le.
• -a edia es afectada #or outliers.
• -a edia* eneral ente* no es i ual a al uno de losvalores +ue co #onen la uestra.
-
8/16/2019 Modulo de Estadística_N°5
20/21
• Ejemplo . En una sección de una tienda co ercial* se 5aofrecido a sus e #leados un incentivo econó ico #orlo rar cierta eta en las ventas ensuales. A cada uno delos 9 vendedores se les ofrece un incentivo de 70.000 )#ara el (efe de la sección el incentivo de 900.000.
-a edia de los incentivos es 199.000* este valor nodescri$e la situación +ue ocurre en esta sección de latienda. -a ediana* #or otra #arte* es 70.000 ) es al
enos re#resentativa de lo +ue 9 de los e #eladosreci$irían de incentivo.
-
8/16/2019 Modulo de Estadística_N°5
21/21
Actividades1.D -as cali caciones o$tenidas #or 8 a i os en Estadística
5an sido: 6*8 "*7 2*2 9*; *7 9*1 6*6
a.D Calcula la edia de las notas o$tenidas.$.D Calcula la ediana de las notas o$tenidas.c.D Calcula la oda de las notas o$tenidas.
2.D En una o cina el (efe ana 600.000 ) los tres e #leadosanan 900.000* " 0.000 ) 128.000. Flaedia de los sueldos es un valor re#resentativo de esos
sueldosG
".D -a asa en H de 7 co #a>eros de clases es:" 97 98 9" 2 7 62 9;a.D FCu,l es la ediana de las asa de los 7 co #a>erosG$.D FCu,l es la ediana de las asas* si inclui os al #rofesor
+ue #esa 8" H G