estadÍstica descriptiva 17.pdf · • las variables muchas veces son medidas con algún

87
ESTADÍSTICA DESCRIPTIVA Análisis Exploratorio de Datos e Inferencia Descrip<va

Upload: lytuong

Post on 30-Sep-2018

229 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

ESTADÍSTICADESCRIPTIVA

AnálisisExploratoriodeDatoseInferenciaDescrip<va

Page 2: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

AntesesImportantetenerencuentaque…

NONecesariamentelaE.Descrip<va<enequelimitarseaesterol

Describiratodala

Derivarconclusionessobrela

Derivarconclusionesdela

Page 3: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Noscentraremosendescribirlamuestra

•  Sinembargo,debetenerseencuentalasdiferenciasanteriores,yaqueimpactanenlosinstrumentosparahacerdescripcionesefec<vas.

v NOeslomismodescribirunamuestradeunapoblación.

Ej:CámaradeDiputados2014-2018.Contraej.CámaradeDiputadoscomouna“realización”.v Esteprincipioespar<cularmenteimportanteparagenerarindicadoresdedispersión.

Page 4: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Estadís<caDescrip<va

•  Resumelainformacióncontenidaenunconjuntodedatos(observaciones).NOsedesliga,necesariamente,delosobje<vosinferenciales.

•  Consideraremostresaspectos:1.  Frecuencias.2.  Indicadores.3.  RepresentacionesmedianteGráficosyTablas.

v Sedebedis<nguirentreelanálisisunivariado,bivariadoymul<variado.

Page 5: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Engeneral,sehaceprevioalainferencia.•  Sonmúl<pleslosmo<vosporloscualesseexaminanlosdatos:1.  Para conocer el detalle de la información contenida

(comúnmente no es de elaboración propia). Esto implicaconocerlaslimitacionesdelosdatos.

2.  Paraconocerlaformaenqueestáestructuradalainformación.3.  Paradetectarproblemasenlosdatos.4.  Paradetectarpatrones.5.  Paragenerarhipótesisorefinarlas.6.  Para seleccionar el método apropiado para evaluar las

hipótesis.Depar<cularrelevanciaesdetectarviolacionesalossupuestosestadís<cos.

Page 6: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

DosConsejosImportanasimos(G.King)

•  Laeleccióndeunmétododeanálisisestadís<codebebasarseenlasgte.pregunta:¿quélehice(voyahacer)alosdatos?

v Nobastaconmencionarelprocedimiento,hayquecomprenderquéhaceparagenerarestadís<cas.

•  ElhechodequelosdatosenCienciaPolí<canosa<sfaganlossupuestosestándaresnollevaaquesedebanrechazarlosmétodoscuan<ta<vos.Únicamenteexigeunusomáscuidadosodeéstos(yenalgunoscasosu<lizarinstrumentosmássofis<cados).

Page 7: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Primeroquetodo…•  UnaVariableesunacaracterís<caquetomadis<ntosvaloresdentrodelasen<dadesobservadas(agrupaatributosdemodológico).

•  Lamedicióndeunavariableconsisteenasignarlevaloresadichascaracterís<cas.

•  Existendis<ntos<posdevariables.Suniveldemediciónimpactasobreel<podeestadís<casquepuedenu<lizarse(tantoenestadís<cadescrip<vacomoinferencial).

•  Elniveldemediciónnoesalgointrínsecoalavariable.

Page 8: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

•  TiposdeVariables:–  Cualita<va:observablemásnomedibleenescalasmétricas.Seasocianvaloresparasumanejo.

–  Cuan<ta<va:medibleenescalamétrica.•  EscalasdeMedición:–  Con<nua–  Discreta

•  NiveldeMedición:–  Nominal(exhaus<vidadyexclusividad).–  Ordinal(orden).–  DeIntervalo(cuan<ficableladistanciaentrevalores).–  DeRazón(ceroabsoluto).NormalmentealasdosprimerasselesllamaCATEGÓRICASyalasdosúl<masESCALARES.

Page 9: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Variable

Categórica(Cualita<va)

Nominal(Categoríassin

ordenymutuamenteexcluyentes)

Ordinal(Categoríasconordennaturaly

mutuamenteexcluyentes)

EscalaroNumérica

(Cuan<ta<va)

Discreta(Enteros,

teóricamentecontablesofinitas)

Con<nua(Toma

cualquiervalorenunRangodevalores).Puedeser

IntervalarodeRazón.

Page 10: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Ejemplo:Educación

•  Tengolossiguientesindicadoresdeeducación:

•  Puntajeobtenidoenuntestdedesempeño(PSU).•  NiveldeEstudiosalcanzados(Básica,Secundaria,Técnico-Profesional,Universitaria).

•  AñosdeEscolaridad.•  Estudióencolegiomunicipal,par<cularsubvencionadoopar<cularpagado.

•  Enbasealtest:DesempeñoSobresaliente,Sa<sfactorio,Insa<sfactorio.

Page 11: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

ErrordeMedición

•  Lasvariablesmuchasvecessonmedidasconalgún<podeerror.

•  Esdis<ntounerroraleatorio(alazar)yunosistemá<co.Elsegundoesmásproblemá<coalgenerarsesgo.

•  Esdilcil,sininformaciónadicional,conocerelcarácterdelerrordemedición.

Page 12: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Frecuencias

•  UnaDistribucióndeFrecuenciasesunlistadodelosposiblesvalores(ointervalosdeéstos)quetomaunavariable,juntoalnúmerodeobservacionesparacadavalor.

•  F.Absoluta:registraeln°devecesqueapareceundeterminadovalorentrelasobservaciones.

•  F.Rela<va:registralaproporciónoporcentajedeocurrenciadeundeterminadovalordelasobservaciones.

Page 13: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

RepresentacionesdeInformación

•  LasDistribucionesdeFrecuenciapuedenrepresentarsemediantetablas.

•  DEBEincluirtodoslosposiblesvaloresdelavariable(enconjuntoserexhaus<va),demodoquesepuedanclasificartodoslosvaloresobservados.

•  Esdeseableindicareltotaldeobservaciones(n).•  Sise<eneunagrancan<daddedatosresultaconvenienteagruparlosmedianteintervalos.

Page 14: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Indicadores

•  Unaalterna<vaesdescribirunconjuntodedatosmedianteunindicador(unnúmero)queresumeunacaracterís<cadeladistribucióndelosdatosanalizados.

•  Unabuenadescripciónrequiereanalizar:– ElCENTROdeladistribución.–  LaDISPERSIÓNdeladistribución.–  La POSICIÓN RELATIVA de observaciones en ladistribución.

–  LaFORMAdeladistribución.

Page 15: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresdeTendenciaCentral

•  MediaoPromedio(Aritmé<co).

•  Moda:valormásfrecuente(puedeserunoovarios).

Page 16: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

OtrosTiposdeMedias

Page 17: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresdeTendenciaCentral

•  Mediana:Esuncasoespecialdelpercen<ldeordenp.Correspondealpercen<ldeorden0.5

v Valorde lavariableenestudio,demodotalque,a lomás el (100p)% de las observaciones toman valoresmenoresqueélya lomás100*(1-p)%tomanvaloresmayoresqueél.

•  Hay dis<ntas convenciones. Pero en general, si n esimpar, la mediana es el valor intermedio(n+1)/2;mientrasquesíespar,lamedianasonlosdosvaloresintermedios (n/2) y (n+1)/2. Ahora bien, algunosautorespromedianambosvalores.

Page 18: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Percen<ldeOrdenp

•  Comoindicadordeformarela<va,necesitaquelasobservacionesdemenoramayor.

•  Sin*pesentero,tantoelvalorXqueocupadichaposicióncomoelqueocupaellugar(n*p)+1endichalistaordenadasonpercen<lesdeordenp.

•  Sinoesenteron*psedebetomarlaparteentera.

•  Ejemplos:cuar<les,quin<les,deciles,etc.

Page 19: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Mediavs.Mediana

Page 20: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Mediavs.Mediana

•  Lamedianaesunindicadormenossensiblealasobservacionesaapicasquelamediaaritmé<ca(hayalterna<vasalpromediosimple).Sinembargo,dicebastantepocosobreladistribucióncomountodo.

•  Encambio,lamediaesunindicadorquesinte<zamuchainformaciónsobreladistribución(deahísusensibilidadalosvaloresaapicos).Tienecomointenciónserun“representante”globaldeladistribución.

Page 21: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresdeDispersión

•  Varianza:eselpromediodelasdesviacionescuadradasdelasobservacionesrespectoalamedia.

•  Deesteindicadorsederivanladesviaciónestándaryelcoeficientedevariación.

Page 22: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

UnAspectoImportanasimo

V.Muestral V.Poblacional

Page 23: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresdeDispersión

•  Launidaddelavarianzaestáalcuadrado.Suvaloresdilcildeinterpretar,porloquepuederesultaruntantoarbitrario.

•  Ladesviaciónestándareslaraízcuadradadelavarianza(facilitainterpretación).

•  Elcoeficientedevariaciónes:

C.V.=DesviaciónEstándar/Media

Page 24: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

OtrosIndicadoresdeDispersión

•  Mínimo•  Máximo•  Rango:diferenciaentremínimoymáximo.•  RangoIntercuaralico:diferenciaentreelvalordelterceryprimercuar<l(percen<l0.75y0.25).Deestemodo,concentrael50%delasobservaciones.

Page 25: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresdeTendenciaCentralyNiveldeMedicióndelaVariable

Page 26: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

PrincipioClave

•  Siempreunindicadordetendenciacentraldebeseracompañadodeunindicadordedispersión.Normalmente:

1)Media+DesviaciónEstándar2)Mediana+Rango(oRangoIntercuaralico)3)Moda+FrecuenciaAbsoluta(oRela<va)yN

Page 27: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresDescrip<vosdeForma

•  Dadaslaslimitacionesdelosindicadoresdetendenciacentral(yotros),secomplementaconindicadoresdeforma.

•  Informansobreelgradodenormalidaddeladistribución.1.  Asimetría:FormaDistribuciónensen<dohorizontal2.  Curtosis:FormaDistribuciónensen<dover<cal

Page 28: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresDescrip<vosdeForma

•  Asimetría:mideelgradoenquelaformadeladistribuciónessimétricaoasimétrica.Endichocaso,elsesgoesrespectoalamedia.–  Sesgo:Colamáslargadeladistribución.

•  Curtosis:mideelgradoenquelaspuntuacionesestánagrupadasentornoalpuntocentral.Esdecir,haycierta“proporcionalidad”entrelafrecuenciadelaspuntuacionescentralesydelaspuntuacionesextremas.

Page 29: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresDescrip<vosdeForma

Page 30: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

IndicadoresDescrip<vosdeForma

Page 31: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún
Page 32: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Estadís<caBivariada

•  Dostécnicastradicionales:CorrelaciónyDescomposicióndelaVarianza.

•  Elcoeficientedecorrelaciónlineal(dePearson)eslatécnicaporexcelenciaparaanalizarrelaciónentreescalaryunacategórica).

•  Ladescomposicióndelavarianzanormalmenteseusatomandounavariablecategóricacondicionanteyunacon<nuacondicionada.

Page 33: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

DescomposicióndelaVarianza

•  Ú<lparaelestudiodelosgrupos(lavariablecondicionantedetectadiferenciasenlavariableestudiada).Lavariablecualita<va(oenalgunoscasoscuan<ta<vadiscreta)par<cionaalasegundaenLgrupos.

•  Lamediatotaleselpromedioponderado(segúneltamañodecadagrupo)delasmediasdelosgrupos.

Page 34: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

FuentesdeVariabilidad

•  LavariabilidadenlavariableXeselresultadodelavariabilidaddentrodecadagrupocomodelasdiferenciasentrelosLgrupos.

•  ComoindicadordelaprimerasecalculalaIntravarianzaqueeslamediaponderadadelasvarianzasdentrodecadagrupo.

Page 35: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

•  Comoindicadordelosegundosecalculalaintervarianza,elcualcorrespondealadispersiónponderadadelasmediasdecadagruporespectoalamediageneral.

•  Sielcoeficientedepar<ciónseaproximaa1,laprincipalfuentedevariabilidadsonlosgrupos(lavariablecondicionante)

Page 36: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Correlación(dePearson)

•  Resumeinformaciónsobrelaasociacióndedosvariablescon<nuas.

•  RelaciónDirecta/Inversa.MEJORhablardeasociaciónposi<vaonega<vaoserprecisoeindicarquesucedeconYcuandocrece(decrece)X.Asínosedependedelacodificación.

Page 37: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

EstudiodelaAsociaciónpormediodelaCovarianza

•  Paradescribirgráficamenteunaasociación,esú<lfijarcomopuntodereferencialasmediasdelasvariablesXeY.

•  Deestemodoseredefineelplanocartesiano(gráficodedispersiónXY).Unarelaciónposi<vacorrespondealcasoenquehayunmayornúmerodepuntosenloscuadrantesIyIII(ynega<vasisonloscuadrantesIIyIV).

Page 38: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Covarianza

•  SilaCovarianzaesmayora0laasociaciónesposi<va;menora0esnega<voysiesaproximadamente0nohayasociación.

•  Lacovarianza<eneproblemassimilaresalavarianza.Esdilcildeinterpretarsumagnitud.

Page 39: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

CoeficientedeCorrelaciónLinealXY

•  Seajustalacovarianzademododeacotarlaavaloresentre-1y1.

•  Engeneral,entre-0.1y0.1nohayasociación.Valores|0.1|a|0.4|sonbajos,entre|0.4|y|0.7|moderadasyvaloresabsolutossuperioressoncorrelacionesaltas.

Page 40: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Correlaciones

•  Hayotros<posdecorrelacionesquemerecensernombradas.Elénfasisseráenlaintuición

•  ElcoeficientedecorrelacióndeSpearman(ρorho)esunamedidadecorrelaciónentredosvariablescon<nuas,dóndeseaprovechaelordendelasobservaciones.Seinterpretadeigualmodoqueelcoef.dePearson.

•  Hayunamul<plicidaddetécnicasdecorrelación/asociaciónparamanejarvariablescategóricas.Entredosvariablesnominaleseseljicuadrado.

Page 41: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Correlaciones

•  Unacorrelaciónpolicóricaesunacorrelaciónentredosvariablesordinalesobservadas.Seasumequeparaamboscasos,lavariablelatentesedistribuyenormalmente.Lacorrelacióntetraclóricaeselcasoespecialenqueambasvariablessondicotómicas.

•  Lacorrelaciónparcialesentredosvariablessilaterceravariablepermanececonstante(1erorden,subeelordenalsumarvariables).

Page 42: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

DetallesTípicos

•  Asociaciónnoescausación.•  ElcoeficientedecorrelaciónesLINEAL.•  Eltamañodelcoeficientedecorrelaciónesrela<voaladesviaciónestándar.

•  Esposibleevaluarlaposibilidaddequelacorrelaciónen una muestra de datos sea producto del azar(realizaruntestdehipótesis).

•  Falacia Ecológica: una correlación a nivel grupal nodebe condecirse con una correlación a nivelindividual.

Page 43: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Tablas•  Estrategiadeorganizaciónyresumendelainformación.

•  Laclaveesfacilitarelanálisiseinterpretacióndeltrabajoempírico.– Autosuficienciaensucomprensión.

•  Dis<ntos<pos:1.  DeFrecuencia2.  DeCon<ngencia(bivariadas,mul<variadas)3.  DeResumen(estadís<cos,modelos,etc.)

Page 44: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

EtapasenConstruccióndeTabla

1.  Definirlospropósitosdelatabla:¿quémostrar?2.  Asignarun<tuloalatabla.3.  Asignarlasvariablesafilasycolumnas,indicandoel

nombredecategorías,valoresointervalosusados.4.  Colocarlosvaloresrelevantesparainterpretar.5.  Agregarnotasexplica<vascuandoseannecesarias

paraunamejorcomprensióndelaTabla.6.  IndicarlaFuentedelainformación.

Page 45: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

TituloyFuente

•  El<tulodebeespecificardemaneracompletasucontenido:1.  Quésepresenta.2.  Cómoseclasificanlasunidadesdeobservación.3.  Dóndeseob<enendatos(espacialidad).4.  Cuándoseob<enendatos(temporalidad).

•  LaFuentecorrespondealosautoresdelosdatos,siendonecesarioindicarsunombre(personalocorpora<vo)yelañodeproducción/recopilación.

Page 46: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Recomendaciones

•  Apartedelostemasyareseñados,algunosconsejosrápidos:– Noabusardelusodelíneas.– SiempreincluirelNºdeobservaciones(N).– Nuncausare<quetasdevariablesenbasededatos:aludirafenómenos.

– Español.– Usocuidadosodelporcentaje

Page 47: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

UnejemplosencilloTabla1:AprobaciónPresidencialsegúnSexo

Sexo

Hombre Mujer Total

ApruebalaGes<óndelPresidente

Sí 110 89 199

No 491 500 991

Total 601 589 1190

Fuente:CEP,2015

¿EscorrectodecirqueloshombresapoyanenmayormedidaalaPdta.?

Page 48: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

UsodePorcentajes1Tabla1:AprobaciónPresidencialsegúnSexo

Sexo

Hombre Mujer Total

ApruebalaGes<óndelPresidente

Sí 9.2% 7.5% 83.3%

No 41.3% 42.0% 16.7%

Total 50.5% 49.5% 100.0%

Fuente:CEP,2015

Secalculanlosporcentajesrespectoaltotal(N=1190)

Page 49: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

LosPorcentajesTotalesdicenpocorespectoaunaasociación/crucedevariables

PorcentajeFila

VariabledeInterés(Y)

VariableCondicionante(X)

%Fila

PorcentajeColumna

•  Lastablasseleenenladireccióndelavariablecondicionante(X).

•  Cuandose<eneunobjetoexplica<vo,sehipote<zadependenciaestadís<ca.

Variablecondicionante(X)

VariabledeInterés(Y)

%Columna

Page 50: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

UsodePorcentajes2Tabla1:AprobaciónPresidencialsegúnSexo

Sexo

Hombre Mujer Total

ApruebalaGes<óndelPresidente

Sí 55.3% 44.7% 100.0%

No 49.5% 50.5% 100.0%

Total 50.5% 49.5% 100.0%

Fuente:CEP,2015

Secalculanlosporcentajesrespectoaltotaldelasfilas(N=1190;Sí=199;No=991)

Page 51: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

UsodePorcentajes3Tabla1:AprobaciónPresidencialsegúnSexo

Sexo

Hombre Mujer Total

ApruebalaGes<óndelPresidente

Sí 18.3% 15.1% 16.7%

No 81.7% 84.9% 83.3%

Total 100.0% 100.0% 100.0%

Fuente:CEP,2015

Secalculanlosporcentajesrespectoaltotaldelascolumnas(N=1190;Hombres=601;Mujeres=589)

Page 52: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

InterpretacióndeTabla%Columna

1.  Describirelmarginalcolumna(totaldecolumna),enfa<zandolomásfrecuente/relevante.Claroestá,dependedelnºdecategoríasdelaTabla.

2.  Compararalolargodelafila(lógicahorizontal).–  ¿Haydiferenciasenloanteriormentedescritoporgrupos?

–  ¿Cuáleselpatróndediferencia?–  Buscardiferenciassustan<vas(sobre5%)

3.  Noabusardelainclusióndenúmeros,enfa<zarlastendencias/patrones.Serexplícitoconunidaddeanálisis(nohablardecasos),conlasvariables(entantofenómenos)yconladirecciónderelaciones.

Page 53: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Gráficos

•  Losgráficoscons<tuyenotraformadesinte<zarinformaciónacercadelosdatos.Sonformasvisiblementemásresumidasy“agradables”alavista.

•  Todográfico<enesubyacenteunatabla.Sonmodosequivalentes(rela<vamente)depresentarlainformación.Ladecisiónsebasaenloquesebuscacomunicar(yaquiénsedirige).

•  Noobstante,suusodependerádel<podevariables,can<daddevariables,can<daddeatributosentreotrascaracterís<cas

Page 54: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún
Page 55: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

ReflexionesPreviasalaConstruccióndeunGráfico

•  Laseleccióndel<podegráfico(diseño)sehaceenbase alNivel deMedición de la(s) variable(s), a loque se desea comunicar (Obje<vo), los aspectosespecíficosdelainves<gaciónylaaudiencia.

– Gráfico de Torta o Pastel: Variables nominales uordinales– Histogramas o Gráfico de caja o Polígono defrecuencia(áreas):Variablesdeintervaloorazón.

Page 56: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

FormatodelosGráficos•  NUNCAolvidarqueungráficoesunresumendeinformación.

Porlotanto,serequiereclaridadenlainformaciónpresentada.Algunosconsejos:

1)  Losatulosgenerales,delosejesylasleyendas,notasalpiedelatabla(fuente,eliminacióndeatributos…)

2)LógicadelaClasificación:Exhaus<vidadyexclusividaddelascategorías3)  Tamañosdeletraslegibles-Idiomacastellano4)  Privilegieunformatoacadémico

Nuncasobrecargueungráfico(“ChartJunk”)

Page 57: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

AspectoVisualClave:Proporcionalidad

•  Iden<ficaciónClaradelasunidadesdemedicióndelasVariables.•  Elejedebeserproporcional.Porlotanto,evitar,enlamedidade

loposible,lasescalasquenocomiencenenelvalormínimo(comúnmente0).

•  Elusodeproporciones/%debeceñirseestrictamentealprincipiodeproporcionalidad.Evitarqueenungráficonosumen100%(especialmenteengr.detorta).Siocurreincluirunanotaexplica<va.

•  Cuidadoconlosgráficoscuyoporcentajenosecorrespondeconeltamañodelarebanada.NOesrecomendableu<lizargráficosdetortaen3D,especialmentecuando<enenmuchascategoríasosi<enenfraccionessemejantes.

•  Cuidadoconloshistogramasqueno<enenigualanchodeclase.

Page 58: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

FuentedelaInformación

•  Indiquelafuentedelosdatos.Silasfuentessonmúl<plesincluiralgunanotaodetallarenelAnexo.

•  Preferentementeseñaleelnconelquetrabajaeneltotaloporgrupo.Asuvez,señalesiconsiderasobrequetotalcalculalosporcentajes.

•  Escrucialnumerarlosgráficosparafacilitarlalecturadeltexto.

Page 59: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

GráficosUnivariados

•  Loshistogramaspermitenlaagrupacióndelasvariablesescalaresentramosequivalentes,dondecadabarrarepresentalafrecuenciaacumuladaparacadatramoovalornumérico.

•  Sonespecialmenterelevantesparaconocerladistribucióndelasvariablesenestudio,comounaaproximaciónunivariada.

Page 60: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Histograma•  DEFINICIÓNDELIBRO:“m”barrasconalturash(ak)yanchola

longituddelintervalo(ak-1,ak],así,eláreadecadabarraesigualalafrecuenciadeobservacionesquecaenenelintervalocorrespondiente.

•  Eláreatotalesiguala1.

•  CONCLUSIÓN:loqueseinterpretasonlasÁREASdelasbarras,NOsualtura.Sisegraficantodoslosvaloresconigualancho,sepuedeninterpretarlasalturas.

•  Puederepresentarlafrecuenciaabsoluta,rela<vaoladensidad(No%).

•  Ladensidadpuedeseralgomás“abstracta”,perosepuedevincularconlanocióndeprobabilidad.Laalturacorrespondealporcentajedivididoporlalongituddelintervalodeclase.Sisequiere,eselporcentajeporunidadhorizontal.

Page 61: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Histograma

•  Loshistogramassonbastantesensiblesaladefinicióndelanchodelabarra/compar<miento/estanco(bin).Amedidaquesereducenlostramos,elgráficoseaproximaaunacurva.

•  Obviamente,tambiénesdependientedeladefinicióndelosejes.

Page 62: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

GráficodeBarras

•  Paravariablescategóricas.•  EláreaNO<enesen<do.Seinterpretaúnicamentelaaltura.Buscaserunarepresentacióngráficadelasfrecuencias(absolutasorela<vas).

•  ¿SeparacióndeNiveles/Barras?•  Permitepresentarlainformacióndeunavariableque<enemúl<plescategorías.Permiteunordenamientosegúnfrecuencia.

Page 63: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

GráficodeBarras

•  Laorientacióndelasbarraspuedeserelegidadeacuerdoalacan<daddecategoríasdelavariable,asícomoel<podeordenquedeseemosdaralasbarrasopormo<voses<lís<cos.

Page 64: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

HistogramayGráficosdeBarras

Page 65: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

GráficodeTorta

•  Muypocorecomendable.Endesusoeneltrabajoacadémicoporloengañosoquepuederesultar.Siguesiendousadoparaaudienciasmásmasivas.

•  Suusoesrecomendablecuandolavariable<enepocascategoríasderespuesta.Delocontrario,lainformaciónsaturaelgráficoynopermiteunabuenalectura.

•  Sedebetenercuidadoconlasdimensionesylaperspec<va,paranogenerardistorsionesalobservarlostrozosquerepresentanacadacategoríaderespuesta.

Page 66: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

BoxPlot

Losbigotessegeneranenelcasodequeelvalormáximosean,alomás,1,5*IQR.Losvaloresquesuperenestareglaserepresentancomopuntos(aapicos).

Page 67: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

BoxPlot

•  GráficodeCajayBigotes.•  Seusanconvariablesescalares(cuan<ta<vas).•  Elobje<voesdescribirladistribucióndelavariable.

Page 68: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

¿Cuantasobservacionesseincluyen?

Page 69: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

GráficosBivariados

•  Categórica+Categórica:tablacruzada(con<ngencia),gráficodebarrascondicionadooboxplotapilado.

•  Categórica+Escalar:Boxplot•  Con<nua+Escalar:GráficodeDispersiónoBoxplotApilado

Page 70: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Categórica+Escalar:Boxplot

Cuello Azul Cuello Blanco Profesional

5000

10000

15000

20000

25000

Grafico 4: Distribucion del Ingreso segun el Tipo de Trabajo

Duncan (1979)Tipo de Empleo

Ingr

eso

Pro

med

io (D

olar

es)

AquíelNºdeobservacionesesaúnmásrelevante(olaproporcióngrupal)

Page 71: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Escalar+Escalar:GráficodeDispersión

0 20 40 60 80 100

020

4060

80100

Grafico 5: Relacion entre Heterogeneidad Etnica y Migracion en Ciudades Estadounidenses en 1950

Fuente: Angell (1951)Porcentaje de Personas No Blancas

Por

cent

aje

de R

esid

ente

s M

igra

ntes

Page 72: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

GráficodeLínea

•  Suprincipalusoesenelanálisistemporaldelainformación.Demaneramásgeneral,<enencomoobje<voindicartendenciasenlosdatos(opuntosdeinflexión).

•  Puedenpresentarsemúl<plesvariablesalavez.Laprecaucióndebecentrarseenlasunidadesdemedidaylosejes.

Page 73: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

0

5

10

15

20

2 4 6Tiempo (Meses)

Dem

anda

por

Cig

arro

s (D

olar

es)

Grafico 6: Evolucion de la Demanda por Cigarros tras la Aprobacion de Nueva Legislacion

Page 74: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Categórica+Categórica

Page 75: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Categórica+Categórica

•  d

Page 76: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

GráficosdeBarrasAgrupadas

•  Permitencompararáreasquecorrespondenamismascategoríasenvariablesdiferentes.Cadabarrasuma100%,esdecir,con<enetodaslascategoríasderespuestadelavariableevaluada.

•  Noserecomiendaeste<podegráficoscuandohaymuchascategoríasderespuesta.Nosepuedeinterpretar.

Page 77: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

GráficoconBarrasPosi<vasyNega<vas

•  Seaprovechanlaestructuraparahacerunacomparaciónentrevalores“opuestos”.

•  Muchasvecesseexcluyenlascategorías/valoresintermedios.

Page 78: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Unapequeñaintroducciónalcasomul<variado

Page 79: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún
Page 80: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún
Page 81: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún
Page 82: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún
Page 83: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún
Page 84: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Resumen

Page 85: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

ErroresFrecuentes

•  Noreflexionarsobreel<podevariables.•  Mostrarpocainformación.•  Incluir“basura”gráfica.•  U<lizarefectos3Doabusardeloscolores.•  Usarunaescalainadecuada.•  Noprecisarlosejes(e<quetas,unidad,valormínimoymáximo).

Page 86: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Gráficosvs.Tablas•  Laelecciónentreusargráficosotablasparapresentarinformación

noestansencilla.

•  1.Ifthereisarela<velysmallamountofdataandthespecificnumericvaluesareimportant,thentablesareprobablybe�erthangraphs.

•  2.Ifthereisalargenumberofdatavalues,thengraphsarelikelytoprovidemoreusefulinforma<onthantabulardisplays.

•  3.Iftheresearcherismoreinterestedinsystema<cpa�ernswithinthedatathaninpar<cularnumericvalues,thengraphsareprobablymoreusefulthantables.

Page 87: ESTADÍSTICA DESCRIPTIVA 17.pdf · • Las variables muchas veces son medidas con algún

Parafinalizar…•  Intryingtodeterminewhatmakesagoodgraph,therelevantcriterionis

nottheaesthe<csofthedisplay.Instead,itisthedegreetowhichthegraphencouragesaccurateinterpreta<onoftheinforma<onthatitcontains.

•  Inordertodeterminewhetherapar<culargraphicaldisplayisa“good”graphornot,itisnecessarytoconsiderthepurposeofthedisplay.

•  analy<cgraphicsareintendedtorevealinteres<ngandsalientaspectsofthedatatotheresearcher.

•  Presenta<onalgraphsassumethattheimportantfeaturesofthedataarealreadyknowntotheresearcher.Instead,theycreatevisualdepic<onsofthesefeaturesforotheraudiences.

Extraídode“GraphicalDisplaysforPoli<calScienceJournalAr<cles”deW.JacobyyS.Schneider(2010).