estadÍstica descriptiva 17.pdf · • las variables muchas veces son medidas con algún
TRANSCRIPT
ESTADÍSTICADESCRIPTIVA
AnálisisExploratoriodeDatoseInferenciaDescrip<va
AntesesImportantetenerencuentaque…
NONecesariamentelaE.Descrip<va<enequelimitarseaesterol
Describiratodala
Derivarconclusionessobrela
Derivarconclusionesdela
Noscentraremosendescribirlamuestra
• Sinembargo,debetenerseencuentalasdiferenciasanteriores,yaqueimpactanenlosinstrumentosparahacerdescripcionesefec<vas.
v NOeslomismodescribirunamuestradeunapoblación.
Ej:CámaradeDiputados2014-2018.Contraej.CámaradeDiputadoscomouna“realización”.v Esteprincipioespar<cularmenteimportanteparagenerarindicadoresdedispersión.
Estadís<caDescrip<va
• Resumelainformacióncontenidaenunconjuntodedatos(observaciones).NOsedesliga,necesariamente,delosobje<vosinferenciales.
• Consideraremostresaspectos:1. Frecuencias.2. Indicadores.3. RepresentacionesmedianteGráficosyTablas.
v Sedebedis<nguirentreelanálisisunivariado,bivariadoymul<variado.
Engeneral,sehaceprevioalainferencia.• Sonmúl<pleslosmo<vosporloscualesseexaminanlosdatos:1. Para conocer el detalle de la información contenida
(comúnmente no es de elaboración propia). Esto implicaconocerlaslimitacionesdelosdatos.
2. Paraconocerlaformaenqueestáestructuradalainformación.3. Paradetectarproblemasenlosdatos.4. Paradetectarpatrones.5. Paragenerarhipótesisorefinarlas.6. Para seleccionar el método apropiado para evaluar las
hipótesis.Depar<cularrelevanciaesdetectarviolacionesalossupuestosestadís<cos.
DosConsejosImportanasimos(G.King)
• Laeleccióndeunmétododeanálisisestadís<codebebasarseenlasgte.pregunta:¿quélehice(voyahacer)alosdatos?
v Nobastaconmencionarelprocedimiento,hayquecomprenderquéhaceparagenerarestadís<cas.
• ElhechodequelosdatosenCienciaPolí<canosa<sfaganlossupuestosestándaresnollevaaquesedebanrechazarlosmétodoscuan<ta<vos.Únicamenteexigeunusomáscuidadosodeéstos(yenalgunoscasosu<lizarinstrumentosmássofis<cados).
Primeroquetodo…• UnaVariableesunacaracterís<caquetomadis<ntosvaloresdentrodelasen<dadesobservadas(agrupaatributosdemodológico).
• Lamedicióndeunavariableconsisteenasignarlevaloresadichascaracterís<cas.
• Existendis<ntos<posdevariables.Suniveldemediciónimpactasobreel<podeestadís<casquepuedenu<lizarse(tantoenestadís<cadescrip<vacomoinferencial).
• Elniveldemediciónnoesalgointrínsecoalavariable.
• TiposdeVariables:– Cualita<va:observablemásnomedibleenescalasmétricas.Seasocianvaloresparasumanejo.
– Cuan<ta<va:medibleenescalamétrica.• EscalasdeMedición:– Con<nua– Discreta
• NiveldeMedición:– Nominal(exhaus<vidadyexclusividad).– Ordinal(orden).– DeIntervalo(cuan<ficableladistanciaentrevalores).– DeRazón(ceroabsoluto).NormalmentealasdosprimerasselesllamaCATEGÓRICASyalasdosúl<masESCALARES.
Variable
Categórica(Cualita<va)
Nominal(Categoríassin
ordenymutuamenteexcluyentes)
Ordinal(Categoríasconordennaturaly
mutuamenteexcluyentes)
EscalaroNumérica
(Cuan<ta<va)
Discreta(Enteros,
teóricamentecontablesofinitas)
Con<nua(Toma
cualquiervalorenunRangodevalores).Puedeser
IntervalarodeRazón.
Ejemplo:Educación
• Tengolossiguientesindicadoresdeeducación:
• Puntajeobtenidoenuntestdedesempeño(PSU).• NiveldeEstudiosalcanzados(Básica,Secundaria,Técnico-Profesional,Universitaria).
• AñosdeEscolaridad.• Estudióencolegiomunicipal,par<cularsubvencionadoopar<cularpagado.
• Enbasealtest:DesempeñoSobresaliente,Sa<sfactorio,Insa<sfactorio.
ErrordeMedición
• Lasvariablesmuchasvecessonmedidasconalgún<podeerror.
• Esdis<ntounerroraleatorio(alazar)yunosistemá<co.Elsegundoesmásproblemá<coalgenerarsesgo.
• Esdilcil,sininformaciónadicional,conocerelcarácterdelerrordemedición.
Frecuencias
• UnaDistribucióndeFrecuenciasesunlistadodelosposiblesvalores(ointervalosdeéstos)quetomaunavariable,juntoalnúmerodeobservacionesparacadavalor.
• F.Absoluta:registraeln°devecesqueapareceundeterminadovalorentrelasobservaciones.
• F.Rela<va:registralaproporciónoporcentajedeocurrenciadeundeterminadovalordelasobservaciones.
RepresentacionesdeInformación
• LasDistribucionesdeFrecuenciapuedenrepresentarsemediantetablas.
• DEBEincluirtodoslosposiblesvaloresdelavariable(enconjuntoserexhaus<va),demodoquesepuedanclasificartodoslosvaloresobservados.
• Esdeseableindicareltotaldeobservaciones(n).• Sise<eneunagrancan<daddedatosresultaconvenienteagruparlosmedianteintervalos.
Indicadores
• Unaalterna<vaesdescribirunconjuntodedatosmedianteunindicador(unnúmero)queresumeunacaracterís<cadeladistribucióndelosdatosanalizados.
• Unabuenadescripciónrequiereanalizar:– ElCENTROdeladistribución.– LaDISPERSIÓNdeladistribución.– La POSICIÓN RELATIVA de observaciones en ladistribución.
– LaFORMAdeladistribución.
IndicadoresdeTendenciaCentral
• MediaoPromedio(Aritmé<co).
• Moda:valormásfrecuente(puedeserunoovarios).
OtrosTiposdeMedias
IndicadoresdeTendenciaCentral
• Mediana:Esuncasoespecialdelpercen<ldeordenp.Correspondealpercen<ldeorden0.5
v Valorde lavariableenestudio,demodotalque,a lomás el (100p)% de las observaciones toman valoresmenoresqueélya lomás100*(1-p)%tomanvaloresmayoresqueél.
• Hay dis<ntas convenciones. Pero en general, si n esimpar, la mediana es el valor intermedio(n+1)/2;mientrasquesíespar,lamedianasonlosdosvaloresintermedios (n/2) y (n+1)/2. Ahora bien, algunosautorespromedianambosvalores.
Percen<ldeOrdenp
• Comoindicadordeformarela<va,necesitaquelasobservacionesdemenoramayor.
• Sin*pesentero,tantoelvalorXqueocupadichaposicióncomoelqueocupaellugar(n*p)+1endichalistaordenadasonpercen<lesdeordenp.
• Sinoesenteron*psedebetomarlaparteentera.
• Ejemplos:cuar<les,quin<les,deciles,etc.
Mediavs.Mediana
Mediavs.Mediana
• Lamedianaesunindicadormenossensiblealasobservacionesaapicasquelamediaaritmé<ca(hayalterna<vasalpromediosimple).Sinembargo,dicebastantepocosobreladistribucióncomountodo.
• Encambio,lamediaesunindicadorquesinte<zamuchainformaciónsobreladistribución(deahísusensibilidadalosvaloresaapicos).Tienecomointenciónserun“representante”globaldeladistribución.
IndicadoresdeDispersión
• Varianza:eselpromediodelasdesviacionescuadradasdelasobservacionesrespectoalamedia.
• Deesteindicadorsederivanladesviaciónestándaryelcoeficientedevariación.
UnAspectoImportanasimo
V.Muestral V.Poblacional
IndicadoresdeDispersión
• Launidaddelavarianzaestáalcuadrado.Suvaloresdilcildeinterpretar,porloquepuederesultaruntantoarbitrario.
• Ladesviaciónestándareslaraízcuadradadelavarianza(facilitainterpretación).
• Elcoeficientedevariaciónes:
C.V.=DesviaciónEstándar/Media
OtrosIndicadoresdeDispersión
• Mínimo• Máximo• Rango:diferenciaentremínimoymáximo.• RangoIntercuaralico:diferenciaentreelvalordelterceryprimercuar<l(percen<l0.75y0.25).Deestemodo,concentrael50%delasobservaciones.
IndicadoresdeTendenciaCentralyNiveldeMedicióndelaVariable
PrincipioClave
• Siempreunindicadordetendenciacentraldebeseracompañadodeunindicadordedispersión.Normalmente:
1)Media+DesviaciónEstándar2)Mediana+Rango(oRangoIntercuaralico)3)Moda+FrecuenciaAbsoluta(oRela<va)yN
IndicadoresDescrip<vosdeForma
• Dadaslaslimitacionesdelosindicadoresdetendenciacentral(yotros),secomplementaconindicadoresdeforma.
• Informansobreelgradodenormalidaddeladistribución.1. Asimetría:FormaDistribuciónensen<dohorizontal2. Curtosis:FormaDistribuciónensen<dover<cal
IndicadoresDescrip<vosdeForma
• Asimetría:mideelgradoenquelaformadeladistribuciónessimétricaoasimétrica.Endichocaso,elsesgoesrespectoalamedia.– Sesgo:Colamáslargadeladistribución.
• Curtosis:mideelgradoenquelaspuntuacionesestánagrupadasentornoalpuntocentral.Esdecir,haycierta“proporcionalidad”entrelafrecuenciadelaspuntuacionescentralesydelaspuntuacionesextremas.
IndicadoresDescrip<vosdeForma
IndicadoresDescrip<vosdeForma
Estadís<caBivariada
• Dostécnicastradicionales:CorrelaciónyDescomposicióndelaVarianza.
• Elcoeficientedecorrelaciónlineal(dePearson)eslatécnicaporexcelenciaparaanalizarrelaciónentreescalaryunacategórica).
• Ladescomposicióndelavarianzanormalmenteseusatomandounavariablecategóricacondicionanteyunacon<nuacondicionada.
DescomposicióndelaVarianza
• Ú<lparaelestudiodelosgrupos(lavariablecondicionantedetectadiferenciasenlavariableestudiada).Lavariablecualita<va(oenalgunoscasoscuan<ta<vadiscreta)par<cionaalasegundaenLgrupos.
• Lamediatotaleselpromedioponderado(segúneltamañodecadagrupo)delasmediasdelosgrupos.
FuentesdeVariabilidad
• LavariabilidadenlavariableXeselresultadodelavariabilidaddentrodecadagrupocomodelasdiferenciasentrelosLgrupos.
• ComoindicadordelaprimerasecalculalaIntravarianzaqueeslamediaponderadadelasvarianzasdentrodecadagrupo.
• Comoindicadordelosegundosecalculalaintervarianza,elcualcorrespondealadispersiónponderadadelasmediasdecadagruporespectoalamediageneral.
• Sielcoeficientedepar<ciónseaproximaa1,laprincipalfuentedevariabilidadsonlosgrupos(lavariablecondicionante)
Correlación(dePearson)
• Resumeinformaciónsobrelaasociacióndedosvariablescon<nuas.
• RelaciónDirecta/Inversa.MEJORhablardeasociaciónposi<vaonega<vaoserprecisoeindicarquesucedeconYcuandocrece(decrece)X.Asínosedependedelacodificación.
EstudiodelaAsociaciónpormediodelaCovarianza
• Paradescribirgráficamenteunaasociación,esú<lfijarcomopuntodereferencialasmediasdelasvariablesXeY.
• Deestemodoseredefineelplanocartesiano(gráficodedispersiónXY).Unarelaciónposi<vacorrespondealcasoenquehayunmayornúmerodepuntosenloscuadrantesIyIII(ynega<vasisonloscuadrantesIIyIV).
Covarianza
• SilaCovarianzaesmayora0laasociaciónesposi<va;menora0esnega<voysiesaproximadamente0nohayasociación.
• Lacovarianza<eneproblemassimilaresalavarianza.Esdilcildeinterpretarsumagnitud.
CoeficientedeCorrelaciónLinealXY
• Seajustalacovarianzademododeacotarlaavaloresentre-1y1.
• Engeneral,entre-0.1y0.1nohayasociación.Valores|0.1|a|0.4|sonbajos,entre|0.4|y|0.7|moderadasyvaloresabsolutossuperioressoncorrelacionesaltas.
Correlaciones
• Hayotros<posdecorrelacionesquemerecensernombradas.Elénfasisseráenlaintuición
• ElcoeficientedecorrelacióndeSpearman(ρorho)esunamedidadecorrelaciónentredosvariablescon<nuas,dóndeseaprovechaelordendelasobservaciones.Seinterpretadeigualmodoqueelcoef.dePearson.
• Hayunamul<plicidaddetécnicasdecorrelación/asociaciónparamanejarvariablescategóricas.Entredosvariablesnominaleseseljicuadrado.
Correlaciones
• Unacorrelaciónpolicóricaesunacorrelaciónentredosvariablesordinalesobservadas.Seasumequeparaamboscasos,lavariablelatentesedistribuyenormalmente.Lacorrelacióntetraclóricaeselcasoespecialenqueambasvariablessondicotómicas.
• Lacorrelaciónparcialesentredosvariablessilaterceravariablepermanececonstante(1erorden,subeelordenalsumarvariables).
DetallesTípicos
• Asociaciónnoescausación.• ElcoeficientedecorrelaciónesLINEAL.• Eltamañodelcoeficientedecorrelaciónesrela<voaladesviaciónestándar.
• Esposibleevaluarlaposibilidaddequelacorrelaciónen una muestra de datos sea producto del azar(realizaruntestdehipótesis).
• Falacia Ecológica: una correlación a nivel grupal nodebe condecirse con una correlación a nivelindividual.
Tablas• Estrategiadeorganizaciónyresumendelainformación.
• Laclaveesfacilitarelanálisiseinterpretacióndeltrabajoempírico.– Autosuficienciaensucomprensión.
• Dis<ntos<pos:1. DeFrecuencia2. DeCon<ngencia(bivariadas,mul<variadas)3. DeResumen(estadís<cos,modelos,etc.)
EtapasenConstruccióndeTabla
1. Definirlospropósitosdelatabla:¿quémostrar?2. Asignarun<tuloalatabla.3. Asignarlasvariablesafilasycolumnas,indicandoel
nombredecategorías,valoresointervalosusados.4. Colocarlosvaloresrelevantesparainterpretar.5. Agregarnotasexplica<vascuandoseannecesarias
paraunamejorcomprensióndelaTabla.6. IndicarlaFuentedelainformación.
TituloyFuente
• El<tulodebeespecificardemaneracompletasucontenido:1. Quésepresenta.2. Cómoseclasificanlasunidadesdeobservación.3. Dóndeseob<enendatos(espacialidad).4. Cuándoseob<enendatos(temporalidad).
• LaFuentecorrespondealosautoresdelosdatos,siendonecesarioindicarsunombre(personalocorpora<vo)yelañodeproducción/recopilación.
Recomendaciones
• Apartedelostemasyareseñados,algunosconsejosrápidos:– Noabusardelusodelíneas.– SiempreincluirelNºdeobservaciones(N).– Nuncausare<quetasdevariablesenbasededatos:aludirafenómenos.
– Español.– Usocuidadosodelporcentaje
UnejemplosencilloTabla1:AprobaciónPresidencialsegúnSexo
Sexo
Hombre Mujer Total
ApruebalaGes<óndelPresidente
Sí 110 89 199
No 491 500 991
Total 601 589 1190
Fuente:CEP,2015
¿EscorrectodecirqueloshombresapoyanenmayormedidaalaPdta.?
UsodePorcentajes1Tabla1:AprobaciónPresidencialsegúnSexo
Sexo
Hombre Mujer Total
ApruebalaGes<óndelPresidente
Sí 9.2% 7.5% 83.3%
No 41.3% 42.0% 16.7%
Total 50.5% 49.5% 100.0%
Fuente:CEP,2015
Secalculanlosporcentajesrespectoaltotal(N=1190)
LosPorcentajesTotalesdicenpocorespectoaunaasociación/crucedevariables
PorcentajeFila
VariabledeInterés(Y)
VariableCondicionante(X)
%Fila
PorcentajeColumna
• Lastablasseleenenladireccióndelavariablecondicionante(X).
• Cuandose<eneunobjetoexplica<vo,sehipote<zadependenciaestadís<ca.
Variablecondicionante(X)
VariabledeInterés(Y)
%Columna
UsodePorcentajes2Tabla1:AprobaciónPresidencialsegúnSexo
Sexo
Hombre Mujer Total
ApruebalaGes<óndelPresidente
Sí 55.3% 44.7% 100.0%
No 49.5% 50.5% 100.0%
Total 50.5% 49.5% 100.0%
Fuente:CEP,2015
Secalculanlosporcentajesrespectoaltotaldelasfilas(N=1190;Sí=199;No=991)
UsodePorcentajes3Tabla1:AprobaciónPresidencialsegúnSexo
Sexo
Hombre Mujer Total
ApruebalaGes<óndelPresidente
Sí 18.3% 15.1% 16.7%
No 81.7% 84.9% 83.3%
Total 100.0% 100.0% 100.0%
Fuente:CEP,2015
Secalculanlosporcentajesrespectoaltotaldelascolumnas(N=1190;Hombres=601;Mujeres=589)
InterpretacióndeTabla%Columna
1. Describirelmarginalcolumna(totaldecolumna),enfa<zandolomásfrecuente/relevante.Claroestá,dependedelnºdecategoríasdelaTabla.
2. Compararalolargodelafila(lógicahorizontal).– ¿Haydiferenciasenloanteriormentedescritoporgrupos?
– ¿Cuáleselpatróndediferencia?– Buscardiferenciassustan<vas(sobre5%)
3. Noabusardelainclusióndenúmeros,enfa<zarlastendencias/patrones.Serexplícitoconunidaddeanálisis(nohablardecasos),conlasvariables(entantofenómenos)yconladirecciónderelaciones.
Gráficos
• Losgráficoscons<tuyenotraformadesinte<zarinformaciónacercadelosdatos.Sonformasvisiblementemásresumidasy“agradables”alavista.
• Todográfico<enesubyacenteunatabla.Sonmodosequivalentes(rela<vamente)depresentarlainformación.Ladecisiónsebasaenloquesebuscacomunicar(yaquiénsedirige).
• Noobstante,suusodependerádel<podevariables,can<daddevariables,can<daddeatributosentreotrascaracterís<cas
ReflexionesPreviasalaConstruccióndeunGráfico
• Laseleccióndel<podegráfico(diseño)sehaceenbase alNivel deMedición de la(s) variable(s), a loque se desea comunicar (Obje<vo), los aspectosespecíficosdelainves<gaciónylaaudiencia.
– Gráfico de Torta o Pastel: Variables nominales uordinales– Histogramas o Gráfico de caja o Polígono defrecuencia(áreas):Variablesdeintervaloorazón.
FormatodelosGráficos• NUNCAolvidarqueungráficoesunresumendeinformación.
Porlotanto,serequiereclaridadenlainformaciónpresentada.Algunosconsejos:
1) Losatulosgenerales,delosejesylasleyendas,notasalpiedelatabla(fuente,eliminacióndeatributos…)
2)LógicadelaClasificación:Exhaus<vidadyexclusividaddelascategorías3) Tamañosdeletraslegibles-Idiomacastellano4) Privilegieunformatoacadémico
Nuncasobrecargueungráfico(“ChartJunk”)
AspectoVisualClave:Proporcionalidad
• Iden<ficaciónClaradelasunidadesdemedicióndelasVariables.• Elejedebeserproporcional.Porlotanto,evitar,enlamedidade
loposible,lasescalasquenocomiencenenelvalormínimo(comúnmente0).
• Elusodeproporciones/%debeceñirseestrictamentealprincipiodeproporcionalidad.Evitarqueenungráficonosumen100%(especialmenteengr.detorta).Siocurreincluirunanotaexplica<va.
• Cuidadoconlosgráficoscuyoporcentajenosecorrespondeconeltamañodelarebanada.NOesrecomendableu<lizargráficosdetortaen3D,especialmentecuando<enenmuchascategoríasosi<enenfraccionessemejantes.
• Cuidadoconloshistogramasqueno<enenigualanchodeclase.
FuentedelaInformación
• Indiquelafuentedelosdatos.Silasfuentessonmúl<plesincluiralgunanotaodetallarenelAnexo.
• Preferentementeseñaleelnconelquetrabajaeneltotaloporgrupo.Asuvez,señalesiconsiderasobrequetotalcalculalosporcentajes.
• Escrucialnumerarlosgráficosparafacilitarlalecturadeltexto.
GráficosUnivariados
• Loshistogramaspermitenlaagrupacióndelasvariablesescalaresentramosequivalentes,dondecadabarrarepresentalafrecuenciaacumuladaparacadatramoovalornumérico.
• Sonespecialmenterelevantesparaconocerladistribucióndelasvariablesenestudio,comounaaproximaciónunivariada.
Histograma• DEFINICIÓNDELIBRO:“m”barrasconalturash(ak)yanchola
longituddelintervalo(ak-1,ak],así,eláreadecadabarraesigualalafrecuenciadeobservacionesquecaenenelintervalocorrespondiente.
• Eláreatotalesiguala1.
• CONCLUSIÓN:loqueseinterpretasonlasÁREASdelasbarras,NOsualtura.Sisegraficantodoslosvaloresconigualancho,sepuedeninterpretarlasalturas.
• Puederepresentarlafrecuenciaabsoluta,rela<vaoladensidad(No%).
• Ladensidadpuedeseralgomás“abstracta”,perosepuedevincularconlanocióndeprobabilidad.Laalturacorrespondealporcentajedivididoporlalongituddelintervalodeclase.Sisequiere,eselporcentajeporunidadhorizontal.
Histograma
• Loshistogramassonbastantesensiblesaladefinicióndelanchodelabarra/compar<miento/estanco(bin).Amedidaquesereducenlostramos,elgráficoseaproximaaunacurva.
• Obviamente,tambiénesdependientedeladefinicióndelosejes.
GráficodeBarras
• Paravariablescategóricas.• EláreaNO<enesen<do.Seinterpretaúnicamentelaaltura.Buscaserunarepresentacióngráficadelasfrecuencias(absolutasorela<vas).
• ¿SeparacióndeNiveles/Barras?• Permitepresentarlainformacióndeunavariableque<enemúl<plescategorías.Permiteunordenamientosegúnfrecuencia.
GráficodeBarras
• Laorientacióndelasbarraspuedeserelegidadeacuerdoalacan<daddecategoríasdelavariable,asícomoel<podeordenquedeseemosdaralasbarrasopormo<voses<lís<cos.
HistogramayGráficosdeBarras
GráficodeTorta
• Muypocorecomendable.Endesusoeneltrabajoacadémicoporloengañosoquepuederesultar.Siguesiendousadoparaaudienciasmásmasivas.
• Suusoesrecomendablecuandolavariable<enepocascategoríasderespuesta.Delocontrario,lainformaciónsaturaelgráficoynopermiteunabuenalectura.
• Sedebetenercuidadoconlasdimensionesylaperspec<va,paranogenerardistorsionesalobservarlostrozosquerepresentanacadacategoríaderespuesta.
BoxPlot
Losbigotessegeneranenelcasodequeelvalormáximosean,alomás,1,5*IQR.Losvaloresquesuperenestareglaserepresentancomopuntos(aapicos).
BoxPlot
• GráficodeCajayBigotes.• Seusanconvariablesescalares(cuan<ta<vas).• Elobje<voesdescribirladistribucióndelavariable.
¿Cuantasobservacionesseincluyen?
GráficosBivariados
• Categórica+Categórica:tablacruzada(con<ngencia),gráficodebarrascondicionadooboxplotapilado.
• Categórica+Escalar:Boxplot• Con<nua+Escalar:GráficodeDispersiónoBoxplotApilado
Categórica+Escalar:Boxplot
Cuello Azul Cuello Blanco Profesional
5000
10000
15000
20000
25000
Grafico 4: Distribucion del Ingreso segun el Tipo de Trabajo
Duncan (1979)Tipo de Empleo
Ingr
eso
Pro
med
io (D
olar
es)
AquíelNºdeobservacionesesaúnmásrelevante(olaproporcióngrupal)
Escalar+Escalar:GráficodeDispersión
0 20 40 60 80 100
020
4060
80100
Grafico 5: Relacion entre Heterogeneidad Etnica y Migracion en Ciudades Estadounidenses en 1950
Fuente: Angell (1951)Porcentaje de Personas No Blancas
Por
cent
aje
de R
esid
ente
s M
igra
ntes
GráficodeLínea
• Suprincipalusoesenelanálisistemporaldelainformación.Demaneramásgeneral,<enencomoobje<voindicartendenciasenlosdatos(opuntosdeinflexión).
• Puedenpresentarsemúl<plesvariablesalavez.Laprecaucióndebecentrarseenlasunidadesdemedidaylosejes.
0
5
10
15
20
2 4 6Tiempo (Meses)
Dem
anda
por
Cig
arro
s (D
olar
es)
Grafico 6: Evolucion de la Demanda por Cigarros tras la Aprobacion de Nueva Legislacion
Categórica+Categórica
Categórica+Categórica
• d
GráficosdeBarrasAgrupadas
• Permitencompararáreasquecorrespondenamismascategoríasenvariablesdiferentes.Cadabarrasuma100%,esdecir,con<enetodaslascategoríasderespuestadelavariableevaluada.
• Noserecomiendaeste<podegráficoscuandohaymuchascategoríasderespuesta.Nosepuedeinterpretar.
GráficoconBarrasPosi<vasyNega<vas
• Seaprovechanlaestructuraparahacerunacomparaciónentrevalores“opuestos”.
• Muchasvecesseexcluyenlascategorías/valoresintermedios.
Unapequeñaintroducciónalcasomul<variado
Resumen
ErroresFrecuentes
• Noreflexionarsobreel<podevariables.• Mostrarpocainformación.• Incluir“basura”gráfica.• U<lizarefectos3Doabusardeloscolores.• Usarunaescalainadecuada.• Noprecisarlosejes(e<quetas,unidad,valormínimoymáximo).
Gráficosvs.Tablas• Laelecciónentreusargráficosotablasparapresentarinformación
noestansencilla.
• 1.Ifthereisarela<velysmallamountofdataandthespecificnumericvaluesareimportant,thentablesareprobablybe�erthangraphs.
• 2.Ifthereisalargenumberofdatavalues,thengraphsarelikelytoprovidemoreusefulinforma<onthantabulardisplays.
• 3.Iftheresearcherismoreinterestedinsystema<cpa�ernswithinthedatathaninpar<cularnumericvalues,thengraphsareprobablymoreusefulthantables.
Parafinalizar…• Intryingtodeterminewhatmakesagoodgraph,therelevantcriterionis
nottheaesthe<csofthedisplay.Instead,itisthedegreetowhichthegraphencouragesaccurateinterpreta<onoftheinforma<onthatitcontains.
• Inordertodeterminewhetherapar<culargraphicaldisplayisa“good”graphornot,itisnecessarytoconsiderthepurposeofthedisplay.
• analy<cgraphicsareintendedtorevealinteres<ngandsalientaspectsofthedatatotheresearcher.
• Presenta<onalgraphsassumethattheimportantfeaturesofthedataarealreadyknowntotheresearcher.Instead,theycreatevisualdepic<onsofthesefeaturesforotheraudiences.
Extraídode“GraphicalDisplaysforPoli<calScienceJournalAr<cles”deW.JacobyyS.Schneider(2010).