guía metodológica

Upload: carlinrod

Post on 06-Jul-2015

1.841 views

Category:

Documents


1 download

TRANSCRIPT

2011 Asuncin - Paraguay Dr. Alexis Moreno Consultor CIRD Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud Tomo I:El Anlisis Descriptivo Aplicado - Nociones del Anlisis Inferencial Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 2

Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud Tomo I: El Anlisis Descriptivo Aplicado -Nociones del Anlisis Inferencial Dr. Alexis Moreno Consultor CIRD Marzo 2011Asuncin Paraguay Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 3 Programa para el Mejoramiento de la Calidad de la Informacin en Salud (PMCIS) Eje Estratgico II: Supervisin CapacitanteComponente: Anlisis de la Informacin Gua Metodolgica para el Anlisis CientficoDe la Informacin en Salud Tomo I: El Anlisis Descriptivo Aplicado - Nociones del Anlisis Inferencial PropuestaelaboradaenelmarcodelProyectoMejoramientodelSistema de Informacin en Salud (MSIS) desarrollado por el Centro de Informacin y Recursos para el Desarrollo (CIRD) con financiamiento de USAID. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 4 FICHA TCNICA Ttulo de la obra Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud. Tomo I: El Anlisis Descriptivo Aplicado -Nociones del Anlisis Inferencial. Como citar la obra Moreno A. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud. Tomo I: ElanlisisdescriptivoaplicadoNocionesdeestadsticainferencial.Asuncin.USAID CIRD. 2011 Editor responsable Centro de Informacin y Recursos para el Desarrollo (CIRD) Mariscal Lpez 2.029 esquina Ac Caray. Telefax: (+595 21) 212-540 / 226-071. [email protected] Autor Dr. Alexis MorenoOru [email protected] Agradecimientos a los revisores de la obra Dr. Carlos Rodrguez Dra. Mirtha Mongels Dra. Gloria Aguilar Dr. Arturo MorenoDr. Fidel Moreno Marzo2011. Asuncin, Paraguay. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 5 Contenido Temtico 1.Elaboracin y ordenamiento de los datos.6 2.Presentacin estadstica.14 2.1.Presentacin tabular o cuadros.15 2.2.Presentacin grfica.23 3.Herramientas y mtodos de anlisis.34 3.1.Distribuciones de frecuencia en escala cualitativa: 35 3.2.Anlisis con frecuencias relativas.35 3.3.Distribucin de frecuencia en escala cuantitativa:39 3.3.1.Constantes centrales.60 3.3.2.Estadsticos de Posicin.49 3.3.3.Medidas de dispersin.51 3.4.Anlisis de datos de asociacin.57 3.4.1 Correlacin y regresin lineal simple.59 3.5. Anlisis de tendencias en series cronolgicas.67 4. Anlisis estadstico con las funciones estadsticas de Excel.69 5. El paso a paso en la aplicacin de las funciones estadsticasPara el anlisis de la informacin. 96 5.1. El anlisis descriptivo de una base de datos. 96 5.2. Introduccin al anlisis inferencial. 104 5.3. Anlisis de datos de asociacin: Correlacin y regresin. 107 5.4. Anlisis de tendencias de series cronolgicas con la regresin Lineal. 113 6. Estructura de un Informe Estadstico.115 7. Bibliografa.121 8. Anexos. 123 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 6 Elaboracin y Ordenacin de Datos Siguiendo con las etapas del Mtodo Estadstico. . . 1- Recogida de datos 2- Ordenacin y Elaboracin(Pasos de la etapa de Elaboracin): 2. 1) Revisin y Correccin de los datosrecogida. 2. 2) Clasificacin y Computacin de los datos. 2. 3) Presentacin por Cuadros y Grficos. 3- Anlisis de la informacin 4- Conclusiones 5- Decisiones finales 1.RECOGIDA DE DATOS - Recoger datos consiste en anotar los valores observados de la variable de un determinado fenmeno. - Estos datos recogidos constituyen lo que se llama T Ta ab bl la a d di ir re ec ct ta a d de e d da at to os s. . TABLA DIRECTA DE DATOS 495315 870412 114247 103293 -En la tabla directa de datos, stos no estn ordenados, en cuanto a su valor, sino que figuran segn el orden en que se han realizado las observaciones. 2.ORDENACIN -Los diversos aspectos que, dentro de la etapa de ordenacin hemos estudiado en esta leccin, aparecen recogidos en el siguiente esquema. ORDENACIN DE Creciente o decreciente DATOSLmites En intervalos Marca de Clase TamaoConstruccin -La ordenacin, creciente o decreciente, consiste en colocar los datos de menor a mayor, o de mayor a menor respectivamente. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 7 DATOS ORDENADOS En orden creciente 022333 444457 78991011 121215151516 En estudiantes es ms frecuente ordenar los datos clasificndolos por grupos, denominados intervalos de clase. Intervalos de clase: Es cada una de las partes en que se divide el recorrido para el estudio. Un ejemplo de la ordenacin de datos en intervalos de clase, partiendo de la Tabla directa de datos anterior, es el siguiente: Intervalo de Clase 11 24 57 810 1113 1416 Limites del intervalo: Son los valores extremos de dicho intervalo. -Al valor mximo del intervalo se llama lmite superior. -Al valor mnimo del intervalo se le llama lmite inferior. Por ejemplo, en el intervalo 8 10. El lmite inferior es 8. El lmite superior es 10. Un intervalo de clase viene determinado por sus lmites inferior y superior. Lmitesexactosdelintervalo:Conobjetodeevitarqueundatonoencajeen ninguno de los intervalos de clase, se hace coincidir el lmite inferior de un intervalo conellmitesuperiordelanterior,demaneraquenohayaunsaltoentreell mite superior de un intervalo y el inferior del siguiente. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 8 De esta manera obtenemos unos nuevos lmites del intervalo que se denomina lmites exactos. -Lmite exacto inferior. ( Li) -Lmite exacto superior. (Ls) Se dice que un intervalo est definido por sus lmites exactos cuando: -Su lmite inferior coincide con el lmite superior del intervalo anterior. -Su lmite superior coincide con el lmite inferior del intervalo siguiente. Veamos un ejemplo: Consideremos el intervalo 21 27.-Su lmite inferior coincide con el lmite superior del intervalo anterior. -Su lmite superior coincide con el lmite inferior del intervalo siguiente. LMITES DE LOS INTERVALOS 6 3 413 1423 2433 3443 LMITES EXACTOS DE LOS INTERVALOS 6,53,5 3,513,5 13,523,5 23,533,5 33,543,5 LMITES EXACTOS DE LOS INTERVALOS 3 9 9 15 15 21 21 27 27 33 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 9 Veamos un ejemplo: -El lmite exacto superior del primer intervalo es: 9 + 10 __________ =9,5 2 -El lmite exacto superior del segundo intervalo es: 19+20_________ = 19,5 2 De igual formase calculan los lmites exactos superiores del resto de los intervalos, menos el del ltimo. El lmite exacto inferior de un intervalo coincide con el lmite exacto superior del intervalo anterior. Cuando el tamao del intervalo es constante, para calcular el lmite exacto inferior del primer intervalo y el lmite exacto superior del ltimo intervalo, tendremos que: -El lmite exacto inferior del primer intervalo se calcular restando al lmite exacto superior del primer intervalo el tamao del mismo. Li = Ls c En el ejemplo que venimos estudiando ser: Li = Ls c = 9,5 10 = 0,5 -El lmite exacto superior del ltimo intervalo se calcular sumando al lmite exacto inferior del ltimo intervalo, el tamao del mismo. Ls = Li + c Ls = Li + c = 39,5 + 10 = 49,5 Lmite superior Lmite inferior (de ese intervalo)+ (del intervalo siguiente) Lmite exacto _________________________________________ superior =(de un intervalo) 2 LMITE DE LOS INTERVALOS 09 1019 2029 3039 4049 LMITES EXACTOS DE LOS INTERVALOS 0,59,5 9,519,5 19,529,5 29,539,5 39,549,5 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 10 Cuandoeltamaodelintervalonoesconstante,paracalcularellmiteexacto inferior del primer intervalo y el lmite exacto superior del ltimo intervalo, tomaremos comovaloresdecloscorrespondientesalsegundoypenltimointervalo respectivamente. MARCA DE CLASE (X): Es el punto medio de un intervalo. Para obtener la marca de clase de cada intervalo, se suman los lmites exactos de dicho intervalo y el resultado se divide por dos. Es decir: Observa la siguiente Tabla en la que se indican los lmites exactos de los intervalos y su marca de clase: -La marca de clase del intervalo 3 9 se ha obtenido de la siguiente forma: Li+Ls 3+ 9 X = ____________= _________=6 22 -La marca de clase del intervalo 9 15 se ha obtenido: Li+Ls 9+ 15 X = ______________=_____________=12 22

Lmite exacto inferior Marca de Clase Lmite exacto superior Li +Ls MC=________ 2 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 11 -De la misma manera se han obtenido las marcas de clase correspondientes al resto de los intervalos. A efectos de clculos posteriores, se puede considerar que todos y cada uno de los valores que entran dentro de un intervalo se pueden sustituir por un mismo valor: el de su marca de clase. TAMAO DEL INTERVALO: Es la diferencia entre los lmites exactos del intervalo y se representa por la letra c. Es decir que: Dado el intervalo de lmites exactos 3 9, el tamao del intervalo ser: c= Ls Li =9 3 = 6 El tamao de los intervalos suele ser normalmente constante, aunque nonecesariamente. Conocidos el tamao del intervalo y uno de los lmites exactos del mismo, se puede conocer el otro lmite exacto. -Dado un intervalo cuyo tamao es c =6, y su lmite exacto inferior es 9 su lmite exacto superior ser: Ls = Li + c = 9+6 = 15 -Dado un intervalo cuyo tamao es c= 12, y su lmite exacto superior es 25, su lmite exacto inferior ser: Li = Ls c = 27 6 = 21 CONSTRUCCIN DE INTERVALOS: Dado una Tabla directa de datos si queremos agrupar dichos datos en intervalos de clase, necesitamos determinar: -El nmero de intervalos a utilizar, de tamao constante. -El lmite exacto inferior del primer intervalo. Para ello partimos e la siguiente expresin: En ella: -Res el recorrido. -ces el tamao constante de intervalo utilizado. Al desarrollar esta expresin obtendremos, en general, una parte entera y una fraccionaria. Veamos un ejemplo: Supongamos que tenemos un recorrido R = 36 y tomamos un tamao de intervaloc = 8. c = Ls Li R+ 1 c Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 12 La expresin quedar: R3636 + 844 ______ + 1 =________ + 1 = _________= __________ c 8 8 8 Este quebrado expresado en forma de nmero mixto ser: 44 4 _______= 5 + ________ 88 En definitiva, mediante el desarrollo de esta expresin, se ha obtenido: -Una parte entera ("n") que es 5. 4 -Una parte fraccionaria ("r/c") que es_____. 8 n = determina el nde intervalos a usar. r/c = determina las condiciones del Li del 1er. Intervalo. Numero de intervalos: Se aconseja por convencin, que el nde intervalos a usar est comprendido entre 5 y 20. (En nuestro ej. n = 5; o sea, 5 intervalos). Li del 1er. Intervalo: Es el punto de partida para construir los intervalos, de forma que: El menor valor observado se halle en el 1er. intervalo. El mayor valor observado se halle en el ltimo intervalo. Para ello el Li del 1er intervalo debe cumplir unas condiciones: Ser menor o igual que a (menor valor observado). Ser mayor que a + r - c (r = numerador de la partefraccionaria; c = tamao constante del intervalo). Condiciones del Li del 1er intervalo Ser menor o igual que a (menor valor observado). Ser mayor que a + r - c R+ 1 c 1 +nc Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 13 a + r - c < Li del 1er. intervalo a Siguiendo con nuestro ej.: r/c = 4/8; a = 5 5 + 4 - 8 = 1 < Li del 1er. intervalo 5 Lmites Exactos(Ls = Li + c) 1,5 -9,5 9,5 - 17,5 17,5 - 25,5 25,5 - 33,5 33,5 - 41,5 Construccin de intervalos por la regla de Sturges K = 1 + 3,322 (log10 n) K (nmero de intervalos de clase); n (tamao muestral) De la tabla directa de la pgina 6:K = 1 + 3,322 (log 20)K = 1 + 3,322 (1,3010) = 5,32 El valor resultante (ej. K=5) debe considerarse como una gua y puede variar segn convenga al estudio. La amplitud del intervalo (c) = R=15= 3(R = recorrido) k5 Las amplitudes deberan ser igual en las clases, aunque esto es a veces, imposible. Tarea: Ordenar en intervalos de clases: Valores de glicemia en ayunas 68847582689062887693 73798873609371598575 61657587746295786372 66788275947769746860 96788961759560798371 79626797788576657175 65807357887862765374 86677381726376758577 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 14 1.Presentacin Estadstica Mtodo Estadstico: Etapas desde la perspectiva del SIECS1 -Planificacin -Recoleccin de datos -Elaboracin y Ordenamiento -Presentacin -Anlisis propiamente dicho -Conclusiones y sugerencia (Informes de las UARs) Elmtodoestadsticoqueconstituyeelmotivoconductornaturaldelaestadstica aplicada. Enestaguapretendemosdarleunenfoqueparticularenrelacinalsistemade informacin que ha sido diseado como ideal, el SIECS. Sibienpodemosapreciarquehayunaetapaespecficadeanlisis;ya en laetapa deelaboracinyordenamientodelosdatos,yenparticular,enlapresentacinestadsticadelosdatoseindicadoresconstituyenunaformainicialdeanalizarlos datos presentarlos de una manera resumida y lgica. Existendosformasclsicasdepresentarestadsticamentedatoseindicadores:la presentacin tabular o cuadros; y la presentacin grfica. Lapresentacintabularresultaimprescindibleenunreporteestadsticooenun trabajodeinvestigacin;losgrficospuedencomplementaraloscuadros,perono siempre son necesarios. Esimportanteademsrecordarloscriteriosdeescogenciasobreeltipoms apropiadodecuadrosogrficos,segnlascaractersticasparticularesdeltipoy variable de estudio. Es muy frecuente ver, sobre todo en quien no maneja conceptos metodolgicos deestadstica, usar bonitos grficos desde una perspectiva artstica, pero poco tiles para resumir una informacin, y aun ms, darnos una interpretacin equivocada de la realidad por una mala praxis en eleccin del grfico. 1 Sistema de la informacinpara la Evidencia y el Conocimiento en Salud (SIECS). Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 15 1.1.La presentacin tabular o cuadros a) Caractersticas generales: La finalidad de los cuadros estadsticos es presentar en forma resumida e inteligible determinado material numrico.Aunqueladelcuadrovariardeacuerdoalosdatosqueintentaresumir,hay algunos principios comunes que deben tenerse en cuenta.En todo cuadro debe considerarse: Cuadroestadstico:eslapresentacindelaexpresinnumricadelosdatos recogidos,pormediodeunatablaocuadropararesumiryhacerlams comprensible. Todo cuadro debe tener: 1- Ttulo: permite entender el contenido del cuadro. Debe ser: a) completo: para ello debe contestar: QUE universo se estudia?, CMOse clasificarn los elementos segn sus caractersticas? DONDE? A qu lugar se refieren los datos. CUANDO? La fecha del estudio. b) breve: lo ms conciso y claro posible, pero no debe sacrificarse la claridad por la concisin. Ttulo no recomendable:Cuadro que muestra la distribucin de las defunciones habidas en el Hospital de Clnicas, durante el ao 2000, clasificadas de acuerdo con la edad y sexo de los fallecidos. Ttulo Correcto: Defunciones por edad y sexo. Hospital de Clnicas, 2000. 2- Cuadro o tabla propiamente dicho:Elcuerpodelcuadroconstadeunconjuntodecasillasoceldas,dispuestasencolumnas (las verticales) y filas (las horizontales). Laprimeracolumnaylaprimerafilatienenunafinalidaddiferentealasrestantes, porque en ellas irn las diferentes subdivisiones de la clasificacin que se adopte, o los encabezamientos que indiquen a que se refiere los datos numricos inscri ptos. Laprimerafila,esladelosENCABEZAMIENTOS,loscualesindicanaquse refieren los datos que van inscritos en las celdas subyacentes. Ellos al igual que los ttulos, deben ser breves, pero suficientemente explcitos. As por ejemplo, en vez de poner simplemente Edad, es preferible poner Edad en aos o Edad en meses, etc. LaprimeracolumnaconocidacomoColumnaMatrizsedestinaaasentarlas diferentes clases de la escala de clasificacin utilizada. Cuando las observaciones se clasifican de acuerdo a una nica escala, digamos edad, las subdivisiones de esta, deben ir en esta columna. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 16 3. Notas explicativas: Con el fin de que no haya dudas sobre el contenido del cuadro, ste se acompaa a vecesdenotasexplicativas,quepuedenirensupartesuperioroinferior. Convencionalmentelasnotascolocadasenlapartesuperior,afectantodoel contenido del cuadro, mientras que aquellas que se colocan en la parte inferior, solo se refieren a cifras de determinadas celdas o de una fila o columna en particular, lo cual se indicara con un pequeo nmero o letra. Morbilidadsegn edad y causas. Lugar. Ao Edad (aos)Examinados Neumona (3) Tbc (1) Chagas (2)Diarreas < de 1 a200 04 1901 - 2 a 380 7 12 6250 3 - 4 a4005030 8300 5 y + a 70090 90 17450 TOTAL: 1680 147 13632 1090 (1)Tuberculina +(2) prueba de aglutinacin +(3) radiologay bacteriologa + b) Diferentesclasesdecuadros:De acuerdo a su finalidad los cuadros estadsticos pueden dividirse en 2 categoras: 1. Cuadros de propsito general. Sirvendebaseparalaconstruccindelossegundos,soncuadrosextensos,de resmenes,frecuentementedestinadosapresentarmaterialbsicoaotros investigadoresydeahquecuandosepublicanseacompaandeextensasnotas explicativas y de cuidadosa mencin de los procedimientos y mtodos utilizados en la recoleccin de los datos2. Cuadros de propsito especialPresentacintabular de las distribuciones de frecuencia, de las seriescronolgicas, de los datos de asociacin. Soncuadrosgeneralmenteelaboradosconpropsitosanalticos.Habitualmentese intercalanenlapresentacindetrabajosymonografasoriginalesydestinadasa mostrar determinadas relaciones sobre las cuales el autor quiere llamar la atencin y que constituyen el ncleo de las conclusiones que de la investigacin se derivan. 2.1. Presentacin tabular de las Distribuciones de FrecuenciaLlamaremos distribucin de frecuencias al conjunto de clases junto a las frecuencias correspondientes a cada una de ellas.Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 17 Silosindividuosseclasificandeacuerdoaunanicaescala,elcuadropodr hacerse como el que sigue abajo: Defunciones por accidentes, por grupos de edad. Paraguay 2000Aos de edad Nde defunciones0 4 5015 14 45315 24 60525 44 93145 64 49965 84 218total 3.207 Enloscuadrosdeestetipo,seacostumbraponerunacolumnams,conla distribucin porcentual de los casos, lo cual facilita grandemente las comparaciones. Muertes Por Causas En Infantes.Lugar.Tiempo (ao) CausasN muertesPorcentajeDiarreas587027.4 IRA250011.7 Sepsis20009.3 Congnitas15557.3 Otros9500 44.3 ______________________________________ TOTAL: 21425 100.00 Finalmente, se pueden agregar dos columnas ms, correspondientesalas frecuencias acumuladas tanto absolutas como relativas. Deestamanera,laformageneraldeuncuadrodedistribucindefrecuencias quedara estructurado como sigue: Variable Frec. Abs. Frec. Rel. Frec.Abs.Acumu.Frec.Rel.Acumu. xni fi Ni Fi Parapresentardistribucindefrecuenciasenescalacuantitativasedebedividirel rango de valores de las observaciones en una serie de intervalos distintos que nose superpongan. Sihaydemasiados intervalos,el resumennotienegrandesventajasrespectoa los datos sin procesar. Si hay muy pocos, se pierde gran cantidad de informacin. Losintervalosseconstruyendetalmaneraquetenganamplitudesiguales,para facilitarlascomparacionesentreclases;peropudieranexistirclasesdeamplitudes diferentes. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 18 Niveles de colesterol en hombresde entre 25 y 34 aos. Laboratorio Central del MSP y BS. Eneroa diciembre del 2010. Nivel de colesterol (mg/100 ml)Nmero de hombres 80-11913 120-159150 160-199442 200-239299 240-279115 280-31934 320-3599 360-3995 Total1067 La tabla muestra como se distribuyen los valores del nivel de colesterol a travs de los intervalos. Se observaquelasmedicionesselocalizanentre80y399mg/100mlconrelativamentepocas mediciones en los extremos del intervaloy una granproporcin de valores entre120 y 279 mg/100 ml. El intervalo 160-199 mg/100 ml contiene el mayor numero de observaciones. La tablapermite una mejor comprensin de los datos de lo que hara una lista de 1067 lecturas de niveles de colesterol. 2.2. Presentacin tabular de las series Cronolgicas Cuando la escala de clasificacin es el tiempo, mostrando como vara un fenmeno en relacin a l. La elaboracin del cuadro es muy semejante al caso anterior. Sinembargo,comotalescuadrosslopretendenmostrarlavariacindeun fenmenodeunapocaaotra,enellosseomitenlostotalesylgicamente,alno existir stos, ser imposible el clculo de la respectiva columna de porcentajes. No obstante, si el cuadro se refiere a lo ocurrido en una poblacin cuyo nmero de habitanteshavariadoatravsdelosaos,esconvenientecolocarunaltima columna que seale el nmero de veces que ocurri el fenmeno estudiado por cada 1.000, 10.000 100.000 habitantes. En otras palabras: las cifras absolutas se deben acompaardeloscoeficientesotasasrespectivas,conlocualsefacilitarla comparacin de los datos.Defunciones por accidentes y tasas por 100.000 habitantes.Lugar. Ao Aos Nde Defunciones Defunciones por 100.000 hbts.1957 2.872 43.31958 3.255 47.31959 3.390 47.61960 3.217 43.71961 3.223 42.4Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 19 2.3. Presentacin Tabular de los Datos de AsociacinSi los individuos se clasifican simultneamente de acuerdo a dos escalas por ejemplo: edad y sexo (datos de asociacin), una escala ir en la vertical y otra en la horizontal.Elqueunauotravayanenlaverticaloenlahorizontal,nocambiael significado del cuadro. Sin embargo, es conveniente poner en la vertical, aquella escala que presente mssubdivisiones,yaqueelojohumanocomparamsfcilmente,nmeros dispuestos en columnas de arriba abajo, que arreglados unos al lado de otro, en filas horizontales. Observequecomohaydosescalas,latabladebetenerdostotales.Estos suelenponerseenlaltimacolumnayenlaltimafila,perosiseprefierepueden colocarse en la primera columna y en la primera fila. Tngaseencuentatambin,queesposiblepresentarenelmismocuadro tantolascifrasabsolutascomolosporcentajesotasascorrespondientes.Debe evitarsequeelcuadroquedecondemasiadascolumnas,puesentalcasosu interpretacinseharadifcil.Entalesocasiones,espreferiblepresentarla informacinen2mscuadrosdistintos(loexplicadopuedeverseenelcuadro siguiente). Defunciones por accidente, por sexo y grupos de edad, Paraguay, 2000Edad (aos)SexoTotal HombresMujeres 0 4275226501 5 14288165453 15 2451986605 25 4483596931 45 6440099499 65 84115103218 Total2.4327753.207 Si los individuos se clasifican al mismo tiempo de acuerdo a tres escalas, como ser edad, sexo y causa de la defuncin, el cuadro aparecer de la manera ilustrada ms abajo.Defunciones segn Causa; Sexo y grupo Etario.Paraguay.2000Edades SEXO CAUSAS DE ACCIDENTEM F Total T S C V Otras Total15 aos 15 44 45 y ms563 1.354 515391 182 202954 1.536 717272 786 310169 219 4863 110 16963 29 9387 392 181954 1.536 717Total 2.432 775 3.207 1.368 436 342 101 960 3.207Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 20 c) Erroresenlapresentacintabular Entre los errores que se cometen al elaborar un cuadro estadstico, deben evitarse especialmente los siguientes:1. Disposicinincorrectadelosdatos: Contrstese el cuadro anterior que es correcto, con el que aparece a continuacin, el cual ilustra un error cometido frecuentemente por los principiantes. El error consiste en que el cuadrono clasifica a cada individuo de acuerdo a tres escalas. En realidad son dos cuadros diferentes colocados uno al lado del otro.No indica cuntos hombres (o mujeres) murieron en cada grupo etario segn causas, lo cual si puede ser determinado en el cuadro anterior. 2.Ttulosyencabezamientosincompletosoinadecuados:Elcuadrodebecomprendersefcilmente,sinnecesidadarecurriraltextoque acompaa, lo cual ser imposible si los ttulos o encabezamientos son incompletos. 3.Cuadrosque muestransolamenteporcentajes: Por lo general un cuadro no debe mostrar solamente porcentajes sin indicar las cifras dedondeproceden,puesunporcentajede50%puedesignificar1casoen2;10 casos en 20; 100 casos en 200, y como es obvio mientras menor es elnmero de casos, menor valor tendr el porcentaje.4.Cuadrosobrecargados:Aquellosqueintentanmostrarmuchosdatosalavez,resultanconfusose inadecuados, es preferible hacer varios cuadros separados.d) Manera de leer un cuadro estadstico Leer cuidadosamente el ttulo: La lectura cuidadosa del ttulo es necesaria con el findecomprenderperfectamenteaqueserefiereelcuadro.Definirlaunidadde anlisistemporalyespacialmente,ascomocaractersticasespecficaselestudio (distribuidos de acuerdo a su edad, sexo, etc.). Nos puede indicar tambin el mtodo de anlisis utilizado (porcentajes, tendencias centrales y de dispersin, etc.). Leer notas explicativas: Las notas explicativas le acompaan al cuadro, permiten a menudo su mejor compresin. En primer lugar determinar que no se estudia a todo el universo, sino solamente una muestra. Esto es importante, pues ya sabemos que los resultados de las muestrasestn sometidos al error del muestreo. En segundo lugarlanotaindicasielestudioserefiereaungrupoparticularcomolastasas especficas.Sepuedendefinirconceptualmentelasvariablesysobretodo patologas.Porejemplo:TBC,definidacomobaciloscopa(+)ocomomantoux(+). Menciona la fuente usada. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 21 Averiguarlesunidadesdemedidasutilizadas:Elencabezamientodelaprimera columna explica la unidad de medida y escala de clasificacin. Fijarse en el promedio o porcentaje general del grupo: En el cuadro se muestra queel20.5%,esdecir1decada5personas,muriporalgunadelascausas consideradas. Ej. N2: 1151 x 100 / 28240 = 5,49 % Relacionar el promedio general del grupo con cada una de las variedades que seestudian:Lasvariablespresentadasenelcuadroanteriorson:edad,sexo, causas; y deben analizarse separadamente. Mortalidad x Sexo: (mujeres) = 1033 x 100 /18030 = 5,73 % (>5,49 %) El grupo < 1 ao muere 342 x 100 / 1780 = 19,21 %;El grupo 1 a 4 aos 371 x 100 / 8750 = 4,24 %; El grupo 5 y ms aos320 x 100 /7500=4,27 % El grupo - 1 ao: su mortalidad es > la mortalidad general (19,21 y 5,49%). Losotrosdosgrupostienenunporcentaje(4,24y4,27)inferioralgeneral(5,49). MortalidadxSexo:(hombres)=mueren5,07% algeneral (5,49 %); los Otros grupos etarios < al general.Relacionarentresilospromediosoporcentajesdelasvariablesquese estudian:Estoesnecesarioporquepuedehaberalgunainteraccinentrelas variables que cause diferencias observables. Sexo: La mortalidad femenina (5,73) es > que la masculina (5,07). Relacionar sexo por grupos de edades: Mujeres: mueren ms los < 1 ao: 19,21 %, le siguen los de 5 + aos (4,27); y los de 1 a 4 aos (4,24). Hombres:muerenmaslos-de1ao:17,24%,lesiguen losde1a4aos (2,71) y los de 5 + aos (1,57). Relacionar los grupos de edad por sexo: < de 1 ao: mueren msGua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 22 mujeres: 19,21% que los homb: 17,24 %; 1 a 4 aos: mueren ms las mujeres 4,24 % que los varones; 5 y ms aos: mueren msmujeres 4,27 % que los varones. Relacionar entre si los grupos de edades: Mortalidad en < de 1 ao: =635 x 100 / 3480 = 18,24 %; 1 a 4 aos = 3,51 %; 5 y ms aos = 4,09 % La mortalidad ms elevada corresponde al grupo < de 1 ao: 18,24 %. Le siguen los grupos 5 y ms aos, y 1 a 4 aos con 4,09 y 3,51 %respectivamente. Para los datos de muerte por diarreas, sepsis, Ca. y otras causas correspondehacerelmismotipodelecturadesdeelpunto5hastael9 inclusive. Buscar irregularidades en los datosDatos anmalos e inconsistentes Conclusiones finales .a)La mortalidad es mayor en el primer ao de vida. b)Elsexofemeninoesfactorenlamortalidadaumentndolaenlos grupos 1 a 4 aos;5 y ms aos. c)Ladiarreaeslaprincipalcausademuertesentodoslosgruposde edad, y principalmente en el menor de 1 ao. d)La mortalidad por sepsis aumenta con los aos, siendo ms elevada en las mujeres. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 23 2.2. La presentacin Grfica Caractersticas generales: La representacin grfica consiste en un artificio eficiente para obtener rpidamente unaimpresinvisualdeconjuntodeunaseriededatosyhacerresaltarsus relaciones, que es en muchos casos la primera etapa de un anlisis. Latablaestadsticaresumelosdatosquedisponemosdeunapoblacin analizarladeunamaneramssistemticayresumida.Paraunapercepcin rpida de las caractersticas de la poblacin resultatil el uso de grficos. Constituyen ayuda para interpretar los datos contenidos en las tablas y no un mtodo substitutivo. Losgrficossonmsfcilesdeinterpretar,ycomostos,tienenttulo,elgrfico propiamente dicho, y las notas explicativas. Escalas del grfico y errores en su empleo: -Losgrficosgeneralmenteseinscribenenlascoordenadasrectangulares, formada por la interseccin de dos lneas en ngulo recto. -Lalneahorizontaloabscisasedestinageneralmenteparalasdiferentes clases de escalas que se utilizan (aos, meses, sexo, raza, vacunas, etc.). -La lnea vertical u ordenada generalmente se usa para anotar la frecuencia nmero de veces que se observa el fenmeno en estudio, segn la indicacin de la abscisa.

Recordar que: a) Las escalas inscriptas en las abscisas y ordenadas deben tener la misma longitud oalgomayorlahorizontal,nosobrepasandoaldobledelavertical.Assila ordenada mide5 cms.,la horizontal debe medir 5, tolerndose un mximo de 10 cms. b) Las dos escalas deben comenzar en cero, corresponde al ngulo de unin de la lneaverticalconlahorizontal.Sinembargo,cuandolosvaloressepresentan sonelevadosytienenpocafluctuacin,sehaceusodeunartificio:partirel grfico para poner de manifiesto las fluctuaciones.c) el ttulo debe ser claro y conciso y estar escrito debajo. d) las escalas utilizadas deben ser claras: aos, meses, minutos, kilos, gramos, etc. e) los grficos no dan idea de exactitud matemtica, para eso estn los cuadros. f)las escalas que se utilizan deben ser por lo general nmeros enteros. g) silosaosomesesseinscribendebajodelasordenadas,queselaspinten rayas de puntos como en los grficos 4 - 5, el punto que representa determinada frecuencia se har sobre ellas. Silosaosomesesseinscribenentrelasordenadas,lainscripcindelpuntose har generalmente en la mitad de dicho espacio. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 24 Partes del grfico Por homologa con las tablas, los grficos estn constituidos por tres partes: El ttulo El grfico propiamente dicho Las notas explicativas (optativo). Aqu es aplicable la conceptualizacin que se hiciera con respecto a las partes de la presentacin tabular Tipos de Grficos LosobjetivostrazadosenestaGuaMetodolgicahacenquenoseapertinenteun listado exhaustivo de los tipos de grficos, sino ms bien, centrarnos en algunos que son representantes por antonomasia. Primeroestableceremosloscriteriosdeescogenciadelosdistintosgrficos,para pasar a las especificaciones de los tipos de grficos ms frecuentemente usados. Grficos para variables cualitativas Losgrficosmsusualespararepresentarvariablesdetiponominalsonlos siguientes: Grfico debarras:Serepresentamosenelejedeordenadaslasfrecuenciasabsolutasolas frecuenciasrelativas,yenabscisaslasmodalidadesoclasesdelavariable.Si, medianteel grfico, se intentacompararvariables y/o poblaciones entre s, existen variaciones(barrasdobles,compuestas).Cuandolostamaosdelasdos poblacionessondiferentes,esconvenienteutilizarlasfrecuenciasrelati vas,ya que en otro caso podran resultar engaosas. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 25 Grfico debarras simplesparaunavariablecualitativa Grfico de barras dobles Seusapararepresentardatosdeasociacin,cuyasdosescalasseancualitativas. Tambin se la usa cuando se quiere comparar dos distribuciones de frecuencia con relacin al tiempo.Grfico debarras dobles paracomparar unavariablecualitativaen diferentespoblaciones. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 26 Diagramas desector (tambin llamado detorta).Consiste en una circunferencia en la cual se escriben en cifras absolutasorelativaslaproporcinenqueparticipanlos diversos componentes del objeto en estudio.El porcentaje que corresponde a una variable se multiplica por 3,6 y se obtiene el N de grados que le corresponde en el crculo. El arco de cada porcin se calcula usandola regla de tres:

n 360 = 360 . f1= grados para f1 f1 ? n 1000 360 = 360 . 375 = 135375 ? 1000

Comoen lasituacinanterior,puede interesarcomparardospoblaciones.Eneste casotambinesaconsejable eluso de lasfrecuenciasrelativas(porcentajes).Otraposibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama semicircular(vermsabajo).Seann1n2lostamaosrespectivosdelasdos poblaciones.La poblacin mas pequea se representa con un semicrculo de radio r1y la mayor con otro de radio r2. Larelacinexistenteentrelosradios,eslaqueseobtienedesuponerquela relacinentrelasreasdelascircunferencias esigualalade los tamaosdelas poblacionesrespectivas, es decir: GrupoA 375individuos 37,5% GrupoD 125individuos 12,5% Grupo B 250individuos 25% GrupoC 250individuos 25% 135 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 27 Diagramade sectores paracomparardos poblaciones PictogramasExpresancondibujos(generalmenterelacionadoaltemadeestudio),lasfrecuenciasdelasclasesdelavariable.Estosgrficossehacenrepresentadoa diferentesescalas un mismo dibujo, como vemos ms abajo. El escalamiento2 de los dibujos debe ser tal que cada uno de ellos sea proporcionala la frecuencia de la claseque representa. Este tipo degrficos suele usarse en los medios decomunicacin,paraqueseancomprendidosporelpbliconoespecializado,sin que sea necesariauna explicacin compleja. Las reas son proporcionalesa las frecuencias. Pictograma Grficos para variables cuantitativas Existen dos tipos de variables cuantitativas: discretas y continuas. 2Esunerrorhacerlarepresentacinconunaescalatalqueelpermetrodeldibujoseaproporcionalala frecuencia,yaqueafrecuenciadoble,corresponderaundibujodereacudruple,loquedaun efectovisualengaoso. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 28 Grficospara variables discretas Cuandorepresentamosunavariablediscreta,usamoselgrficodebarras.Se recomiendaquelasbarrasseanestrechaspararepresentarelquelosvaloresque tomalavariablesondiscretos.Eldiagramaintegraloacumuladotiene,porla naturaleza de la variable, forma de escalera.Se lanzan tres monedas al aire en 8 ocasiones y se contabilizael nmero de cruces, obtenindoselos siguientes resultados: 2,1,0,1,3,2,1,2 En primerlugar observamosque la variable x es cuantitativa discreta, presentando las clases: 0, 1, 2, 3. Ordenamosa continuacin los datos en una tabla estadstica. xnifiNiFi 011/811/8 133/844/8 233/877/8 311/888/8 n= 81 x = clases de la variable x; ni = frecuencias absolutas; fi = frecuencias relativas; Ni = frecuencias absolutas acumuladas; Fi = frecuencias relativas acumuladas. FamiliasClasificadasporsuNdehijos Ndehijos(xi )1234 Frecuencias (ni )1353 Gr f i c o (barras)eintegralparaunavariablediscreta.El diagramaacumul ado(integral)contabilizaelnmerodeobservacionesdelavariableinferioreso igualesacadapuntodelejede abscisas. Compararlosdiagramasdebarrasparafrecuenciasabsolutasyrelativas. Realizar el diagramaacumulativocreciente. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 29 Solucin:Enprimerlugar,escribimoslatabladefrecuenciasenelmodo habitual: Variable xi F. Absolutas ni F. Relativas fi F. Acumuladas Ni 110,0831 230,2504 350,4169 430,25012 12 1 Conlascolumnasrelativasaxiynirealizamoseldiagramadebarraspara frecuenciasabsolutas, lo que se muestra en la figura de abajo Grficosparavariables continuas Cuandolasvariablessoncontinuas,utilizamospor defecto elhistograma yel polgonodefrecuencias.Enparticular,sisepartedeunatablaordenadaen intervalos de clase. Justamente,elhistogramaseconstruyeapartirdelatablaestadstica,representandosobrecadaintervalo,unrectnguloquetienecomobasela amplituddedichointervalodeclase.Elcriterioparacalcularlaalturadecada rectnguloeseldemantenerla proporcionalidad entrelasfrecuenciasabsolutas(orelativas)decadaintervaloparaqueseaelreadelosmismos,laque determina el escalamiento (a diferencia de la altura del grfico de barras). Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 30 Histograma paraunavariablecontinua (peso en kg). Elpolgonodefrecuencias seconstruye facilmentesitenemosrepresentadopreviamenteelhistograma,yaqueconsisteenunir mediante lneasrectaslospuntosdelhistogramaquecorrespondenalasmarcasdeclase.Pararepresentarelpolgonodefrecuenciasenelprimeryultimointervalo, suponemosqueadyacentesaellosexistenotrosintervalosdelamisma amplitudyfrecuencianula,yseunenporunalnearectalospuntosdel histogramaquecorrespondenasusmarcasdeclase.Existe,puestotal correspondenciadeestosdostiposdegrficos,engeneral,seprefiereel histograma,porserdeunainterpretacinmsintuitiva;siendoslola comparacindedosomsseriesdondetieneeleccinelpolgonode frecuencias,dadalaimposibilidadgrficadesuperponerdosoms histogramas. El diagramaintegralparaunavariablecontinuase denomina tambin polgonode frecuencias acumulado, y se obtiene como la poligonaldefinida enabscisas a partir delosextremosdelosintervalosenlosquehemos organizado latabla de la variable,yenordenadaspor alturasquesonproporcionalesalasfrecuenciasacumuladas.Dichodeotromodo,elpolgonode frecuenciasabsolutases unaprimitivadel histograma. Diagramas diferencialese integrales paraunavariablecontinua. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 31 Pasos para elaborar un histograma Tenemos la siguiente distribucin de frecuencias: Muestra de distribucin etaria del Ca cervical: 22-29 (18 casos); 30-34 a. (45 c.); 35-39 a. (79 c.); 40-54 a. (225 c.); 55-59 a. (63 c.); 60-69 a. (45 c.); 70-90 a. (13 c.).Como se trata de una variable cuantitativa continua y ordenada en intervalos de clases, el grfico de eleccin es un histograma. Pasos: 1.Realizarlapresentacintabularcorrespondiente,comosevemsabajo.La amplitud (c), corresponde al rango de valores de cada clase, as la primera por ejemplo(2229),incluye22,23.....29aos=8valores.Laamplitudest representado por la anchura de cada rectngulo (en la abscisa). Para la altura, NO se debe usar directamente las frecuencias absolutas3, sino el resultado de la raznf/cporquesenecesitaunpromediounidaddelaescalausada.Aqu sera casos de Ca Cervical por ao de edad. 2.Al trazar el sistema de coordenadas, el ngulo debe comenzar en0; por tanto para guardar una coherencia debe cuidarse que si la primera clase no comienza en0sedebedejarunespaciocorrespondiente;opartirelejedeabscisascomoseobservaenlafigura.Deigualmodocuidarlaproporcionalidaddelas amplitudes de cada clase. Recordar que el inicio de cada clase, se corresponde con la finalizacin de la que le precede. Por convencin en el grfico se escriben los inicios de las clases.

3 Un caso especial de histograma es cuando las amplitudes de todas las clases son iguales. En este caso se puede usar directamente f para el escalamiento de la ordenada. EdadesFrecuencia (f)Amplitud(c)F /c 22-291882,25 30-344559 35-3979515,8 40-542251515 55-5963512,6 60-6945104,5 70-9013210,6 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 32 Lasiguientedistribucinserefierealaduracinenminutosdereunionesde trabajode integrantes de las UARsDuracin en min.Personal UARs 300-50050 500-700150 700 -1.100275 1.10025 Total500 -Representarelhistogramadefrecuenciasrelativasyelpolgonode frecuencias. -Trazar la curva de defrecuenciasrelativasacumuladas -Determinarelnmerom ni modeintegrantes que se reunieronmenos de 900 minutos. Solucin:Siempre que se tengaunrangotanampliode valoresresultamsconveniente agruparlaenintervalosdeclases.Laconsecuenciaesunaligeraprdidade precisin. El l t i mo intervalo estabierto por el lmitesuperior. Dado queen elhay25observacionespuedeserconveniente cerrarloconunaamplitud razonable. Todoslos intervalosexceptoel tercerotienenunaamplitud de 200 min,luegopodramos cerrarel ultimointervaloen1.300 min4. Antesderealizarelhistogramaconvienehacerunaobservacin importante,elhistogramarepresentalasfrecuenciasdelosintervalosmediante reasynomediantealturas.Sinembargoesmuchomsfcilhacer representacionesgraficasteniendoencuentaestas ltimas; por eso si todoslos intervalostienenlamismaamplitudnoesnecesariodiferenciarentrelos conceptosde reay altura, pero en este caso el tercerintervalotieneuna amplitud doblealosdems,yportantohayquerepartirsureaenunrectngulodebase doble (lo que reduce su altura a la mitad). As serconvenienteaadira la habitual tablade frecuenciasunacolumna que representea las amplitudes aide cadaintervalo, y otrade frecuencias relativas rectificadas, (fi) para representar la altura del histograma. Intervalos ai ni fi f 0 Fi i300 500200500,100,100,10 500 7002001500,300,300,40 700 1.1004002750,550,2750,95 1.100 1.300200250,050,051,00 n=500 4 Cualquierotra eleccin para ellmitesuperior del intervalo que sea desentido comn sera vlida.. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 33 En el grfico de arribasevequesumandofrecuenciasrelativas,hastalas900min deduracinhay 0,10+ 0,30+ 0,275= 0,675= 67,5 %delosparticipantesde las UARs. Estacantidadseobtienedemodomsdirectoviendoaqu altura corresponde alvalor900 enel diagramadefrecuenciasacumuladas. Comoentotalson500participantesdelasUARs,lacantidaddepersonasque trabajaron900horasomenoses0,675500=337,5.Redondeando,338 personas. Diagrama acumulativodefrecuenciasrelativa El grfico de dispersin o correlacin, se usa para presentar datos asociados en escala cuantitativa. Se lo estudia ms adelante en el captulo de herramientas de anlisis para datos de asociacin. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 34 3. Herramientas y Mtodos de Anlisis Mtodos Estadsticos de Anlisis El anlisis de todo estudio debe comenzar con una evaluacin de la informacin disponible:-Se cumpli con lo planificado y los objetivos del estudio. -La metodologa de recoleccin de datos. -El rigor cientfico y la fidelidad de la informacin. Los factores que determinan el mtodo de anlisis son: Las tcnicas de anlisis estadstico y su escogencia varan segn: -El nmero de individuos estudiados -El tipo de informacin recogida -La escala de clasificacin utilizada -El propsito del estudio 1- Nmero de individuos estudiados -Series no agrupadas: cuando el nmero de individuos es bajo. -Series agrupadas: cuando incluye una cantidad apreciable de individuos es necesario clasificar previamente en grupos o clases segn la caracterstica estudiada. 2- Tipo de informacin recogida -Distribucin de frecuencia -Datos de asociacin -Series cronolgicas 3-Escala de clasificacin utilizada El nmero de escalas depende de la cantidad de variables consideradas en el estudiodetermina un: -Anlisis univariante; bivariante; o multivariante. La caracterstica de la variante determina: -Escala cualitativa o nominal -Escala cuantitativa: se pueden ponderar o medir. Discretas: Series Ordinales Continuas: Series intervlicas y proporcionales. 4- El propsito del estudio -Estudios Descriptivos: busca resumir y destacar las caractersticas ms importantes del grupo en estudio. Consiste en el anlisis de la descripcin realizada de los datos cualitativos y/o cuantitativos en estudio que se encuentran resumidos en cuadros y grficos. -Estudios Comparativos: busca si hay o no diferencias reales entre los grupos estudiados y las razones para explicarlas (significancia estadstica). Esta clasificacin es ms bien aparente y sera mejor considerarla como pasos del proceso inferencial. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 35 Tcnicas de anlisis de los estudios descriptivos 1.Distribuciones de Frecuencia 1.1.En escala cualitativa: Las frecuencias relativas: porcentajes, tasas, etc. 1.2.En escala cuantitativa:a) las tendencias centrales: (promedio, mediana, modo). b) medidas de dispersin (desviacin estndar, etc.). 2.Datos de Asociacin 2.1.Ambas escalas son cualitativas: se resumen en frecuencias relativas. 2.2.Una escala es cuantitativa y la otra es cualitativa: (segn la finalidad del estudio), se podr escoger cualquier medida ya mencionada. 2.3.Ambasescalassoncuantitativas:seutilizaelcoeficientedecorrelacinoel coeficiente de regresin. 3.Series CronolgicasSe resumen por tendencias calculadas, cambios porcentuales, y tcnicas de regresin. 3.1.Distribuciones de frecuencia en escala cualitativa 1-Presentacin tabular: 1 columna: subdivisiones de la escala de clasificacin utilizada. Ej. Sexo (masculino / femenino) 2 columna:n de sujetos con dichas caractersticas (frecuencia absoluta). 3 columna: frecuencias relativas (porcentajes). 2-Presentacin grfica: Barras (si tiene muchas subdivisiones) o de sector. Se los puede presentar en cifras absolutas o relativas. 3 3- Anlisis mediante frecuencias relativas: Anlisis de los datos numricos relacionados a otra cantidad que se usa como base de comparacin. Importancia: Evidencian la intensidad de la relacin de 2 o ms datos estudiados. Los ms comunes son: la razn, porcentaje, la proporcin, las tasas, ndices, coeficientes. Razones:Relaciona frecuencias absolutas de 2 categoras distintas. Ej. Hay 297 hombres y 99 mujeres. La relacin hombres / mujeres es: 297/99 = 3. (relacin 3 x 1). Proporciones:Relaciona frecuencias absolutas de 1 categora con el total del grupo. Ej. 297 hombres + 99 mujeres = 396. La proporcin de hombres es: 297/396 = 3/4 = 0,75.Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 36 Hay 3 hombres por cada mujer en este grupo. Porcentajes:Es la frecuencia absoluta de 1 categora multiplicado por 100 y dividido por el total del grupo; o sea, una proporcin x 100. Ej. 297/396 x 100 = 75 %. Cuando la serie tenga 2 categoras pueden usarse cualquiera de estas FR; si tiene 3 o ms se usan proporciones y porcentajes. Ventajas de los porcentajes: 1-Mejor comparacin de 2 o ms series con totales diferentes (son reducidos a 100). 2-Resumen la probabilidad de ocurrencia del fenmeno estudiado. Variable (sexo)Grupo AGrupo B Hombre297255 Mujer9985 Total396340 A pesar de la aparente disparidad ambos grupos tienen el mismo porcentaje de hombres (75 %). Hay una probabilidad de un 75 % de que la persona sea varn y un 25 % que sea mujer en estas series. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 37 Frecuencias absolutas y relativas de colesterolemia de 2294 hombres5.Laboratorio Central del MSP y BS. Enero diciembre del 2010. Nivel de colesterol (mg/100 ml) Edades 25-34Edades 55-64 Nmero de hombres Frecuencia relativa (%) Nmero de hombres Frecuencia relativa (%) 80-119131.2250.41 120-15915014.06483.91 160-19944241.4226521.60 200-23929928.0245837.33 240-27911510.7828122.90 280-319343.1912810.43 320-35990.84352.85 360-39950.4770.57 Total10671001227100 Debidoaquehaymshombresenlosgruposdemayoredad,noesapropiado comparar las columnas de frecuencias absolutas de los 2 conjuntos de individuos. Interpretacin: -Los hombres mayores tienen nivelessuperiores de colesterol que los ms jvenes.-Los ms jvenes tienen una gran proporcin de observaciones inferiores a 200 mg/ml, mientras que los hombres mayores tienen una proporcin mayor superior de este valor. 5 La tabla presenta la frecuencia absoluta y relativa de los niveles de colesterol de1067 individuosde 15 a 34, as como las frecuencias correspondientes a un grupo de 1227 individuos de 55 a 64 aos de edad. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 38 T Ta as sa as s Accidentes automovilsticos segn sexo del conductor. Sexo del conductorCasosPorcentajesHombre40080 % Mujer100 20 % Total500100 % Los porcentajes calculados sealan un 80 % de probabilidad de accidentes para un hombre pero sera un absurdo inferir en base a esta informacin que los hombres tiene mayor peligro de accidentes. Las tasas son frecuencias relativas usadas cuando las relaciones del fenmeno estudiado son proyectas a su poblacin correspondiente. Miden la probabilidad de ocurrencia de un fenmeno en relacin a la poblacin en la que puede acontecer. T Ta as sa a = =N N d de e v ve ec ce es s q qu ue e o oc cu ur rr ri i e el l f fe en n m me en no o e es st tu ud di ia ad do o x x 1 10 0n n P Po ob bl la ac ci i n n e en n l la a c cu ua al l o oc cu ur rr ri i e el l f fe en n m me en no o Una TASA es simplemente un quebrado. El numerador, indica el nmero de veces que ocurri determinado fenmeno en unrea limitada y en un perodo de tiempo definido.El denominador indica el nmero de habitantes de la poblacin en la cual puede ocurrir el fenmeno descrito en el numerador. Como el numerador nunca ser mayorque su denominador, el resultado ser menor que la unidad y para evitar el uso de decimales, los resultados multiplican por un amplificador (100, 1000, etc.) Tasas crudas y especficas Tasa cruda: intenta medir la probabilidad de que un hecho ocurra en la poblacin total.TC= n de hechos ocurridos en la poblacin en un tiempo. Poblacin total a mitad del mismo periodo. Tasa especfica: se refieren a partes o caractersticas particulares de la poblacin: edad, sexo, raza, etc. T.E. = n de hechos ocurridos en el grupo especfico de la poblacin en un periodo. Poblacin de ese grupo especfico a mitad del mismo periodo. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 39 T Ta as sa as s i im mp po or rt ta an nt te es s e en n m me ed di ic ci in na a Tasas de mortalidad: expresan el riesgo de morir. Tasas de morbilidad: expresan el riesgo de adquirir determinadas enfermedades. Tasas de natalidad: miden el crecimiento de las poblaciones. Tasas de letalidad: indican cuan graves son las enfermedades. Estas tasas pueden calcularse para toda la poblacin o para partes (segmentos o grupos) de la misma y se llaman tasas especficas. Recomendaciones para construir frecuencias relativas Especificar que tipos de fenmenos se estn comparando y cual de ellos fue usado como base. El valor del cociente no reflejaninguno de los fenmenos por separado, sino la relacin de magnitud entre ambos. Con frecuencias absolutas poco numerosas, no se deben sacar frecuencias relativas, pues inducen a error. Todo cociente puede expresarse por su valor real o multiplicado por un factor de amplificacin. En las tasas habr que tener en cuenta la poblacin expuesta al riesgo, para que el denominador sea correcto. 3.2.Distribucin de frecuencia en escala cuantitativa Presentacin tabularigual a las otras distribuciones de frecuencias. Presentacin grfica: si la escala es continua se hace en histogramas (por defecto) polgonos de frecuencia. Si la escala es discontinua se utiliza el grfico de barras. Anlisis Losfenmenosbiolgicosnosuelenserconstantes,porloqueesnecesarioquejuntoaunamedidaqueindiqueelvaloralrededor delcualse agrupan los datos,seasocieunamedidaquehagareferenciaalavariabilidadquerefleje dichafluctuacin. Esdecir,dadoungrupodedatosorganizadosenunadistribucinde frecuencias(obienunaseriedeobservacionessinordenar),pretendemos describirlosmediantedoso trescantidadessintticas.. Tambin pueden analizarse mediante porcentajes y porcentajes acumulados, pero se prefieren analizar usando: a)Constantescentrales(promedioaritmtico,medianaymodo):sealancifras alrededor de las cuales se da la mayora de las observaciones.b) Medidas de dispersin (desviacin estndar, el espacio intercuartilar): sealan como se distribuyen las observaciones con respecto a las constantes centrales.c)Porcentajes, menos frecuentemente. El tipo de anlisis a utilizarse depende de la finalidad del estudio, ya que la informacin brindada por ellas es diferente.Suelen utilizarse simultneamente. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 40 Anlisis mediante frecuencias relativas: se utiliza el porcentaje y porcentaje acumulado. Distribucin de pacientes segn el sobrepeso sobrepeso Peso en grs. Nmero de pacientes Porcentaje (%) Porcentaje acumulado 800 - 99932,52,5 1000 - 119975,88,3 1200 - 13993024,833,1 1400 - 1599403366,1 1600 - 17992722,388,4 1800 - 1999129,998,3 2000 - 219921,7100 TOTAL 121 100En este caso, el simple promedio aritmtico suma de peso = 1506,6 gramos;N de casos oculta que el 33.1 % (porcentaje acumulado) de los pacientes tienen menor sobrepeso que1400 grs.;tericamenteconsideradocomomnimoaceptableyqueel estudiode los porcentajes nos aclara que: 2.5 % pesan de 800 a 999 grs.; 83 % de 1000 a 1199 grs. y 24.8 % de 1200 a 1399 grs. 3.3.1. Constantes centrales en Series No Agrupadas (simples) _ a) Promedio aritmtico o media aritmtica (X):Es el cociente de la sumatoria de los datos observados ( xn) dividido el nmero total de los mismos (N) _ _ X = xn X(*) = xn.fn NN (*)Sihayvaloresdelavariablequeserepiten:Semodificaelnumeradorporlasumatoriadelos productos de cada variable por su frecuencia correspondiente ( xn. fn) Ejemplo: Los pesos en Kgs. de 6 nios son: 40; 38; 42; 44; 39; 45 La media aritmtica de estos valores es: 40+38+42+44+39+45=41.5Kgs. 6 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 41 Si representamos el valor 40 como x1; 38 como x2; 42 como x3; ..........Xn. Al nmero de observaciones, por n y a la media aritmtica porxtendremos: =x1+x2+x3+.............Xn N Ahorasupongamosquesean200loscasosyquelosvaloresenkg.delosnios aparecen repetidos un cierto nmero de veces: 40 Kgs. 20 veces; 38 Kgs. 40 veces; 42 Kgs. 30 veces: 44 Kgs. 50 veces; 39 Kgs. 15 veces; 43 Kgs. 45 veces. X = (40x20)+ (38x40)+ (42x30)+ (44x50)+ (39x15)+ (43x45)= 20 + 40 + 30 + 50 + 15 + 45 X = 800 + 1520 + 1260 + 2200 + 585 + 1935=8300=41.5 200200 Si usamos los smbolos f1 para indicar la frecuencia asociada 20 de la primera variable de peso 40, y f2 a la segunda frecuencia 40 de la segunda frecuencia 30 de la tercera variable 42........fn, tendremos: X = (x1.f1) + (x2.f2) + (x3.f3)..............xn.fn f Media Aritmtica ponderada: pueden los valores x1; x2; xn etc. ser asociado con ciertos pesos:w1;w2........Wnquedependendelsignificadooimportanciaasignadoalos valores.En estos casos la media aritmtica se calcula as: Xp = x1.w1+x2.w2+....xn.wn= w Ejemplo: si en un curso acadmico dividido en tres perodos, se asigna a cada perodo unaimportanciade1,2,3respectivamenteyunalumnoobtienelassiguientes calificaciones: 50, 60, 75, su nota promedio ser: Xp=50x1 + 60x2 + 75x3 =395 = 65.8 1+2+3 6 b) La mediana (Ma): es aquella cifra de observacin que divide a la serie en dos partes iguales, dejando igual nmero de observaciones a cada lado. Es necesario ordenar las cifras de las observaciones de menor a mayor. Se tienen los siguientes datos: 8, 18,8,3,4,4,5,6,8. Se ordena3, 4, 4, 5, 6, 8, 8,8, 18. La mediana es 6; porquees el valor de la serie que deja a ambos lados igual nmero de valores. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 42 Cuandoelnmerodecifrasdeobservacinespar,noexisteunacifraqueocupael centrodelaserie.Enestoscasosparaobtenerlamedianasepromedianlosdos valores centrales.Ej.5, 5, 7, 9, 11, 12, 15, 18. La mediana est comprendida entre los valores 9 y 11, que se promedia: 9+11 =10 2 c)Elmodo(Mo):elmododeunconjuntodevaloresesaquelquesepresentacon mayor frecuencia, es decir es el valor ms comn.El modo puede no existir o puede no ser nico. Ej.3, 7, 3, 8, 5. El Mo = 3. 5, 3, 2, 4, 8, 9No hay modo porque todos se presentan con una sola frecuencia. 1, 2, 5, 3, 3, 6, 5, 4, 4, 7, 9, 13. Los modos son 3, 5, 4, pues ellos se presentan en dos ocasiones, en tanto que las otras cifras se presentan una sola vez. CONSTANTES CENTRALES EN SERIES AGRUPADAS a)Promedio Aritmtico:para calcularlo se presume que todos los valores que caen dentro de un intervalo de frecuencia de clase coinciden con el punto medio de la clase.En estos casos los valores X1, X2........Xn(1)corresponden a la marca de clase y f1, f2,......fn; son las frecuencias correspondientes a esos valores. As la frmula para el clculo de la media aritmtica ser:X = X.f n Situviramoslosdatossinagrupar,lamediaseobtendradirectamentedelos valores no ordenados y serams exacta, porque en el caso de las series agrupadas suponemosquetodoslosvalorescomprendidosdentrodelintervalo20-24por ejemplo, toman el valor de 22, lo cual no es cierto. Pero el error cometido calculando la media a partir de los datos agrupados no es importante si la variable escontinua y la distribucin simtrica. X=Lasumadelosproductosdecadamarcadeclaseporsufrecuencia correspondiente(xn.fn)divididaporelnmerototaldeobservaciones(N) X = ( xn. fn) N . Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 43 Peso en Kgr. de pacientes LUGARXXFECHAXX Peso en KgsN de casos (fn)Punto medio (xn)X.f 20 - 2442288 25 - 29827216 30 - 34932288 35 - 391037370 40 - 44742294 45 - 49647282 50 - 54652312 TOTALn= 50 (xi .fi)=1.850 Reemplazando segn la frmula: X = (xi. fi)/nX = 1.850 / 50 =37 kg. Consideraciones especiales: 1.-Cuandounaescaladedistribucindefrecuenciastieneunolosdosextremos indeterminados:-20kgs.y+de54kgs.,no hay indicacinacercadelvalorquedebe elegirse para representar a la clase para el clculo de la media.Si supusiramos que el grupo indeterminado tiene el mismo punto medio que el que le precede o sigue, dara unvalormuybajo,porquesesueledejarunaclaseabiertaporhaberunaspocas frecuencias dispersas entre escala de valores amplios. 2.- La media calculada para una distribucin de frecuencia asimtrica de intervalos de clase desiguales, es solo una aproximacin de la verdadera media. 3.-Si laserieessimtrica,selapuedecalcularconbastanteexactitud,promediando los valores extremos. Delej.anterior:delcuadroN2losvaloresextremosdelospuntosmedios, promediando nos d : 20 + 54 = 37 kg;2 4.- Cuando se presentan valores aberrantes inslitos se lo desecha para los clculos demediaporqueseconsideraqueprocedendebidoafactoresquelohacenno comparables a las otras observaciones. 5.-Promediodeporcentaje:cuandosedeseepromediarporcentajessedebentomar en cuenta su base como factor de ponderacin. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 44 Ejemplo: Personas Tuberculino-positivas por grupos de edad Pas............... - Ao......... Edad(aos)Pruebas ledasN Mantoux +% Mantoux + 1 - 6 167.71514.5918.7 7 - 14235.69570.70830.0 15 y + 288.578173.14760.0 TOTAL691.988258.44637.3 El promedio de estos porcentajes NO es: X = 8.7 + 30.0 + 60.0 = 32.9 3 Debe darse a cada porcentaje el peso correspondiente representado por el nmero de personas examinadas: 0.087x167.715 + 0.30x235.695 + 0.60x288.578 = 37.3 691.988 Estoresultacorrectocuandoloreferimosalnmerodeexaminados,perose dimensiona ms si lo queremos referir a todo el universo. EdadPoblacin% +N + 1 - 6 420.0008.736.540 7 - 14560.00030.0168.000 15 y + 1.020.00060.0612.000 TOTAL2.000.00040.8816.540 X = 816.540 x 100 = 40.8 lo que es lo mismo; 2.000.000 X = 0.087x420.000 + 0.30x560.000 + 0.60x1.020.000= 40.8 2.000.000 Resultado diferente a 37.3 encontrado sin tener en consideracin la poblacin total. 6.- Promedio de promedios: es problema similar: Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 45 Egresos y promedios de permanencia por especialidad. Hospitales del pas...........Ao ............ Especialidades N egresosPromedio de estada (das de internacin) Clnica Mdica37.0007.3 Clnica Quirrgica 15.00021.0 Obstetricia35.0003.5 Tuberculosis600 65.0 TOTAL87.600 El promedio general promedio de promedios NO es: X = 7.3 + 21.0 + 3.5 + 65.0= 24.2 4 Se lo debe calcular as: X= 7.3x37.000 + 21.0x15.000 + 3.5x35.000 + 65.0x600= 8.5 das de internacin 87.600 b) Mediana: Para el clculo (ver cuadro siguiente) Distribucin de frecuencias de pesos en Kgr Lugar XXFecha XX Peso en Kgs.N de casos (f)Frecuencia acumulada (Fa) 50 - 5411 55 - 5923 60 - 641114 65 - 691024 70 - 741236 75 - 792157 80 - 84663 85 - 89972 90 - 94476 95 - 99480 TOTAL80 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 46 1.-Sedivideeltotaldeobservaciones(N)endospartesiguales(N/2),en nuestro ejemplo 80/2 = 40, que es el lugar que ocupa la mediana. 2.- Se busca el intervalo al cual pertenece esa observacin, para ello semirala columna de frecuencias acumuladas, se observa corresponde el intervalo 75-79. 3.-Determinarelpuntomediodelintervalo75-79,quecorrespondeala observacin de 40 sujetos, por medio de la siguiente frmula: Me = Li + (N/2 - Fa ) x C fi Me:mediana;Li:lmiteinferiordelintervalodondecaelamediana;fifrecuenciadel intervalo donde cae la mediana; C: amplitud del intervalo donde cae la mediana. Donde:Li = 74.5 ; N/2 = 40 ; Fa = 36 ; Fi = 21 ; C = 5 NtesequeenlafrmulalaporcindeintervaloquesesumaaLiestdadaporlas frecuenciasdelintervaloqueseacumulanhastalamediana(N/2-Fa)divididasporel total de frecuencias del intervalo multiplicadas por la amplitud del intervalo. Como la mediana en la observacin es 40 y como hay 36 casos en el acumulativo por debajo de 74.5 (verdadero lmite inferior del intervalo de clase 75 - 79), para ubicar a la mediana.Considerandoquelas21observacionesdelintervalo75-79estnauna misma distancia; se tomar 4/21 de la amplitud de clase (5) y se aadir a 74.5 que es su verdadero comienzo, con el fin de obtener la mediana, as: Ma =74.5 + 4x 5=75.45 21 Es decir que las 21 observaciones estnentre los 5 espacios (75 - 79). Aplicando la frmula: Ma= Li + N/2 - FaC Fi Ma =74.5 +(40-36)x5 =75.45 21 ESCOGENCIA ENTRE EL PROMEDIO, LA MEDIANA Y EL MODO: El promedio aritmtico: tiene la ventaja de tomar en consideracin la totalidad de los valores, que a su vez es una desventaja cuando existen valores anormalmente altos bajos, pues es influenciado por ellos. Cuando se presentan valores aberrantes inslitos se los desecha para los clculos de mediaporqueseconsideraqueprocedendebidoafactoresquelohacenno comparables a las otras observaciones. Si laserieessimtrica,se lapuedecalcularconbastanteexactitud,promediandolos valores extremos (marca de clase, en series agrupadas). Ej.(22 + 52) / 2 = 37. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 47 Si la distribucin es simtrica pueden usarse las tres medidas (son parecidas); pero se prefiere la media.Lamediana:Siladistribucinesasimtricalamedianoesunvalortpicoyes preferibleusar lamediana.Encuantomssesgadosestn losdatos,msseparadas entresiestarnlas3medidasdecentralizacin;ysiendolaMamenossensiblea valoresextremosyatpicos,quelamedia,reflejamejorqueesta,ellugarendonde estn la gran masa de valores. Ej.Das de hospitalizacin de 5 pacientes = 2; 3; 4; 6; 30. X = 9 das; Ma = 4 das. Observar los cambios al aumentar o disminuir el sesgo. Sedebeusarlamedianacuandolaprimeraltimaclasenotienenlmitesprecisos (sesueledejarunaclaseabiertaporhaberunaspocasfrecuenciasdispersasentre escala de valores amplios). Del ej. anterior: menos de 25kg(1 clase); ms de 50kg (ltima clase).La medida de tendencia central a utilizarse depender: -Si la distribucin es simtrica pueden usarse indistintamente las tres medidas. -Si la distribucin es asimtrica la media no es un valor tpico y es preferible usar la mediana. -Se debe usar la mediana cuando la primera ltima clase no tienen lmites precisos. -El promedio aritmtico tiene laventaja de tomar en consideracin la totalidad de los valores, que a su vez es una desventaja cuando existen valores anormalmente altos bajos, pues es influenciado por ellos. -Por regla general podemos decir que cuando la serie es ms menos simtrica, el promedio debe ser preferido. Algunos inconvenientesdelamedia Lamediapresentainconvenientesenalgunassituaciones: oUnodeellosesqueesmuysensiblea losvaloresextremosde la variable:yaquetodaslasobservaciones intervienenenelclculodela media,laaparicindeunaobservacinextrema,haraquelamediase desplaceenesadireccion. Enconsecuencia; oNoes recomendable usarlamediacomomedidacentralenlas distribucionesmuyasimtricas; oSi consideramosunavariablediscreta, porejemplo,elNdehijoselvalor delamediapuedenoperteneceralconjuntodevaloresdelavariable;Ej.x= 1, 2 hijos. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 48 Propiedades delamediana Entrelaspropiedadesdelamediana,vamosadestacar lassiguientes: oComomedidadescriptiva,tienelaventajadenoestarafectadaporlas observacionesextremas,yaquenodependedelosvaloresquetomala variable,sinodelordendelasmismas.Porelloesadecuadosuusoen distribucionesasimtricas. oEs de clculo rpidoy de interpretacin sencilla. oA diferencia de la media, la medianade una variable discretaessiempre unvalorde la variableque estudiamos(ej. La medianade una variableNde hijos tomasiempre valores enteros). Resumiendo. La eleccin de las CC depende: Modo:Rapidezsobreprecisin;deeleccincondatosnominaleso cualitativos; se usa ms marketing que enbiologa. Mediana: Escalas ordinales; series asimtricas y con datos anmalos; clases abiertas. Media: Escalas intervlicas continuas; en series simtricas. Si es aplicable, es la CC de preferida por:-Tiene en cuenta todos los valores de la serie. -Es el valor ms estable (en series simtricas). -Sufrmulapermiteclculosalgebraicostilesparalaestadstica inferencial. Relaciones entre las CC Y MD: EscalaCCMD NominalModaRango OrdinalMedianaRq IntervlicaMediaDE ProporcionalMediaDE Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 49 Efectos de la Simetra. Relaciones de las Constantes centrales LaserieesSimtricacuandolaproporcindelosvaloresextremosoraros(altoso bajos) son aproximadamente iguales y estn a los lados del grupo central. Serie Simtrica. X = Ma = Mo La serie es Asimtrica o sesgada cuando predominan uno de los valores extremos; si predominan los valores altos (hacia la derecha o +), se llama asimetra (+). Si es hacia los valores pequeos se llama asimetra (-). La asimetra atrae el valor de la X. Asimetra o sesgo (+) X - Mo = 3 (X - Ma)o,Ma = 2 X + Mo En este caso el X ser mayor que la Ma; la situacin se invierte en la asimetra (-) 3.3.2. EstadsticosdePosicin Losestadsticosdeposicinvanaservaloresdelavariablecaracterizadosporsuperaraciertoporcentajedeobservacionesenla poblacin(omuestra).Tenemosfundamentalmentealospercentilescomo medidasdeposicin,yasociadosaellosveremostambinloscuartiles, decilesy cuartiles. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 50 frecuencia relativa 0.00 0.01 0.02 0.03 0.04 Percentiles Paraunavariablediscreta,sedefineelpercentildeordenk,comola observacin, Pk ,quedejapordebajo desielk %delapoblacin. Veasela figuradeabajo.Ej . : el 10Per cent i l esel val or por debaj odel que est nel 10%del asobser vaci ones. Estadefinicinnosrecuerdaala mediana, y por extensin de ladefinicines evidenteque Med = P50 Peso de 100 individuos P25 P50 P75 405060708090 Peso Percentiles 25,50y75deuna variable. Losquesemuestran dividenalamuestra encuatro intervalos iguales, yrecibentambinelnombredecuartiles. Cuartilos Silosdatosdelaserieestnordenadossegnlamagnitud,elvalorquedivideala serie en dos partes iguales es la mediana.Aquellos valores que dividen la serie en 4 partes lo llamamos cuartilos y se simbolizan con:Q1 =primer cuartil (25percentil): valor por debajo del que estn el 25 % de las observaciones. Q2 =segundo cuartil (50percentil): equivale a la mediana Q3 =tercer cuartil (75percentil)valor por debajo del que estn el 75 % de las observaciones. Intervalo Intercuartilar: es el comprendido entre el primer cuartil y el tercer cuartil; equivale al 50 % de las observaciones centrales NO AFECTADAS por las fluctuaciones extremas de una serie. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 51 3.3.3. Medidas de Dispersin o Variabilidad Supongamos3gruposdeenfermosde7sujetoscadauno.Siladuracindela enfermedad en cada sujeto fuera la que aparece a continuacin: Duracin de la Enfermedad en tres tipos de Patologas EnfermedadDas de hospitalizacin Enteritis1, 3, 5, 7, 9,11, 13 Bronquitis1, 2, 3, 7, 11, 12, 13 Conjuntivitis1, 5, 6, 7,8, 9,13 Se constata que: Lastresseriestienenelmismonmerodeobservaciones=7pacientes;lamisma amplitud = 1 a 13; la misma mediana =7 das; y el mismo promedio = 7 das. Sin embargo, son muy distintas. . .Grafiquemos: EnfermedadDas de duracin de la enfermedad 12345678910111213 Enteritisxx xx xx x (Distribucin uniforme) Bronquitisx xxx xx x (Se agrupan en los extremos) Conjuntivitisxxxxx x x (Se agrupan en el centro) Sinembargosonmuydistintasporquecomovemosenlarepresentacingrfica,la forma en que se agrupan o distribuyen las observaciones en estas tres series son muy distintas entre si: 1.- Los 7 pacientes de la enteritis se distribuyen uniformemente en duracin en el lapso de 1 a 13 das. 2.- Los pacientes con bronquitis se agrupan en los extremos. 3.- Los pacientes con conjuntivitis se agrupan hacia el centro. Estoindicaqueanteungrupodeobservacionesnosonsuficientesconocerel promedio y su mediana, sino que es necesario tener una medida que indique como se distribuyen las observaciones alrededor de las medidas centrales. Las medidas de dispersin nos indican si esas puntuacioneso valores estnprximas entre s, opor el contrario estn muy dispersas. Las ms utilizadas son: Recorrido de la variable o Rango 1.RECORRIDO Recorridoo intervalo intercuartlicoRecorrido interdeclico. Recorrido intercentlico.Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 52 2.DESVIACION MEDIA 3. VARIANZA 4. DESVIACION TIPICA O ESTANDAR 5.CUASIVARIANZA Rango Se obtienerestando el valor mas bajo de un conjuntode observaciones del valor ms alto. Propiedades delrango -Es fcil de calculary sus unidadesson las mismas que las de la variable. -No utiliza todas las observaciones(solo dos de ellas); -Se puede ver muy afectadapor algunaobservacin extrema; -El rangoaumenta con el nmerode observaciones,o bien se queda igual. En cualquiercaso nunca disminuye. Seutilizaladesviacinestndarparamedirladispersindelasobservaciones alrededor de la media aritmtica y el intervalo intercuartilar para la mediana. Recorrido o intervalo intercuartlico (RQ): Es la diferencia entre el cuartil tercero (Q3) y el primero (Q1); y comprende el 50 % de las observaciones. RQ = Q3 - Q1Cuartil (Qn): Son los valores que dividen las observaciones en 4 partes iguales x1, x2, x3, . . .x12, x13; x14, x15, . . .x25, x26; x27, x28, . . .xn, xn; xn, xn. . . xn, xn 25 %|25 %| 25 %|25 % Q1 (N/4) Q2 (N/2) Q3 (3N/4) |_______________RQ_____________| |________________________________R_______________________________|

DESVIACION TIPICA O ESTANDAR - DE (S; ): Es la media cuadrtica de las desviaciones; o sea, es la raz cuadrada de la varianza.S = S2o, S = xn2 - X2 _ _Valores sin repetir: S = dn2 = xn2 - X2

NN Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 53 Valores repetidos y/o agrupados: S = dn2 fn = xn2 fn - X2 NN Si los valores de la variable se agrupan en clases, se utilizan las marcas de clase de cada intervalo para la aplicacin de la frmula. En distribuciones normales unimodales y simtricas; el 68,27 % de los casos est entre el X 1DE; el 95,45 % entre el X 2DE; y el 99,73 % de los casos entre X 3DE. Esunamedidadedispersinquetienelamismadimensionalidadquelas observaciones. Clculo de la Desviacin Estndar (EN SERIES NO AGRUPADAS) Tenemos el ejemplo de los 7 pacientes con enteritis: 1; 3; 5; 7; 9; 11; 13 =49Promedio 49/7 = 7 das Se disponen los datos de la siguiente manera: DURACION DE LA ENFERMEDAD EN 7 PACIENTES CON ENTERITIS CALCULO DE LA DESVIACION ESTANDAR PACIENTES DIAS DEDESVIACIONESDESV. AL CUADR. (1)HOSPITALvalor de c/observacin(4) (2) menos promedio (3) Primer 11-7 =-636 Segundo22-7 =-525 Tercer33-7 =-416 Cuarto77-7 = 00 Quinto1111-7=416 Sexto1212-7=525 Sptimo1313-7=636 TOTAL490 154 Cuando el grupo de observacin es mayor digamos a 30, n queda igual; pero cuando espequeocomoesteejemplode7pacientes,esaconsejableusarelajustepara muestras pequeas (n-1); es decir se debe poner 6 en lugar de 7. X = 49/7 = 7 dasS2 =D2 /nS = S2 S = D2 /n= 154 / 7S = 22 = 4,7 dasa-) Obtenerel promedio (X);b-) Buscar las dn de cada observacin y el X (3); c-) Elevar las dn al cuadrado (4) y su sumatoria, dividirla por las observaciones; d) Extraer la raz cuadrada.Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 54 DESVIACION ESTANDAR EN SERIES AGRUPADAS Escolares de acuerdo a su peso.Clculo de la Desviacin Estndar PesoN ind. Punto mediof1 . x1 Desv. (dn)Desv.al cuad. f1 . d2 Kgs.(f) de clase (x)(2).(3) xn -X (d2) (2) . (6) (1) (2)(3)(4) (5)(6)(7) 20 - 2442288-15 225 900 25 - 29827216-10 100 800 30 - 34932288-5 25 225 35 - 391037370 0 00 40 - 44742294 5 25175 45 - 49647282 10 100600 50 - 54652312 15 2251350 TOTAL 501.8504.050 Los pasos son:1.Calcular el promedio (X) conforme a lo estudiado.X = f1 . x1 = 1850 = 37 Kg. f1 502.Encontrarladiferenciaodesvo(5)entrecadaunodelospuntosmediosde clases (3) y promedio.3. Elevar al cuadrado la anterior diferencia (6).4. Multiplicarfilaafila lascifras de lascolumnas2y6,puesesasdiferenciasse refieren a un solo individuo.5.Sumarlosproductosde(7),parasaberladiferenciaglobalentretodoslos individuos y su promedio.6.Dividir la suma anterior por el nmero de individuos estudiados (n = 50).7.Extraer la raz cuadrada, cuyo resultado ser la D.E.D.E. = f1 . D2 = D.E. = 4050 / 50= 9 kg. f1 La expresin matemtica de la distribucin normal: Determina un principio estadstico: X 1 D.E.= 68 % del rea (68,27 %); e2121-|.|

\| out oxGua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 55 X 2 D.E.= 95 % del rea(95,45%); X 3 D.E.= 100 % del rea(99,73%). Portantoapartirdeestasmedidasderesumendevariablescuantitativasque determinan las bases para un anlisis estadstico descriptivo, podemos incursionar en los principios de la inferencia estadstica, al determinar intervalos de confianza con una determinada certeza. Coeficiente deVariacin de Pearson (V) Hemosvistoquelasmedidasdecentralizacinydispersinnosdaninformacinsobreunamuestra. Nos podemospreguntar si tienesentidousar estas magnitudes para comparardos poblaciones. Por ejemplo, si nos piden compararladispersinde la variable considerada de dos poblaciones diferentes. Quocurresi lo que comparamoses la alturaconrespecto a su peso? Tantola mediacomo la desviacin tpica,x y S, se expresanenlasmismasunidadesquelavariable.Porejemplo,enlavariablealturapodemosusarcomounidadde longitudel metroy en la variablepeso, elkilogramo.Comparar unadesviacin(conrespectoalamedia)medidaenmetrosconotraenkilogramosnotieneningn sentido. El problema no deriva solo de que una de las medidas sea de longitud y la otra sea de masa.Elmismoproblemaseplanteasimedimosciertacantidad,porejemplola longitudes/talla,dedospoblaciones,perocondistintasunidades.Esteeselcasoen quecomparamostalla en cmde unapoblacinde hombres con el correspondiente en micrasde una poblacinde microorganismos. El problemanose resuelvetomandolasmismasescalasparaambas poblaciones; ya que las dispersiones pueden ser falsamente nulas segn sea el caso. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 56 Enlosdosprimeroscasosmencionadosanteriormente,elproblemavienedel a dimensionalidaddelasvariables,yeneltercerodeladiferenciaenormeentrelas medias de ambas poblaciones. Elproblemaseresuelveconlasmedidasdedispersinrelativa,querelacionanuna medidadedispersinconsucorrespondientemedidadecentralizacin.Elcoeficiente de variacin de Pearson (V), es el mejor exponente de este grupo; su potencialidad se basaen,eliminarladimensionalidaddelasvariables.Tieneencuentalaproporcin existente entre medias y desviacin estndar.Se define del siguientemodo: V = DE . 100 X Supongamos que queramos comparar rendimientos en relacin a indicadores.

Pararealizarcomparacionesdedeobservacionesindividualesdeseriesdiferentes, podemos recurrir al valor tipificado. Valor tipificado (z): Es el valor que permite expresar un valor inicial (en las unidades originales), en trminos de unidades DE _ z= (x1- X) DE_ x1 = valor inicial (a investigar);X = promedio; DE = desviacin estndar Ejemplo: Estamoscomparandoelrendimientodeunindicadordecobertura(en%)endistritos (a y b) de dos Regiones Sanitarias (A y B);a tuvo 84 %, el X de la RSA = 76 % y un DE = 10 %;b tuvo 90 %, el X de la RSB = 82 % y un DE = 16 %.Cul de los dos distritos tuvo un mejor rendimiento? A 78,81 % X = 76 ZA =x -X ZA=84 76= 0,8 DE10 TablaA: 0,8 = 0,2881. 50% + 28,81%=78,81 %

Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 57 B 69,14 %X = 82 ZB =x -X ZB=90 82= 0,5 DE16 TablaB: 0,5 = 0,1914 50 % + 19,14%=69,14% Interpretacin:atuvo unmejorrendimientomsalto, porqueestporencima del78,81%de los distritos de su RS;en cambio, b tuvo un rendimiento ms alto que slo el 69,14% de losdistritosdesuRS.Apesarquebaparentementefuemejor,noposeeunrendimiento relativo mayor que a porque el rendimiento de la RS fue alto (X= 82). 3.4. Anlisis de Datos de Asociacin Se denomina datos de asociacin cuando los elementos se clasifican simultneamente en dos escalas ya sean cuantitativas o cualitativas de ambos. Ambas escalas cualitativas PresentacinTabular:enellatomaremosfilas(horizontales)ycolumnas(verticales), cada una con sus correspondientes totales. De las dos escalas, generalmente corresponde ubicar en la vertical a lo que tienems subdivisiones. Pueden asociarse columnas filas con los respectivos porcentajes, en este ltimo caso se debe inscribir el nmero de observaciones sobre el cual se basan los porcentajes. CASOS DE TUBERCULOSIS POR FORMAS CLINICAS Y SEXO, PARAGUAY. AO............. POBLACION : .................. Formas clnicas Sexo Hombres MujeresAmbos Sexos Pulmonar7417351476 Menngea53 8 Otras 139 22 Total de casos759747 1506 Presentacin grfica: se la puede graficar en cualquiera de las formas de barras. Anlisis:relacionaren%losgruposentrescadagrupoensconlapoblacin correspondiente. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 58 El 98 % de los casos son pulmonares: 1476x100=98 % 1506 El 0.5 % de todos los casos son menngeos:8 x 100= 0.5 % 1506 El 1.5 % de todos los casos tienen otras localizaciones: 22 x100=1.5 % 1506 El 50.4 % de todos los casos son del sexo masculino:759x100 =50.4 1506 El50.2%detodosloscasospulmonaressondiagnosticadosenelsexomasculino:741x 100 =50.2 % 1476 Una Escala Cuantitativa y otra Cualitativa Presentacintabular:laescalacuantitativaseponeenlaprimeracolumnaque correspondealiniciodelasfilas,salvoquelaescalacualitativatengamuchas subdivisiones,ylaescalacualitativaenlosencabezamientosdelassiguientes columnas. Presentacin grfica: se utiliza el polgono de frecuencia.El diagrama puede trazarse en papel de pautado aritmtico, semilogartmico logartmico. Anlisis:pormediodeporcentajes,tasas,promedios,mediana,moda,desviacin estndar,cuartilos,segnlanecesidaddelcaso.Medidasestasquenospermitirn apreciar variaciones de los fenmenos en estudio. Si no se est seguro de cual de ellos es el indicado, utilizar las tasas y porcentajes. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 59 3.4.1 Ambas escalas cuantitativas Enestoscasosseinvestiganencadaindividuodosvariablescuantitativasdiferentes como ser edad y peso, estatura y peso. Alhablardecorrelacinyregresinsimplenosreferimosalanlisisbivariante(dos variables);yalusarlapalabra"lineal"expresamoselconceptodequelarelacin existente es de este tipo. Deestointuimosquesepuedencalcularrelacionesdemsde2variables(anlisis multivariante);yquepuedenexistirotro tiposderelaciones:exponencial,parablicas, lgicas, etc. Aspectos Generales: El anlisis presenta dos aspectos diferentes:Correlacin:Si lasdosvariablesestnasociadas(comoedadypeso)ymedirhasta que punto los cambios en una pueden explicarse por los cambios que ocurren en otra.Regresin: Cuando conocida una correlacin se la cuantifica con el fin de calcular los valoresde laotravariableconociendounadeellas(laescala depesodependedela edad).Elpesotieneunarelacincon laedad,es decir la escalapesodependede laescala edad. Al subir bajar la edad, el peso tiende a subir bajar.A la escala edad se la denomina escala independiente (x), y a la escala peso: escala dependiente (y). Avecesnopuededecirsequeciertosvaloresdeterminanlosotros,sinoqueunosy otrosvaranconjuntamente.Lasrelacionestienenlamismatendencia,aunque independientementelaunadelaotra;existiendonounacausacomnparaello,(aumento depulsaciones y aumento de respiraciones). En caso de no existir un trasfondo comn es pura coincidencia, como sera el aumento de embarazos al aumentar el consumo de papas. La aplicacin de un mtodo no excluye necesariamente al otro. Alestudiarla variacindecualquiercaractersticadebemosaveriguarprimerocualesfactores puedenexplicardichasvariaciones(correlacin)yunavezidentificadodedicarnosa medir en que grados los cambios que ellos experimentan afectan a la caracterstica que nos interesa (regresin) Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 60 PRESENTACION TABULAR: Si son pocos los elementos observados, especificar los valores observados al lado de cada elemento; si son numerosos se debern agrupar en clases. PRESENTACION GRAFICA: Se hace mediante el grfico de puntos. Coeficiente de Regresin a) Clculo del coeficiente de regresin.b) La lnea de regresin.c) Limitaciones en la utilizacin.Para hallar el coeficiente de regresin se hace primero un cuadro, luego el grfico que le corresponde, poniendo los valores de la variable independiente en la abscisa. Mtodo predictivo para calcular una variable a partir del dato conocido de otra variable con la que guarda correlacin. El clculo se basa en la ecuacin de la lnea o recta de regresin. Lnea de Regresin (LR): Es la recta que pasando por los datos minimiza la suma de loscuadradosdelasdesviacionesdelosdatosrealesconrelacinasuajuste correspondiente(minimizalavarianza);elmtodoutilizadoparacalcularlasellama: Anlisis de la Regresin o Mtodo los Mnimos Cuadrados. LaLRpasaporlasmediasdelavariabledependiente;yeslaquemejorexplicala ecuacin: y = a + b.x ESTATURA Y PESO DE LOS ALUMNOS DE BIOSESTADISTICA FACULTAD.. AO. AlumnosEstatura en centmetrosPeso en Kgm. 116258 215858 315556 416260 517068 616061 717570 816560 916864 1016569 Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 61 Diagrama de dispersinEstatura y peso de los alumnos del curso de Estadstica x = Estatura (cm)((cm)(cm) 7 y = Pesos (kg) (kg) 70 66 62

58 54 155160 165170 175 La relacin entre las variables (estatura, peso) puederepresentarse por la lnea recta trazada en el grfico. Mientras ms tiendan los puntos a caer sobre la lnea deregresin, ms estrecha es la relacin entre las dosvariables.Si el fenmeno en estudio puede ser resumido por unalnea recta, podemos resumir matemticamente dicharelacin, con lo cual nos ser posiblepredecir los valoresde la escala dependiente cuando se conocen los de laescala independiente. Coeficiente de regresin (b) indica que los valores de laescala dependiente cambian "b"unidadesporcadaunidadquecambianlosvaloresdelav.independiente.Enel ejemplopresenteencontramosqueb=0,8,locualsignificaqueporcadaaumentode 1cm en la estatura se observa un aumento de 0,8 Kg. de peso. Coeficiente de regresin puede ser positivo o negativo. Sies positivo, o aumentan o disminuyenalavez.Siesnegativoquiere decirquecuando unavariableaumenta la otra disminuye, o viceversa. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 62 Si el coeficiente de regresin fuera0, para cualquier valorde la escala independiente, habra siempre el mismo valor en la escala dependiente.Clculo del coeficiente de regresin Estatura y peso de un grupo de pacientes (f)Talla (x) Peso (y)Talla dx Peso dydx2dy2(dx)(dy) (1)(2) (3) (4) (5) (6)(7) (8) 1 162 58-2-4 4 16 8 2 158 54-6-836 64 48 3 15556-9-681 36 54 4 16260-2-24 4 4 5 17068 6 636 36 36 6 16061-4 -116 1 4 7 1757011812164 88 8 16560 1-21 4-2 9 16864 4 2164 8 10 16569 1 71 49 7 Sumas 1.640 0 0 316 278 255 Prom.164 62 a)Clculo del coeficiente de regresinQue el clculo del coeficiente de regresin es fcil, aunque las operaciones son muy laboriosas. Los pasos para el clculo del coeficiente de regresin son: 1. Disponer los datos como en el cuadro anterior. 2. Obtener el promedio para cada una de las variables en estudio. 3.Vercuntodifierecadaobservacindesupromediorespectivo.Estas desviacionesseobtendrnprimeroparaunavariableyluegoparalaotrayse anotarn respectivamente en las columnas (4) y (5) del cuadro, teniendo cuidado de indicar si son positivas o negativas. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 63 4. Elevar al cuadrado las anteriores desviaciones, y situndolas en las columnas respectivas (6) y (7). 5. Totalizar las dos columnas de cuadrados. 6. Buscar el producto de las desviaciones obtenidas en el punto (3), para lo cual se multiplicaron rengln a rengln las columnas (4) y (5) conservando los signos algebraicamente. Totalizar luego estos productos. 7.Calcularelcoeficientederegresin,paralocualsedivideeltotaldela columna de productos por el total de la columna dx2(desviaciones cuadrados de los valores independientes). b = dx . Dy=255= 0,80kilos dx2 316 b) Lnea de regresin (LR) Lalnearectatrazadaenelgrficopuedeusarseparapredecirelpesodecualquier individuo cuya estatura se conozca. El grfico anterior presenta una inclinacin de0,8 kilos de peso por cada centmetro de estatura.__La ecuacin de la LR: y = a + b.x; donde a = Y - b.X _ _ y = ( Y-b . X) + b . x Donde:y = valor de la variable dependiente a conocer Y ; X = promedio de las variables b y x = coeficiente de regresin y valor de la variable independiente respectivamente. Ejemplo:sequiereconocerelpeso(Y)deunindividuoquemide180centmetrosde estatura (X). Mediante el cuadro 176 sabemos que: Y = 62 X = 164 B = 0,8 kilos X=180,eslaestaturadelindividuocuyocorrespondientepeso(Y)quequeremos saber: Reemplazando: Y180 = 62- (0,8 x 164) + (0,8 x 180) Calcularalgebraicamente,y poner correctamente los signos: Y180 = 62- 131,2 + 144,0 = 74,8 kilos. En la misma forma, si se quiere averiguar el peso de un individuo de 158 centmetros de estatura: Y158 = 62- (0,8x164) + (0,8x158) = 57,2 kilos. Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 64 Limitaciones para su uso: oEl coeficiente de regresin se calcula nicamente si el grfico demuestra que la relacin estudiada es lineal. oElcoeficientenopuedeaplicarseparaestimarvaloresqueexcedenloslmites delaseriedondefuecalculado.Asserabsurdopretendercalcularporeste procedimiento la estatura de una persona de 60 aos. oSielcoeficientederegresin(b)tienevalorpositivosignificaquelasdos variables aumentan o disminuyen al mismo tiempo. oSi es negativo: cuando uno aumentael otro disminuye, o viceversa. oSiescero,paracadavalordelaescalaindependientecorrespondecualquier valor en la escala dependiente: Coeficiente de correlacin: r En un problema de correlacin no puede decirse que unavariable sea dependiente y otra independiente. Tenemos que hallar el coeficiente de regresin b, querepresentar la variacin de y con respecto a x y el coeficiente de regresin b, que representar la variacin de x con respecto a y. Conelfindereducirlasdosconstantesaunasola,seutilizaelcoeficientede correlacin r, que es igual a la raz cuadrada del producto de los dos coeficientes de regresin mencionados. r=\ bx bCoeficiente de correlacin a)Clculo del coeficiente de correlacin b)Valores de "r" c)Interpretacin del "r". a)Clculo del coeficiente de correlacin Elclculodelcoeficientedecorrelacinsehacefcilmenteconlosdatosdel cuadro precedente.Siseconsideraprimeroquelaestatura,eslavariableindependiente,entonces, conforme ya se ha visto: b= dx . dy = 255 =0,80kilos dx2 316 Y si se considera luego que el peso es la variable dependiente, entonces se calcular b, para lo cual slo variar el denominador del quebrado: Gua Metodolgica para el Anlisis Cientfico de la Informacin en Salud-Dr. Alexis Moreno 65 b = dx . dy = 255 =0,91cm. dy2 278 Por lo tanto: r = \ b. b= \ 0,80 x 0,91= 0,86 b)Valores de r -Puede valer entre-1 y+1 -Valorespositivosindicanqueambasvariablesaumentanodisminuyenal mismo tiempo. -Valoresnegativosindicanquecuandounoaumentan,elotrodisminuye,o viceversa. -Siresexactamenteiguala1o+1,quieredecirquehayunaperfecta asociacinentrelasdosvariable,enelsentidodequeporcadaunidadque aumentaodisminuyeunavariable,laotracambiasiempreigualnmerodeunidades. En dichas ocasiones los puntos en el grficocaeran todos sobre una lnea recta. -Si r = 0, significa que no hay ninguna asociacin entre las dos variables, o que de existir, no es una relacin lineal. r=1r=0,97r=0,53 r=1r=0,97r=0 Interpretacin de larr=1eslomismoquedecirquelasobservacionesdeambasvariablesestn perfectamentealineadas. Elsignodernosindicaelcrecimientoodecrecimiento de larecta.La relacin lineal estanto msperfecta cuantor estcercanoa1. c)Interpretacin de r-Enelejemploquenossirviparaelclculodelcoeficientedecorrelacin encontramosquer=0,86Estevalornodebeinterpretarsecomosehace Gua