medidas tendencia central d.a. y d.n.a

Upload: francisco-galicia

Post on 20-Jul-2015

69 views

Category:

Documents


0 download

TRANSCRIPT

TEMA2

MEDIDASDETENDENCIACENTRALY DEPOSICIN

Anlisisdedatosdelainvestigacineducativa

1

NDICE

1. Intr oduccin3 2. Objetivos..3 2.1 Gener ales..3 2.2 Especficos.3 3. Desar r ollodelosdistintosapar tados4 3.1 Medidasdetendenciacentr al.4 3.1.1Media...4 3.1.2Mediana...7 3.1.3Moda...11 3.2 Medidasdeposicin14 3.2.1Per centiles..15 3.2.2Deciles.19 3.2.3Cuar tiles.20 4. Actividadesopr oblemas...21 5. Solucionesalospr oblemaspr opuestos23 6. Bibliogr afa.23 7. Cuestionar iodeevaluacin...23

2

1. Intr oduccin:En este trabajo veremos que podemos contar con una serie de valores o ndices capaces de describir el conjunto de una forma simple y exacta, concentrandolainformacinenvaloresnumricos. Trabajaremos las medidas de tendencia central, que son aquellas que nos indican los valores medios del conjunto de las puntuaciones, permitindonos describir brevemente las caractersticas de un grupo y compararlas con las de otros grupos diferentes. Las medidas de tendencia centraldelasqueaqunosocuparemossonlamedia,lamedianaylamoda. Tambintrabajaremoselestudiodelasmedidasdeposicindeunindividuo enrelacinalconjuntodepuntuacionesdelgrupo.Estainformacinqueda recogidaconlospercentiles,decilesycuartiles.

2. Objetivos. 2.1 Gener ales.

Conseguirquelosalumnosconozcanysepancalcularlasmedidasde tendenciacentralydeposicin.

2.2

Especficos.

Los alumnos deben diferenciar entre las tres medidas de tendencia central (media, mediana y moda), aprender a calcularlas estando agrupadasosinagruparporintervalos. Adems, deben diferenciar entre las tres medidas de posicin (percentil, decil y cuartil), aprender a calcularlas estando agrupadas porintervalos.

3

3. Desar r ollodelosdistintosapar tados 3.1 Medidasdetendenciacentr al

3.1.1Media Queslamedia?Lamediaesunamedidadetendenciacentralqueseobtieneporlasuma detodaslaspuntuacionesdeungrupodivididaporelnmerodeellas.

Cmolacalculamos?o Tenemosdatosagr upadospor inter valos: Lafrmulasera:

Donde: Xi:eselpuntomediodecadaintervalo. fi:eslafrecuenciadecadaintervalo. r:esel nmerodeintervalos. n:eselnmerodecasos. o Tenemosdatossinagr upar : Lafrmulasera:

Donde: Xi:escadapuntuacin. n:eselnmerodecasos.

Ejemplo:

4

La directora de la biblioteca de un centro universitario est interesadaenconocerelnmerodelibrosqueportrminomedio sacaron en prstamos los 100 alumnos de una promocin a lo largodesusaosenelcentro.Culserlamediadelibrospor alumno, si los datos correspondientes al grupo son los recogidos en la distribucin de frecuencias para datos agrupados por intervalos, que se muestra en las dos primeras columnas de la siguientetabla? Nmerodelibros f1 (Intervalos) 100104 9599 9094 8589 8084 7579 7074 6569 6064 5559 5054 4549 4044 2 0 6 4 12 20 16 16 8 4 8 2 2 Puntomedio f1 X1 X1 102 97 92 87 82 77 72 67 62 57 52 47 42 204 0 552 348 984 1540 1152 1072 496 228 416 94 84

f1 X1 =7170Para obtener la media, hemos dado algunos pasos y realizado ciertos clculos, que aparecen integrados junto a los datos de la

5

tabla. As, hemos incluido una columna con los puntos medio de cadaintervaloenladistribucin. Igualmente, hemos destinado una columna de la tabla para recogerlosproductosdelospuntosmediodecadaintervaloporla correspondientefrecuenciainternaregistradaenste. En la base de esta columna hemos consignado el resultado de sumartodoslosproductos.Llegadosaestepunto,elclculodela mediasereduceadividirlasumadelosproductosentreelnmero totaldepuntuaciones.

Por tanto, la media de libros obtenidos en prstamo por los alumnos a lo largo de sus estudios en el centro ascendi a 71.7 libros. Ello nos da una idea del valor en torno al que se sita el conjuntoglobaldelosdatos. Enrealidad,lamediaobtenidacondatosagrupadosenintervalos esunamediaponderadadelospuntosmediodelosintervalos.El pesoasignadoacadapuntuacin(cadapuntomedio)seraigualal nmerodeobservacionesdentrodedichointervalo.

Pr opiedades. Lasumadelasdesviacionesdetodaslaspuntuacionesrespectoala mediaes0.

La suma de las desviaciones al cuadrado respecto a la media es menorquerespectoaotrovalorcualquiera.6

La media es sensible a la variacin de cualquiera de las puntuaciones. Basta que cambie un solo valor para que la media se modifique. Sisemultiplicanporunaconstantelaspuntuacionesdeungrupo,la mediaquedarmultiplicadapordichaconstante. SiunavariableXescombinacinlinealdervariablesX1,X2,Xr, su media se obtiene como combinacin lineal de las medias de dichas variables.

Dados r grupos con n1, n2, nr casos y sus respectivas medias, lamediaglobalseobtieneponderandodichasmedias.

Cuando calculamos la media para datos agrupados en intervalos el valor resultante depende de los intervalos elegidos (de su amplitud, su nmeroydeloslmitesfijados). La media puede calcularse cuando las variables se han medido en unaescaladeintervaloorazn.

3.1.2Mediana Queslamediana?La mediana es una medidadetendenciacentral,esel valorque divide en dos partes iguales a un conjunto de puntuaciones ordenadas. Es la puntuacinquedejaporencimaypordebajodesel50%deloscasos.7

Cmolacalculamos?o Tenemosdatosagr upadospor inter valos: Lafrmulaes:

Donde: Li: es el lmite inferior del intervalo crtico (que contiene a la mediana). I:eslaamplituddelosintervalos. fi:eslafrecuenciaabsolutaenelintervalocrtico. n:eselnmerodecasos. fa: es la frecuencia acumulada en el intervalo anterior al intervalo crtico. o Tenemosdatossinagr upar : Sielnmerodedatosquenospresentanesimpar,lamediadaser elvalorquequedajustoenelcentro.Ejemplo: 7,5,3,7,5,4,4,6,4 Losordenamosdemenoramayorybuscamoselvalorcentral: 3,4,4,4, 5,5,6,7,7 Sielnmerodedatosquenospresentanespar,lamedianaserla mediaaritmticadelosvalorescentrales.Ejemplo: 2,5,3,4,3,5 Losordenamos,buscamoslosvalorescentralesyhacemoslamedia aritmticadeambos: 2,3,3,4, 5,5

8

En este caso la mediana no corresponde con ningn valor del conjuntodedatos.

Ejemplo: A partir de la siguiente distribucin de frecuencias para datos agrupados por intervalos (tabla siguiente), correspondiente al nmerodeerroresortogrficoscometidosenunejerciciodedictado por los 104 alumnos de 3 de Educacin Primaria de un centro, calcularlamedianadeloserrores.Errores fi fa 1621 8 8 2227 12 20 2833 18 38 3439 17 55 4045 17 72 4651 12 84 5257 8 92 5863 9 101 6469 3 104

Para obtener la mediana de esta distribucin, comenzaremos por determinar cul es el intervalo crtico, es decir, aqul en el que habr de estar contenida la mediana. Puesto que la mediana deja por debajo de s al 50% de las puntuaciones, que en este caso resultan ser 52, habr de estar contenida en el intervalo 3439 donde la frecuencia acumulada alcanza y supera esta cifra. Este serelintervalocrtico.

9

Teniendoencuentaqueellmiteinferiorcrticoes33.5laamplitud delosintervaloses6,lafrecuenciaenelintervalocrticoes17,yla frecuenciaacumuladaenelintervaloanterior38,podemoscalcular lamedianaaplicandolafrmulaquesebasaenellmiteinferiordel intervalocrtico:

A idntico resultado habramos llegad utilizando la frmula que se basa en el lmite superior del intervalo crtico. Teniendo en cuenta que la frecuencia acumulada en los intervalos superiores al intervalocrticoasciendea49,elvalordelamedianaser:

Es decir, el 50% de los alumnos comenten 38 o menos errores ortogrficos, y en el dictado del 50% restante aparecen 39 o ms errores.

Pr opiedades. Es menos sensible que la media a variaciones de las puntuaciones. Puedequealmodificarunvalorlamediananosealtere. Para datos agrupados por intervalos, el valor de la mediana depender de la amplitud de los intervalos, el nmero de ellos y los lmitesfijados. Lamedianapuedecalcularsecuandosehanmedidolasvariablesen escalaordinalosuperior.

10

3.1.3Moda Queslamoda?La moda es una medida de tendencia central que indica cul es la puntuacin,categorao modalidadque msserepiteenelconjuntode medidas. o Ventajas: Lamodapuedecalcularseconcualquiertipodedatos. o Inconvenientes: La modaes la ms instablede las medidasdetendenciacentral, ya quepuedevariarmuchodeunaaotramuestraextradadeunamisma poblacin. Podemos encontrarnos con que no existe una nica moda, a lo que llamaramosdistribucionesbimodalesomultimodales. o Atener encuenta: Si nos encontramos con que todas las puntuaciones de una distribucin tienen la misma frecuencia consideraramos que no existemoda.Ejemplo: Puntuaciones: 2,2,2,5,5,5,9,9,9

Comovemostodoslosvalorespresentanunafrecuenciade3,porlo queconsideramosquenoexistemoda. Cuandoenlaspuntuacionesdeunadistribucinvemosquedosde ellastienenlamismafrecuencia,yademsesmayorqueelrestode las frecuencias de las dems puntuaciones, consideramos que la modaeselpromediodeestasdospuntuacionesadyacentes.Ejemplo: Puntuaciones:1,1,4,6,6,6,6,7,7,7,7,9,10

Enestecasolamodaseraelpromediodelosvalores6y7yaquese repitenconlamismafrecuencia.

11

Estaramos ante una distribucin bimodal en el caso de encontrarnos con dos puntuaciones que sin ser adyacentes tienen la misma frecuencia y adems es mayor que la de otra puntuacin cualquiera.Ejemplo: Puntuaciones:1,1,3,3,3,3,4,4,5,6,6,6,6,7

Nos encontramos con que tanto el valor 3 como el valor 6, tienen una frecuencia de 4, por lo que ambos valores determinarn la moda.

Cmolacalculamos?o Tenemosdatosagr upadospor inter valos: Enestecasolamodaeselpuntomediodelintervaloqueregistrala mayor frecuencia, a lo que llamamos intervalo modal. Tambin disponemos de expresiones de clculo que nos permiten calcular la moda.

d1: es la diferencia entre las frecuencias del intervalo modal y elintervaloanterior.

d2: es la diferencia entre las frecuencias del intervalo modal y elinmediatosuperior. Li:esellmiteinferiordelintervalomodal. I:eslaamplituddelintervalomodal.

12

Ejemplo: A partir de la siguiente distribucin de frecuencias para datos agrupadosporintervalos,calcularlamoda. Intervalos 1621 2227 2833 3439 4045 4651 5257 5863 6469 fi 8 12 18 17 17 12 8 9 3

Si adoptamos como moda el punto medio del intervalo de mayor frecuencia, la moda ser el valor 30,5, ya que en este intervalo se alcanzalamayordelasfrecuencias(18). Si empleamos la expresin para clculo de la moda en distribuciones de frecuencias con datos agrupados por intervalos, obtenemosqueladiferenciadelafrecuenciadelintervalomodalcon la frecuencia del inmediatamente anterior es d1 = 18 6 = 6 y la diferenciaconlafrecuenciadelintervaloposterioresd2 = 1817 = 1,acontinuacinpodemoscalcularlamoda:

o Tenemosdatossinagr upar : En primer lugar se construye la distribucin de frecuencias. La modaseraaquelvalorconfrecuenciamxima.Ejemplo:

13

Puntuaciones:1,1,2,3,4,4,4,5,6,7,7,8

El valor 4 tiene una frecuencia de 3, mayor que el resto de las frecuencias,porloqueseralamoda. Si la frecuencia mxima se repite en dos o ms valores, obtendramos varias modas, y el grupo se denominara bimodal o multimodal.Ejemplo: Puntuaciones:1,1,2,3,4,5,5,6,7,7,8

Comovemos,losvalores1,5y6tienenlafrecuenciamximade2, por tanto estamos ante un grupo multimodal, cuyas modas son las puntuaciones1,5y7. En el caso de que dos valores adyacentes alcanzaran la misma frecuencia,lamodaseraelpromediodeambos.Ejemplo: Puntuaciones:1,2,3,3,4,4,5

Lamodaeslasumadelosvalores3y4divididaentredos,yaque estossonadyacentesylamodaseconsideraelpromediodeambos.

Pr opiedadesdelamoda: Eslamedidadetendenciacentralmsinestable,pudiendovariar muchodeunamuestraaotraextradasdelamismapoblacin. Para datos agrupados por intervalos, el valor de la moda dependerdelaamplituddelosintervalos,elnmerodeellosylos lmitesfijados. Puededeterminarseparavariablesmedidasencualquierescala.

3.2

Medidasdeposicin

Ademsdeconocerlosvaloresdetendenciacentralparaunadistribucin, puede resultar interesante localizar la posicin de determinadas puntuacionesindividualesenrelacinconelgrupo.Deestoseencarganlas medidas de posicin informan de la posicin de determinadas

14

puntuaciones individuales en relacin con el grupo del que forman parte. La mediana, adems de indicar una tendencia central, puede ser considerada una medidadeposicin,puestoqueatravsdeellapodemos saberqueelindividuoquelograunapuntuacinsimilaraellaseencuentra justo en el centro de la distribucin, dejando el mismo nmero de puntuacionesporencima ypordebajo.Estetipodeinformacineslaque nosaportanloscuantiles. Sideseamosexpresarlapuntuacindeunsujetoenrelacinconelgrupoal que pertenece, la forma ms sencilla de hacerlo sera ordenar todas las puntuaciones y sealar el lugar que ocupa. Pero no es suficiente decir el lugar que ocupa un determinado sujeto, es preciso conocer tambin el nmerodesujetosqueintegranelgrupo. Para indicar de forma clara el lugar que ocupa un sujeto en un grupo podemos ordenar de mayor a menor todos los componentes del grupo, segn las puntuaciones obtenidas. Llamaremos cuantiles a los puntos o valoresdecorteenladistribucinquedejanpordebajodesunporcentaje determinado de casos o individuos, y por encima otro porcentaje, complementarioalanterior. Parapodercalcular loscuantiles, laescala ha de ser al menos ordinal, y ser preciso ordenar previamente los datos o agruparlosdemayoramenor. Dependiendo del nmero de partes en que se divide la serie de puntuaciones,podremoshablardepercentiles,cuartilesodeciles.

3.2.1Per centiles Qusonlosper centiles?Los percentiles son los 99 valores que dividen en 100 partes iguales a unaseriedepuntuacionesordenadas,deformaqueelpercentilPm deja pordebajodesel mporcientodelaspuntuacionesdelgrupo.Acada

15

unadeestascienpartesenlasquesedividenlaspuntuacionestambin laspodemosllamarcentil(Cm).

Cmoloscalculamos?Si los datos aparecen agrupados por intervalos, bastar ordenarlos y determinar cuntas puntuaciones representan el m por ciento de la distribucin. Una vez determinada esta cantidad, localizaremos en la serie ordenada cul es la puntuacin que deja por debajo de s a ese nmerodepuntuaciones. En el caso en que los datos aparecen agrupados por intervalos, emplearemos la siguiente expresin, que nos permitir calcular un percentilcualquiera:

L1: es el lmite inferior del intervalo crtico (intervalo donde estar contenidoelpercentil). I:eslaamplituddelosintervalos. fa:eslafrecuenciaacumuladadelintervaloanterioralintervalocrtico. n: eselnmerodecasos. fi: eslafrecuenciaabsolutadelintervalocrtico. La expresin m n/100 representa el nmero de puntuaciones que quedaran por debajo del percentil m en la distribucin estudiada. El intervalo crtico es precisamente aquel donde la frecuencia acumulada alcanzaosuperaesenmerodepuntuaciones.Ejemplo:

Una prueba de rendimiento en Estadstica ha sido calificada con una escalade0a50.Silaspuntuacionesobtenidasporlos204alumnosde 2 de Pedagoga de una facultad espaola son los que aparecen en la

16

tabla4,culserelpercentil80deesadistribucin?Qupercentil correspondeaunsujetocuyapuntuacines35? Para responder al primero de los interrogantes, comenzaremos por determinarculeselintervalocrtico,esdecir,aqulenelquehabr deestarcontenidoelpercentilP80.Puestoqueestepercentildejapor debajodesal80%delaspuntuaciones,calcularemospreviamentede cuntaspuntuacionessetrata:

que en este caso resultan ser 163.2. Lgicamente, puesto que las puntuaciones son indivisibles, para dejar 163.2 puntuaciones por debajotendremosquetomar164puntuaciones.ElpercentilP80habr de estar contenido en el intervalo 30 33, donde la frecuencia acumuladasuperalas164puntuaciones.Esteserelintervalocrtico. Teniendoencuentaqueellmiteinferiordelintervalocrticoes29.5,la amplitud delosintervaloses4,lafrecuenciaenelintervalocrticoes 21,ylafrecuenciaacumuladaenelintervaloanteriores144,podemos aplicarlafrmuladeclculo:

17

Calificaciones f1 25 69 1013 1417 1821 2225 2629 3033 3487 3841 4245 4649 4 18 14 20 20 54 14 21 10 15

fa4 22 36 56 76 130 144 165 175 190

10 200 4 204

Es decir, la puntuacin 33.16 deja por debajo de s el 80% de las puntuacionesyporencimael20%restante. Veamos ahora el segundo de los interrogantes. Se tratara de determinarelpercentilquecorrespondealapuntuacin35.Paraello, aplicaremos de nuevo la frmula anterior, aunque esta vez el valor desconocidoesmenlugardePm. El intervalo crtico ser 34 37, pues de hecho es en este intervalo donde se encuentra el percentil con el que trabajamos (P m= 35). Sustituyendotodoslosvaloresconocidos,podremosobtenerelvalorde m:

ydespejando,tendremosm=82.72.Enconsecuencia,podemosafirmar quelapuntuacin35correspondeaunpercentilaproximadode83.Es18

decir,esesujetoposeeunacalificacinsuperioral83%delaclasey quesevesuperadasloporel17%delossujetosdelaclase.

3.2.2Deciles Qusonlosdeciles?Sidividimos unaserie depuntuacionesendiezpartes,cadaunade las puntuaciones que limitan las partes se denomina decil (Dm). La escala dedecilesvadesdeelD1 alD9.Definiremosundecil(Dm)comoaquel valornumricoquedejapordebajodesmdcimaspartesdeltotalde puntuaciones.

Cmoloscalculamos?Paracalcularlosseguimoslasiguienteexpresin:

Donde: Li:esellmiteinferiordelintervalocrtico(quecontieneaDm) I:eslaamplituddelosintervalos. fi:eslafrecuenciaabsolutadelintervalocrtico. n:eselnmerodecasos. fa: es la frecuencia acumulada en el intervalo anterior al intervalo crtico.

Ejemplo: Tomando como referencia la distribucin de la tabla usada en el ejemplo de los percentiles, determinar la puntuacin que constituye el tercerdecil. Comenzaremos determinando el intervalo crtico, es decir, aqul que contiene al decil tercero. Esta puntuacin dejar por debajo de s a 319

dcimas partes de la distribucin. Podremos saber de cuntas puntuacionessetratamedianteelsiguienteclculo:

Este nmero de puntuaciones queda alcanzado en el intervalo 1821, queserelintervalocrtico.Adems,sabemosquedentrodelintervalo crtico hay un total de 20 puntuaciones y que el intervalo inmediatamenteinferioracumula56puntuaciones.Deestaforma:

Por tanto, la puntuacin18.54 deja por debajo de s 3 dcimas de la distribucin,oloqueesigual,un30%delaspuntuaciones.

3.2.3Cuar tiles Qusonloscuar tiles?Loscuartelessonlos3valoresquedividenencuatropartesaunaserie de puntuaciones ordenadas, de manera que el cuartel Qm deja por debajodesmcuartaspartesdeltotaldepuntuacionesdelgrupo.

Cmoloscalculamos?Lasiguienteexpresinnospermitircalculardichoscuarteles:

Ejemplo: Tomandodenuevoladistribucindelejemploanteriorvamos acalcularlacalificaci6nobtenidaporunalumnoquesesita eneltercer cuartil.

20

En primer lugar, identificaremos el intervalo crtico. Para ello,calcularemoselnmerodepuntuacionesqueconstituyen lastrescuartaspartesdeladistribucin:

Lapuntuacinquedejapordebajoauntotalde153puntuacionesha de hallarse necesariamente en el intervalo 30 33, pues en ste se llegan a acumular 165 puntuaciones, mientras que en el inmediatamenteanteriorsloseacumulaban144.Ellmiteinferiorreal del intervalo crtico es 29.5, y la frecuencia en su interior asciende a 21.Aplicandolafrmulaparaelclculo:

Lapuntuacin31.21constituyeeltercercuartilparaladistribucin,es decir,trescuartaspartesdelaspuntuaciones,oloqueesigualel75%, quedanpordebajodeella.

4. Actividadesopr oblemas1. EnunapruebademadurezlectoralosalumnosdeprimerodePrimaria hanobtenidolassiguientespuntuaciones: 18,17,7,12,15,6,7,10,9,4,2,7,20,9,10,13,11,2,16,8,3,9,4,2, 19,14,15,9,8,11,10,13,10,4,10,3. a)Calculalamodaylamediana. b)Calculalamediaapartirdelosdatosdirectos.

21

c) Calcula la media y la mediana a partir del agrupamiento de las puntuacionesentornoa10intervalosdeamplitud2,comenzandoenel intervalo23yfinalizandoenel2021. d)Q3. e)P25 yP90. f)D5. 2. Calculalamediaaritmtica,medianaymodaencadaunodeloscasos siguientes: a)2,8,3,5,4,7,9. b)2,3,2,4,5,8,6,2. c)100,200,200,100,300,100,200. d)984,894,498,849,948,894. 3. Las puntuaciones obtenidas en un test de inteligencia, supuestamente bienconstruido,por25alumnosde6 A deundeterminadoCentrode EducacinPrimariasonlassiguientes: Intervalos 9195 96100 101105 106110 F 2 4 15 4 Fa

Calcula media, mediana y moda. Cul es la medida de tendencia centralmsadecuada?

22

5. Solucionesalospr oblemaspr opuestos.1. a)Moda=10Mediana=9.50 b)9.64 c)Media=9.67Mediana=9.50 d)Q3 =12.83 e)P25 =6P90 =16.90 f)D5 =9.50

2. a)Media=5.43Mediana=5Modanoexiste. b)Media=4Mediana=3.5Moda=2. c)Media=171.43Mediana=200Moda=100y200. d)Media=844.5Mediana=894Moda=894.

3. Media=102.2,Mediana=102.67Moda=103.Lastressonsimilares.

6. Bibliogr afaPrez Santamara, F. J. Manzano Arrondo, V. y Fazeli Khalili, H. (1998): Problemas resueltos de anlisis de datos. Ediciones Pirmide,Madrid,pp.4566. Gil Flores, J. Rodrguez Gmez, G. y Garca Jimnez, E. (1995):

Estadstica bsica aplicada a las Ciencias de la Educacin.EditorialKronos,Sevilla,pp.5575. Gil Flores,J.DiegoMartn,J. L.Garca Jimnez,E. yRodrguez Gmez,G.:ProblemasdeestadsticaaplicadaalasCienciasdela

Educacin.EditorialKronos,Sevilla,pp.7172.

7. Cuestionar iodeevaluacin

23