u3. muestreo, medidas de tendencia central y de dispersion

24
Estadística Básica Unidad 3. Muestreo, Medidas de tendencia central y de Dispersión Universidad Abierta y a Distancia de México 1 Estadística Básica Unidad 3. Muestreo, medidas de tendencia central y de dispersión

Upload: pedroluna

Post on 07-Sep-2015

72 views

Category:

Documents


6 download

DESCRIPTION

tercera semana del 30 ago. al 20 sep. 2015

TRANSCRIPT

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    1

    Estadstica Bsica

    Unidad 3. Muestreo, medidas de tendencia central y de dispersin

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    2

    ndice

    Presentacin de la Unidad ................................................................................... 3

    Muestreo .............................................................................................................. 5

    Conceptos bsicos de muestreo aleatorio ....................................................... 5

    Metodologa del muestreo aleatorio simple ...................................................... 6

    Medidas de tendencia central ............................................................................ 11

    Datos no agrupados (media, mediana y moda) ............................................. 11

    Datos agrupados (media, mediana y moda) .................................................. 15

    Medidas de dispersin ....................................................................................... 19

    Datos no agrupados (varianza y desviacin estndar) .................................. 19

    Datos agrupados (varianza y desviacin estndar) ....................................... 20

    Cierre de la Unidad ............................................................................................ 23

    Fuentes de consulta .......................................................................................... 23

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    3

    Presentacin de la Unidad

    Para cualquier conjunto de datos estudiados es importante tener informacin resumida de sus caractersticas, la cual debe indicar cmo se comporta la poblacin de datos que se tiene. Para resumir la informacin se utilizan dos tipos de valores que en lugar de representar cada dato, representan conjuntos de datos. Estos dos tipos de indicadores estadsticos son: las medidas de tendencia central, que nos muestran hacia qu valores se agrupan o acumulan los datos, y las medidas de dispersin, que, de forma contraria a las anteriores, muestran cmo se dispersan o separan los datos.

    Propsitos Mediante el estudio de esta unidad se busca que logres los siguientes propsitos:

    Identificar problemas de datos desagrupados y agrupados.

    Obtener una muestra a partir de datos desagrupados y agrupados.

    Calcular medidas de tendencia central y dispersin.

    Aplicar la estadstica bsica para elaborar conclusiones.

    Competencia especfica Con la integracin de los elementos declarativos, procedimentales, actitudinales y contextuales de esta unidad, logrars utilizar muestras de una poblacin para explicar fenmenos mediante la interpretacin y representacin de las medidas de tendencia central y dispersin.

    Actividades

    Conforme vayas avanzando en el estudio de esta unidad, puedes ir realizando las

    actividades correspondientes a esta unidad. La descripcin de las mismas puedes

    encontrarla en el documento Unidad 3. Actividades; puedes encontrar este

    documento en la pestaa de la unidad.

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    4

    Para saber ms

    Se ha seleccionado una serie de recursos en lnea con el fin de ofrecerte un panorama general de la unidad y alternativas en caso de que se te dificulte la comprensin de algn concepto o proceso. Estos recursos tienen una extensin breve pero complementan lo expuesto en este material. Algunos de ellos te ayudarn a visualizar cmo puedes aplicar estos contenidos en las actividades de la unidad. Puedes revisarlos en este momento o volver cuando hayas concluido la revisin de esta unidad. Documentos escritos (Disponibles en la seccin Material de apoyo):

    Alegre J. y Cladera M. (s.f.). Introduccin a la estadstica descriptiva para economistas (p. 11-22, 39-83). Recuperado de: http://www.uib.es/depart/deaweb/personal/profesores/personalpages/hdeemcm0/Estadistica/Material101.PDF

    Estuardo, A. (2012). Estadstica y probabilidades (p. 39-51). Recuperado de: http://dme.ufro.cl/clinicamatematica/pdf/Estadistica%20y%20Probabilidad.pdf

    Comunidad de Madrid (s.f.). Estadstica bsica (p. 4-13). Recuperado de: http://www.madrid.org/cs/StaticFiles/Emprendedores/Analisis_Riesgos/pages/pdf/estadisticas_es.pdf

    Matus J. (s.f.). Fascculo 2. Medidas de tendencia central. En Estadstica descriptiva e inferencial I. Recuperado de: http://washingtonst.conevyt.org.mx/bachilleres/material_bachilleres/cb6/5sempdf/edin1/edi1_f02.pdf

    Universidad Autnoma de Quertaro. (s.f.). Estadstica descriptiva (p. 16-32). Recuperado de: http://fcps.uaq.mx/descargas/prope2014/estadistica/2/frecuencias.pdf

    Pgina web

    Anlisis de Datos con Herramientas Estadsticas. Direccin: https://sites.google.com/site/estadisticadm/home

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    5

    Muestreo

    Muestra.

    Fuente: cooldesign, 2012. freedigitalphotos.net

    Los estudios estadsticos normalmente se hacen con una parte de la poblacin, ya que

    realizarlos sobre la totalidad resultara demasiado complicado. Para que la informacin

    obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas

    condiciones especficas, relacionadas con el mtodo para determinar el tamao y

    caractersticas de la muestra y los individuos que la componen.

    Conceptos bsicos de muestreo aleatorio

    Para que la informacin obtenida tenga validez y confiabilidad es necesario que cumpla

    con algunas condiciones especficas. Los mtodos de muestreo se pueden clasificar en:

    Muestreo probabilstico

    En l, todos los elementos de una poblacin y, por lo tanto, todas las muestras

    posibles, tienen la misma posibilidad de ser elegidas. Las muestras obtenidas a

    travs de este tipo de muestreo son confiables porque aseguran la condicin de

    representatividad que es muy importante para hacer generalizaciones.

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    6

    Muestreo no probabilstico

    En este tipo de muestreo los elementos de la poblacin no comparten las mismas

    posibilidades de ser seleccionados. Las muestras obtenidas no cumplen con la

    condicin de representatividad, por lo que no es confiable hacer generalizaciones a

    toda la poblacin.

    Metodologa del muestreo aleatorio simple

    Dentro del muestreo probabilstico existen diversos mtodos para obtener el tamao de una muestra, a continuacin estudiars el muestreo aleatorio simple, el cual consiste en los siguientes pasos.

    1. Definir la poblacin de estudio y el parmetro a estudiar

    Como recordars, la poblacin es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas comunes observables en un lugar y en un momento determinado. Por lo tanto, el paso 1 es determinar la que se va a estudiar.

    Por ejemplo: un investigador realiza un estudio sobre las relaciones de gnero en el noviazgo, su objeto de estudio son las manifestaciones de violencia fsica y psicolgica entre los estudiantes del ltimo ao de la carrera de ingeniera. Su poblacin es el total de estudiantes del ltimo ao de ingeniera que tengan novio o novia; el total de individuos con esta caracterstica es de 386 en este ejemplo. Por lo que, la poblacin es de 386 individuos y las variables son: violencia fsica y violencia psicolgica.

    2. Enumerar a todas las unidades de anlisis que integran la poblacin,

    asignndoles un nmero de identidad o identificacin

    Una vez que se ha definido la poblacin y las variables a estudiar, es necesario asignar un nmero de identificacin a cada individuo de la poblacin. Siguiendo con el ejemplo de la relaciones de gnero en el noviazgo en los estudiantes de ingeniera, lo que sigue es enumerar a los 386 estudiantes con un nmero del 1 al 386.

    3. Definir la poblacin de estudio y el parmetro a estudiar Definir el tamao de la poblacin significa determinar el nmero de individuos que la constituyen; la variable N representa el tamao de la poblacin. Esto es, N=X. Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:

    a. El porcentaje de confianza con el cual se quiere generalizar los datos desde la

    muestra hacia la poblacin total.

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    7

    b. El porcentaje de error que se pretende aceptar al momento de hacer la

    generalizacin.

    c. El nivel de variabilidad que se calcula para comprobar la hiptesis.

    A continuacin se describen los conceptos enlistados:

    Porcentaje de confianza

    Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin (censo). Se denota como Z. Para evitar un costo muy alto se busca un porcentaje de confianza menor, comnmente es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningn clculo) para poder acertar al valor verdadero de la poblacin. Nota: Al estandarizar este valor, el 95% de confianza corresponde a una Z=1.96.

    Porcentaje de error

    Este error es una distancia alrededor del valor que se desea estimar y da un margen de aproximacin. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin (censo), por lo que conviene realizar un muestreo que implica menos tiempo y menor costo, aunque se corre un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta que no son complementarios la confianza y el error, es decir, que en un muestreo podemos tener 95% de confianza con 6% de error.

    Variabilidad

    Es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere comprobar. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se indica con (tambin llamada probabilidad de xito), y el porcentaje con el que se rechaz la hiptesis es la variabilidad negativa, identificada con , tambin llamada probabilidad de fracaso, y se obtiene como = 1 .

    Variabilidad positiva es la probabilidad de que suceda el evento. Variabilidad negativa es la probabilidad de que no suceda el evento. Para este curso se considerar siempre = 0.5, y por lo tanto = 1 0.5 = 0.5

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    8

    4. Determinar el tamao ptimo de muestra para el estudio Una vez que la poblacin, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad han sido determinados, se debe calcular el tamao de la muestra. En este paso se utilizan las siguientes frmulas, en donde la primera implica que no se conoce el tamao de la poblacin y la segunda se utiliza cuando s se conoce el tamao de la poblacin. Desconocimiento del tamao de la poblacin Frmula

    es el tamao de la muestra

    es el nivel de confianza

    es la variabilidad positiva

    es la variabilidad negativa

    es la precisin o error

    Ejemplo En un lote grande de medicinas se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Si la variabilidad es de = = 0.5

    Solucin: Para que el nivel de confianza sea igual al 95% se tiene que () = 0.95 si =1.96. Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en el caso necesario, hay que convertir esos valores a proporciones. Sustitucin: Al sustituir los valores en la frmula se obtienen los siguientes resultados.

    Es decir, se ocupar una muestra de aproximadamente 384 unidades.

    Conocimiento del tamao de la poblacin Frmula

    es el tamao de la muestra

    es el nivel de confianza

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    9

    es la variabilidad positiva

    es la variabilidad negativa

    es el tamao de la poblacin

    es la precisin o error

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    10

    Ejemplo En un lote de 25,000 cajas de medicina se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Si la variabilidad es = = 0.5

    Solucin: Para que el nivel de confianza sea igual al 95% se tiene que () = 0.95 si =1.96 Sustitucin: Al sustituir los valores en la frmula se obtienen los siguientes resultados.

    En otras palabras, se ocupar una muestra de aproximadamente 378 cajas.

    5. Seleccionar la muestra usando nmeros aleatorios El ltimo paso para obtener la muestra es saber qu individuos especficos de la poblacin se tomarn. Para hacer esto se debe:

    1. Numerar a los individuos de la poblacin del 1 al (donde es el tamao de la poblacin).

    2. Generar nmeros aleatorios mediante herramientas informticas (por ejemplo,

    hojas de clculo con la funcin =aleatorio ()), funciones en calculadora o bien

    utilizando tablas de nmeros aleatorios. Tambin puedes generar nmeros

    aleatorios de formas mecnicas, por ejemplo, sacando nmeros de una urna o

    lanzando una moneda al aire.

    3. Tomar los individuos correspondientes a los nmeros elegidos.

    Revisa el siguiente recurso para conocer tres formas de obtener nmeros aleatorios.

    Ingresa a la seccin Material de apoyo de la asignatura, para descargar el documento Obtencin de nmeros aleatorios.

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    11

    Medidas de tendencia central

    Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que ayudan a saber dnde estn acumulados los datos pero sin indicar cmo se distribuyen. Se llaman as porque tienden a ubicarse en la parte central del conjunto de datos. Las medidas de tendencia central ms comunes son: la media aritmtica, comnmente conocida como media o promedio, la mediana y la moda.

    Datos no agrupados (media, mediana y moda)

    Con la finalidad de que las medidas de tendencia central tengan mayor validez estadstica se utilizarn frmulas diferentes para datos agrupados y datos no agrupados, en donde tambin se deben distinguir si se trabaja con una muestra o con una poblacin.

    Media

    Concepto y frmula

    La media aritmtica o, simplemente, media, se denota por o por la letra segn se calcule en una muestra o en la poblacin, respectivamente. La media es el resultado de dividir la suma de todos los valores (xi) entre el nmero total de datos, para el caso de toda la poblacin y para el caso de una muestra.

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    12

    La frmula para calcular la media de una distribucin de datos vara de acuerdo a la manera como se tienen organizados.

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    13

    Frmula para calcular la media en datos no agrupados: Los datos no agrupados son aqullos que se organizan en una tabla de datos, es decir, cada valor se representa de manera individual. Las frmulas para calcular la media son:

    En una poblacin En una muestra

    En estas frmulas la diferencia radica en que el total de la poblacin se representa con la letra N y el total de la muestra con la letra n, en donde la media poblacional se denota con la letra griega Mu y la media muestral se presenta como equis barra . Ejemplo En una serie de das elegidos al azar, se registr el tiempo, en horas, de utilizacin de dos impresoras en una empresa y se obtuvieron los siguientes resultados: Impresora I: 3.2, 2.1, 2.7, 3.4, 1.9, 4.2, 3.8, 2.6, 5.2, 4 Impresora II: 3.4, 3.3, 2.5, 4.6, 2.8, 3.6, 4.3 Se requiere lo siguiente: hallar el tiempo medio de utilizacin de cada impresora.

    Impresora I Impresora II

    1 1,9 2,5

    2 2,1 2,8

    3 2,6 3,3

    4 2,7 3,4

    5 3,2 3,6

    6 3,4 4,3

    7 3,8 4,6

    8 4

    9 4,2

    10 5,2

    Datos ordenados

    Respuestas Para obtener la media de la impresora 1 se suma cada uno de los valores: 1,9+2,1+2,6+2,7,+3,2+3,4+3,8+4,0+4,2+5,2 a continuacin el resultado de la sumatoria que es 33.1, se divide entre el nmero de observaciones de la muestra que es 10 y se obtiene el resultado que es 3,31. Anlogamente se realiza el mismo procedimiento para la impresora 2 y se obtiene el resultado de 3,5 Media impresora I 3,31 Media impresora II 3,5

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    14

    Mediana

    Concepto La mediana (Me) es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o decreciente, entonces, el nmero de datos que queda a la izquierda de la mediana es igual al nmero de datos que queda a la derecha. Si es impar hay un dato que queda en medio de todos, ste ser igual a la mediana. Si es par hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de esos dos datos, es decir, su suma dividida entre dos. Ejemplos Para cuando la cantidad de valores de la distribucin es impar Supn que se tienen los siguientes valores: 2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9

    1. Se ordenan los valores de menor a mayor. 0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9

    2. Se busca el valor del centro. El dato que divide a la mitad es: 4, por lo tanto la mediana Me: 4

    Para cuando la cantidad de valores es par Supn que se tienen los siguientes valores: 5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1, 3, 2

    1. Se ordenan los valores de menor a mayor. 1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9

    2. SE buscan los valores del centro. 1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9

    3. Se promedian los valores del centro. , por lo tanto Me:

    4.5

    Moda

    Para el caso de la moda (Mo), en los datos no agrupados, la moda corresponde al valor que ms se repite, si se tienen los siguientes datos: 1,1,2,2,3,3,4,4,4,4,5,5,6,6,7,8,9,9,9 la Moda es: 4.

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    15

    Datos agrupados (media, mediana y moda)

    Media

    Frmulas Frmula para calcular la media en datos agrupados por frecuencias simples Los datos agrupados en frecuencias son aquellos que se organizan en una tabla de

    frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable () y, en otra columna, la frecuencia () o el nmero de veces que se repite cada valor en una serie de datos. Para calcular la media con datos agrupados se procede a realizar la sumatoria de el valor de la variable () por el valor de su frecuencia () y el resultado se divide, para el caso de la poblacin, entre N, y para el caso de la muestra, entre n. Las frmulas para calcular la media con los datos organizados de esta manera son:

    En una poblacin En una muestra

    Frmula para calcular la media en datos agrupados por intervalos Los datos agrupados en intervalos son aquellos que se organizan dentro de un rango establecido entre un lmite inferior y un lmite superior. Recuerda que las tablas de intervalos muestran el nmero de datos que abarca cada intervalo (frecuencia por intervalo). Las frmulas para calcular la media con los datos organizados de esta manera son:

    En una poblacin En una muestra

    En donde debes realizar la sumatoria de cada marca de clase (Mci) por su frecuencia (fi) y el resultado se divide entre el total de elementos poblacionales (N) -si se trata de poblacin- o bien, entre los elementos de la muestra (n).

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    16

    Ejemplo En el siguiente cuadro estadstico se presentan, mediante una distribucin de frecuencias, los kilmetros recorridos por alumnos en la universidad. Determinar la media.

    # CLASE

    CLASES

    fi fa Marca de clase MC

    MC* fi

    Li Ls

    1 0.1 18 15 15 9.05 135.75

    2 18.1 36 14 29 27.05 378.7

    3 36.1 54 28 57 45.05 1261.4

    4 54.1 72 26 83 63.05 1639.3

    5 72.1 90 17 100 81.05 1377.85

    100

    4793.00

    MEDIA 47.93

    Mediana

    Frmula Cuando se quiere calcular la mediana en datos agrupados por intervalos se tiene que buscar el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las

    frecuencias absolutas, es decir, es necesario localizar el intervalo donde se encuentre

    2,

    para lo cual se utiliza la siguiente frmula:

    = Lmite inferior del rengln en donde debe estar la mediana

    1 = Frecuencia acumulada anterior al rengln de la mediana = Frecuencia del rengln de la mediana = Tamao del intervalo

    Ejemplo Pasos para buscar la mediana Recuerda que la mediana representa el valor que divide a los datos en la mitad exacta, es decir, a la derecha del valor de la mediana se encuentran el 50% de los datos y a la izquierda de dicho valor el otro 50%, por lo que para una distribucin con datos agrupados se deben seguir los siguientes pasos:

    Ubicar la clase de la mediana, para ello se debe buscar en qu clase se

    encuentra

    2=

    40

    2= 20

    Ubicar en la frecuencia acumulada el dato 20

    1

    2

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    17

    Ubicar el lmite inferior de la clase de la mediana que es igual a 6.63

    Ubicar la frecuencia de la clase de la mediana que es igual a 12

    Ubicar la frecuencia acumulada anterior a la clase de la mediana es igual a 14.

    Ubicar la amplitud de la clase que es 21,

    El siguiente esquema representa algunos de los pasos descritos:

    Li Ls Fi Fa

    5.97 6.18 2 2

    6.19 6.4 5 7

    6.41 6.62 7 14

    6.63 6.84 12 26

    6.85 7.06 8 34

    7.07 7.28 6 40

    Sustituyendo en la frmula de la mediana se tiene que el valor de la mediana es 6.73

    Moda

    Frmula La moda es el valor del dato que ms veces se repite, esto es, el valor cuya frecuencia absoluta es mayor, y se denota como Mo. Algunas veces el valor que ms se repite puede no ser nico, es decir, puede haber dos o ms datos que aparezcan con la misma frecuencia absoluta, siendo sta la mayor. En esas ocasiones se habla de poblaciones o muestras bimodales cuando existen dos modas o multimodales si existen ms de dos. Por ejemplo, si se toma una muestra de hombres y mujeres y se miden sus estaturas, se tienen dos modas. Cuando la distribucin de datos es por intervalos de clase, primero se localiza el intervalo que tiene mayor frecuencia absoluta y se utiliza la siguiente frmula para calcular la moda:

    = Lmite inferior del rengln en donde debe estar la moda

    3

    4

    5

    6

    2 3

    4

    5

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    18

    = Frecuencia del rengln de la moda

    +1 = Frecuencia ulterior al rengln de la moda 1 = Frecuencia anterior al rengln de la moda

    = Tamao del intervalo

    Ejemplo Como se mencion con anterioridad, la moda corresponde al valor o valores, si es multimodal, que ms se repiten en una distribucin; para el caso de datos agrupados se deben seguir los siguientes pasos para obtener el valor de la moda. Pasos para buscar la moda

    Ubicar la clase de la moda y sta es la clase donde se tienen ms datos, es decir, hay 12 datos entre 6.63 y 6.84, como puedes observar en la cuarta fila

    Ubicar el lmite inferior de la clase de la moda, el cual es 6.63

    Calcular ( 1) = 12 7 = 5

    Calcular ( +1) = 12 8 = 4

    Ubicar la amplitud de la clase 21

    El siguiente esquema representa algunos de los pasos descritos:

    Li Ls Fi Fa

    5.97 6.18 2 2

    6.19 6.4 5 7

    6.41 6.62 7 14

    6.63 6.84 12 26

    6.85 7.06 8 34

    7.07 7.28 6 40

    Sustituyendo en la frmula de la moda se tiene 6.74

    1

    2

    3

    4

    5

    1 2

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    19

    Medidas de dispersin

    A diferencia de las medidas de tendencia central que miden acumulaciones mediante un solo punto, las medidas de dispersin miden el grado de separacin o alejamiento que tiene una variable estadstica en torno a una medida de posicin o tendencia central. Dicho grado de separacin indica lo representativa que es la medida de posicin con respecto al conjunto total de datos. A mayor dispersin menor representatividad de la medida de posicin y viceversa. Las medidas de dispersin ms comunes son: el recorrido, la varianza y la desviacin estndar.

    Datos no agrupados (varianza y desviacin estndar)

    Al igual que las medidas de tendencia central, las medidas de dispersin se pueden obtener a partir de datos agrupados o no agrupados y de manera anloga para datos poblacionales o bien muestrales como a continuacin se mostrar.

    Varianza

    La varianza mide la mayor o menor dispersin de los valores de la variable respecto a la media aritmtica. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las diferencias del valor de los datos menos la media aritmtica de stos.

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    20

    Las frmulas de la varianza para datos no agrupados son:

    En una poblacin En una muestra

    Para obtener la varianza se realiza la sumatoria de cada valor menos la media y se eleva al cuadrado y el resultado se divide ya sea entre el valor poblacional (N), o bien el muestral menos 1, que corresponde a: n-1.

    Desviacin tpica o estndar

    La desviacin tpica muestra qu tan alejado est un dato del valor de la media aritmtica,

    es decir, la diferencia que hay entre un dato y la media aritmtica. Se denota como S o , segn se calcule en una muestra o en toda la poblacin, respectivamente. Se define como la raz cuadrada positiva de la varianza. Las frmulas de la desviacin tpica o estndar para datos no agrupados son:

    En una poblacin En una muestra

    Es decir que al valor de la varianza, ya sea poblacional o muestral, se le aplica la raz cuadrada y se obtiene la desviacin tpica o estndar.

    Datos agrupados (varianza y desviacin estndar)

    Varianza para datos agrupados por intervalos

    Las frmulas para calcular la varianza en datos agrupados por intervalos son las siguientes:

    En una poblacin En una muestra

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    21

    En este caso se realiza la sumatoria de cada marca de clase menos la media (ya sea poblacional o muestral, segn sea el caso) y se eleva al cuadrado, al final se divide entre la poblacin o bien la muestra, segn se trate.

    Desviacin tpica o estndar en datos agrupados por intervalos

    Las frmulas para calcular la desviacin tpica o estndar en datos agrupados por intervalos son las siguientes:

    En una poblacin En una muestra

    De manera anloga al resultado de la varianza se le aplica la raz cuadrada y se obtiene la desviacin estndar, ya sea para una poblacin o bien una muestra. Ejemplo Los siguientes datos se refieren al dimetro en pulgadas de un engrane.

    6 6.25 6.5 6.65 6.75 6.75 7 7.1

    6 6.25 6.5 6.7 6.75 7 7 7.15

    6.25 6.5 6.5 6.7 6.75 7 7 7.15

    6.25 6.5 6.5 6.75 6.75 7 7 7.25

    6.25 6.5 6.65 6.75 6.75 7 7.1 7.25

    Obtenga la media, la varianza y la desviacin estndar.

    LI LS FI MC FA FR FRA F. Porcentual (360*F

    I)/N FI*MC

    (MC-MEDIA)

    ^2*FI

    5.97 6.18 2 6.08 2 0.05 0.05 5 18 12.15 0.83

    6.19 6.4 5 6.30 7 0.13 0.18 12.5 45 31.475 0.90

    6.41 6.62 7 6.52 14 0.18 0.35 17.5 63 45.605 0.29

    6.63 6.84 12 6.74 26 0.30 0.65 30 108 80.82 0.00

    6.85 7.06 8 6.96 34 0.20 0.85 20 72 55.64 0.45

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    22

    7.07 7.28 6 7.18 40 0.15 1.00 15 54 43.05 1.25

    N 40 100 360 268.74 3.72

    Media = 6.72

    Varianza = 0.093

    Desviacin estndar = 0.305

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    23

    Cierre de la Unidad

    Al terminar esta unidad has podido tener una

    visin general de la importancia que tienen las

    medidas de tendencia central y de dispersin

    para comprender el comportamiento de los datos

    y poder ubicar qu tan cercano o alejado se

    encuentra un valor cualquiera de las medidas de

    tendencia central, as como la variabilidad y

    dispersin de los datos en conjunto de una

    distribucin, de manera que puedas interpretar

    mejor tu problema prototpico.

    Fuentes de consulta

    Bibliografa bsica

    Ibarra, O. M. (2006). Estadstica para la Administracin Turstica. Mxico: Trillas.

    Levin, R. y Rubin, D. (2010). Estadstica para administracin y economa. Mxico: Pearson.

    Montgomery, D. C. y Runger, G. C. (1996). Probabilidad y Estadstica aplicadas a la ingeniera. (Cuarta edicin). Mxico: McGraw-Hill.

    Shao, S. P. (2007). Estadstica para Economistas y Administradores de Empresas. Mxico: Herrero Hermanos.

    Walpole, R. E., Myers, R. H. et al. (2007). Probabilidad y Estadstica para Ingeniera y ciencias. (Octava edicin). Mxico: Pearson Educacin.

    Fuentes electrnicas

    Asesor Juan Manuel. Tutorial Excel-Funcin Aleatorio- Random. Recuperado de: http://www.youtube.com/watch?v=kr56Sc4YygY

    Rasilga, R. Medidas de dispersin.swf. Recuperado de: https://www.youtube.com/watch?v=GGO_4wHqric

    Indicador Fuente: Master isolated images, 2011.

    freedigitalphotos.net

  • Estadstica Bsica

    Unidad 3. Muestreo, Medidas de tendencia central y de

    Dispersin

    Universidad Abierta y a Distancia de Mxico

    24

    Ruiz, M. Mediana para datos agrupados. Recuperado de: https://www.youtube.com/watch?v=02Q7OBiSQgo

    Ruiz, M. Moda para Datos Agrupados. Recuperado de: https://www.youtube.com/watch?v=Y1Ja2C8VtAE

    Vitutor (2012). Estadstica y probabilidad. Recuperado de: http://www.vitutor.com/estadistica.html