apuntes tc1 2013-2014 con isbn

256
Apuntes de TÉCNICAS CUANTITATIVAS 1 José Alberto Hermoso Gutiérrez Dpto. Métodos Cuantitativos para la Economía y la Empresa Universidad de Granada

Upload: antonio-lopez-perez

Post on 24-Nov-2015

140 views

Category:

Documents


12 download

TRANSCRIPT

  • Apuntes

    de

    TCNICAS CUANTITATIVAS 1

    Jos Alberto Hermoso Gutirrez

    Dpto. Mtodos Cuantitativos para la Economa y la Empresa

    Universidad de Granada

  • Apuntes de TCNICAS CUANTITATIVAS 1

    2013,Jos Alberto Hermoso Gutirrez Edita e imprime: Copicentro S. L. ISBN:978-84-15814-40-5 Depsito Legal: GR-1690/2013 Impreso en Espaa. Printed in Spain Quedan rigurosamente prohibidas, bajo las sanciones establecidas en las leyes, la reproduccin o almacenamiento total o parcial de la presente publicacin, incluyendo el diseo de la portada, as como la transmisin de la misma por cualquiera de sus medios tanto si es elctrico, como qumico, mecnico, ptico, de grabacin o bien de fotocopia, sin la autorizacin escrita de los titulares del copyright

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 3

    $&HOLD

  • 4 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 5

    1.- Variables estadsticas unidimensionales. 1.1 Variables estadsticas. Tablas estadsticas. Representaciones grficas . . . . . . . . . 7

    1.2 Momentos centrados y no centrados . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    1.3 Medidas de posicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    1.4 Medidas de dispersin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    1.5 Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    1.6 Medidas de concentracin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    1.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    2.- Variables estadsticas bidimensionales. 2.1 Representaciones numricas en dos columnas y en tablas de contingencia . . . . . . 66

    2.2 Distribuciones marginales y condicionadas. Independencia de variables estadsticas . 68

    2.3 Covarianza y coeficiente de correlacin lineal . . . . . . . . . . . . . . . . . . . . . 71

    2.4 Recta de regresin de mnimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . 77

    2.5 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    3.- Nmeros ndices. 3.1 Tasas de variacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

    3.2 ndice elemental. ndice sinttico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

    3.3 ndices de precios, de cantidades y de valor . . . . . . . . . . . . . . . . . . . . . . 114

    3.4 Enlace de series de nmeros ndices con distinta base . . . . . . . . . . . . . . . . . 117

    3.5 Deflacin de series econmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

    3.6 Dependencia de un ndice general de un grupo de productos . . . . . . . . . . . . . . 121

    3.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

    4.- Anlisis descriptivo de series cronolgicas. 4.1 Definicin de una serie cronolgica. Representacin grfica . . . . . . . . . . . . . . 135

    4.2 Componentes de una serie cronolgica. Modelos . . . . . . . . . . . . . . . . . . . . 136

    4.3 Tendencia secular: ajuste de una recta de mnimos cuadrados y medias mviles . . . 138

    4.4 Variacin estacional. Desestacionalizacin . . . . . . . . . . . . . . . . . . . . . . . 143

    4.5 Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

    4.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

  • 6 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    5.- Probabilidad. 5.1 Definicin de probabilidad. Asignacin de probabilidades . . . . . . . . . . . . . . . 172

    5.2 Definicin de probabilidad condicionada. Sucesos dependientes e independientes . . 179

    5.3 Frmula de la probabilidad total. Frmula de Bayes . . . . . . . . . . . . . . . . . . 182

    5.4 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

    6.- Variables aleatorias y distribuciones de probabilidad. 6.1 Concepto de variable aleatoria. Distribucin de probabilidad . . . . . . . . . . . . . 194

    6.2 Funcin de distribucin. Variables aleatorias discretas y variables aleatorias continuas 196

    6.3 Valor esperado de una variable aleatoria. Momentos . . . . . . . . . . . . . . . . . . 200

    6.4 Otras medidas de posicin, dispersin y forma . . . . . . . . . . . . . . . . . . . . . 202

    6.5 Variables aleatorias bidimensionales. Independencia de variables aleatorias . . . . . 206

    6.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

    7.- Distribuciones discretas de probabilidad. 7.1 Distribucin Uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

    7.2 Distribucin Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

    7.3 Distribucin de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241

    7.4 Distribucin Hipergeomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243

    7.5 Distribucin Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

    7.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 7

    1. VARIABLES ESTADSTICAS

    UNIDIMENSIONALES.

    1.1 Variables estadsticas. Tablas estadsticas. Representaciones

    grficas.

    El trmino Estadstica procede del latn status debido a que sus primeras aplicaciones tuvieron

    que ver con la recogida y cuantificacin de informacin referente al estado: censos de poblacin,

    ejrcito, cosechas, impuestos, etc. El trmino estadstica o estadsticas en muchos casos hace

    referencia a una cantidad de informacin, por ejemplo estadsticas de precios, estadsticas de

    produccin, etc.

    La descripcin de esta informacin es el objetivo de la Estadstica Descriptiva. Para llevar a cabo

    esta tarea fundamentalmente nos apoyaremos en las representaciones grficas de dichos datos y en

    su sntesis mediante medidas que resuman las caractersticas ms relevantes.

    Podemos distinguir, fundamentalmente, dos tipos de fenmenos:

    Fenmenos causales o determinsticos: Son aquellos que presentan los mismos resultados si

    se realizan en idnticas condiciones (por ejemplo las reacciones qumicas).

    Fenmenos aleatorios o estadsticos: Son los que no se puede predecir el resultado aunque

    sean conocidas las condiciones de realizacin (por ejemplo el lanzamiento de una moneda).

    Fenmenos de naturaleza social, econmica,... en los que la incertidumbre de su

    comportamiento se debe tambin a la imposibilidad de repetirlos en las mismas condiciones,

    son tratados como fenmenos estadsticos.

    Se denomina poblacin al conjunto de elementos sobre los que se quiere realizar un estudio. En la

    prctica se observa un subconjunto de la poblacin que debe ser representativo y al que llamamos

    muestra.

    Entre otras muchas razones para restringirnos al estudio de muestras destacamos:

    Rapidez. Por ejemplo, las elecciones.

    Evitar la destruccin de la poblacin. Como en el control de calidad.

    Economa y precisin. El estudio de una poblacin completa puede llevar a cometer muchos

    errores, mientras que en una muestra se puede dedicar ms atencin a la calidad de los datos.

  • 8 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Utilizaremos el trmino variable (variable estadstica) para referirnos a la caracterstica en estudio.

    Se dice que una variable es cuantitativa cuando sus diversas modalidades pueden ser medidas

    numricamente (precios, edad,...). Denominaremos atributos a las variables no numricas (sexo,

    profesin,...).

    Segn los valores que toman las variables estadsticas distinguimos:

    Variables discretas: toman valores aislados (nmero de empleados, habitaciones de una

    vivienda,...)

    Variables continuas: pueden tomar todos los valores de un intervalo (estatura, peso,...)

    En la prctica toda variable es discreta debido a la precisin limitada de los aparatos de medida, por

    ello distinguiremos entre variables con pocas modalidades (discretas) y variables que toman un

    gran nmero de valores distintos (donde se incluyen las variables continuas y otras muchas

    magnitudes sociales y econmicas como salarios, poblacin de ciudades,...)

    Tablas estadsticas.Una vez recogidos los datos se procede a su descripcin con la finalidad de obtener el mayor

    conocimiento acerca del fenmeno.

    El primer paso de esta descripcin consiste en la ordenacin, clasificacin, recuento y

    representacin de los datos. Posteriormente se procede a resumirlos en cantidades que miden

    caractersticas del fenmeno.

    EJEMPLO 1.1 Un estudio sobre el tipo de vivienda en construccin en una gran urbe ha aportado los siguientes

    datos

    TIPO Colectiva

    Unifamiliar 56 14

    total 70

    Nmero de dormitorios

    1 2 3 4 5

    7 14 21 21 7

    total 70

    EJEMPLO 1.2 Para conocer el salario/hora de los trabajadores de un sector se ha observado una muestra de 100.

    Los datos se han recogido en la siguiente tabla

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 9

    Salario/hora0-10

    10-20 20-40 40-50

    25 40 20 15

    total 100

    A estas representaciones numricas se denominan tablas estadsticas.

    Estas tablas recogen la siguiente informacin: las modalidades, ix , (valores que ha presentado el

    fenmeno) de forma individual o agrupadas en intervalos y las frecuencias absolutas de cada

    modalidad o intervalo, in , (nmero de veces que se ha observado esa modalidad o valores del

    intervalo). El nmero total de observaciones, n , se obtiene sumando todas las frecuencias

    absolutas (lo que hemos llamado total en los ejemplos 1.1 y 1.2)

    1

    k

    ii

    n n=

    =A las tablas estadsticas se le puede aadir ms informacin, como:

    La frecuencia relativa de la modalidad o intervalo i, if , es el cociente de la frecuencia absoluta

    sobre el total de observaciones

    ii

    nfn

    =

    A menudo las frecuencias relativas se multiplican por 100 para expresar en tanto por ciento la

    medida en que se presenta cada modalidad o intervalo de valores.

    La frecuencia absoluta acumulada de la modalidad o intervalo i, iN , es el nmero de veces que se

    han observado valores menores o iguales que dicha modalidad o intervalo.

    1

    i

    i jj

    N n=

    =Anlogamente se define la frecuencia relativa acumulada, iF , a partir de las frecuencias relativas.

    Se denomina distribucin de frecuencias al conjunto de valores que presenta una variable

    estadstica junto con sus frecuencias. sta se representa segn el siguiente modelo donde no todas

    las columnas son necesarias y su posicin puede cambiarse

  • 10 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    1i iL L ix in if iN iF

    0 1L L

    1 2L L... 1k kL L

    1x

    2x...

    kx

    1n

    2n...

    kn

    1f

    2f...

    kf

    1N

    2N...

    kN

    1F

    2F...

    kF n 1

    EJEMPLO 1.3 Usando los datos de los ejemplos 1.1 y 1.2.

    ix in ifColectiva

    Unifamiliar56 14

    0,800,20

    total 70 1

    ix in iN if iF1 2 3 4 5

    7 14 21 21 7

    7 21 42 63 70

    0,10 0,20 0,30 0,30 0,10

    0,10 0,30 0,60 0,90

    1 total 70 1

    1i iL L ix in if iN iF0-10

    10-20 20-40 40-50

    5 15 30 45

    25 40 20 15

    0,25 0,40 0,20 0,15

    25 65 85

    100

    0,25 0,65 0,85

    1 total 100 1

    Nota: en variables de tipo continuo cada intervalo de valores o clase est representado por su punto

    medio o marca de clase, ix .

    Cada da ms, debido al uso de los ordenadores (hojas de clculo, programas de estadstica,...), la

    representacin numrica de los datos se reduce a escribir en una columna los valores observados sin

    ordenarlos, clasificarlos o contarlos (sin frecuencias), tal y como aparece en la siguiente imagen.

    ix

    1x2x

    ... nx

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 11

    Representaciones grficas.Aunque es cierto que una tabla estadstica contiene toda la informacin observada de un fenmeno,

    es conveniente en ocasiones traducir toda esa informacin en un grfico que nos permita realizar

    una rpida sntesis visual.

    Entre las representaciones grficas ms utilizadas estn el diagrama de barras, histograma, y

    diagrama de sectores.

    DIAGRAMA DE BARRAS

    La longitud de la barra nos informa de la frecuencia con que se ha observado cada valor de la

    variable.

    Nmero de dormitorios in

    1 2 3 4 5

    7 14 21 21 7

    HISTOGRAMA

    En esta representacin y en la siguiente es el rea de las figuras utilizadas (rectngulos o sectores) la

    que nos indica con qu frecuencia se observa cada clase o modalidad

    1i iL L in ia ih0-10

    10-20 20-40 40-50

    25 40 20 15

    10 10 20 10

    2,5 4 1

    1,5

    La pirmide de poblacin consiste en dos histogramas colindantes, uno para la edad de los

    hombres y otro para la edad de las mujeres. La tpica forma triangular de este grfico le ha dado el

    nombre de pirmide de poblacin.

    0

    5

    10

    15

    20

    25

    1 2 3 4 5

  • 12 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    DIAGRAMA DE SECTORES

    ix in if sector Colectiva

    Unifamiliar 56 14

    0,80 0,20

    0,80x360=288 0,20x360=72

    total 70 1 360

    1.2 Momentos centrados y no centrados.

    Los momentos son unos valores calculados a partir de la distribucin de frecuencias que resumen la

    informacin relativa a alguna propiedad de la variable.

    Como veremos ms adelante, la media aritmtica y la varianza son casos particulares de momentos

    que resumen el valor global y la dispersin de los valores que presenta la variable estadstica. Otros

    momentos sern utilizados para medir ciertas caractersticas relativas a la forma de la distribucin

    de frecuencias.

    En la prctica utilizaremos momentos de rdenes uno a cuatro.

    Colectiva Unifamiliar

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 13

    Momentos no centrados. Se definen los momentos no centrados (o respecto al origen) como:

    1 1

    1 k kr rr i i i i

    i ia x n x f

    n= =

    = = (para tablas con frecuencias)

    1

    1 n rr i

    ia x

    n=

    = (para tablas sin frecuencias) Propiedades:

    El momento no centrado 1a se conoce tambin como media (aritmtica) y se suele notar como

    x .

    0 1a = .

    Momentos centrados.Se definen los momentos centrados (o respecto a la media) como:

    ( ) ( )1 1

    1 k kr rr i i i i

    i im x x n x x f

    n= =

    = = (para tablas con frecuencias) ( )

    1

    1 n rr i

    im x x

    n=

    = (para tablas sin frecuencias) Propiedades:

    El momento centrado 2m se conoce tambin como varianza y se suele notar como 2S .

    0 11, 0m m= = .

    ( )2 2 22 21 1 1 1 1 1 1

    2

    2 2k k k k k k k

    i i i i i i i i i i i ii i i i i i i

    x x n x n x n xx n x n x n x x nm

    n n n n n n n= = = = = = =

    = = + = + =

    2 2 22 1 2 1 1 1 2 12 2a x xa a a a a a a= + = + =

    Anlogamente, desarrollando el correspondiente binomio elevado a r, cualquier momento

    centrado puede escribirse en funcin de los momentos no centrados. Sealamos por su

    importancia los casos r=2 y r=3. 3 2 4

    3 3 2 1 1 4 4 3 1 2 1 13 2 4 6 3m a a a a m a a a a a a= + = +

    Clculo de los momentos. Para facilitar la obtencin de los momentos, los clculos se disponen en una tabla como sigue:

  • 14 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    EJEMPLO 1.4 (momentos no centrados) Tabla sin frecuencias.

    ix 2ix

    3ix

    4ix

    3 9 27 813 9 27 812 4 8 162 4 8 163 9 27 815 25 125 625

    18 60 222 9002

    1 21 1

    3 43 4

    1 1

    1 18 1 603 106 6

    1 222 1 90037 1506 6

    n n

    i ii i

    n n

    i ii i

    x a x a xn n

    a x a xn n

    = =

    = =

    = = = = = = =

    = = = = = =

    Tabla con frecuencias. Variable discreta.

    ix in i ix n 2i ix n

    3i ix n

    4i ix n

    1 7 7 7 7 72 14 28 56 112 2243 21 63 189 567 17014 21 84 336 1344 53765 7 35 175 875 4375

    total n=70 217 763 2905 116832

    1 21 1

    3 43 4

    1 1

    1 217 1 7633'1 10 '970 70

    1 2905 1 1168341'5 166 '970 70

    k k

    i i i ii i

    k k

    i i i ii i

    x a x n a x nn n

    a x n a x nn n

    = =

    = =

    = = = = = = =

    = = = = = =

    Tabla con frecuencias. Variable continua.

    1i iL L ix in i ix n 2i ix n

    3i ix n

    4i ix n

    0-10 5 25 125 625 3125 1562510-20 15 40 600 9000 135000 202500020-40 30 20 600 18000 540000 1620000040-50 45 15 675 30375 1366875 61509375total n=100 2000 58000 2045000 79750000

    21 2

    1 1

    3 43 4

    1 1

    1 2000 1 5800020 580100 100

    1 2045000 1 7975000020450 797500100 100

    k k

    i i i ii i

    k k

    i i i ii i

    x a x n a x nn n

    a x n a x nn n

    = =

    = =

    = = = = = = =

    = = = = = =

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 15

    EJEMPLO 1.5 (momentos centrados) Tabla sin frecuencias.

    ix ix x ( )2ix x ( )3ix x ( )4ix x3 0 0 0 03 0 0 0 02 -1 1 -1 12 -1 1 -1 13 0 0 0 05 2 4 8 16

    total 0 6 6 18

    ( ) ( )( ) ( )

    2

    1 21 1

    3 4

    3 41 1

    1 0 1 60 16 6

    1 6 1 181 36 6

    n n

    i ii i

    n n

    i ii i

    m x x m x xn n

    m x x m x xn n

    = =

    = =

    = = = = = =

    = = = = = =

    Tambin podramos haberlos calculado en funcin de los momentos no centrados que hemos

    obtenido en el ejemplo 1.4. El momento centrado de orden dos (varianza) se suele calcular as

    22 2 2 22 2 1

    1

    1 10 3 1n

    ii

    S m a a x xn

    =

    = = = = =

    Dado que los clculos para tablas con frecuencias son anlogos para variables discretas y continuas,

    incluimos un solo ejemplo de momentos centrados con frecuencias.

    Tabla con frecuencias. Variable continua.

    1i iL L ix in ( )ix x ( )i ix x n ( )2i ix x n ( )3i ix x n ( )4i ix x n 0-10 5 25 -15 -375 5625 -84375 1265625

    10-20 15 40 -5 -200 1000 -5000 2500020-40 30 20 10 200 2000 20000 20000040-50 45 15 25 375 9375 234375 5859375total n=100 0 18000 165000 7350000

    ( ) ( )( ) ( )

    2

    1 21 1

    3 4

    3 41 1

    1 0 1 180000 180100 100

    1 165000 1 73500001650 73500100 100

    k k

    i i i ii i

    k k

    i i i ii i

    m x x n m x x nn n

    m x x n m x x nn n

    = =

    = =

    = = = = = =

    = = = = = =

    Tambin podramos haberlos calculado en funcin de los momentos no centrados que hemos

    obtenido en el ejemplo 1.4. El momento centrado de orden dos (varianza) se suele calcular as

    22 2 2 2

    2 2 11

    1 580 20 580 400 180k

    i ii

    S m a a x n xn

    =

    = = = = = =

  • 16 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Clculos como los anteriores, dispuestos en forma de tabla, son muy fciles de hacer con la ayuda

    de una hoja de clculo.

    1.3 Medidas de posicin.

    Las distintas medias, la moda y la mediana tratan de representar mediante un solo valor a un

    conjunto de datos y suelen tomar una posicin central respecto de los mismos, motivo por el que son

    conocidas como medidas de posicin central.

    Media aritmtica. Es el promedio ms familiar y utilizado en los ms diversos mbitos, aunque no es el nico ni el

    ms adecuado en todas las ocasiones. Se define como

    1 1

    1i i

    k k

    i ii i

    x x n x fn

    = =

    = = (para tablas con frecuencias)

    1

    1i

    n

    ix x

    n=

    = (para tablas sin frecuencias) Coincide con el momento no centrado 1a x= .

    Las calculadoras cientficas nos permiten obtener fcilmente algunos valores estadsticos con la

    opcin SD, entre ellos la media aritmtica x .

    EJEMPLO 1.6.

    ix in i ix n1 2 3 4 5

    7 14 21 21 7

    7 28 63 84 35

    total 70 217

    1

    1 217 3,170i

    k

    ii

    x x nn

    =

    = = =

    1i iL L ix in i ix n0-10

    10-20 20-40 40-50

    5 15 30 45

    25 40 20 15

    125 600 600 675

    total 100 2000

    1

    1 2000 20100i

    k

    ii

    x x nn

    =

    = = =

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 17

    Propiedades de la media aritmtica:

    Consideramos n observaciones agrupadas en s conjuntos de datos con 1n , 2n , , sn

    observaciones cada uno y con medias 1 2, , ..., sx x x respectivamente, entonces la media x de

    las n observaciones es:

    1 1

    11

    ... 1

    ...s

    i

    ss

    iis

    x n x nx x nn n n

    =

    + += =

    + +

    Con frecuencia se dividen o multiplican los valores de la variable por una constante, iex

    (cambio de escala), por ejemplo cuando decidimos expresar los valores en millones en lugar

    de en euros (en $ en lugar de ,). En otras ocasiones se suma o resta una constante a los

    valores de la variable, ix c+ (cambio de origen). Si realizamos una o ambas

    transformaciones sobre la variable original obtenemos una nueva variable, i iy ex c= + , cuya

    media est relacionada con la media de la variable de partida segn:

    y ex c= +

    ( )1 1 1 1 1 1

    1 1 1 1 1 1i i i

    k k k k k k

    i i i i i i ii i i i i i

    y y n ex c n ex n cn e x n c n ex cn n n n n n

    = = = = = =

    = = + = + = + = +

    Media geomtrica.

    11

    1

    ...n nni kk

    nn i ki

    G x x x=

    = = (para tablas con frecuencias)

    11

    ...n

    nn i ni

    G x x x=

    = = (para tablas sin frecuencias) La media geomtrica se utiliza para promediar porcentajes, tasas, ndices de precios,... es decir, en

    aquellos casos en los que la variable representa variaciones acumulativas. La media geomtrica es

    menor que la media aritmtica calculada sobre los mismos datos.

    EJEMPLO 1.7. El valor de la vivienda ha sufrido en los ltimos 5 aos los siguientes incrementos

    incremento 6% 5%

    17% 20% 14%

    Obtenga el incremento anual medio del valor de la vivienda en estos cinco aos.

  • 18 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    Una vivienda cuyo valor fuese 0V al comienzo de estos cinco aos alcanzara un valor

    1 0 0 06 1,06

    100V V V V= + =

    al final del primer ao, que se transformara en

    2 1 1 1 05 1,05 1,05 1,06

    100V V V V V= + = =

    despus de transcurridos dos aos.

    As sucesivamente, al final de los cinco aos

    5 01,14 1,20 1,17 1,05 1,06V V=

    55 0

    0

    1,7814 1,7814VV VV

    = = Luego ha habido un incremento del precio de la vivienda en los ltimos cinco aos del 78,14%

    (0,7814 por uno).

    El incremento medio anual ser aquel valor r (en tanto por uno) tal que si se hubiera observado

    durante todo el periodo (ltimos 5 aos) ese incremento constante, el resultado final habra sido el

    mismo

    0 01,14 1,20 1,17 1,05 1,06 (1 ) (1 ) (1 ) (1 ) (1 )V r r r r r V = + + + + +

    por tanto 5

    5 5

    (1 ) 1,14 1,20 1,17 1,05 1,06 1,7814

    1 1,14 1,20 1,17 1,05 1,06 1,7814 1,12240,1224 en tanto por ciento % 12,24%

    r

    rr r

    + = =

    + = = =

    = =1 r+ es la media geomtrica de los valores 1 ir+ , donde ir es el incremento en cada ao

    expresado en tanto por uno.

    Teniendo en cuenta que 50

    1,14 1,20 1,17 1,05 1,06 1,7814 VV

    = = , otra forma de expresar r es

    55

    0

    1 VrV

    + =

    O en general para n aos

    0

    1 nn VrV

    + =

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 19

    Utilizaremos esto ltimo cuando se desconozcan los incrementos anuales (6%, 5%,) pero se

    conozcan los valores inicial ( 0V ) y final ( nV ) del bien que se est analizando (como en el ejemplo

    1.8)

    La media aritmtica no es adecuada en este contexto como puede verse

    ( )

    0,06 0,05 0,17 0,20 0,14 0,1245

    6% 5% 17% 20% 14%(en tanto por ciento) 12,4% 12,4% 12,24%5

    r

    r

    + + + += =

    + + + += =

    Segn la media aritmtica habra un incremento del valor de la vivienda en los 5 aos de

    ( )51,124 1,794 79,4%= , que no se corresponde con la realidad del ejemplo (78,14%).

    EJEMPLO 1.8. Una vivienda que en el ao 2000 se compr por 125.000 se ha vendido en el ao 2007 por

    500.000. Otra vivienda que se compr en 1995 por 100.000 se vendi en el 2006 por 700.000.

    Cul de las viviendas increment ms su valor?

    Solucin:

    Responderemos apoyndonos en el incremento anual medio observado en el valor de cada vivienda.

    72007 77

    2000

    500.000 4 1,219125.000

    VV

    = = = incremento anual medio del 21,9% (primera vivienda)

    112006 1111

    1995

    700.000 7 1,1935100.000

    VV

    = = = incremento anual medio del 19,35% (segunda vivienda)

    La primera vivienda experiment un incremento anual medio del 21,9% en su valor mientras que la

    segunda experiment un incremento menor, 19,35%.

    Media armnica.

    1

    ki

    i i

    nHnx

    =

    =

    (para tablas con frecuencias)

    1

    1n

    i i

    nH

    x=

    =

    (para tablas sin frecuencias)

  • 20 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Se utiliza para promediar velocidades, precios por unidad, cambios de divisas,...

    La media armnica es menor que la media geomtrica y esta ltima menor que la media aritmtica.

    EJEMPLO 1.9. Si se sube en bicicleta a Sierra Nevada a una velocidad de 10 Km/h y se baja a una velocidad de 60

    Km/h, a qu velocidad media se ha hecho el recorrido completo de ida y vuelta. Suponga que la

    distancia desde la casa del ciclista a Sierra Nevada es de 30 Km.

    Solucin:

    Si calculamos la media aritmtica, obtenemos 10 60 35 /2

    x Km h+= = , que no es la solucin.

    Entendiendo por velocidad media aquella velocidad constante a la que si se realizara el recorrido se

    tardara lo mismo, claramente 35 Km/h no lo cumple.

    30 30 1,714335

    h+ = mientras que hemos tardado 30 310

    h= en subir y 30 0,560

    h= en bajar, en total 3

    horas y media.

    La solucin sera la media armnica 2

    1

    2 2 2 17,1429 /1 11 0,10 0,016710 60i i

    H km h

    x=

    = = = =

    ++(Obsrvese que la distancia, 30 Km., no interviene en el clculo)

    A esa velocidad media tardaramos 30 30 3, 4999917,1429

    h+ = , es decir 3,5 h (la diferencia que se

    observa es debida a los errores de redondeo), lo que realmente se ha tardado en la subida y bajada.

    Nota:

    Utilizando el valor de las distancias recorridas, la media se hubiera calculado como

    2

    1

    2 2 601 1 30 301

    10 60 10 60i i

    H

    x=

    = = =

    + +y en general

    1

    11

    distancia totaltiempo total como suma de los tiempos parciales...

    kki

    ki i

    D DH dddv vv

    =

    = = =

    + +

    EJEMPLO 1.10.Una agencia inmobiliaria ha vendido las siguientes viviendas

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 21

    Precio Superficie 2/precio m240.000 180.000 420.000

    60 90

    100

    4.000 2.000 4.200

    Cual ha sido el precio medio al que ha vendido el metro cuadrado.

    Solucin:

    ini

    i

    nx i

    x

    240.000 180.000 420.000

    60 90

    100

    4.0002.0004.200

    840.000 250

    2

    1

    840.000 Precio total 3.360 /250 Superficie totalk i

    i i

    nH mnx

    =

    = = = =

    Todos aquellos datos que representen precios por unidad como cambio de divisas (p.e., $/, /$),

    precios de alimentacin, combustibles,... (p.e., /Kg, /l), precio de la vivienda por m2 (/m2), etc.,

    se promedian utilizando la media armnica.

    Hay ms tipos de medias, como la media cuadrtica, , que no estudiaremos en esta asignatura.

    Moda. Es el valor que se presenta con ms frecuencia. Se nota Mo. Puede haber varias modas.

    Para variables discretas y atributos su clculo es inmediato. En las variables continuas la mayor

    o menor frecuencia de las observaciones en un intervalo depende en parte de su amplitud, por lo que

    para calcular la moda consideraremos las frecuencias observadas en conjuntos de igual amplitud

    (amplitud unidad).

    Dentro del intervalo modal (el de mayor frecuencia por unidad de amplitud, mayor altura en el

    histograma) hay que seleccionar un punto como moda, para lo cual no hay un nico criterio.

    Sealaremos tres criterios diferentes que notaremos como ( ), ( ) ( )Mo I Mo II y Mo III .

    Uno de ellos consiste en tomar el punto medio o marca de clase:

    1( )2

    i ii

    L LMo I x += =

    Otro criterio sita la moda a una distancia de los extremos del intervalo proporcional a las alturas de

    los intervalos anterior y posterior al intervalo modal:

    11

    1 1

    ( ) ii ii i

    hMo II L ah h

    +

    +

    = ++

  • 22 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Y el tercero tiene en cuenta un procedimiento grfico para situar la moda dentro del intervalo

    modal:

    ( ) ( )1

    11 1

    ( ) i ii ii i i i

    h hMo III L ah h h h

    +

    = + +

    En las expresiones anteriores 1iL es el extremo inferior del intervalo modal, ia la amplitud del

    intervalo modal y ih la altura del intervalo modal ( 1ih la altura del intervalo anterior, 1ih + la altura

    del intervalo posterior).

    EJEMPLO 1.11.

    ix in1 2 3 4 5

    7 14 21 21 7 70n =

    Mo=3

    Mo=4 TIPO in

    Colectiva Unifamiliar

    56 14

    total 70

    Mo=Colectiva

    1i iL L in ia ih0-10

    10-20 20-40 40-50

    25 30 40 15

    10 10 20 10

    2,5 3 2

    1,5 100n =

    Intervalo modal: 10-20.

    Dentro del intervalo modal hay que seleccionar

    un punto como moda. Hay diversos criterios:

    1 10 20( ) 152 2

    i iL LMo I + += = =

    11

    1 1

    2( ) 10 10 14,442,5 2

    ii i

    i i

    hMo II L ah h

    +

    +

    = + = + =+ +

    ( ) ( ) ( ) ( )1

    11 1

    3 2,5( ) 10 10 13,333 2,5 3 2

    i ii i

    i i i i

    h hMo III L ah h h h

    +

    = + = + = + +

    Mediana. Es aquel valor, Me, que divide a la muestra ordenada en dos partes iguales, es decir, hay el mismo

    nmero de datos menores que la mediana como mayores que ella.

    Si hay un nmero impar de observaciones, la mediana es el nico valor central

    5, 10, 30, 45, 50 Me=30

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 23

    Si hay un nmero par de observaciones, la mediana es el punto medio de los dos valores centrales

    5, 10, 30, 45 Me=(10+30)/2=40/2=20 Si tenemos los datos representados en una tabla estadstica la mediana se calcula buscando el valor

    que deja por debajo de l una frecuencia acumulada igual a 2n

    EJEMPLO 1.12.

    Para variables discretas buscamos en la columna de frecuencias absolutas acumuladas el valor 2n ,

    70 352 2n

    = =

    ix in iN1 2 3 45

    7 14 14 28 7

    7 21 3563 70

    70n =

    pudiendo ocurrir que hay un 2inN = , en cuyo caso la mediana

    es: 1 3 4 3,52 2

    i ix xMe ++ += = = ,

    ix in iN1 2 3 4 5

    7 14 21 21 7

    7 21 42 63 70

    70n =

    o bien, como en este otro ejemplo, todos los 2inN . Entonces, se

    busca el primer 2inN > , siendo la modalidad ix asociada a esa

    frecuencia acumulada el valor que se toma como mediana, 3Me = .

    En variables continuas se distinguen las mismas dos posibilidades:

    1i iL L in iN0-10

    10-20 20-40 40-50

    20 30 35 15

    20 50 85

    100 100n =

    2inN = . La mediana es el extremo superior del intervalo

    donde se alcanza la mitad de las observaciones.

    20iMe L= =

    1i iL L ia in iN100-110 110-120 120-140 140-150

    10 10 20 10

    25 40 20 15

    25 65 85

    100 100n =

    Todos los 2inN . La mediana est en el intervalo donde

    por primera vez 2inN > y se calcula mediante:

  • 24 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    1

    150 252 110 10 116,25

    40

    i

    i ii

    n NMe L a

    n

    = + = + =

    que es el resultado de repartir homogneamente las 40 observaciones sobre la amplitud 10 del

    intervalo. Segn la tabla, hasta 110 hay una frecuencia acumulada de 25, hasta 120 hay una

    frecuencia acumulada de 65 (por tanto 40 observaciones entre 110 y 120), luego el valor Me hasta

    el que hay una frecuencia acumulada de 502n

    = estar entre 110 y 120. Si las observaciones se

    reparten homogneamente en el intervalo, la distancia entre la mediana y el extremo inferior del

    intervalo ser proporcional al nmero de observaciones entre dichos valores

    120 110 40110 50 25Me

    =

    ( )120 110 50 25 11040

    Me =

    120 11040

    = Amplitud entre cada una de las 40 observaciones del intervalo 110-120.

    ( )50 25 = Nmero de observaciones en el intervalo 110-Me. Despejando el valor Me se obtiene la anterior expresin para la mediana

    10 40 110 50 25 50 25 50 25110 10 110 10110 50 25 10 40 40 40

    Me Me MeMe

    = = = = +

    Percentiles. Estas medidas ( )1 99 1 99,..., ,...,P P o C C dividen a la muestra ordenada en 100 conjuntos con igual nmero de observaciones,

    100n , habiendo por tanto

    100n

    observaciones menores que P . La

    mediana coincide con 50P . Salvo este percentil, el resto de percentiles ocupan una posicin no

    central respecto de los datos de la muestra, propiedad por la que reciben la denominacin de

    medidas de posicin no central.

    Otros casos particulares de percentiles son los denominados cuartiles

    ( )1 25 2 50 3 75, ,Q P Q P Q P= = = que dividen a la muestra en 4 conjuntos con igual nmero de observaciones,

    4n , y los deciles ( )1 10 2 20 9 90, , ...,D P D P D P= = = que dividen a la muestra en 10

    conjuntos con igual nmero de observaciones, 10n .

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 25

    El clculo de los percentiles es similar al de la mediana, cambiando 502 100n n

    = por 100

    n

    dependiendo del percentil, P , que se quiera calcular.

    En las distribuciones de variables discretas no hay consenso sobre la forma de calcular los

    percentiles, existiendo en la literatura cientfica nueve mtodos diferentes que conducen a

    resultados diferentes. Por ello, al calcular cualquier percentil por medio de software o manualmente,

    es bsico saber e indicar el mtodo utilizado. Excel no utiliza el mismo mtodo que en estos

    apuntes.

    EJEMPLO 1.13. Calcule sobre las siguientes tablas los percentiles 30 y 85

    ix in iN1 2 3 4 5

    7 14 14 28 7

    7 21 35 63 70

    70n =

    130

    2 330 21 2,5100 2 2

    i ix xn P ++ += = = =

    8585 59,5 4100n P= =

    1i iL L ia in iN100-110 110-120 120-140 140-150

    10 10 20 10

    25 40 20 15

    25 65 85

    100 100n =

    8585 85 140100n P= =

    30 30100

    n=

    100inN P est en el intervalo donde por primera vez 100i

    nN >

    se calcula con una expresin similar a la de la mediana, sustituyendo 2n por

    100n

    , que es el

    resultado de repartir homogneamente las observaciones sobre la amplitud del intervalo

    1

    1100 i

    i ii

    n NP L a

    n

    = +

    1

    30 1

    30 30 25100 110 10 111,2540

    i

    i ii

    n NP L a

    n

    = + = + =

    EJEMPLO 1.14. Los saldos de las cuentas abiertas por los clientes de una sucursal bancaria se distribuyen de

    acuerdo a la siguiente tabla

  • 26 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    SALDOS NUMERO DE CLIENTES 0-200

    200-1.000 1.000-5.000

    5.000-30.000

    100 400 300 50

    Se consideran clientes preferentes al 10% de los clientes con mayores saldos, cul ha de ser el

    saldo para que un cliente sea considerado como tal?

    Qu porcentaje de clientes tienen un saldo superior a 900?

    Solucin:

    SALDOS NUMERO DE CLIENTES iN0-200

    200-1.000 1.000-5.000

    5.000-30.000

    100 400 300 50

    100 500 800 850

    850850 90 765100

    n = =

    1

    90 1

    90 765 500100 1000 4000 4533,33300

    i

    i ii

    n NP L a

    n

    = + = + =

    Se considerarn clientes preferentes a los que tienen un saldo superior a 4533,33.

    1

    1

    850 100100 100900 200 800 52,94

    400

    i

    i ii

    n NP L a

    n

    = + = = + =

    El 52,94% de los clientes tienen un saldo inferior a 900, por tanto un 47,06% =(100-52.94)% de

    clientes tienen un saldo superior a 900.

    Considerando el reparto homogneo de las observaciones en cada intervalo, las anteriores

    cuestiones se podran haber resuelto tambin de la siguiente manera

    90 9090 90

    5000 1000 800 500 4000 300 4000 2651000 3533,33 4533,331000 765 500 1000 265 300

    P PP P

    = = = = =

    1000 200 500 100 800 400 400 700100 350 450900 200 100 700 100 800

    x xx x

    = = = = =

    . Hay 450 clientes

    con un saldo inferior a 900 que representan un 450100 52,94%850

    = .

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 27

    1.4 Medidas de dispersin.

    Las medidas de dispersin cuantifican la variabilidad o esparcimiento de los datos. Cuando esta

    dispersin se mide respecto de alguna medida de posicin central (por ejemplo, la media) nos indica

    la mayor o menor representatividad de dicha medida.

    Recorridos El recorrido o rango R se define como la diferencia entre los valores extremos.

    R=mximo-mnimo

    Es la medida de dispersin ms fcil de calcular pero tiene el inconveniente de que slo utiliza dos

    valores (estando sujeta a posibles datos errneos) por lo que no nos da una medida precisa de la

    dispersin de todos los datos.

    El recorrido intercuartlico IR se define como la diferencia entre el tercer y primer cuartil,

    3 1 75 25IR Q Q P P= =

    representa la amplitud del intervalo donde se encuentra el 50% de las observaciones centrales de la

    muestra. Con esta medida se evita la fuerte influencia que tienen los valores extremos en el

    recorrido R.

    Con la misma idea se pueden definir distintos recorridos utilizando otros percentiles.

    Varianza

    ( )221

    1 ki i

    iS x x n

    n=

    = (para tablas con frecuencias) ( )22

    1

    1 ni

    iS x x

    n=

    = (para tablas sin frecuencias) La varianza coincide con el momento centrado de orden 2, 2 2S m= .

    Mide la dispersin o distancia de los datos, ix , respecto de la media aritmtica, x . Esta medida est

    expresada en las unidades de los datos al cuadrado (p.e., 2, hab.2,...) por lo que no tiene una

    interpretacin fcil. Con el objeto de tener una medida de dispersin expresada en las mismas

    unidades que los datos en estudio, se define la desviacin tpica como la raz cuadrada positiva de la

    varianza.

  • 28 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Con frecuencia se dividen o multiplican los valores de la variable por una constante, iex (cambio de

    escala), por ejemplo cuando decidimos expresar los valores en millones en lugar de en euros (en $

    en lugar de en ,). En otras ocasiones se suma o resta una constante a los valores de la variable,

    ix c+ (cambio de origen). Si realizamos una o ambas transformaciones sobre la variable original

    obtenemos una nueva variable, i iy ex c= + , cuya varianza est relacionada con la varianza de la

    variable de partida mediante: 2 2 2y xS e S=

    (los cambios de origen en los valores de la variable no afectan al valor de la varianza, pero s los

    cambios de escala).

    ( ) ( ) ( ) ( )( )( ) ( )

    22 2 22

    1 1 1 1

    2 22 2 2 2

    1 1

    1 1 1 1

    1 1

    i i i

    i i

    k k k k

    y i i i i ii i i i

    k k

    i i xi i

    S y y n ex c ex c n ex ex n e x x nn n n n

    e x x n e x x n e Sn n

    = = = =

    = =

    = = + = = =

    = = =

    En general, para cualquier momento centrado se tiene que

    ( ) ( )rr rm y e m x=

    Desviacin tpica.La medida de dispersin absoluta ms utilizada es la desviacin tpica, S.

    2S S=

    Las calculadoras cientficas nos permiten obtener fcilmente algunos valores estadsticos con la

    opcin SD, entre ellos la desviacin tpica nS = y elevndola al cuadrado obtenemos la varianza 2S .

    Los cambios de origen en los valores de la variable no afectan al valor de la desviacin tpica, pero

    s los cambios de escala segn la expresin y xS e S= .

    EJEMPLO 1.15. Calcule el rango, la varianza y la desviacin tpica para la siguiente distribucin de frecuencias.

    1i iL L in0-10

    10-20 20-30 30-40

    1 2 3 4

    10

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 29

    Solucin:

    1i iL L in ix i ix n ( )2ix x ( )2i ix x n

    0-1010-2020-3030-40

    1234

    5152535

    53075

    140

    400100

    0100

    400200

    0400

    10 250 1000

    R=40-0=40

    1

    1 250 2510

    k

    i ii

    x x nn

    =

    = = =( )22

    1

    1 1000 10010

    k

    i ii

    S x x nn

    =

    = = =2 100 10S S= = =

    Desigualdad de TchebycheffEsta desigualdad nos permite entender mejor el significado de la desviacin tpica como medida

    de dispersin.

    Dado un conjunto de datos con media x y desviacin tpica S , la proporcin de datos en el

    intervalo ( ),x kS x kS + es mayor o igual que 211 k (k>1). ( ) 21, 1ip x x kS x kS k +

    Otra forma equivalente de expresar el mismo resultado, haciendo 2

    22

    t tt kS k kS S

    = = = , dice

    que la proporcin de datos en el intervalo ( ),x t x t + es mayor o igual que 221 St . Por ejemplo, para k=2, ( )2 , 2x S x S + , tenemos que alejndonos de la media dos desviaciones tpicas, a la derecha e izquierda, abarcaramos ms del 75% de las observaciones,

    2 2

    1 11 1 0,752k

    = = .

    EJEMPLO 1.16. Se sabe que el nmero medio de unidades diarias de un determinado producto que vende un

    supermercado es 100x = y la desviacin tpica 40S = . Si cada da el supermercado repone hasta

    completar 200 unidades del producto en sus estanteras:

    Cuntos das al ao la demanda ser mayor que su oferta?

    Cunto habra que reponer para asegurar que no va a faltar producto en las estanteras el 95% de

    los das?

  • 30 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    200 100x t t+ = = la proporcin de observaciones dentro del intervalo

    ( ) ( ), 0, 200x t x t + = es mayor o igual que 22 16001 1 0,8410000St = = y por tanto fuera de dicho intervalo (demanda inferior a 0 o superior a 200) la proporcin de observaciones es menor o igual a

    0,16=1-0,84 . Es decir, en menos del 16% de los das la demanda es superior a 200 unidades. 2

    22 2

    1600 16001 1 0,95 32000 178,9 2790,05

    S t t x tt t

    = = = = = +

    Reponiendo hasta completar 279 unidades en las estanteras aseguramos que ms del 95% de los

    das no faltar producto en el supermercado.

    Variable tipificadaSe define la variable X tipificada como la nueva variable obtenida al realizar el siguiente cambio

    X xZS

    =

    Esta nueva variable se caracteriza por tener media cero y desviacin tpica 1.

    La tipificacin de variables se puede utilizar para establecer comparaciones entre valores de dos

    variables (por ejemplo, las calificaciones de dos alumnos en dos centros diferentes).

    EJEMPLO 1.17. Se quiere comparar los precios de dos viviendas con las mismas caractersticas, una en Madrid y

    otra en Granada. El precio medio de las viviendas del tipo considerado es 200.000 en Madrid y

    140.000 en Granada, las desviaciones tpicas son respectivamente 20.000 y 15.000. Las dos

    viviendas a comparar tienen unos precios de 260.000 (Madrid) y 190.000 (Granada). cul de las

    dos viviendas est alcanzando un mayor valor en su mercado?

    Solucin:

    260.000 200.000 60.000 320.000 20.000

    = = 190.000 140.000 50.000 3,3315.000 15.000

    = =

    3,33 3> por tanto la vivienda de Granada est alcanzando mayor valor en su mercado que la de Madrid.

    Una vivienda con las caractersticas de la de Granada en Madrid tendra un precio de unos 266.600

    ( )200.000 3,33 20.000 3,33 200.000 266.60020.000

    x x = = + =

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 31

    Los recorridos, la varianza y la desviacin tpica son medidas de dispersin absoluta que

    dependen de la unidad de medida de la variable (y por tanto les afecta el cambio de escala), lo

    anterior conlleva que no se puedan comparar estas medidas en dos variables con distinta unidad de

    medida. En la prctica para evitar este problema se prefiere trabajar con otras medidas de

    dispersin, obtenidas de las anteriores, que se denominan medidas de dispersin relativa. Las

    medidas de dispersin relativa son adimensionales (no dependen de la unidad de medida de la

    variable estadstica y por tanto no les afectan los cambios de escala)

    Coeficiente de Variacin. Es la medida de dispersin relativa ms utilizada. Se define como el cociente de la desviacin

    tpica sobre la media aritmtica

    SCVx

    =

    Esta medida es invariante frente a cambios de escala pero le afecta los cambios de origen.

    EJEMPLO 1.18. La distribucin de los salarios mensuales de 10 trabajadores con igual cualificacin profesional es

    Salarios en cientos de in

    0-10 10-20 20-30 30-40

    1 2 3 4

    10 El horario de trabajo no es nico para todos, siendo 6 el nmero medio de horas trabajadas cada da

    y 1 hora la desviacin tpica. Es coherente la distribucin de los salarios con la de las horas

    trabajadas?

    Razonamiento:

    Si todos los empleados trabajan las mismas horas, lo coherente es que reciban el mismo salario (la

    variacin del salario sera cero y tambin la del nmero de horas). Quien trabaje ms debe recibir

    ms salario y quien trabaje menos debe recibir menos, es decir, debe haber la misma variabilidad en

    las horas trabajadas que en los salarios percibidos.

    Solucin:

    La media y desviacin tpica de los salarios segn hemos calculado en el ejemplo 1.15 sobre estos

    mismos datos son:

  • 32 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    1

    1 250 2510

    k

    i ii

    x x nn

    =

    = = = 2 100 10S S= = = 10( ) 0,425CV salarios = =Mientras que 1( ) 0,167

    6CV horarios = = . La dispersin en los salarios es ms del doble que en las

    horas trabajadas, luego no es coherente la distribucin de salarios en relacin con las horas de

    trabajo.

    Otra forma de razonar:

    x=horas trabajadas, y=salario

    Si y kx= , donde k=salario/hora, debido a la invariabilidad del coeficiente de variacin frente a

    cambios de escala x yCV CV = , pero si x yCV CV y kx . Los salarios no son proporcionales a las horas trabajadas.

    EJEMPLO 1.19. Las subvenciones, en millones de euros, a las pequeas empresas en 2006 y 2007 segn

    comunidades autonmicas se recogen en la siguiente tabla

    2006 2007 ANDALUCIA 42,95 69,15ARAGON 5,91 19,25ASTURIAS 2,23 28,5BALEARES 1,24 12,5CANARIAS 3,29 25,8CANTABRIA 7,20 16,25CASTILLA LA MANCHA 11,02 19,5CASTILLA LEON 11,15 26,05CATALUA 25,89 58,2COMUNIDAD VALENCIANA 17,26 58,35EXTREMADURA 6,08 41,5GALICIA 6,75 29MADRID 8,15 13,55MURCIA 9,78 25,35NAVARRA 1,84 15,5PAIS VASCO 7,88 34,35LA RIOJA 1,38 17,2

    Se han mantenido las diferencias entre las subvenciones recibidas en 2006 y 2007? Si han variado,

    indique en qu sentido.

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 33

    Solucin:

    2006

    ix ( )2ix x 2007 iy ( )2iy yANDALUCIA 42,95 1085,7025 69,15 1532,7225ARAGON 5,91 16,7281 19,25 115,5625ASTURIAS 2,23 60,3729 28,5 2,25BALEARES 1,24 76,7376 12,5 306,25CANARIAS 3,29 45,0241 25,8 17,64CANTABRIA 7,20 7,84 16,25 189,0625CASTILLA LA MANCHA 11,02 1,0404 19,5 110,25CASTILLA LEON 11,15 1,3225 26,05 15,6025CATALUA 25,89 252,4921 58,2 795,24COMUNIDAD VALENCIANA 17,26 52,7076 58,35 803,7225EXTREMADURA 6,08 15,3664 41,5 132,25GALICIA 6,75 10,5625 29 1MADRID 8,15 3,4225 13,55 270,6025MURCIA 9,78 0,0484 25,35 21,6225NAVARRA 1,84 66,5856 15,5 210,25PAIS VASCO 7,88 4,4944 34,35 18,9225LA RIOJA 1,38 74,3044 17,2 163,84

    TOTAL 170,00 1774,75 510,00 4706,79

    17n = 1

    1 170 1017

    n

    ii

    x xn

    =

    = = = 1

    1 510 3017

    n

    ii

    y yn

    =

    = = =( )22

    1

    1 1774,75 104,4017

    n

    x ii

    S x xn

    =

    = = = ( )221

    1 4706,79 276,8717

    n

    y ii

    S y yn

    =

    = = =2 10, 22x xS S= =

    2 16,64y yS S= =

    200610,22 1,022

    10xSCV

    x= = = 2007

    16,64 0,55530

    ySCVy

    = = =

    Las diferencias entre las subvenciones recibidas por las distintas comunidades autonmicas han

    disminuido en 2007 en relacin al ao anterior.

    1.5 Medidas de forma.

    Momentos como la media y la varianza nos aportan informacin sobre la posicin y dispersin de

    los datos. En este apartado, las denominadas medidas de forma cuantifican caractersticas

    observables en la forma de la representacin grfica que nos proporcionan ms informacin sobre el

    fenmeno en estudio.

    Hay diversas medidas de forma, las ms utilizadas se basan en los momentos.

  • 34 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Coeficiente de asimetra de Fisher.

    31 3

    mgS

    =

    Se basa en que en distribuciones simtricas por cada observacin a la derecha de la media hay otra a

    igual distancia a la izquierda, por tanto la expresin

    ( )31

    0n

    ii

    x x=

    =Si la grfica es asimtrica a la izquierda se rompe el anterior equilibrio entre sumandos positivos y

    negativos, resultando la suma negativa. Lo mismo ocurre cuando la distribucin de frecuencias es

    asimtrica a la derecha, resultando la suma positiva. El signo del denominador de 1g es siempre

    positivo, por tanto:

    Si la distribucin es simtrica 1 0g = Si la distribucin es asimtrica a la izquierda 1 0g < Si la distribucin es asimtrica a la derecha 1 0g >

    El signo de 1g lo aporta 3m , se define dividiendo por 3S para conseguir que el coeficiente sea una

    medida adimensional que pueda compararse con la asimetra de otras distribuciones, adems

    tambin se consigue as que sea independiente de cambios de origen y escala.

    Coeficiente de curtosis (o apuntamiento) de Fisher.Las medidas de curtosis se utilizan en distribuciones unimodales simtricas o levemente asimtricas

    para cuantificar la mayor o menor frecuencia de observaciones en torno a la media. La mayor

    frecuencia de observaciones prximas a la media dar lugar a una representacin grfica ms

    apuntada, la menor frecuencia de observaciones prximas a la media dar lugar a una representacin

    ms aplanada. El perfil de apuntamiento que se toma como referencia es el de la conocida campana

    de Gauss o curva normal.

    La medida de apuntamiento ms utilizada es el coeficiente de curtosis de Fisher

    42 4 3

    mgS

    =

    Al igual que el coeficiente de asimetra de Fisher es adimensional e independiente de cambios de

    origen y escala.

    Los valores del coeficiente de curtosis de Fisher se interpretan de la siguiente manera:

    Si la distribucin tiene un apuntamiento normal (mesocrtica) 2 0g =

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 35

    Si la distribucin es ms aplanada que la curva normal (platicrtica) 2 0g < Si la distribucin es ms apuntada que la curva normal (leptocrtica) 2 0g >

    1.6 Medidas de concentracin.

    Las medidas de concentracin miden la mayor o menor igualdad en el reparto de una cantidad (por

    ejemplo, la masa salarial total de una empresa, ). Ante este problema eminentemente econmico,

    medidas estadsticas como la media, la varianza, , no son significativas, por lo que es necesario

    construir unos indicadores especficos. Debido a la naturaleza de los fenmenos que aqu se

    consideran, las variables tomarn slo valores positivos (por ste y otros motivos, no deben hacerse

    cambios de origen).

    La caracterstica que se va a estudiar puede presentar las siguientes situaciones lmite:

    Mxima concentracin: Cuando un solo individuo recibe la cantidad total a repartir y el resto

    nada.

    Equidistribucin (mnima concentracin): Todos los individuos reciben la misma cantidad.

    Entre ambas situaciones extremas hay infinidad de situaciones intermedias que trataremos de

    cuantificar con las siguientes medidas de concentracin:

    Curva de concentracin de Lorenz. Ilustraremos la construccin de la curva de Lorenz con un ejemplo.

    EJEMPLO 1.20. Estudiar la concentracin de los salarios/hora de 25 trabajadores recogidos en la siguiente tabla

    1i iL L in

  • 36

    Hacemos los siguientes clcul

    1iL iL ix

    Donde in son los trabajadores

    en cada intervalo, acumulando

    (representan el nmero de tra

    intervalo i)

    Por ltimo, ip y iq son los va

    p

    (representan el porcentaje de

    hasta el intervalo i)

    La curva de Lorenz es la repr

    , a los que se aade el punto (0

    del punto (0, 0) y termina en e

    Apuntes de Tcnicas Cuantitativas 1. Jos A

    os

    in i ix n iN iu

    25n = 1

    73000k

    j jj

    x n=

    = s en cada intervalo, i ix n es la suma de los sa

    o los anteriores valores obtenemos respectivam

    1

    i

    i jj

    N n=

    = 1

    i

    i j jj

    u x n=

    =bajadores y la suma de los salarios de todos

    alores iN y iu expresados en porcentajes.

    100iiNpn

    =

    1

    100ii kj j

    j

    uqx n

    =

    =

    trabajadores y el porcentaje de los salarios d

    resentacin grfica de los puntos con coorden

    0, 0). Como puede verse en el grfico, la curv

    el punto (100, 100).

    Alberto Hermoso Gutirrez.

    ip iq

    alarios de los trabajadores

    mente iN y iu .

    los trabajadores hasta el

    de todos los trabajadores

    nadas ( ),i ip q , 1, ...,i k=va de Lorenz siempre parte

  • Apuntes de Tcnicas Cuantitativas

    Interpretacin de la curva d

    Si hay un reparto equitativo

    corresponde un porcentaje iq

    iguales a los valores iq y la

    cuadrante). Cuanto ms prxim

    la curva de Lorenz de la recta

    curva de Lorenz de dicha lnea

    ndice de Gini. El ndice de Gini cuantifica la

    los puntos ( ),i ip q , 1, ...i =( ), (100 ,100)k kp q = ].

    Interpretacin del ndice de

    Si hay un reparto equit

    Si hay concentracin m

    0 1, ...,iq i k = =Luego el ndice de Gini es

    concentracin cuanto mayor se

    s 1. Jos Alberto Hermoso Gutirrez.

    e Lorenz.

    o (todos reciben lo mismo), a un porcenta

    de la cantidad total repartida igual a ip . Es

    a curva de Lorenz coindice con la lnea y

    mos estemos de esta situacin de reparto equi

    y x= , cuanto mayor sea la concentracin de

    a.

    a anterior propiedad de la curva de Lorenz ba

    ., 1k , a la recta y x= . [No se tienen en

    ( )1 11 1

    1 1

    1 1

    1

    k k

    i i ii i

    G k k

    i ii i

    p q qI

    p p

    = =

    = =

    = =

    Gini.

    tativo (equidistribucin) 1,i ip q i = =mxima (todos reciben nada, salvo uno que re

    1 , 100 1k Gq I = =un valor entre 0 y 1 que mide la concen

    ea y mayor equidistribucin cuanto menor se

    37

    aje ip de trabajadores le

    s decir los valores ip son

    x= (bisectriz del primer

    itativo ms prxima estar

    el reparto ms se alejar la

    asndose en la distancia de

    cuenta los puntos (0,0) y

    ..., 1 0Gk I =ecibe todo)

    ntracin, indicando mayor

    a.

  • 38 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    En el ejemplo anterior el ndice de Gini vale 253,51 0,1769308G

    I = = .

    (Obsrvese que a la suma de los ip y iq se ha restado 100 puesto que 100kp = y 100kq = no se

    incluyen en el clculo del ndice de Gini)

    Mediala. La mediala o valor medial, Ml, es aquel valor tal que la suma de las observaciones menores que l

    es igual a la suma de las observaciones mayores que l.

    Se trata pues de una mediana sobre los valores i ix n en lugar de sobre las frecuencias in . Su clculo

    se realiza de forma anloga, buscando el valor de la variable asociado a la mitad de la cantidad total

    repartida, 12

    k

    j jj

    x n=

    , o equivalentemente asociado a 50%iq = .

    Segn lo anterior, en variables continuas (valores agrupados en intervalos) la mediala se obtiene de

    ( )1 1

    1 11

    50 50%i i

    i i i ii i i i

    q qMl L a L an x q q

    = + = +

    Donde ( )%i in x representa el porcentaje recibido en el reparto por el intervalo i (intervalo donde se encuentra la mediala), 1iL es el extremo inferior del intervalo medial (intervalo donde por primera

    vez 50iq > ) y ia es la amplitud del intervalo donde est la mediala.

    La mediala de los datos del ejemplo anterior es:

    50 23,32500 1000 3311,5556, 2 23,3

    Ml = + =

    De qu forma nos ayuda la mediala a medir la concentracin? Si hay equidistribucin la

    mediana y mediala coinciden, separndose ms cuanto mayor sea la concentracin. Por tanto la

    respuesta es

    M Ml Me =

    En el ejemplo anterior 12,5 102500 1000 2812,58

    Me = + = 499,05M Ml Me = =

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 39

    El valor M , que depende de la unidad de medida de la variable, se suele relativizar en

    comparacin con el rango, /M R .

    En nuestro ejemplo, 6500 500 6000 0,0832MRR

    = = = , que confirma de nuevo lo que

    ya conocamos por la curva de Lorenz e ndice de Gini de que la concentracin es dbil.

    En el anterior ejemplo hemos visto cmo sobre una variable continua se calculan las medidas de

    concentracin, en el siguiente ejemplo lo veremos sobre una variable discreta.

    EJEMPLO 1.21. Dos familias con 4 y 5 hijos respectivamente deciden repartir parte de sus patrimonios entre ellos de

    la siguiente forma.

    Familia A

    Familia B

    Cul de los dos repartos es ms equitativo?

    Solucin:

    De estas tablas pasamos los datos a tablas estadsticas con frecuencias para variables discretas.

    Familia A:

    ix in i ix n iN iu ip iq

    1

    11

    1

    99,9( ) 1 1 0,334150

    k

    ii

    G k

    ii

    qI A

    p

    =

    =

    = = =

    Para obtener la mediala, sencillamente buscamos en la columna de los iq dnde se supera por

    primera vez el valor 50%, 3 356,5 50 ( ) 300000q Ml A x= > = = .

  • 40 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    (Si hay un 1502

    i ii

    x xq Ml ++= = , anlogamente a como se hace en el clculo de la mediana)

    Familia B:

    ix in i ix n iN iu ip iq

    1

    11

    1

    73, 4( ) 1 1 0,266100

    k

    ii

    G k

    ii

    qI B

    p

    =

    =

    = = =

    Para obtener la mediala, sencillamente buscamos en la columna de los iq dnde se supera por

    primera vez el valor 50%, 3 3100 50 ( ) 2000000q Ml B x= > = = .

    Comparando ambos ndices de Gini se observa que es ms equitativo el reparto de la familia B

    ( ) 0,334 ( ) 0,266G GI A I B= > =

    1.7 Ejercicios resueltos.

    1. La compaa de telefona mvil Noteoigo est considerando cambiar sus tarifas. Para ello ha

    observado la duracin en segundos de 1000 llamadas realizadas por sus abonados:

    Duracin de las llamadas Nmero de llamadas 0-20

    20-60 60-90

    90-180 180-300

    15 180 195 405 205

    Obtenga:

    a) Duracin media de las llamadas.

    b) Coste medio de las llamadas segn las siguientes tarifas:

    b.1) 10 cntimos el establecimiento de llamada, ms 6 cntimos por minuto

    (proporcionalmente las fracciones de minuto).

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 41

    b.2) 8 cntimos por minuto (proporcionalmente las fracciones de minuto), sin coste

    de establecimiento de llamada.

    c) Porcentaje de llamadas que superan los 2 minutos de duracin.

    Solucin:

    1iL iL i ix n 0 20 10 15 150 15 1,5

    20 60 40 180 7200 195 19,560 90 75 195 14625 390 3990 180 135 405 54675 795 79,5

    180 300 240 205 49200 1000 1001000 125850

    a) 1

    1 125850 125,851000i

    k

    ii

    x x n segundosn

    =

    = = =b) Utilizaremos como afecta a la media un cambio de origen y/o escala:

    Y eX c y ex c= + = +X=duracin de las llamadas en segundos. Y=duracin de las llamadas en minutos.

    1Z = coste de la llamada segn la opcin b.1 2Z = coste de la llamada segn la opcin b.2

    1 1 125,85 2,097560 60 60

    Y X y x= = = =

    b.1) ( ) ( )1 110 6 10 6 10 6 2,0975 22,585Z Y z y= + = + = + = cntimos. b.2) 2 28 8 8 2,0975 16,78Z Y z y= = = = cntimos.

    c) Calculamos, interpolando, el porcentaje de llamadas que duran menos de 120 segundos, y se lo

    restamos a 100%.

    90 39 120 x 180 79,5

    180 90 120 90 52,5% 100 52,5 47,5%79,5 39 39

    xx

    = = =

    El 47,5% de las llamadas superan los dos minutos.

    2. Se dispone de la siguiente informacin sobre los salarios anuales brutos de los empleados de una

    empresa (en miles de euros):

    Salarios 0-20 20-60 60-70 70-90 n empleados 10 45 30 15

    a) Obtenga el coeficiente de variacin de los salarios.

    b) Qu salario es superado por el 60% de los empleados?

    c) Qu tanto por ciento de empleados tienen un salario superior a 63000 euros?

    ix in iN ip

  • 42 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    0-20 20-60 60-70 70-90

    10 40 65 80

    10 45 30 15

    100 1800 1950 1200

    1000 72000

    126750 96000

    10 55 85

    100

    10 55 85

    100n=100 5050 295750

    a) 1

    1 1 5050 50,5100

    n

    i ii

    x x nn

    =

    = = =22 2 2

    1

    1 295750 50,5 407, 25 407,25 20,18100

    n

    i ii

    S x n x Sn

    =

    = = = = =20,18 0,399650,5

    SCVx

    = = =

    b) 20 x 60

    10 40 55

    60 20 20 1200 20 46,655 10 40 10 4546666 40%46666 60%

    x x x

    euros no son superados por el de los empleadoseuros son superados por el de los empleados

    = + = =

    c) 60 63 70

    55 x 85

    70 60 63 60 3 3055 6485 55 55 1064% 63000100 36% 63000

    x xx

    de los empleados tienen salario inferior a eurosx de los empleados tienen salario superior a euros

    = = =

    =

    3. Se tienen datos sobre los beneficios en millones de euros (ya deflactados) obtenidos por las

    empresas de tres sectores productivos en los aos 2008 y 2012:

    2008 2012

    Sector Beneficio medio (millones de euros) Nmero de empresas

    Beneficio medio (millones de euros)

    Nmero de empresas

    A B C

    40 65 50

    800 1200 1000

    35 60 35

    735 1165 900

    Calcule para los tres sectores en conjunto:

    a) El beneficio medio en 2008 y 2012.

    b) La disminucin media anual (en %) de los beneficios en el periodo 2008-2012.

    Solucin:

    a) ( ) ( ) ( )( )1

    20081 1 16000040 800 65 1200 50 1000 53,33

    3000 3000

    s

    ii

    ix x nn=

    = = + + = =( ) ( ) ( )( )

    12012

    1 1 12712535 735 60 1165 35 900 45, 42800 2800

    s

    ii

    ix x nn=

    = = + + = =

    iL ip

    iL ip

    1i iL L ix in i ix n 2i ix n iN ip

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 43

    b) 4 45, 41 0,96 0,04 ( 4%)53,33

    r r+ = = = . Se ha producido una disminucin

    media anual del 4% en los beneficios del sector.

    4. El salario medio, la desviacin tpica de los salarios y el nmero de empleados en tres empresas

    filiales de G.E.C.O.S.A. son

    Salario medio Desviacin tpica Nmero de empleados A B C

    1365 1300 1560

    105 100 120

    100 300 170

    Se decide subir el salario un 5% en la filial A, un 6% en la filial B y 50 euros a los empleados de la

    filial C.

    a) En cul de las tres filiales son ms homogneos los salarios antes de la subida?

    b) En cul de las tres filiales son ms homogneos los salarios tras la subida?

    Solucin:

    a) Antes de la subida la homogeneidad de los salarios es la misma en las tres filiales

    105 100 120 0,07691365 1300 1560A B C

    CV CV CV= = = = = =

    b) Despus de la subida la homogeneidad no cambia en las filiales A y B pues el coeficiente de

    variacin es invariante frente a cambios de escala.

    Y Xy x x

    y ex xY eX CV CVS eS S

    = = = = =

    Sin embargo, si cambia en la filial C al cambiar la media aunque no la desviacin tpica.

    Si llamamos X al salario antes de la subida e Y al salario despus de la subida:

    Filial A Y=X+0,05X=1,05X

    Filial B Y=X+0,06X=1,06X

    Filial C Y=X+50

    120 1200,0769 0,07451560 50 1610A B C

    CV CV CV= = = = =+

    Por tanto, despus de la subida la filial C es la de salarios ms homogneos (aunque C tiene

    la mayor desviacin tpica, recuerde que para comparar la dispersin de dos variables

    estadsticas se ha de usar una medida de dispersin relativa)

    5. Sea una distribucin de frecuencias con media 300, varianza 36 y n=5000. Cuntas observaciones

    contiene el conjunto ( ,288] [312, ) ?

  • 44 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    La desigualdad de Tchebycheff afirma que la proporcin de datos en el intervalo ( ),x kS x kS + es mayor o igual que 2

    11k

    (k>1).

    ( ) 21, 1ip x x kS x kS k + En nuestro caso: 288=300-12= 2x S 312=300+12= 2x S+

    Por tanto, la proporcin de observaciones en el intervalo (288, 312) es mayor o igual que

    2 2

    1 1 31 1 0,752 4k

    = = = , de modo que en el conjunto ( ,288] [312, ) habr menos de un

    25% de las observaciones, es decir, menos de 1250 observaciones 25 5000 1250100

    = .

    6. En un fenmeno se han observado 2000 individuos con media 1000 y varianza 100. Cuntas

    observaciones, como mnimo, son mayores que 970 y menores que 1030?

    Solucin:

    De nuevo, de acuerdo a la desigualdad de Tchebycheff :

    970=1000-30= 3x S , 1030=1000+30= 3x S+ , en el intervalo ( )3 , 3x S x S + hay una proporcin de observaciones mayor o igual que 2

    1 81 0,88893 9

    = = . El 88,89% de las 2000

    observaciones son 1777,8 , luego como mnimo hay 1778 observaciones entre 970 y 1030.

    7. Para asignar los puestos de trabajo en una cadena de montaje se realiza un test a los 90 empleados;

    12 de ellos realizarn un trabajo tipo A (los que obtengan mejor puntuacin), otros tantos un

    trabajo tipo C (los que saquen puntuacin ms baja), y el resto realizarn labores tipo B. El

    resultado del test fue:

    Puntuacin 0-30 30-50 50-70 70-100 100-120 120-150

    in 10 15 20 20 20 5 Cul fue la puntuacin en el test para los que desempearn un trabajo tipo B?

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 45

    Solucin:

    1iL iL in iN 0 30 10 10

    30 50 15 2550 70 20 4570 100 20 65

    100 120 20 85120 150 5 90

    Si los 12 mejores harn el trabajo A, los 78=90-12 restantes con la puntuacin ms baja no lo harn.

    Buscamos 78 en la columna de frecuencias acumuladas, como no aparece interpolaremos entre los

    siguientes valores

    100 65 x 78

    120 85

    120 100 100 11385 65 78 65

    x x = =

    Los que obtengan ms de 113 harn el trabajo A.

    Los 12 con puntuacin ms baja harn el trabajo C. Buscamos 12 en la columna de frecuencias

    acumuladas e interpolamos entre los valores ms prximos

    30 10 x 12

    50 25

    50 30 30 32,6725 10 12 10

    x x = =

    Los que obtengan menos de 32,67 puntos harn el trabajo C.

    Por tanto harn el trabajo B los que obtengan una puntuacin entre 32,67 y 113 puntos.

    8. En la siguiente tabla se recogen los salarios anuales, en miles de euros, de los empleados de dos

    empresas del mismo sector

    Nmero de empleados salarios Empresa A Empresa B

    5-15 15-25 25-35 35-45 45-55

    2 15 28 45 10

    5 5

    10 50 30

    a) Qu empresa constituye un grupo ms homogneo de empleados en cuanto a salarios se

    refiere?

    b) Qu empresa presenta mayor concentracin en sus salarios?

    c) Qu porcentaje de la masa salarial de la empresa A perciben los trabajadores cuyo salario

    anual est comprendido entre 22500 y 30000 euros?

    d) Qu salario anual percibe un empleado de la empresa B que se encuentra dentro del 25% de

    los mejor pagados en dicha empresa?

  • 46 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    Empresa A

    1iL iL ix in i ix n 2i ix n iN iu ip iq5 15 10 2 20 200 2 20 2 0,58

    15 25 20 15 300 6000 17 320 17 9,2525 35 30 28 840 25200 45 1160 45 33,5335 45 40 45 1800 72000 90 2960 90 85,5545 55 50 10 500 25000 100 3460 100 100,00

    100 3460 128400 254 228,90

    1

    1 3460 34,6100

    k

    i ii

    x x nn

    =

    = = =22 2 2

    1

    1 128400 34,6 86,84 86,84 9,3188 ( ) 0,2693100

    k

    i ii

    SS x n x S CV An x=

    = = = = = = = ( )1 1

    1 11 1

    1 1

    118,90( ) 1 1 0,163154

    k k

    i i ii i

    G k k

    i ii i

    p q qI A

    p p

    = =

    = =

    = = = =

    Empresa B

    1iL iL ix in i ix n 2i ix n iN iu ip iq5 15 10 5 50 500 5 50 5 1,27

    15 25 20 5 100 2000 10 150 10 3,8025 35 30 10 300 9000 20 450 20 11,3935 45 40 50 2000 80000 70 2450 70 62,0345 55 50 30 1500 75000 100 3950 100 100,00

    100 3950 166500 205 178,48

    1

    1 3950 39,5100

    k

    i ii

    x x nn

    =

    = = =22 2 2

    1

    1 166500 39,5 104,75 104,75 10, 2347 ( ) 0, 2591100

    k

    i ii

    SS x n x S CV Bn x=

    = = = = = = = ( )1 1

    1 11 1

    1 1

    78,48( ) 1 1 0, 2526105

    k k

    i i ii i

    G k k

    i ii i

    p q qI B

    p p

    = =

    = =

    = = = =

    a) Para ver donde son ms homogneos los salarios estudiamos la variabilidad o dispersin de

    esta variable. Para poder comparar la dispersin necesitamos una medida de dispersin

    relativa como el coeficiente de variacin. Se observa una dispersin similar en ambas

    empresas, si bien algo mayor en la empresa A

    ( ) 0,2693 ( ) 0,2591CV A CV B= > =

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 47

    Observe que si nos hubiramos apoyado en los valores de las varianzas o de las desviaciones

    tpicas la conclusin hubiese sido la opuesta.

    b) El ndice de Gini en la empresa A es menor que en la empresa B, luego hay menos

    concentracin en los salarios de la empresa A.

    ( ) 0,163 ( ) 0,2526G GI A I B= < =

    c) Buscamos en la tabla de la empresa A el tanto por ciento de masa salarial acumulada

    asociada a los valores 22,5 y 30. Como ninguno aparece en la tabla interpolaremos entre los

    valores ms prximos:

    15 0,5822,5 x 25 9,25

    25 15 22,5 15 7,089, 25 0,58 0,58

    xx

    = =

    25 9,25 30 x 35 33,53

    35 25 30 25 21,3933,53 9,25 9,25

    xx

    = =

    Los trabajadores con un salario inferior a 30000 euros reciben el 21,39% de la masa salarial.

    Los que su salario es inferior a 22500 euros reciben el 7,08% de la masa salarial. Por tanto

    los que su salario est comprendido entre 22500 y 30000 euros recibirn el 14,31% de la

    masa salarial (21,39-7,08=14,31).

    d) El salario que es superado por el 25% de los empleados de la empresa B mejor pagados es el

    mismo salario que no es alcanzado por el 75% restante. Buscamos en la columna de los ip

    el valor 75, como no aparece, interpolamos entre los valores ms prximos

    45 70 x 75

    55 100

    55 45 45 46,667 46667100 70 75 70

    x x euros = =

    9. El sueldo mensual, en euros, correspondiente a los empleados de dos factoras de una misma

    empresa es

    Sueldo mensual

    Nmero de empleados. Factora A

    Nmero de empleados. Factora B

    600-1000 1000-1400 1400-2000 2000-3000

    20 40 30 10

    16 20 32 32

    a) Qu sueldo corresponde al 60% de los empleados de la empresa?

    b) Calcule el sueldo del 25% de los empleados de la factora B con menor salario.

    c) Qu sueldo puede ser considerado moda de la factora A?

    d) Halle el sueldo medio: de la factora A, de la factora B y de la empresa.

    e) En cul de las dos factoras los sueldos son ms homogneos?

  • 48 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    f) En cul de las dos factoras los sueldos tienen una concentracin mayor?

    g) Calcule la mediana y la mediala para todos los empleados de la empresa.

    h) Qu porcentaje de empleados de la empresa tienen un sueldo superior a 2300 euros?

    i) Qu sueldo corresponde al 30% de los empleados de la empresa con mayor sueldo?

    j) Calcule el porcentaje de empleados de la empresa, con menor sueldo, que reciben el 43% de

    la nmina.

    k) Cuntos empleados de la empresa, con mayor sueldo, reciben el 25% de la nmina?

    Solucin:

    Sumando el nmero de empleados en las dos factoras de la empresa obtenemos la distribucin de

    frecuencias para todos los empleados de la empresa.

    Sueldo mensual

    Nmero de empleados. Factora A

    Nmero de empleados. Factora B

    Nmero de empleados. EMPRESA

    600-1000 1000-1400 1400-2000 2000-3000

    20 40 30 10

    16 20 32 32

    36 60 62 42

    En primer lugar realizamos en las siguientes tablas los clculos necesarios para responder a todos

    los apartados:

    Factora A

    1iL iL ix in i ix n 2i ix n ia ih iN iu ip iq600 1000 800 20 16000 12800000 400 0,05 20 16000 20 11,43

    1000 1400 1200 40 48000 57600000 400 0,1 60 64000 60 45,711400 2000 1700 30 51000 86700000 600 0,05 90 115000 90 82,142000 3000 2500 10 25000 62500000 1000 0,01 100 140000 100 100,00

    100 140000 219600000 270 239,29

    Factora B

    1iL iL ix in i ix n 2i ix n iN iu ip iq600 1000 800 16 12800 10240000 16 12800 16 7,48

    1000 1400 1200 20 24000 28800000 36 36800 36 21,501400 2000 1700 32 54400 92480000 68 91200 68 53,272000 3000 2500 32 80000 200000000 100 171200 100 100,00

    100 171200 331520000 220 182,24

    Empresa

    1iL iL ix in i ix n 2i ix n iN iu ip iq600 1000 800 36 28800 23040000 36 28800 18 9,25

    1000 1400 1200 60 72000 86400000 96 100800 48 32,391400 2000 1700 62 105400 179180000 158 206200 79 66,262000 3000 2500 42 105000 262500000 200 311200 100 100,00

    200 311200 551120000 245 207,90

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 49

    a) Esta pregunta puede tener diferentes interpretaciones: el 60% de los empleados de la

    empresa con mayores sueldos, el 60% con menores sueldos, el 60% de los sueldos

    intermedios o centrales,

    Para su resolucin aqu supondremos el 60% de los empleados con menores sueldos.

    60 no aparece en la columna de los ip de la tabla Empresa, por lo que interpolaremos

    entre los valores ms prximos a 60 en la tabla.

    1400 48 x 60

    2000 79

    2000 1400 1400 1632,2679 48 60 48

    x x euros = =

    El 60% de los empleados con menores sueldos tienen un salario inferior a 1632,26 .

    b) 25 no aparece en la columna de los ip de la tabla Factora B, por lo que interpolaremos

    entre los valores ms prximos a 25 en la tabla.

    1000 16 x 25

    1400 36

    1400 1000 1000 118036 16 25 16

    x x euros = =

    El 25% de los empleados de la factora B con menores salarios tienen un salario por debajo

    de 1180 .

    c) La moda es el valor ms frecuente de la variable. En variables continuas se sita en el

    intervalo de mayor altura (que no siempre coincide con el de mayor frecuencia, aunque s en

    este caso). Calculamos las alturas dividiendo la frecuencia absoluta, in , entre la amplitud

    del intervalo, ia . Dentro del intervalo de mayor altura ( )0,1 , 1000-1400ih = hay diferentes criterios para situar la moda, el ms sencillo es el del punto medio del intervalo.

    Segn dicho criterio, 1200 euros puede considerarse la moda en la factora A.

    d) 140000 171200 311200( ) 1400 ( ) 1712 ( ) 1556100 100 200

    x A x B x empresa= = = = = =

    e)22 2 2

    1

    1 219600000( ) 1400 236000 ( ) 236000 485,8100

    k

    i ii

    S A x n x S An

    =

    = = = = =

    ( )( ) 0,347( )

    S ACV Ax A

    = =

    22 2 2

    1

    1 331520000( ) 1712 384256 ( ) 384256 619,88100

    k

    i ii

    S B x n x S Bn

    =

    = = = = =

    ( )( ) 0,362( )

    S BCV Bx B

    = =

    Hay menos dispersin, por tanto son ms homogneos los sueldos, en la factora A, aunque

    como puede observarse las diferencias no son importantes.

  • 50 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    f)

    1

    11

    1

    139, 29( ) 1 1 0,181170

    k

    ii

    G k

    ii

    qI A

    p

    =

    =

    = = =

    1

    11

    1

    82, 24( ) 1 1 0,315120

    k

    ii

    G k

    ii

    qI B

    p

    =

    =

    = = =

    Hay una mayor concentracin en el reparto de los sueldos en la factora B.

    g)1

    1100 962 1400 600 1438,71

    62

    i

    i ii

    n NMe L a

    n

    = + = + =

    11

    1

    50 50 32,391400 600 1711,9666,26 32,39

    ii i

    i i

    qMl L aq q

    = + = + =

    h) En la tabla Empresa buscamos el valor 2300. ste no est, interpolamos entre los valores

    ms prximos a 2300:

    2000 79 2300 x 3000 100

    3000 2000 2300 2000 85,3% 100 85,3 14,7%100 79 79

    xx

    = = =

    Luego el 14,7% de empleados en la empresa tienen un sueldo superior a 2300 .

    i) El mismo sueldo que es superado slo por el 30% de los empleados de la empresa con

    mayor sueldo no es alcanzado por el 70% restante. Buscamos en la tabla Empresa el

    valor 70 en la columna ip e interpolamos entre los valores ms prximos:

    1400 48 x 70

    2000 79

    2000 1400 1400 1825,879 48 70 48

    x x euros = =

    El 30% de los empleados de la empresa con mayor sueldo tienen un sueldo superior a

    1825,8 .

    j) Buscamos en la columna iq de la tabla Empresa el valor 43 e interpolamos:

    48 32,39 x 43

    79 66,26

    79 48 48 57,71%66,26 32,39 43 32,39

    x x = =

    k) Buscamos en la tabla Empresa el porcentaje de empleados, con menor sueldo, que

    reciben el 75% de la nmina

    79 66,26 x 75

    100 100

    100 79 79 84,44% 100 84,44 15,56%100 66,26 75 66, 26

    x x = = =

    Por tanto, el 15,56% restante de empleados recibirn el 25% restante de la nmina. El

    15,56% de los 200 empleados de la empresa son 31,12 31 empleados.

    10. Se conoce el salario medio, la desviacin tpica de los salarios y el nmero de empleados de dos

    empresas filiales:

  • Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 51

    Filial Sueldo medio () Desviacin tpica () Nmero de empleados A 853,4 60 25 B 795 52 35

    Se decide subir el sueldo un 5% a los empleados de la filial A y subir 138 euros a cada uno de los

    de la filial B. Justifique en cul de las dos filiales los sueldos sern ms heterogneos despus de la

    subida.

    Solucin:

    Llamemos X=sueldo antes de la subida e Y=sueldo tras la subida.

    En la filial A la relacin entre X e Y es un sencillo cambio de escala:

    Y=X+0,05X=1,05X

    En la filial B la relacin entre X e Y es un cambio de origen

    Y=X+138

    En la filial A la media y desviacin tpica para la nueva variable Y son:

    ( ) 1,05 ( ) 1,05 853, 4 897,12y A x A= = =

    ( ) 1,05 ( ) 1,05 60 63y xS A S A= = =

    En la filial B la media y desviacin tpica para la nueva variable Y son:

    ( ) ( ) 138 795 138 933y B x B= + = + =

    La desviacin tpica de X e Y es la misma en la filial B puesto que los cambios de origen no afectan

    a su valor.

    Para comparar la variabilidad de los sueldos despus de la subida utilizamos el coeficiente de

    variacin

    63 0,0702897,12A

    CV = =

    52 0,0557933B

    CV = =

    Luego, despus de la subida, son ms heterogneos los sueldo en la filial A.

    11. En una empresa de embalaje se conoce el nmero de cajas que hacen los 75 empleados de esa

    seccin al final de una semana:

    Nmero de cajas 350-400 400-450 450-500 500-550 % de empleados 26,67 22,67 36 14,66

    a) Calcule la varianza.

    b) Calcule el nmero de cajas que con ms frecuencia hace un empleado.

    c) Para incentivar la productivid