cómo medir la desviación estándar de poblaciones

18
CÓMO MEDIR LA DESVIACIÓN ESTÁNDAR DE POBLACIONES Introducción En el capítulo anterior se trataron los diversos factores que determinaron el tamaño de muestra que se necesita para hacer una inferencia acerca de la población. En este capítulo se tratará otro factor llamado la desviación estándar de la población. La desviación estándar es una medida de una característica más general llamada la dispersión de la población. Primero se examinará el concepto de dispersión y después se describirán varios métodos para el cálculo de la desviación estándar. El concepto de dispersión La tabla 5.1 a) proporciona una serie de valores obtenidos de un inventario. La tabla 5.1. b) proporciona una serie de valores de otro inventario. La distribución de frecuencias de cada serie se presentó en la figura 5.1 a) y en la figura 5.1 b). Esta distribución de frecuencias nos indica el número de veces que cada valor aparece. Llamemos lecturas a los valores atribuidos a cada artículo del inventario.

Upload: luis-veliz

Post on 07-Nov-2015

232 views

Category:

Documents


3 download

DESCRIPTION

Auditoria

TRANSCRIPT

CMO MEDIR LA DESVIACIN ESTNDAR DE POBLACIONES

Introduccin

En el captulo anterior se trataron los diversos factores que determinaron el tamao de muestra que se necesita para hacer una inferencia acerca de la poblacin. En este captulo se tratar otro factor llamado la desviacin estndar de la poblacin.La desviacin estndar es una medida de una caracterstica ms general llamada la dispersin de la poblacin. Primero se examinar el concepto de dispersin y despus se describirn varios mtodos para el clculo de la desviacin estndar.El concepto de dispersinLa tabla 5.1 a) proporciona una serie de valores obtenidos de un inventario. La tabla 5.1. b) proporciona una serie de valores de otro inventario.La distribucin de frecuencias de cada serie se present en la figura 5.1 a) y en la figura 5.1 b). Esta distribucin de frecuencias nos indica el nmero de veces que cada valor aparece. Llamemos lecturas a los valores atribuidos a cada artculo del inventario.Observe que la figura 5.1 a) y la 5.1. b) tienen varias caracteristicas interesantes. Primero note que el valor medio, o sea el valor total dividido entre el nmero de lecturas de ambas distribuciones son idntico a 9.92. Despus ntese que ambas distribuciones son simtricas en grado sumo, es decir, el nmero de lecturas se encuentra simtricamente a ambos lados del pico de la distribucin.Sin embargo, las figuras 5.1 a) y 5.1 b) muestran claramente que las dos distribuciones no son idnticas. La figura 5.1 a) tiene un pico ms alto que la figura 5.1 b) y que sta ltima tiene una base ms ancha que la figura 5.1 a).Tabla 5.1 (a) y (b). el valor de los articulos del inventario.Valor del articulo de inventario No. de articulos que tienen este valor

(a)(b)

3-1

4-1

5-4

622

744

875

91413

102114

111513

1277

1334

1412

15-2

16-1

17-1

7474

Valor Medio 9.929.92

Estas dos caractersticas indican que las lecturas representadas en la figura 5.1 b) se encuentran dispersadas ms ampliamente alrededor del valor medio de la poblacin que las lecturas representadas en la figura 5.1 a).Necesitamos medir este factor de dispersin de las lecturas alrededor del valor medio de la poblacin para poder estimar el valor de una variable de la poblacin a partir de una muestra obtenida de la misma. Como un experimento sencillo, el lector podra seleccionar, de las tablas 5.1 a) y 5.1 b), varias muestras aleatorias de cuatro unidades. Tomar el valor medio de estas muestras dividiendo su valor total entre cuatro, y comparar esta estimacin de las muestras con el verdadero valor medio de la poblacin, que es 9,92. En este caso el lector encontraria que si, por ejemplo, toma una docena de muestras de cuatro unidades, entonces la mayora de las estimaciones tomadas de la tabla 5.1 a) estarn ms cerca del verdadero valor medio de la poblacin que de los valores sacados de la tabla 5.1 b).Seleccione una docena de muestras aleatorias de cuatro unidades de cada poblacin y los resultados sern los siguientes:Medida estimada a partir de la tabla

Tabla123456789101112

5.1(a)101011.751110.751199910.258.759

5.1(b)10.59.7512.7511.511.509.758.58.58.510.58.58.5

De las 24 estimaciones realizadas, las tomadas de la tabla 5.1 a) proporcionan las mejores estimaciones.Esto se debe a que la tabla 5.1 a) tiene una dispersin ms reducida que la tabla 5.1 b) y, por consiguiente, la mayoria de las lecturas de la tabla 5.1 a) se encuentran ms cerca de la media de la poblacin.

Figura 5.1 las distribuciones de la frecuencia de dos series de valores de inventario. Observe que la distribucin del inventario. a) Tiene una punta ms alta y una base mas estrecha que en b), o sea que tiene una dispersin ms reducidaPor tanto, para un tamao fijo de la muestra, la poblacin con la dispersin ms reducida dar una estimacin ms precisa de la media de la poblacin.Puesto que la dispersin de la poblacin afecta el tamao de la muestra requerida, el auditor necesita medir, o, por lo menos, calcular la dispersin de la poblacin que se anliza cuando efecta una estimacin de un valor, como es el caso de un valor de inventario, un valor de deudas, o de error. La medida de la dispersin que utilizar el auditor se llama la desviacin estndar de la poblacin.Ahora se describirn tres mtodos para el calculo de la desviacin estndar. Los primeros dos mtodos proporcionan una medida precisa de la desviacin estndar de la poblacin, y se pueden utilizar cuando la poblacin que se est analizando es relativamente pequea. Cuando, como sucede la mayora de las aplicaciones de auditoria, la poblacin que se esta auditando es relativamente grande, formada por varios miles de unidades, o de un nmero mayor de stas, entonces el auditor utilizar el tercer mtodo descrito que estima la desviacin estndar.Este tercer mtod, llamado al mtodo del rango promedio, casi siempre lo utilizan los auditores, puesto que son muy grandes las poblaciones con que trabajan.

Metodo convencional para medir la desviacin estndar de una Poblacin

La tabla 5.2 muestra diez lecturas de una variable, por ejemplo la altura de diez hombres. El mtodo convencional para medir la desviacin estndar de esta poblacin es el siguiente:

1. Calcular la media de la poblacin de n unidades2. Restar la media de cada una de las lecturas.3. Elevar al cuadrado cada uno de los resultados obtenidos despus del paso 2.4. Sumar estos nmeros elevados al cuadrado y dividir el resultado entre n.5. Encontrar la raz cuadrada de la respuesta obtenida despus del paso 4.

La respuesta que se obtiene despus del paso 5, es la desviacin estndar de la poblacion.

Tabla 5.2 La estatura de diez hombre Hombres Estatura (pulgadas)

168

270

365

471

567

668

766

868

972

1064

Con los datos presentados en la tabla 5.2, los clculos son los siguientes:1-3) (a)Altura(b)Media(c)(a)-(b)(d) (c)2

686800

7068+24

6568-39

7168+39

6768-11

686800

6668-24

686800

7268+416

6468-416

59

4) 59 10= 5.95) (5.9)1/2 = 2.43La desviacin estndar de la poblacin de la altura de diez hombres es 2.43 pulgadas.Una manera ms rpida de calcular la desviacin estndarEl mtodo para el clculo de la desviacin estndar que acabamos de descubrir resultar bastante dificil si la poblacin est dividida entre un gran nmero de clase.Usando una calculadora pequea, el mtodo siguiente puede aplicarse con facilidad, ya que es bastante ms sencillo.1. Elevar al cuadrado cada valor de la poblacin, sumar los cuadrados y dividir el resultado entre n, el nmero de unidades en la poblacin. Llmese a al resultado de estos clculos.2. Sumar cada valor de la poblacin, dividir el resultado entre n, despus elevar al cuadrado este ultimo, resultado. Llamamos b al valor resultante de estos clculos.3. Resaltar b de a y encontrar la raz cuadrada de la respuestas El resultado final del paso 3) es la desviacin estndar de la poblacin.Para los datos presentados en la tabla 5.2 los clculos son los siguientes:1. Valor (Valor)2

684624

704900

654225

71541

674489

684624

664356

684624

725184

644096

67946,163

2. 46,163/10 = 4616.3679/10 = 67.9, (67.9)2 = 4610.43. (4616.3 4610.4)1/2 = (5.9)1/2 = 2.43Deseche la raz negativa y encontrar que la desviacin estndar de la poblacin es 2.43, o sea la misma respuesta que se obtuvo cuando se utiliz el mtodo convencional.El lector podr pensar que el segundo mtodo es ms complicado que el primero. Sin embargo, si dispone una pequea calculadora de bolsillo, podr comprobar que el segundo mtodo es ms facil. Las desviaciones estndar de la poblacin que se muestran en la Tabla 5.1a) y 5.1 b) resultan ser:a) 1.63b) 2.67El lector podra desear hacer la comprobacin de estos resultados utilizando los dos mtodos ya descritos. Recuerde que una vez que se haya restado la media de cada lectura y elevado al cuadrado el resultado, debe multiplicarse cada uno de los resultado por el nmero de articulos que se encuentran en el intervalo de cada clase. Encontrando la desviacin estndar de poblaciones grandes Los dos mtodos para el calculo de la desviacin estndar ya descritos, nos dan una medida precisa de la desviacin estandar. Estos mtodos no son, desafortunadamente, muy tiles para el calculo de la desviacin estndar de la mayora de las poblaciones que se manejan en las operaciones de contadura.La mayora de las poblaciones de las operaciones de contadura estn formadas de decenas de miles de unidades, y de esta manera, a menos que se pueda clasificar la poblacin con una computadora, los anteriores mtodos para el clculo de la DE son demasiado laboriosos.En estos casos se puede efectuar un clculo preciso de la DE; lo mejor que puede hacerse es estimar la desviacin estndar.El auditor puede obtener una muestra, calcular la desviacin estndar de esta muestra, y despus utilizar este dato estadistico como una estimacin de la desviacin estndar de la poblacin de la cual se obtuvo la muestra. La tabla 3.4, describe la frmula para el clculo del error estndar de la estimacin de la desviacin estndar. El mtodo del rango promedio, que se describir a continuacin, es otro camino para la estimacin de la desviacin estndar de una poblacin muy grande. Quienes primero sugirieron este mtodo fueron F.E. Grubbs y C.L. Weaver en 1947.

El metodo del rengo promedio para la estimacion de la desviacion estandar

El procedimiento para la estimacin de la desviacin estndar de una poblacin, al utilizar el mtodo del rango promedio es el siguiente:1. Seleccionar aleatoriamente, de una poblacin, una muestra de 49 unidades. 2. Escribir los 49 valores en el orden que se van obteniendo. No deben ordenarse en secuencia.3. Separar las 49 unidades en 7 grupos de 7 unidades.4. Calcular el rango de cada grupo substrayendo el valor ms pequeo de ese grupo del valor ms grande del mismo.5. Calcular el rango promedio dividiendo la suma de los 7 rangos entre 7.6. Dividir en rango promedio entre el numero 2.7047. El resultado es una buena estimacin inicial de la desviacin estndar. Despus se verificar la precisin de esta estimacin empleando una muestra que comprenda todas las unidades. Los diversos pasos son de fcil comprensin, excepto el sexto. De donde surgi el misterio nmero 2.704?. Suponga que tenemos dos nmeros cerca de los limites inferiores y superiores de la distribucin normal se sabe que el 99.7% del rea que se encuentra debajo de la distribucin normal hay tres desviaciones estndar a cada lado de la media. Por consiguiente, se sabe que estos dos nmeros deben estar aproximadamente separados seis desviaciones estndar. Por tanto, si restamos el valor ms pequeo del valor ms grande y dividimos este rango entre 6, se obtiene una estimacin aproximada de la desviacin estndar.Los mismos principios se pueden aplicar a la estimacin de la desviacin estndar con los rangos ms estrechos. Utilizando grupos de 7 podemos utilizar mtodos estadsticos para calcular la distancia ms probable entre los limites superior e inferior de este rango promedio de las desviaciones estndar. En este caso, la estimacin es que los limites superior e inferior se encuentran separados 2.704 desviaciones estndar.Ahora tomemos un ejemplo prctico:1. Una poblacion est formada de 638 unidades. Seleccione 19 nmeros aleatorios entre 001 y 638, y se obtiene los siguientes valores aleatorios:(1)(2)(3)(4)(5)(6)(7)

336411276574274686787

481388285386318721608

211887110255914702212

917202350319382684443

354318617417617191361

626514848891493222618

233300226902350343310

2. El rango de cada grupo es:(1)(2)(3)(4)(5)(6)(7)

El valor mas alto917887848902924721847

El valor mas bajo211202226255274191212

706685622647640530635

3. Por consiguiente, el rango promedio es:

4. Por lo tanto, la estimacin de la desviacin estndar es:

Observe, sin embargo, que este valor es slo una estimacin inicial que se hizo utilizando grupos de 7 de siete unidades aleatorias. Mientras ms grupos de 7 unidades se tome, ms precisa sera la estimacin de la desviacin estndar que se encuentre. Si el tamao requerido para la muestra resulta ser de 154 unidades, se tendrn 22 grupos de siete unidades para estimar la DE. Pero recuerde que las 154 unidades se debern enlistar en el orden en que aparece la tabla de nmeros aleatorios.

El efecto de la desviacin estndar en el tamao para la muestra

En el capitulo anterior se not que otras situaciones equivalentes a un incremento en la desviacin estndar incrementarn el tamao requerido para la muestra, y viceversa. Supngase, por ejemplo, que se representa el siguiente problema de muestreo. Tamao de la poblacin 10,000 unidades Nivel de confianza requerida 95% Limite de precisin 10,000 Unidad de limite de precisin 1

Tabla 5.3 presenta el tamao requerido para la muestra que satisface los requerimientos anteriores para las diversas desviaciones estndar.Tabla 5.3 la tabla ilustra el efecto de la desviacin estndar sobre el tamao para la muestra.DesviacinEstndarPorcentaje deDS inicialTamao requeridopara la muestraPorcentaje del tamaoinicial para la muestra

50 4900

2550193640

10203708

510962

3.37431

Una reduccin en el tamao de la desviacin estndar causa una reduccin proporcional mayor en el tamao de la muestra.Ahora recordaremos que en el caso del nivel de confianza y el limite de precisin el auditor puede reducir el tamao para su muestra pasando a un nivel de confianza menor o a un lmite de precisin mayor, pero en el caso de la desviacin estndar no parece que pueda hacer lo mismo. La desviacin estndar de la poblacin esta dada y, no puede alterarse.Esta ltima afirmacin es verdadera, pero afortunadamente podemos evitar dificultades alterando la poblacin misma. Puede estratificarse la poblacin en dos o ms subpoblaciones de manera que la desviacin estndar de la subpoblacin de menor valor sea mucho menor que la DE de la poblacin total. Esto permite reducir el tamao para la muestra.

El coeficiente de variacinUna medida sencilla de la dispersin relativa de una poblacin de lecturas alrededor del valor medio es el coeficiente de variacin.El C. de V. (coeficiente de variacin) es simplemente la desviacin estndar dividida entre la media. Por ejemplo la DE es 100 libras y la media es 300 libras, el C de V es de 0,33.