conceptos basicos

108
CONCEPTOS BASICOS DE ESTADISTICA Quien desee incursionar en el campo del muestreo debe manejar los conceptos básicos de la estadística por ser indispensables para desarrollar con conocimiento, todas las etapas que implican el diseño de una muestra. 1.1. ELEMENTOS DE ESTUDIO EN EL MUESTREO En un estudio por muestreo juegan un papel básico y esencial los siguientes elementos: la unidad de muestreo, la población, la muestra, la variable y el dato. A continuación se desarrollan conceptos y ejemplos para un correcto uso. 1.1.1. Unidad de muestreo Una unidad de muestreo o unidad muestral, es un individuo que puede ser una persona, animal o cosa en el cual se va a estudiar estadísticamente una o más variables. Una unidad de muestreo puede ser simple o conglomerada. Una unidad de muestreo simple, está compuesta por un solo individuo. Los datos para la variable o variables de estudio son obtenidos directamente de la unidad de muestreo que es el mismo individuo. C. A. Lluén Vallejos

Upload: julio-perez-pari

Post on 03-Dec-2015

221 views

Category:

Documents


1 download

DESCRIPTION

estadistica

TRANSCRIPT

Page 1: conceptos Basicos

CONCEPTOS BASICOS DE ESTADISTICA

Quien desee incursionar en el campo del muestreo debe manejar los conceptos básicos de la estadística por ser indispensables para desarrollar con conocimiento, todas las etapas que implican el diseño de una muestra.

1.1. ELEMENTOS DE ESTUDIO EN EL MUESTREO

En un estudio por muestreo juegan un papel básico y esencial los siguientes elementos: la unidad de muestreo, la población, la muestra, la variable y el dato. A continuación se desarrollan conceptos y ejemplos para un correcto uso.

1.1.1. Unidad de muestreo

Una unidad de muestreo o unidad muestral, es un individuo que puede ser una persona, animal o cosa en el cual se va a estudiar estadísticamente una o más variables.

Una unidad de muestreo puede ser simple o conglomerada.

Una unidad de muestreo simple, está compuesta por un solo individuo.

Los datos para la variable o variables de estudio son obtenidos directamente de la unidad de muestreo que es el mismo individuo.

Una unidad de muestreo es conglomerada, si está formada por una agrupación de unidades de muestreo simples.

Quien determina si la unidad de análisis, es simple o conglomerada, es el objetivo del estudio. Los datos para la variable o variables de estudio son obtenidos de los individuos que se hallan en el conglomerado.

C. A. Lluén Vallejos

Page 2: conceptos Basicos

EJEMPLO N° 01

Unidades de muestreo simple son:

Un paciente enfermo de gripe a quien se le va a indagar el número de días con gripe.

Una silla usada a la cual se le va a inspeccionar la calidad.

Un comerciante, al cual se le va a indagar el tipo de negocio a que se dedica.

Unidades de muestreo conglomeradas son:

Una manzana de viviendas en las cuales se va a estudiar el número de personas por vivienda.

Un establo de vacas lecheras en el cual se va a estudiar la producción diaria de leche por vaca.

Un grupo de pacientes que sufren de presión arterial alta a los cuales durante un tiempo determinado se le va a aplicar un tratamiento para reducir esta presión. Al final se obtendrá los datos logrados con el tratamiento.

1.1.2. Unidad de muestreo potencial

Una unidad de muestreo potencial es la unidad de muestreo que proporciona una información auténtica de la o las variables bajo estudio.

La unidad de muestreo potencial debe ser infalible en la información que proporciona y las que no cumplan este objetivo deben ser depuradas. Por ejemplo,

En un estudio que se desea la opinión de consumidores, respecto de las cualidades de un artículo de tocador, las unidades de muestreo potenciales serán aquellas que tengan una considerable frecuencia de consumo, más no así las de poca frecuencia.

1.1.3. Población

Una población, puede ser un conjunto total de unidades de muestreo, un periodo de tiempo, una longitud, un área o un volumen en donde ocurren una o más variables.

En el caso de individuos, una población es la composición de un conjunto de unidades de muestreo comunes en la variable de estudio.

C. A. Lluén Vallejos

Page 3: conceptos Basicos

3

En el caso de una longitud, la población será una distancia delimitada por un intervalo.

En el caso de un área, la población será el total de una extensión o superficie determinada por ámbitos, perímetros o contornos

En el caso de un volumen, la población será el total de la capacidad o bulto determinada en forma de medida cúbica.

EJEMPLO N° 02

Ejemplos de poblaciones para objetos o personas son:

Un total de pacientes enfermos de gripe a quienes se les va a indagar el número de días con gripe.

Un grupo de sillas usadas a las cuales se les va a inspeccionar la calidad.

Un conjunto de comerciantes informales, a los cuales se les va a indagar el tipo de negocio a que se dedican.

Ejemplos de poblaciones para longitudes son:

Un tramo de una carretera en donde se va a investigar la ocurrencia de accidentes.

El largo de una tela en donde se desea investigar el número de fallas.

El largo de una varilla de fierro en el cual se desea estudiar la uniformidad del color.

Ejemplos de poblaciones para áreas son:

Un terreno de cultivo en el cual se va a estudiar su composición química,

Un área de piel de un animal afectada por un hongo.

Una extensión de agua en un lago en la cual se desea investigar la densidad de una planta acuática.

Ejemplos de poblaciones para volúmenes son:

El total de la sangre de una persona en la cual se va a analizar si tiene una enfermedad tropical.

El volumen de un árbol a fin de analizar su composición química.

El volumen de un material a fin de analizar su resistencia

C. A. Lluén Vallejos

Page 4: conceptos Basicos

4 Conceptos Básicos de Estadística

1.1.3.1. Tamaño de la población

El tamaño de la población, es el total de unidades de muestreo que van a ser objeto de muestreo. Simbólicamente es representado por N.

EJEMPLO N° 03

Los tamaños para los casos de población dados pueden ser respectivamente de:

pacientes enfermos de gripe.

sillas usadas.

comerciantes informales.

1.1.3.2. Ambito de estudio de la población

El ámbito de la población demarca el perímetro, espacio, el ambiente, lugar, etc. en el cual se desarrolla la variable de estudio en las unidades de muestreo.

EJEMPLO N° 04

Los ámbitos de estudio para los casos anteriores pueden ser:

Un barrio de una ciudad.

El colegio de educación secundaria San Juan Bautista de una ciudad.

El contorno del mercado central de una ciudad.

1.1.3.3. Período o tiempo de estudio de la población

El periodo o tiempo de estudio está referido al tiempo en el cual se desarrollará la investigación o estudio estadístico.

Puede ser un solo día o un periodo de tiempo.

C. A. Lluén Vallejos

Page 5: conceptos Basicos

5

EJEMPLO N° 05

Dos de estos casos son:

El día de un censo.

Un período en el cual se va a desarrollar una investigación experimental.

1.1.4. Tipos de población

Teóricamente, se definen las siguientes poblaciones: Población infinita, población finita y población de muestreo.

Una población infinita estará formada por todas las unidades de muestreo definidas en un ámbito muy general o inalcanzable.

Al definir esta población se pueden presentar los siguientes casos:

La población tiene un ámbito cuyos contornos no pueden ser claramente definidos.

El ámbito de las unidades es muy grande.

Las unidades de muestreo de la población son inubicables o están en sitios inaccesibles.

Una población finita tiene una definición con límites o contornos de delimitación, pero sus unidades de muestreo tienen definiciones muy generales.

Corresponden a esta definición, las poblaciones que tienen las características siguientes:

Las poblaciones son pequeñas.

Las poblaciones son fácilmente accesibles con definiciones de unidades de muestreo muy generales.

Las unidades de muestreo no son fácilmente identificadas o ubicadas.

Una población de muestreo (o población objetiva), estará formada por unidades de muestreo totalmente identificadas y ubicadas. Aquí están las unidades de muestreo potenciales.

Las unidades de muestreo cumplen los requisitos siguientes:

Deben ser homogéneas respecto de la variable de estudio.

C. A. Lluén Vallejos

Page 6: conceptos Basicos

Población finita

Población de muestreo o población objetivo

Población infinita o grande

6 Conceptos Básicos de Estadística

Deben ser perfectamente ubicables o accesibles.

Deben ser potenciales, esto es, las unidades de muestreo deben proporcionar información consistente para la variable en estudio.

Deben ser sanas físicamente.

Deben ser creíbles.

El siguiente esquema, muestra como la población de muestreo es subconjunto de la población finita y esta a su vez es subconjunto de la población infinita.

1.1.5. Muestra

Una muestra en general es, una parte de un conjunto, una parte de una longitud, una parte de un área o una parte de un volumen.

Las unidades de muestreo deben ser extraídas aleatoriamente de la población y deben ser buenas representes de todas las unidades de la población.

1.1.6. Tamaño de la muestra

El tamaño de la muestra, es el total de unidades de muestreo que van a ser objeto de análisis. Simbólicamente es representado por .

1.1.7. Marco muestral

El marco muestral es la relación de todas las unidades de muestreo potenciales en donde se deberá anotar la información que identifique y permita su ubicación a fin de tomar de ellas la información que se necesita para realizar la investigación.

C. A. Lluén Vallejos

Page 7: conceptos Basicos

7

EJEMPLO N° 06

Un marco muestral de los comerciantes informales de un mercado puede contener el siguiente registro de información:

No Nombres y Apellidos Edad Tipo de negocio

001 Rodolfo Conteras Pereda 33 Ferretería

002 Juana Carrasco Pisco 42 Comidas

003 Raquel Marino Ramos 28 Jugos

004 Fermina Rios Rosso 31 Ropa

005 Juan Purihuaman Ilo 25 Ropa

… … … …

1.2. CARACTERÍSTICA Y VARIABLE

Definir una característica es dar lugar a una variable y a su vez a los datos. Estos datos son el insumo para realizar los análisis y tanto la variable como los datos deben estar claramente definidos de tal manera que al final, su cuantificación permita un análisis con resultados, decisiones e interpretaciones válidas y confiables.

1.2.1. Característica

Una característica, es el rasgo o dimensión que describe a un individuo.

En estadística, a los individuos se les dice unidades de análisis y en ellas puede ser medida u observadas una o varias características.

Algunas consideraciones a tener en cuenta en la definición de una característica son:

Según sea el caso, una unidad de análisis puede ser una persona, un paciente, un consumidor, un empleado, una silla, una computadora, una planta, un libro, un automóvil, una parcela de cultivo, un día, un volumen de agua, un volumen de tierra, un trozo de madera, etc.

La talla, la edad, el sexo, el peso, la preferencia, el grado de instrucción, el tipo de sangre, el color de pelo, etc. son características que describen a una persona.

La edad, el tipo de enfermedad, la duración de una enfermedad, etc. son características de un paciente.

C. A. Lluén Vallejos

Page 8: conceptos Basicos

8 Conceptos Básicos de Estadística

Cada una de las características tienen modos o definiciones propias que sirven para calificar o medir a las características en los individuos. Así por ejemplo:

El sexo tiene dos modos o maneras de definición: masculino o femenino.

La edad puede ser definida en un rango de mediciones tal como de 20 a 40 años.

El peso puede ser medido en un rango de 50 a 70 Kg.

Una característica cuando es observada o medida en los individuos, da lugar a un conjunto de datos; así por ejemplo,

El conjunto de datos para el sexo de 3 personas puede ser: masculino, femenino, femenino.

El conjunto de datos para el grado de instrucción de 3 persona puede ser: analfabeto, primaria, superior.

El conjunto de datos para el peso de 3 persona de 30 años de edad puede ser: 45 Kg., 80 Kg., 65Kg.

1.2.2. Variable

Variable viene a ser la representación del conjunto de datos de un conjunto de unidades de muestreo.

Una característica cuando es medida, observada o contada en una unidad de muestreo da lugar a un dato. Cuando esta característica se analiza para un conjunto de unidades de muestreo, los diferentes datos que se obtendrán formaran un conjunto de datos que varían entre ellos tomando por esta razón la denominación de variable.

Los símbolos utilizados para representar a una variable son cualquiera de las siguientes letras:

Cuando son las variables observadas, puede usarse la simbología siguiente,

C. A. Lluén Vallejos

Page 9: conceptos Basicos

9

1.2.3. Tipos de variables

De acuerdo a la variedad de datos que pueden obtenerse de las variables en los casos reales, las variables han sido clasificadas en: variables nominales, variables ordinales, variables de razón y variables de intervalo.

1.2.3.1. Variables nominales

Son las variables de tipo modálico, cuyos datos diferencian a los elementos de la población, a unos de otros, sin tener orden preestablecido de clasificación.

Es decir, si la variable tuviese 3 modos de ocurrencia, cualquiera de estos modos puede ser el primero, cualquiera de los restantes el segundo y el restante será el tercero.

El ejemplo más resaltante de este tipo de variable se da a continuación:

El sexo de una persona. El sexo tiene dos modos de ocurrencia y en la persona solo puede darse uno de estos dos modos, o es de sexo femenino o es de sexo masculino.

1.2.3.2. Variables nominales dicótomas y policótomas

Las variables nominales pueden ser dicótomas o policótomas.

Variables dicótomas, son aquellas que solo tienen dos modos de respuesta.

El sexo es un ejemplo de variable dicótoma. Los dos modos son: masculino y femenino.

Variables policótomas, son las que tienen más de dos modos de respuestas.

El estado civil de una persona es una variable policótoma, los modos de esta variable son: soltero, conviviente, divorciado, viudo, casado.

1.2.3.3. Codificación de variables nominales

La codificación, es la asignación de números enteros positivos o negativos a los modos de una variable de tipo modálico según convenga a fin de realizar operaciones con ellos o simplemente para identificarlos.

C. A. Lluén Vallejos

Page 10: conceptos Basicos

10 Conceptos Básicos de Estadística

En el sexo se pueden realizar las siguientes codificaciones:

(0) para el sexo masculino(1) para el sexo femenino

(0) para el sexo femenino(1) para el sexo masculino

(100) para el sexo masculino(200) para el sexo femenino

(100) para el sexo femenino(200) para el sexo masculino

Otros ejemplos de variables nominales son:

El tipo de religión de una persona.

La actitud de una persona.

La marca de un detergente.

1.2.4. Variables ordinales

Son las variables nominales en donde sus modos tienen una jerarquía, rango u orden preestablecido por naturaleza o por superioridad de calificación.

Algunos casos de estas variables son,

El grado de instrucción cuyos modos son: Analfabeto, Primaria, Secundaria y Superior, tienen un orden de superioridad académica.

El grado de dulzor de un refresco, tiene un orden de calificación de dulzor.

El grado de severidad de una enfermedad, tiene un orden de acuerdo al grado de efecto en la enfermedad.

1.2.5. Variables de razón

Son las variables de tipo numérico discreto o continuas cuyos datos tienen un punto de origen que mínimamente es el cero.

Los siguientes casos corresponden a este tipo de variable,

El peso de una bolsa de azúcar.

La talla de una persona.

C. A. Lluén Vallejos

Page 11: conceptos Basicos

11

El número de hijos de una persona.

El número de accidentes en una carretera.

1.2.6. Variables de intervalo

Son las variables numéricas cuyos datos no tienen como mínimo al cero.

Esto es, los datos pueden tener signos positivos o negativos. Los casos que se indican a continuación corresponden a este tipo de variables,

La temperatura climática.

La temperatura de conservación de un tipo de carne.

Una cuenta contable de ingresos y egresos de una empresa.

1.3. DATO ESTADISTICO

Un dato estadístico es el resultado de cuantificar (medir o contar), calificar u observar una característica en un elemento de estudio.

Cuando la característica es de tipo cuantitativa sea discreta o continua, se obtiene un dato formado por un número y una unidad de medida tal como en los casos siguientes,

Para el peso de una persona adulta, el dato puede ser: 56 Kg.

Para la talla de un joven de 16 años, el dato puede ser: 1.70 mts.

Para el número de hijos de un padre de familia, el dato puede ser: 5 hijos.

Si la variable es del tipo modálico, (de cualidad, de atributo, de categoría o de clase), la medición solo recibe una forma literal de denominación, así como en los casos que se dan a continuación,

Para el estado civil de un padre de familia, el dato puede ser: masculino.

Para el tipo de ocupación de una madre de familia, el dato puede ser: ama de casa.

Para el grado de instrucción de un empleado, el dato puede ser: superior.

1.3.1. Representación de un dato en la población

Un dato en la población es representado en mayúsculas por .

Los datos de los N individuos de una población son representados como a continuación se muestra,

C. A. Lluén Vallejos

Page 12: conceptos Basicos

12 Conceptos Básicos de Estadística

En forma extendida:

En forma compacta:

1.3.2. Representación de un dato en la muestra

De manera similar tal como en la población, un dato de la muestra es

representado en minúsculas por .

El conjunto de los n datos de los individuos de la muestra como,

En forma extendida:

En forma compacta:

1.4. MEDIDAS POBLACIONALES

Las medidas poblacionales se calculan para variables cuantitativas y para variables modálicas. Cualquiera de estas medidas es llamada parámetro.

En el caso de variables cuantitativas, las medidas poblacionales son valores representativos que se calculan con los datos obtenidos de las unidades de análisis en la población. Pueden ser de resumen, de variación, de asimetría o de apuntamiento.

En el caso de variables modálicas, se utilizará la proporción y la varianza que serán derivadas del caso de variables dicótomas.

1.4.1. Medidas para variables cuantitativas

1.4.1.1 Media aritmética poblacional

Una media aritmética poblacional, es la magnitud promedio que representa a todos los datos de la variable en las N unidades de la población. Se debe aplicar solo a los datos que tienen un crecimiento aritmético.

La expresión matemática para hallar esta media es,

(1.1)

C. A. Lluén Vallejos

Page 13: conceptos Basicos

13

a pesar de ser indistinto el uso del símbolo de la media, puede adoptarse el

convenio de usar para poblaciones pequeñas y el uso del símbolo será para poblaciones grandes o cuando se trate con temas del cálculo de probabilidades.

Analizar la representatividad de la media en la realidad es importante ya que se pueden presentar una innumerabilidad de casos de representatividad, los cuales resumidos son,

La media es totalmente representativa de los datos, esto sucede cuando todos los datos son iguales entre sí, verificándose la expresión siguiente,

La media no es totalmente representativa de los datos, esto sucede cuando hay alejamientos o desviaciones respecto de la media

aritmética , dando lugar a la expresión que a continuación se muestra,

donde,

para , se le llama error, es el alejamiento o desviación de cada dato respecto de la media aritmética poblacional y puede ser calculado mediante la fórmula,

para todo

De los antes señalado se puede deducir que, si los datos de todas las unidades en la población son todos iguales, la media aritmética poblacional será igual a todos estos datos y si, todos los datos son diferentes entre sí y diferentes de la media aritmética, estos tendrán discrepancias respecto de esta media aritmética.

Este análisis da lugar a las siguientes interrogantes,

¿Cuál es la cantidad total de variabilidad de los datos?

¿Cuáles son los límites de tolerancia que se pueden plantear para aceptar la representatividad de la media?.

¿Qué tanto los datos son diferentes de la media aritmética poblacional?

C. A. Lluén Vallejos

Page 14: conceptos Basicos

14 Conceptos Básicos de Estadística

La varianza poblacional, la desviación estándar poblacional y el coeficiente de variación que a continuación se tratan dan respuesta a estas 3 interrogantes.

1.4.1.2 Total poblacional

El total poblacional es la sumatoria de todos los datos de la variable .

(1.2)

El total poblacional se deduce a partir de la fórmula de la media poblacional dada por,

1.4.1.3 Varianza poblacional

La varianza poblacional, es el parámetro utilizado para captar las variaciones por arriba y por abajo que manifiestan los datos respecto de algún parámetro de resumen tal como la media aritmética poblacional.

Es una medida muy general de la variación de los datos pues sus unidades de medida están en unidades al cuadrado.

En los cálculos de la varianza se tienen dos fórmulas, una para poblaciones pequeñas y otra para poblaciones grandes, estas son,

para poblaciones pequeñas (1.3)

para poblaciones grandes (1.4)

el paso de una a otra varianza se puede realizar mediante las siguientes fórmulas,

C. A. Lluén Vallejos

Page 15: conceptos Basicos

15

La disposición de los datos respecto de la media aritmética puede dar lugar a varios tamaños de varianzas. Las disposiciones gráficas de algunas de estas variaciones se presentan a continuación:

Cuando los datos coinciden en valor con la media aritmética (Varianza nula o varianza cero).

Cuando los datos están muy cercanos a la media aritmética (Varianza pequeña).

Si los datos están simétricamente distribuidos por abajo y por arriba de la media aritmética pero alejados de la media aritmética (Varianza grande).

Si la mayoría de los datos tienen poca discrepancia de la media aritmética y algunos de ellos están alejados (Varianza grande).

1.4.1.4 Desviación Estándar Poblacional

La desviación estándar poblacional es una medida que establece límites de tolerancia de representatividad de la media aritmética poblacional.

C. A. Lluén Vallejos

Page 16: conceptos Basicos

S S

16 Conceptos Básicos de Estadística

Es el desvío medio cuadrático de las ventas diarias que sirve para establecer intervalos de uniformidad de los datos o de representatividad de la media

de los datos que se hallan en el intervalo. El intervalo que tiene la forma

, donde establece cuantas unidades por encima y por

debajo de queremos aceptar la uniformidad o la representatividad de la media aritmética poblacional.

Cuando la desviación estándar poblacional establece dos límites de tolerancia equidistantes de la media aritmética poblacional, identifica dos regiones, una central y dos extremas. La región central es para los datos que la media está representando los cuales tienen desviaciones pequeñas y las regiones extremas es para los datos a los cuales la media ya no los puede representar por estar muy alejados de ella. Estadísticamente se acepta que los datos que están en la región central son iguales entre ellos e iguales a la media.

El cálculo de la desviación estándar se halla con la fórmula siguiente,

(1.5)

1.4.1.5 Coeficiente de Variación Poblacional

El coeficiente de variación poblacional es una forma relativa de expresar el grado que los datos manifiestan por abajo y por arriba de la media aritmética.

La media aritmética el valor que se espera que todos los individuos manifiesten y si no así, algunos serán iguales a la media, otros estarán por arriba y otros por abajo. El grado de esta variación es medido por el coeficiente de variación.

En el cálculo de este coeficiente se toma como parámetro de comparación a la media y a la desviación estándar como promedio de la variación de todas las unidades que están en la región central del gráfico anterior.

La fórmula para calcular este coeficiente es,

C. A. Lluén Vallejos

Page 17: conceptos Basicos

17

(1.6)

que es una forma relativa de expresar la variación de los datos respecto de la media. También se puede aceptar que es la cantidad de variación estadística entre los datos.

El coeficiente de variación en forma porcentual es,

(1.7)

El coeficiente de variación en forma relativa varía de 0 a 1 y en forma porcentual del 0% al 100%. La variación de los datos se incrementa conforme el coeficiente de variación aumenta en valor, así,

Si el C.V es el 0% indicará que los datos son iguales a la media e iguales entre sí.

Si el C.V. es el 1%, será una indicación de que los datos tienen una ligera variación con respecto a la media (o entre ellos).

Si el C.V. es el 90%, será una indicación de fuerte variabilidad con respecto a la media (o entre ellos).

EJEMPLO N° 07

La venta diaria de pescado jurel (en Kgs.) en un minimarket, durante los 31 días del mes de Julio se da en la tabla siguiente:

Día Venta Día Venta1 12 17 262 13 18 163 32 19 174 40 20 365 31 21 266 18 22 177 36 23 208 33 24 259 28 25 2210 21 26 4011 36 27 3212 26 28 18

C. A. Lluén Vallejos

Page 18: conceptos Basicos

18 Conceptos Básicos de Estadística

13 24 29 3514 27 30 2315 38 31 1516 36

Suponga que los datos corresponden a una población.

A fin de practicar un manejo correcto de la simbología estadística se realizan las siguientes enunciaciones:

a) Represente y enuncie la variable de estudio.

b) Represente y enuncie los datos de la variable de estudio.

Represente, calcule e interprete y en los casos que se pueda grafique las siguientes medidas poblacionales:

c) El promedio aritmético de la venta diaria de pescado jurel del mes de Julio.

d) El total de la venta de pescado jurel en el mes de Julio.

e) La varianza de la venta diaria de pescado jurel en el mes de Julio.

f) La desviación estándar de la venta diaria de pescado jurel en el mes de Julio.

g) El coeficiente de variación de la venta diaria de pescado jurel en el mes de Julio.

SOLUCIÓN

a) Represente y enuncie la variable de estudio.

Venta diaria de jurel (en Kgs.)

b) Represente y enuncie los datos de la variable de estudio.

Los datos serán representados por la misma letra de la variable pero subindicada; el subíndice debe hacer referencia a todos los datos, tal como a continuación se muestra,

donde:

C. A. Lluén Vallejos

Page 19: conceptos Basicos

26.42

19

c) Represente, halle, grafique, el promedio aritmético de la venta diaria de jurel, del mes de Julio

Promedio o media aritmética de la venta diaria de jurel del mes de Julio

Kgs.

En el minimarket, en el mes de Julio, diariamente se vendió un promedio de 26.42 Kgs. de pescado jurel.

d) Represente, halle e interprete el total de la venta de pescado jurel en el mes de Julio.

Total de Kgs. de pescado jurel vendidos en los 31días del mes de Julio.

Kgs.

En Julio se vendió un total de 819 Kgs. de pescado jurel.

e) Represente, halle e interprete la varianza de la venta diaria de pescado jurel en el mes de Julio.

Total de la variabilidad de la venta diaria de pescado jurel

C. A. Lluén Vallejos

Page 20: conceptos Basicos

26.42

20 Conceptos Básicos de Estadística

2 2 2(12 26.42) (13 26.42) ... (15 26.42)

30

La variabilidad de la venta diaria de pescado jurel fue de 70.98

f) Represente, halle, interprete y grafique la desviación estándar de la venta diaria de pescado jurel en el mes de Julio.

Es el desvío medio cuadrático de la venta diaria de pescado jurel en el mes de Julio, por encima y por debajo del promedio de 26.42 Kgs.

Kgs.

Para una desviación estándar podemos establecer el intervalo,

entonces, el promedio representa a todas las ventas diarias

dentro del intervalo . Las ventas que se hallan a la izquierda de 17.99 son consideradas ventas bajas y las ventas que están por encima de 34.84 son consideradas ventas altas.

C. A. Lluén Vallejos

Page 21: conceptos Basicos

21

Dentro del intervalo se hallan 17 ventas diarias que representan al 54.84% de las 31 ventas. En un comportamiento normal de las ventas, deben haber el 68.27% que aproximadamente serían 21 ventas.

g) Represente, halle e interprete el coeficiente de variación de la venta diaria de pescado jurel en el mes de Julio.

Representa la variabilidad de las ventas diarias de jurel respecto del promedio de ventas diarias que es lo que se hubiese deseado vender durante los 31 días del mes de julio. Puede asumirse también como la variabilidad entre las 31 ventas diarias de jurel.

Entre las 31 ventas diarias de jurel en el mes de Julio hubo una variabilidad del 32%.

1.4.2. MEDIDAS PARA VARIABLES MODALICAS

La medida resumen de una variable modálica en la población, es la proporción poblacional de casos éxitos. Esta proporción es una frecuencia relativa de los casos éxitos respecto del total.

Para la construcción de una proporción, en primer lugar se debe construir la variable de estudio la cual es una variable que cuenta los casos éxitos y luego se halla la proporción de los casos éxitos. A continuación se trata la construcción de esta proporción.

1.4.2.1 Variable dicótoma

Una variable dicótoma solo tiene dos clases de resultados posibles cuando es observada en las unidades de análisis, una clase de éxitos y una clase de fracasos. Cualquier variable que no sea dicótoma puede ser arreglada para que sea dicótoma.

Los ejemplos siguientes son ejemplos de este caso de variable.

El sexo de un consumidor tiene dos resultados posibles: Masculino y Femenino y cuando sea el interés, se puede establecer como clase de interés a cualquiera de los dos sexos.

C. A. Lluén Vallejos

Page 22: conceptos Basicos

22 Conceptos Básicos de Estadística

La calidad de un material puede ser: muy mala, mala, regular, buena y muy buena. Esta variable tiene varios resultados posibles, pero puede ser el interés el estudio de la calidad mala, en ese caso se podrá hacer el arreglo de las siguientes clases:

Clase éxito: Calidad mala

Clase fracaso: Las calidades muy mala, regular, buena, muy buena.

Dado un conjunto de unidades de análisis y a fin de contar el número de casos se procede con la siguiente nominación:

1.4.2.2 Proporción poblacional

Una proporción poblacional, es la frecuencia relativa de los casos de interés en la población.

Se calcula con la siguiente fórmula:

(1.8)

en la cual,

es el total de todos los casos que corresponden a la clase éxitos. Es equivalente a sumar todos los unos que ocurren en la población, esto es,

luego,

como se aprecia, la fórmula de es la misma fórmula que la de la media aritmética poblacional.

C. A. Lluén Vallejos

Page 23: conceptos Basicos

23

Por ser el complemento de , que es el número de fracasos o ceros que ocurren en la población, entonces, para hallar la proporción de estos fracasos se debe utilizar la fórmula,

(1.9)

finalmente, como las dos clases son complementarias se verifica que,

Para fines de interpretación, la proporción debe ser expresada en forma porcentual.

1.4.2.3 Varianza de una variable cualitativa

La varianza de una variable cualitativa mide la variabilidad de los ceros y unos por arriba y por abajo de la proporción.

La fórmula de la varianza se deduce a partir de la fórmula de la varianza para una variable cuantitativa como sigue,

aquí,

La población debe ser grande a fin de garantizar la varianza .

Por tanto, la varianza para una variable modálica en la población es,

(1.10)

1.4.2.4 Desviación Estándar de una variable cualitativa

C. A. Lluén Vallejos

Page 24: conceptos Basicos

24 Conceptos Básicos de Estadística

La desviación estándar para una variable cualitativa, establece los límites de representatividad de la proporción poblacional.

Se calcula al hallar la raíz cuadrada de la varianza tal como sigue,

(1.11)

1.4.2.5 Coeficiente de variación de una variable cualitativa

El coeficiente de variación, determina el grado de variación de los unos y cero respecto de la proporción poblacional.

Equivalentemente, se puede interpretar como la variabilidad entre los unos y los ceros. La fórmula para determinar este coeficiente es,

(1.12)

Porcentualmente, se puede hallar mediante la fórmula,

(1.13)

donde,

Cuando el coeficiente de variación es del 0%, todos los datos serán iguales a uno.

Cuando el coeficiente de variación es del 50%, la mitad de todos los datos serán iguales a uno.

Cuando el coeficiente de variación es del 100%, todos los datos serán iguales a cero.

EJEMPLO N° 08

C. A. Lluén Vallejos

Page 25: conceptos Basicos

25

Ante una denuncia de que en la discoteca “Estrella Roja” dejan concurrir menores de edad, en una noche del mes pasado las autoridades municipales realizaron una inspección a fin de verificar si se está cumpliendo con la disposición de controlar que solo deben concurrir personas mayores de edad. De esta inspección se encontró que en la discoteca habían 60 personas y se anotó con el número “1” si la persona era menor de edad y con “0” si la persona era mayor de edad. Los datos se dan en la siguiente tabla:

Persona Edad Persona Edad1 1 31 12 1 32 03 0 33 14 0 34 05 0 35 06 0 36 07 1 37 18 1 38 19 0 39 110 1 40 111 1 41 112 0 42 013 1 43 114 1 44 115 1 45 016 1 46 017 0 47 018 0 48 119 0 49 020 1 50 021 1 51 022 0 52 023 0 53 124 1 54 125 0 55 126 0 56 127 0 57 128 0 58 029 1 59 130 0 60 1

Suponga que los datos corresponden a una población.

C. A. Lluén Vallejos

Page 26: conceptos Basicos

26 Conceptos Básicos de Estadística

A fin de practicar un manejo correcto de la simbología estadística se realizan las siguientes enunciaciones:

a) Represente y enuncie la variable de estudio.

b) Represente y enuncie los datos de la variable de estudio.

Represente, halle e interprete y en los casos que se pueda grafique las siguientes medidas poblacionales:

c) El promedio aritmético o proporción de menores de edad que estuvieron en la discoteca la noche de la inspección.

d) El total de menores de edad que estuvieron en la discoteca la noche de la inspección.

e) La varianza de los menores de edad.

f) La desviación estándar de los menores de edad que estuvieron en la discoteca la noche de la inspección.

g) El coeficiente de variación de los menores de edad que estuvieron en la discoteca la noche de la inspección.

SOLUCIÓN

i) Represente y enuncie la variable de estudio.

La variable es de tipo cualitativo dicótoma con las dos clases siguientes:

Menor de edad

Mayor de edad

se asignaran los números 1y 0, el uno para los éxitos “Menor de edad” y el cero para los fracasos “Mayor de edad”.

Luego la variable quedará definida como:

Clase de edad

ii) Represente y enuncie los datos de la variable de estudio.

Como la variable de estudio es , los datos para esta variable son definidos como sigue,

C. A. Lluén Vallejos

Page 27: conceptos Basicos

27

: Dato codificado como 0 o 1, de acuerdo a si la persona es mayor o menor de edad

por tanto,

donde:

iii) Represente, halle e interprete el promedio aritmético poblacional para la clase de menores de edad que estuvieron en la discoteca la noche de la inspección.

Como es una división entre la suma de todos los unos que representan a todos los menores de edad respecto del total de personas

en la población, será igual a una proporción, esto es, .

Del 100% de personas que estuvieron en la discoteca, el día de la inspección, el 50% fueron personas menores de edad.

iv) Represente, halle e interprete el total poblacional para la clase de menores de edad que estuvieron en la discoteca la noche de la inspección.

El total poblacional hace referencia al total de éxitos o de unos. Para el caso será, el total de menores de edad que estuvieron en la discoteca la

noche de la inspección. Este total es representado por .

menores de edad

C. A. Lluén Vallejos

Page 28: conceptos Basicos

28 Conceptos Básicos de Estadística

De las 60 personas que estuvieron en la discoteca, la noche de la inspección, 31 fueron personas menores de edad.

v) Represente, halle e interprete la varianza para la variable clase de personas que estuvieron en la discoteca la noche de la inspección.

Es la varianza para todos los datos, tanto de los ceros, como de los unos.

La variabilidad de las clases de personas es de 0.24972 .

vi) Represente, halle e interprete la desviación estándar para la variable clase de personas que estuvieron en la discoteca la noche de la inspección.

vii) Represente, halle e interprete el coeficiente de variación para la variable clase de personas que estuvieron en la discoteca la noche de la inspección.

El coeficiente de variación indica la variabilidad de ceros y unos que hubo respecto de la proporción de unos. También indica la variabilidad entre los ceros y unos.

C. A. Lluén Vallejos

Page 29: conceptos Basicos

……. ……

fk

1f

2f

3f

kf

29

Entre los 60 datos de ceros y unos hubo una variabilidad del 48%.

1.5. INDICADORES POBLACIONALES DE COMPARACION

A fin de realizar comparaciones entre grupos de población se pueden utilizar las siguientes medidas relativas: la proporción, la razón y la tasa.

1.5.1. Proporción

Una proporción es utilizada cuando se tiene una división de la población en clases o categorías. La proporción para cada una ellas se obtiene dividiendo la frecuencia de cada clase respecto del total de los casos así clasificados.

Cuando el resultado de este cociente se expresa multiplicado por cien, la proporción recibe el nombre de porcentaje.

La frecuencia relativa simple y la porcentual de las tablas de frecuencias corresponden al tipo de proporciones.

La fórmula para calcular la proporción es,

Pi=f i

fK

f =f 1 + f 2 + . . . +f k

donde,

fi : frecuencia del iésimo hecho para una población en observación en un período determinado.

C. A. Lluén Vallejos

Page 30: conceptos Basicos

B

A

2f

1f

30 Conceptos Básicos de Estadística

f : frecuencia total de los casos del mismo hecho en el período de observación y para la misma población.

K es en este caso 100%.

EJEMPLO N° 09

De 400 enfermos que se trataron con un medicamento, mejoraron notablemente 300 de ellos y el resto, no. Halle la proporción de enfermos según su mejoría.

Puesto que, f1 = 300, f2 = 100 donde f = 300 + 100 = 400 entonces,

P1 = (300/400) * 100 = 75 %

P2 = (100/400) * 100 = 25 %

En este caso se dice que del 100% de pacientes que se trataron con el medicamento, el 75% manifestaron una reacción favorable y el 25% no manifestaron esta mejoría.

1.5.2. Razón

Una razón es una medida relativa que relacionan las intensidades de dos hechos distintos en un mismo lugar, o bien de dos categorías distintas de un mismo fenómeno.

Sirve además para comparar, la frecuencia de ocurrencia de algún suceso demográfico en un período determinado de observación con respecto a la ocurrencia de otro suceso en el mismo o en otro período de observación. También es aplicado a la comparación entre lugares de ocurrencia en el mismo o en otros períodos de observación.

La razón la podemos calcular con la expresión,

R=f 1

f 2

K

donde,

f1 : frecuencia de ocurrencia del hecho (A) en un determinado lugar de observación

C. A. Lluén Vallejos

Page 31: conceptos Basicos

Población

1f

2f

31

f2 : " " " de otro hecho (B) en el mismo lugar de observación.

K : factor de amplificación, igual a 100%. Por ejemplo, si R=0 .15 , la cifra para K es 100 y por tanto R = 15%.

EJEMPLO N° 10

En la prueba de un cuestionario se ha determinado que, 275 encuestados cometieron errores por falta de respuesta y 400 encuestados cometieron errores en la respuesta. Halle la razón del número de encuestados que cometieron errores por falta de respuesta respecto del número de encuestados que cometieron errores en la respuesta..

SOLUCIÓN:

f1 = 275, f2 = 400 K = 100%

esta razón indica que, de cada 100 encuestados que cometieron errores en la respuesta, 69 cometieron errores por falta de respuesta.

1.5.3. Tasa y tipos de tasas

Una tasa es una medida relativa que relaciona la frecuencia absoluta del acaecimiento de un fenómeno con respecto al total de la población en que se generó el hecho mencionado en el numerador. Esta tasa es muy útil para comparar la ocurrencia de los hechos: entre lugares, a través del tiempo o para realizar comparaciones en el mismo grupo.

Una tasa tiene en general la fórmula de cálculo,

T=f 1

f 1+ f 2

K =f 1

NK = f ∗ K

f =f 1

N

C. A. Lluén Vallejos

N= f 1 + f 2

Page 32: conceptos Basicos

32 Conceptos Básicos de Estadística

f1 es la frecuencia de ocurrencia afectada por el hecho (A) durante un período de observación

f2 es el complemento de f1, es la frecuencia que no fue afectada por el hecho.

N = f1 + f2 es el número de individuos expuestas al riesgo del hecho durante el mismo período de observación

K : factor de amplificación, es una constante expresada en términos de individuos y que puede ser de 100 % (tanto por 100 individuos), 1000 /oo (tanto por 1,000 individuos), 10000 /ooo (tanto por 10,000 individuos), etc. El valor de K que multiplique a f debe ser un valor para convertirlo a entero. Por ejemplo, si f = 0.00015, la cifra para K debe ser 10,000 y por tanto la tasa es T = 15/ooo.

La tasa calculada para una población es una tasa bruta y las calculadas para partes de dicha población son tasas específicas.

EJEMPLO N° 11

Una población objetivo está formada por 10,234 personas adultas, de las cuales 560 tienen colesterol alto. Halle la tasa de pacientes que tienen colesterol alto en dicha población.

En la población se tiene que, de cada 1000 personas adultas, aproximadamente 55 tienen colesterol alto.

1.5.4. Medidas de distibución: Asimetría y Curtosis

Las medidas de distribución nos permiten identificar la forma y el grado de concentración de los datos alrededor de un punto central. Sus principales medidas son la Asimetría y la Curtosis. Previamente se da la siguiente definición:

a. Sesgo

El sesgo se da cuando los valores de una distribución de frecuencia no están distribuidos uniformemente. Las incidencias se concentran en los valores más bajos o en los más altos de la escala del eje horizontal de un sistema de coordenadas.

C. A. Lluén Vallejos

Page 33: conceptos Basicos

33

Un sesgo es un error que aparece en los resultados de un estudio debido a factores que dependen de la recogida, análisis, interpretación, publicación o revisión de los datos que pueden conducir a conclusiones que son sistemáticamente diferentes de la verdad o incorrectas acerca de los objetivos de una investigación. Este error puede ser sistemático o no, y es diferente al error aleatorio.

b. Asimetría

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes, cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría [ver figura siguiente]. Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

El Coeficiente de asimetría, se representa mediante la ecuación matemática,

Donde representa el coeficiente de asimetría de Fisher. Los resultados de esta ecuación se deben interpretar de acuerdo a las siguientes observaciones:

Si : Se acepta que la distribución es simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar

C. A. Lluén Vallejos

Page 34: conceptos Basicos

34 Conceptos Básicos de Estadística

los valores que son cercanos ya sean positivos o negativos (± 0.5). Esto es, se dice que una distribución de valores cuantitativos continuos tiene semejanza a la curva normal si su sesgo, calculado a través del método de momentos está comprendido en el intervalo siguiente:

.

Si : La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.

Si : La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.

Si mayor es el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media.

c. Curtosis

Esta medida determina el grado de concentración que presentan los datos en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de datos (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).

Para calcular el coeficiente de Curtosis se utiliza la ecuación:

Donde representa el coeficiente de Curtosis. Si el valor está

comprendido en el intervalo de el grado de apuntamiento es semejante a la curva normal.

C. A. Lluén Vallejos

Page 35: conceptos Basicos

35

Los resultados de esta fórmula se deben interpretar de acuerdo a las siguientes consideraciones:

 Si , la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil  encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.).

Si la distribución es Leptocúrtica

Si la distribución es PlaticúrticaCuando la distribución de los datos cuenta con un coeficiente de asimetría

y un coeficiente de Curtosis de , se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente.

Las fórmulas para hallar los momentos, , y se calculan como sigue:

EJEMPLO N° 12

De un lote de pescado jurel se ha tomado una muestra de 25 pescados a fin

de estimar la talla promedio. Las tallas para esta muestra son:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

31 26 19 26 25 32 23 31 30 19 26 35 35 29 33 30 35 27 25 33 23 21 28 26 19

Se podrá decir que la distribución de frecuencias para esta muestra tendrá

una simtería y una curtosis semejante que la distribución normal.

C. A. Lluén Vallejos

Page 36: conceptos Basicos

36 Conceptos Básicos de Estadística

SOLUCION

1 31 12.39 43.61 153.522 26 2.19 -3.24 4.803 19 71.91 -609.80 5171.114 26 2.19 -3.24 4.805 25 6.15 -15.25 37.836 32 20.43 92.35 417.407 23 20.07 -89.92 402.828 31 12.39 43.61 153.529 30 6.35 16.00 40.3310 19 71.91 -609.80 5171.1111 26 2.19 -3.24 4.8012 35 56.55 425.26 3197.9513 35 56.55 425.26 3197.9514 29 2.31 3.51 5.3415 33 30.47 168.20 928.4516 30 6.35 16.00 40.3317 35 56.55 425.26 3197.9518 27 0.23 -0.11 0.0519 25 6.15 -15.25 37.8320 33 30.47 168.20 928.4521 23 20.07 -89.92 402.8222 21 41.99 -272.10 1763.1923 28 0.27 0.14 0.0724 26 2.19 -3.24 4.8025 19 71.91 -609.80 5171.11

27.48 610.24 -497.51 30438.30

C. A. Lluén Vallejos

Page 37: conceptos Basicos

0 0.25 0.50 0.75

Evento no ocurre

1

Evento ocurreEvento puede o no ocurrir

37

Como el sesgo está comprendido en el intervalo , la distribución de las tallas de los 25 peces es semejante en simetría a la curva normal.

Como el grado de curtosis no está en el intervalo , no puede decirse que el grado de apuntamiento de la distribución de las tallas de los 25 pescados sea semejante al de la normal.

1.6. DISTRIBUCION DE PROBABILIDAD NORMAL GENERAL Y ESTANDAR

1.6.1 Definición de probabilidad

Una probabilidad es la medida relativa de la probable ocurrencia de un evento o suceso.

La probabilidad varía en una regla de cero a uno.

C. A. Lluén Vallejos

Page 38: conceptos Basicos

38 Conceptos Básicos de Estadística

Cuando la probabilidad se acera más a uno la probable ocurrencia del suceso es mayor. Por el contrario, cuanto más se acerca a cero el evento probablemente no ocurra. Si la probabilidad es cero el evento no ocurrirá y si la probabilidad es uno el evento ocurrirá.

En un caso cualitativo, la probabilidad del evento E se calcula con la formula siguiente:

Con el objetivo de interpretación la probabilidad debe ser expresada en forma porcentual.

EJEMPLO N° 13

Tres antenas A, B y C deben ser instaladas en los lugares P, Q y R. ¿Cuál es la probabilidad de tener una instalación con A en el lugar P y las restantes en cualquiera de los otros dos lugares?.

SOLUCIÓN:

El número total de maneras en instalar las tres antenas en los tres lugares es:

Todas las maneras de instalar las tres antenas se dan en la tabla siguiente:

P Q RA B CA C BB A CB C AC A BC B A

Sea E el evento de instalar la antena A en el lugar P.

Observando en la tabla, hay dos maneras,

C. A. Lluén Vallejos

Page 39: conceptos Basicos

39

P Q RA B CA C B

Por consiguiente,

o el 33.33%

La probabilidad de instalar la antena A en el lugar P y las restantes en cualquiera de los otros lugares es del 33.33%.

1.6.2 Distribución de probabilidad normal general

La distribución de frecuencias de los datos de una variable aleatoria

se ajusta a una distribución de probabilidad normal si, su histograma de frecuencias, está definido de acuerdo a la siguiente función de densidad de probabilidad normal,

definida en

con media y varianza, y .

Donde es la variable aleatoria, y son los parámetros de esta

distribución, y son puntos de inflexión.

La distribución normal general se usa para pronosticar las probabilidades de ocurrencia de los valores de una variable aleatoria normal.

C. A. Lluén Vallejos

Page 40: conceptos Basicos

40 Conceptos Básicos de Estadística

Por ser la variable normal una variable aleatoria continua, las probabilidades que se determinen serán áreas obtenidas mediante la

integración. Para hallar la probabilidad para el suceso se debe integrar a la función de probabilidad normal tal como se muestra a continuación,

Como la integración con la normal general presenta mucha dificultad, se recurre a realizar un cambio de variable, cambio que produce una variable que sigue una distribución normal estándar de media cero y varianza uno. Esta transformación es,

luego, la variable z tendrá la siguiente función de densidad,

1.6.2.1 Areas bajo la distribución normal estándar

Bajo la distribución normal general se pueden presentar los siguientes casos de probabilidades normales:

Entre , de un 100% de datos, el 68.27% de ellos están contenidos en este intervalo y el 31.73 están fuera del intervalo.

Entre , de un 100% de datos, el 95.45% de ellos están contenidos en este intervalo y el 4.55% están fuera del intervalo.

Entre , de un 100% de datos, el 99.73% de ellos están contenidos en este intervalo y el 0.23% está fuera del intervalo.

C. A. Lluén Vallejos

Page 41: conceptos Basicos

41

Una población de individuos con datos normales concentrará la mayor cantidad de ellos en la parte central y solo algunos de ellos en los extremos.

Algunos casos de estas poblaciones normales se encuentran en las fábricas de producción en donde se debe producir con exactitud y precisión, es decir, bajo un riguroso control de calidad. La producción de gaseosas de un litro es un claro ejemplo de población normal; en este proceso se desea que todas las gaseosas que se produzcan tengan un contenido promedio de 1 litro.

EJEMPLO N° 14

En una población de empleados de una institución educativa se ha determinado que el ingreso medio es de 1340 soles con una desviación estándar de 90 soles. Un nuevo empleado debe ser contratado para la institución, ¿cuál es la probabilidad de que gane menos de 1200 soles?.

SOLUCIÓN:

La probabilidad será hallada cuando se calcule la siguiente integral:

integral que será solucionada mediante la distribución normal estándar que se describe a continuación.

C. A. Lluén Vallejos

Page 42: conceptos Basicos

42 Conceptos Básicos de Estadística

1.6.2.2 Distribución de probabilidad normal estándar

La distribución de probabilidad normal estándar es la distribución normal

de media y varianza . Esta distribución de probabilidad es el estándar de comparación de todas las distribuciones normales generales que se puedan construir.

La distribución de probabilidad normal estándar fue construida a fin de facilitar el cálculo de las probabilidades normales generales y para este fin se tienen tablas de probabilidades. Como se dijo en el ítem anterior, el paso de la distribución normal general a la distribución normal estándar se realiza mediante la siguiente transformación de variables,

Por tanto, para hallar una probabilidad normal general mediante la normal estándar implicará realizar la integración siguiente,

Las probabilidades para este tipo de integraciones, ya se tienen en tablas, por lo tanto, para cualquier integración de este tipo se puede recurrir a estas tablas.

1.6.2.3 Areas bajo la distribución normal estándar

Bajo la distribución normal estándar se pueden presentar los siguientes casos de probabilidades normales:

Entre , de un 100% de datos el 68.27% de ellos están contenidos en este intervalo y el 31.73 están fuera del intervalo.

Entre , de un 100% de datos el 95.45% de ellos están contenidos en este intervalo y el 4.55% están fuera del intervalo.

Entre , de un 100% de datos el 99.73% de ellos están contenidos en este intervalo y el 0.23% está fuera del intervalo.

C. A. Lluén Vallejos

Page 43: conceptos Basicos

43

EJEMPLO N° 15

En una población de empleados de una institución educativa se ha determinado que el ingreso medio es de 1340 soles con una desviación estándar de 90 soles. Un nuevo empleado debe ser contratado para la institución, ¿cuál es la probabilidad de que gane menos de 1200 soles?.

SOLUCIÓN:

La probabilidad será hallada cuando se calcule la siguiente integral:

Estandarizando la variable se obtiene,

Esta probabilidad se puede interpretar como sigue:

C. A. Lluén Vallejos

Page 44: conceptos Basicos

44 Conceptos Básicos de Estadística

Hay una probabilidad de aproximadamente el 6% de que el nuevo empleado gane menos de 1200 soles.

1.7. DISTRIBUCION DE PROBABILIDAD DE LA MEDIA MUESTRAL

1.7.1. Número de muestras en una población de muestreo

Las unidades de muestreo de una población de tamaño N pueden ser seleccionadas al azar con o sin reemplazamiento.

El número de muestras de tamaño n, cuando el muestreo es sin reemplazamiento, se calcula con la fórmula:

El número de muestras de tamaño n, cuando el muestreo es con reemplazamiento, se calcula con la fórmula:

1.7.2. Distribución de probabilidad para la media de una muestra

Sean los datos para una población normal de individuos. De esta población se debe extraer una muestra aleatoria de datos

simbolizada como para construir la media de la muestra y así

estimar a la media de la población . Este propósito hace que se plantee la siguiente interrogante:

¿Cuál de las muestras aleatorias que se pueden formar en la población, será la muestra que sea seleccionada para realizar una buena estimación de la media poblacional?.

A fin de dar solución a esta interrogante, se ha planteado determinar, la distribución de probabilidad de las m medias muestrales, considerándolas a los valores de estas medias como los valores de una variable aleatoria que será denominada como variable aleatoria media muestral.

C. A. Lluén Vallejos

Page 45: conceptos Basicos

45

El principio que deriva esta idea es el siguiente:

De la población de tamaño N se pueden formar m muestras aleatorias de tamaño n. Si se construyen para las m muestras aleatorias sus intervalos de

confianza, una cantidad de intervalos contendrán en sus intervalos

a la media poblacional y una cantidad no la contendrán.

Una manera gráfica de ver este principio es,

En la gráfica se puede apreciar que cada media muestral tiene un intervalo de confianza y por ende debe tener una gráfica normal. Además se puede apreciar que hay intervalos que contienen a la media poblacional y otros que no contienen a esta media. Una de estas muestras cuyo intervalo contenga a la media poblacional será la muestra que se desea.

1.7.1.1 Función de probabilidad para la variable aleatoria media muestral

Sean las m medias muestrales que se pueden formar con los N

datos de la población.

Por el teorema central del límite, la variable media muestral sigue una

distribución de probabilidad normal de media y varianza , por consiguiente, la función de probabilidad estará dada por,

definida en

C. A. Lluén Vallejos

Page 46: conceptos Basicos

46 Conceptos Básicos de Estadística

1.7.1.2 Media aritmética y varianza de la media muestral

La media aritmética o el valor esperado de la media muestral estará dada por:

y la varianza para la media muestral será,

Esta fórmula cuando es demostrada proporciona dos fórmulas de varianza, una para poblaciones pequeñas y otra para poblaciones grandes, las cuales se dan a continuación,

para poblaciones pequeñas

para poblaciones grandes

la fórmula que permite hallar la varianza sin recurrir a todas las medias muestrales es,

El término es llamado factor de corrección por

población finita y el término es llamado fracción de muestreo. Este último término establece cuando una población debe ser considerada como grande. Esta fracción la propone el investigador, si la fracción está cercana

C. A. Lluén Vallejos

Page 47: conceptos Basicos

47

a cero puede ser considerada como población grande, en caso contrario será considerada como pequeña. Convencionalmente se utiliza una fracción de muestreo del 5%.

Si a cualquiera de estas varianzas, se le extrae la raíz cuadrada, se obtendrá el error estándar de la media muestral,

para poblaciones pequeñas

para poblaciones grandes

EJEMPLO N° 16

Supongamos que una población pequeña está formada por 6 comerciantes. En cierto día, estos comerciantes han realizado un gasto de 10, 14, 16, 8, 10, 12 soles, por el consumo de un refrigerio.

a) Halle todas las muestras aleatorias posibles sin reemplazamiento de

tamaño .

b) Halle el gasto medio realizado por los 6 comerciantes. (Media poblacional)

c) Halle la varianza del gasto realizado por los 6 comerciantes. (Varianza poblacional)

d) Halle la desviación estándar del gasto realizado por los 6 comerciantes. (Desviación estándar poblacional)

e) Halle los gastos medios para todas las muestras posibles.

f) Demuestre que la media aritmética de los gastos medios para todas las muestras posibles es igual al gasto medio realizado por las 6 comerciantes. (Valor esperado de la media muestral).

g) Halle la varianza de todos los gastos medios para todas las muestras posibles. (Varianza de la media muestral).

h) Halle el error estándar de todos los gastos medios para todas las muestras posibles. (Error estándar de la media muestral).

i) Construya los intervalos a un nivel del 95% de confianza para todas los gastos medios de todas las muestras.

j) ¿Cuántos intervalos a un nivel del 95%de confianza contienen a la media poblacional?.

C. A. Lluén Vallejos

Page 48: conceptos Basicos

48 Conceptos Básicos de Estadística

k) Halle los errores muestrales de cada muestra y verifique en qué muestras se cumple la condición de que el error muestral es menor que el máximo error de muestreo.

SOLUCIÓN:

a) El tamaño de la población es y todas las muestras tendrán

tamaño . El número de muestras aleatorias posibles sin reemplazamiento se hallará mediante la combinatoria siguiente,

muestras aleatorias

Las muestras aleatorias son,

Muestra Datos de la muestra1 10 14 162 10 14 83 10 14 104 10 14 125 10 16 86 10 16 107 10 16 128 10 8 109 10 8 1210 10 10 1211 14 16 812 14 16 1013 14 16 1214 14 8 1015 14 8 1216 14 10 1217 16 8 1018 16 8 1219 16 10 1220 8 10 12

b) Como los datos de la población son 10, 14, 16, 8, 10, 12, entonces la media poblacional es,

C. A. Lluén Vallejos

Page 49: conceptos Basicos

49

Los 6 comerciantes gastaron en cierto día un promedio de 11.67 soles por el consumo de un refrigerio.

c) La varianza poblacional para los gastos de los 6 comerciantes es,

Si se calcula la varianza con la fórmula para poblaciones grandes, la varianza para la población es,

d) La desviación estándar para el gasto de los 6 comerciantes es,

e) Las medias de los gastos para todas las muestras se dan en la siguiente tabla,

Muestra Datos de la muestraMedia

muestral1 10 14 16 13.332 10 14 8 10.673 10 14 10 11.334 10 14 12 12.005 10 16 8 11.33

C. A. Lluén Vallejos

Page 50: conceptos Basicos

50 Conceptos Básicos de Estadística

6 10 16 10 12.007 10 16 12 12.678 10 8 10 9.339 10 8 12 10.0010 10 10 12 10.6711 14 16 8 12.6712 14 16 10 13.3313 14 16 12 14.0014 14 8 10 10.6715 14 8 12 11.3316 14 10 12 12.0017 16 8 10 11.3318 16 8 12 12.0019 16 10 12 12.6720 8 10 12 10.00

Cada una de las medias muestrales fueron halladas con la fórmula de la media muestral, tal como se muestra para la primera media muestral,

f) Como se muestra a continuación, la media aritmética de los gastos medios para todas las muestras posibles es igual al gasto medio realizado por las 6 comerciantes,

g) Como se tiene una población pequeña, la varianza para la media muestral debe ser calculada mediante la fórmula,

C. A. Lluén Vallejos

Page 51: conceptos Basicos

51

sin recurrir a todas las medias muestrales, se obtiene la misma varianza,

También se puede demostrar que la media aritmética todas las

varianzas muestrales es igual a la varianza poblacional tal como se muestra a continuación,

Cada una de las varianzas muestrales fueron calculadas con la fórmula,

para la muestra 1, la varianza muestral es,

Los cálculos realizados para hallar las varianzas de todas las muestras posibles se dan en la siguiente tabla,

Muestra Datos de la muestra Varianza

C. A. Lluén Vallejos

Page 52: conceptos Basicos

52 Conceptos Básicos de Estadística

muestral1 10 14 16 9.332 10 14 8 9.333 10 14 10 5.334 10 14 12 4.005 10 16 8 17.336 10 16 10 12.007 10 16 12 9.338 10 8 10 1.339 10 8 12 4.0010 10 10 12 1.3311 14 16 8 17.3312 14 16 10 9.3313 14 16 12 4.0014 14 8 10 9.3315 14 8 12 9.3316 14 10 12 4.0017 16 8 10 17.3318 16 8 12 16.0019 16 10 12 9.3320 8 10 12 4.00

h) El error estándar de la media muestral es,

i) Los intervalos de confianza de cada muestra se dan en la tabla siguiente. Cada intervalo fue calculado para el caso de un error estándar con la fórmula,

el primer intervalo fue calculado como se muestra a continuación,

Muestra Datos de la muestra Media muestral

Intervalo de confianza de la

C. A. Lluén Vallejos

Page 53: conceptos Basicos

53

media de cada muestra

1 10 14 16 13.33 11.89 14.782 10 14 8 10.67 9.22 12.113 10 14 10 11.33 9.89 12.784 10 14 12 12.00 10.56 13.445 10 16 8 11.33 9.89 12.786 10 16 10 12.00 10.56 13.447 10 16 12 12.67 11.22 14.118 10 8 10 9.33 7.89 10.789 10 8 12 10.00 8.56 11.4410 10 10 12 10.67 9.22 12.1111 14 16 8 12.67 11.22 14.1112 14 16 10 13.33 11.89 14.7813 14 16 12 14.00 12.56 15.4414 14 8 10 10.67 9.22 12.1115 14 8 12 11.33 9.89 12.7816 14 10 12 12.00 10.56 13.4417 16 8 10 11.33 9.89 12.7818 16 8 12 12.00 10.56 13.4419 16 10 12 12.67 11.22 14.1120 8 10 12 10.00 8.56 11.44

j) Se puede contar en la tabla que del 100% de intervalos de confianza formados con todas las muestras posibles, 14 de ellas que representan al 70% de los intervalos, contienen a la media poblacional (muestras 2-7,10,11 y 14-19).

k) En la tabla siguiente se dan los errores muestrales para cada muestra, los cuales se han calculado con la fórmula,

el primer error muestral se halló de la manera siguiente,

para un error estándar, el máximo error de muestreo es,

C. A. Lluén Vallejos

Page 54: conceptos Basicos

54 Conceptos Básicos de Estadística

si se verifica que para toda

entonces, todas las muestras que tengan errores muestrales en valor absoluto menores que serán estimadores de la media poblacional y sus intervalos de confianza contendrán a la media poblacional. En la siguiente tabla se dan los cálculos,

Muestra Datos de la muestraMedia

muestral abs

Intervalo de confianza de la media de cada

muestra1 10 14 16 13.33 1.67 1.67 11.89 14.78 NO2 10 14 8 10.67 -1.00 1.00 9.22 12.11 SI3 10 14 10 11.33 -0.33 0.33 9.89 12.78 SI4 10 14 12 12.00 0.33 0.33 10.56 13.44 SI5 10 16 8 11.33 -0.33 0.33 9.89 12.78 SI6 10 16 10 12.00 0.33 0.33 10.56 13.44 SI7 10 16 12 12.67 1.00 1.00 11.22 14.11 SI8 10 8 10 9.33 -2.33 2.33 7.89 10.78 NO9 10 8 12 10.00 -1.67 1.67 8.56 11.44 NO10 10 10 12 10.67 -1.00 1.00 9.22 12.11 SI11 14 16 8 12.67 1.00 1.00 11.22 14.11 SI12 14 16 10 13.33 1.67 1.67 11.89 14.78 NO13 14 16 12 14.00 2.33 2.33 12.56 15.44 NO14 14 8 10 10.67 -1.00 1.00 9.22 12.11 SI15 14 8 12 11.33 -0.33 0.33 9.89 12.78 SI16 14 10 12 12.00 0.33 0.33 10.56 13.44 SI17 16 8 10 11.33 -0.33 0.33 9.89 12.78 SI18 16 8 12 12.00 0.33 0.33 10.56 13.44 SI19 16 10 12 12.67 1.00 1.00 11.22 14.11 SI20 8 10 12 10.00 -1.67 1.67 8.56 11.44 NO

Se puede apreciar en la tabla que los estimadores cuyos errores muestrales son menores que el máximo error muestral, contienen al parámetro. Las muestras que contienen a la media poblacional son las muestras 2-7, 10, 11 y 14-19. Este resultado coincide con la alternativa i).

1.7.3. Distribución de probabilidad de la proporción muestral

Dada una población de muestreo de unidades muestrales en las cuales se estudia una variable aleatoria cualitativa se pueden formar muestras

C. A. Lluén Vallejos

Page 55: conceptos Basicos

55

aleatorias y consiguientemente se pueden calcular proporciones muestrales.

Por la ley de los grandes números, la distribución de probabilidad de la proporción muestral es la distribución de probabilidad normal con media

y varianza , cuya función de probabilidad normal es,

definida en

Como la varianza de la proporción muestral no tiene un estimador insesgado, entonces, a continuación se harán operaciones para expresarla en relación a un estimador insesgado.

Haciendo uso de la relación,

entonces,

simplificando y cambiando la simbología, se obtiene la varianza para la proporción muestral en relación a la varianza que tiene un estimador insesgado,

C. A. Lluén Vallejos

Page 56: conceptos Basicos

56 Conceptos Básicos de Estadística

Como el estimador insesgado de es , entonces, el estimador de

es , por tanto,

y como

entonces, la estimación insesgada de la varianza de la proporción muestral es,

En la gráfica se visualiza una probable distribución de 6 proporciones muestrales alrededor de la proporción poblacional. Estas proporciones muestrales están distribuidas alrededor de la proporción poblacional, una cercanas y otras alejadas; las cercanas serán buenas estimadoras y las alejadas no. En tal sentido, como la estimación debe realizarse con una sola muestra, el objetivo será determinar esta muestra.

C. A. Lluén Vallejos

Page 57: conceptos Basicos

57

Los intervalos para las proporciones muestrales contienen a la proporción poblacional, por lo tanto, estas proporciones son buenos estimadores de la proporción poblacional. El intervalo que no contiene a la

proporción poblacional es el que corresponde a la proporción muestral , por lo cual, este no es un buen estimador de la proporción poblacional.

Podemos apreciar además que los intervalos de confianza para las proporciones muestrales están garantizando la estimación bajo el nivel de

probabilidad .

A continuación se da un ejemplo para explicar esta distribución.

EJEMPLO N° 17

C. A. Lluén Vallejos

Page 58: conceptos Basicos

58 Conceptos Básicos de Estadística

Una población pequeña estuvo formada por 6 familias. A la pregunta hecha a alguno de los miembros respecto de si en la familia hay por lo menos una hija, se obtuvieron los siguientes datos:

Familia 1 2 3 4 5 6Respuesta SI NO SI NO NO SI

1 0 1 0 0 1

donde la variable de estudio es , y los datos para esta variable son definidos como sigue,

: Dato codificado como 0 o 1, de acuerdo a la respuesta que da algún miembro de la familia respecto de si en la familia hay por lo menos una hija.

La varianza poblacional para la variable está dada por la fórmula,

la varianza para la proporción muestral es,

la varianza para las proporciones muestrales se calcula con la fórmula,

A fin de analizar como una proporción muestral estima a la proporción poblacional, se plantean los siguientes ejercicios.

a) Halle las proporciones muestrales para todas las muestras aleatorias

posibles sin reemplazamiento de tamaño .

C. A. Lluén Vallejos

Page 59: conceptos Basicos

59

muestras aleatorias

Las 15 posibles muestras aleatorias sin reemplazo de tamaño 4 que se pueden formar con las 6 respuestas que dan las familias, el número de éxitos en las muestras y las proporciones muestrales para las 15 muestras aleatorias, se dan en la siguiente tabla,

Muestra Datos de las muestras

1 1 0 1 0 2 0.502 1 0 1 0 2 0.503 1 0 1 1 3 0.754 1 0 0 0 1 0.255 1 0 0 1 2 0.506 1 0 0 1 2 0.507 1 1 0 0 2 0.508 1 1 0 1 3 0.759 1 1 0 1 3 0.7510 1 0 0 1 2 0.5011 0 1 0 0 1 0.2512 0 1 0 1 2 0.5013 0 1 0 1 2 0.5014 0 0 0 1 1 0.2515 1 0 0 1 2 0.50

b) Halle la proporción poblacional de familias que tienen por lo menos una hija.

familias que tienen por lo menos una hija

familias que tienen por lo menos una hija

o el 50%

El 50% de las familias en la población tienen por lo menos una hija.

c) Halle la varianza para la variable .

C. A. Lluén Vallejos

Page 60: conceptos Basicos

60 Conceptos Básicos de Estadística

d) Halle la varianza para la proporción muestral utilizando la fórmula simplificada y la distribución de las proporciones muestrales.

En la siguiente tabla se dan los cálculos,

Familia Muestra

1 1 0 1 0 2 0.50 0.0002 1 0 1 0 2 0.50 0.0003 1 0 1 1 3 0.75 0.0634 1 0 0 0 1 0.25 0.0635 1 0 0 1 2 0.50 0.0006 1 0 0 1 2 0.50 0.0007 1 1 0 0 2 0.50 0.0008 1 1 0 1 3 0.75 0.0639 1 1 0 1 3 0.75 0.063

10 1 0 0 1 2 0.50 0.00011 0 1 0 0 1 0.25 0.06312 0 1 0 1 2 0.50 0.00013 0 1 0 1 2 0.50 0.00014 0 0 0 1 1 0.25 0.06315 1 0 0 1 2 0.50 0.000

7.50 0.375

como,

entonces,

C. A. Lluén Vallejos

Page 61: conceptos Basicos

61

e) Halle la desviación estándar poblacional

f) Halle el error estándar de la proporción muestral

g) Demuestre que la media aritmética o valor esperado de las 15 proporciones muestrales es igual a la proporción poblacional.

por tanto, .

h) Construya los intervalos de confianza para todas las proporciones muestrales a un nivel del 95% de confianza.

Los límites para los intervalos de confianza se dan en la tabla,

Familia Muestra1 1 0 1 0 2 0.50 0.19 0.812 1 0 1 0 2 0.50 0.19 0.813 1 0 1 1 3 0.75 0.44 1.064 1 0 0 0 1 0.25 -0.06 0.565 1 0 0 1 2 0.50 0.19 0.816 1 0 0 1 2 0.50 0.19 0.817 1 1 0 0 2 0.50 0.19 0.818 1 1 0 1 3 0.75 0.44 1.069 1 1 0 1 3 0.75 0.44 1.06

10 1 0 0 1 2 0.50 0.19 0.8111 0 1 0 0 1 0.25 -0.06 0.5612 0 1 0 1 2 0.50 0.19 0.8113 0 1 0 1 2 0.50 0.19 0.8114 0 0 0 1 1 0.25 -0.06 0.56

C. A. Lluén Vallejos

Page 62: conceptos Basicos

62 Conceptos Básicos de Estadística

15 1 0 0 1 2 0.50 0.19 0.81

i) ¿Cuántos intervalos de confianza contienen a la proporción poblacional?.

El 100% de intervalos de confianza contienen a la proporción poblacional.

j) Halle los errores muestrales de cada muestra y verifique en qué muestras se cumple la condición de que el error muestral es menor que el máximo error de muestreo dado por

.

Familia Muestra1 1 0 1 0 2 0.50 0.002 1 0 1 0 2 0.50 0.003 1 0 1 1 3 0.75 0.254 1 0 0 0 1 0.25 0.255 1 0 0 1 2 0.50 0.006 1 0 0 1 2 0.50 0.007 1 1 0 0 2 0.50 0.008 1 1 0 1 3 0.75 0.259 1 1 0 1 3 0.75 0.2510 1 0 0 1 2 0.50 0.0011 0 1 0 0 1 0.25 0.2512 0 1 0 1 2 0.50 0.0013 0 1 0 1 2 0.50 0.0014 0 0 0 1 1 0.25 0.2515 1 0 0 1 2 0.50 0.00

Todos los errores muestrales , verifican que . Cualquiera de estas muestras da una proporción muestral que estima a la proporción poblacional.

1.8. ELEMENTOS DE LA INFERENCIA ESTADISTICA

C. A. Lluén Vallejos

Page 63: conceptos Basicos

63

1.8.1. Definición de inferencia estadística

La inferencia estadística es el proceso a través del cual se extraen conclusiones relativas a una población a partir de una muestra.

La expresión de inferencia se utiliza también para designar su resultado y la rama de la estadística que se ocupa de ella. Se basa en el uso de estadísticos cuya distribución en el muestreo se conoce.

1.8.2. Parámetro

Un parámetro es un valor generalmente desconocido que sintetiza y resume

el comportamiento de los N datos de la variable de estudio.

Cualquiera que sea el parámetro se le simboliza por .

Como el parámetro es un valor calculado con los datos de todos los individuos que conforman la población, por tal razón se dice que es una función de estos datos. Simbólicamente se expresa como,

Los parámetros son clasificados como: Parámetros de resumen, parámetros de variabilidad, parámetros de asimetría y parámetros de apuntamiento. Entre los parámetros de resumen se tiene a: la media aritmética poblacional

y la proporción poblacional .

Entre los parámetros de variabilidad se tiene a: la varianza , la

desviación estándar y el coeficiente de variación .

1.8.3. Estimador

Un estimador es calculado con los datos de una muestra y con ellos se tiene el propósito de estimar al parámetro. Un estimador

cualesquiera que sea, se simboliza como .

Ya que el estimador es calculado con los datos de la muestra se dice que es una función de estos datos y se expresa simbólicamente como sigue,

A cada uno de los parámetros de la población le corresponde respectivamente un estimador. Así tenemos que:

C. A. Lluén Vallejos

Page 64: conceptos Basicos

64 Conceptos Básicos de Estadística

, donde,

.

.

cuando la muestra es extraída de una población pequeña

cuando la muestra es extraída de una población pequeña

La varianza muestral para el caso de una variable cualitativa

EJEMPLO N° 18

En una investigación se desea determinar cuál es el gasto medio realizado en alimentación en cada una de las familias de una ciudad. Dado que las condiciones económicas no lo permiten debe realizarse la investigación mediante el muestreo.

Por tanto,

C. A. Lluén Vallejos

Page 65: conceptos Basicos

65

El parámetro será el gasto medio realizado en alimentación en cada una de las familias de la ciudad.

El estimador será el gasto medio realizado en alimentación en cada una de las familias de una muestra de la ciudad

1.8.4. Tipos de estimadores

Un parámetro cuyo valor es desconocido puede ser estimado de dos formas: mediante una estimación puntual o mediante una estimación de intervalo.

Una estimación puntual es el proceso de obtener el estimador cuyo valor muestral está destinado a “coincidir” con el verdadero valor de la población

.

Por tanto, un estimador es el mismo valor del estimador y su valor numérico es único en la escala real. El problema que presenta una estimación puntual para considerarlo como estimador es que no hay ninguna garantía de aceptarlo que sea igual o aproximadamente igual al valor del parámetro.

Una estimación de intervalo es el proceso de construir un intervalo para

dentro del cual bajo cierta probabilidad de confianza podemos esperar

que esté el parámetro.

Una estimación de intervalo bilateral para el parámetro está dada por,

este intervalo es garantizado bajo el cálculo de probabilidades mediante la

probabilidad de confianza de que el parámetro esté contenido entre los dos límites del intervalo. Simbólicamente es expresado como:

EJEMPLO N° 19

Hallar el estimador puntual y de intervalo de la media aritmética poblacional.

C. A. Lluén Vallejos

Page 66: conceptos Basicos

66 Conceptos Básicos de Estadística

SOLUCIÓN:

El estimador puntual de la media aritmética poblacional es la media

aritmética muestral, esto es, es estimador de .

El estimador de intervalo de la media aritmética poblacional es el intervalo para la media aritmética muestral.

Como un intervalo de confianza del parámetro debe ser garantizado

bajo una probabilidad de confianza, el intervalo es deducido de la

siguiente expresión,

luego, el intervalo de confianza del estimador es,

y si la media muestral es estimador de la media poblacional, entonces,

el estimador de intervalo de la media poblacional es,

1.8.5. Propiedades de los estimadores

Todo estimador debe gozar de las propiedades de insesgamiento, consistencia, suficiencia y eficiencia.

1.8.5.1 Insesgamiento

Un estimador es insesgado de un parámetro cuando la media aritmética de las medias para todas las muestras posibles de igual tamaño que se pueden formar en la población, es igual a la media poblacional.

En símbolos es igual a:

Dos interpretaciones para esta propiedad son:

C. A. Lluén Vallejos

Page 67: conceptos Basicos

67

Obtenidos los datos para una muestra y la media de esta muestra se espera que, los datos de esta muestra sean coincidentes a la media de la muestra y esta última coincidente a la media poblacional.

Dada la población de datos con ellos se pueden formar

muestras de datos de tamaño n y por tanto m medias muestrales. La media de todas estas medias debe ser igual a la media

poblacional .

1.8.5.2 Consistencia

Se dice que un estimador es consistente si a medida que el tamaño de muestra aumenta se aproxima cada vez más a la media aritmética poblacional.

En este caso se verificará que,

Podemos deducir que cuando n = N, el error muestral es cero y la probabilidad de que el estimador es igual al parámetro, es 1.

1.8.5.3 Eficiencia

Un estimador es eficiente si tiene la capacidad de una buena estimación del parámetro. Respecto de cualquier otro estimador proporcionará una varianza menor.

En lo que respecta a la eficiencia, un estimador debe tratarse

comparativamente con otro, esto es, si y son estimadores insesgados

de diferentes, con varianza y respectivamente, y si

, entonces será el mejor estimador conocido como estimador de varianza mínima.

1.8.5.4 Suficiencia

Un estimador es suficiente si y sólo si, este estimador, él solo, es una función de todos los valores de la muestra. Es decir, en su fórmula de cálculo incluye a todos los valores de la muestra.

C. A. Lluén Vallejos

Page 68: conceptos Basicos

68 Conceptos Básicos de Estadística

Matemáticamente se puede demostrar que un estimador es suficiente si, la función de densidad de probabilidad conjunta de la muestra, puede descomponerse como sigue,

1.8.6. Error de muestreo y máximo error de muestreo

El valor del parámetro solo es posible obtenerlo cuando es realizado un censo. Como el censo es costoso de realizarlo y se pueden agregar otros factores más como por ejemplo, el económico, el tamaño de la población, etc., por tanto, el valor del parámetro será desconocido. Ante estos

impedimentos debe hallarse un estimador mediante una muestra.

Como difícilmente el estimador será igual al parámetro, se obtendrá una diferencia entre estos dos valores, a esta diferencia se conoce como error de muestreo y se simboliza como , luego,

Algunas consecuencias que se pueden apreciar en el error de muestreo son:

El error de muestreo pueden tener signo negativo o positivo.

Esta primera consecuencia de los signos se produce cuando el estimador subestima o sobreestima al parámetro, es decir, el estimador puede estar a la izquierda o a la derecha del parámetro. En el primer caso, el error es negativo y en el segundo es positivo.

El error de muestreo puede ser pequeño o grande.

La segunda consecuencia se da cuando el estimador se acerca o se aleja del parámetro. A fin de establecer cuándo un estimador es bueno o malo en la estimación, se debe proponer un máximo error de muestreo

, equidistante por abajo o por arriba del estimador para formar un intervalo, el propósito es contener al parámetro.

Como conclusión se puede decir lo siguiente,

Un error de muestreo para una muestra aleatoria cualquiera, es la diferencia

entre el estimador y el parámetro. Se simboliza como

C. A. Lluén Vallejos

Page 69: conceptos Basicos

69

Un máximo error de muestreo es un error de muestreo propuesto por el investigador y con el cual se pretende aceptar a una muestra para hallar el estimador del parámetro. Se simboliza como E.Una muestra determinada es aceptable cuando su error de muestreo es menor que el máximo error propuesto.

Cuando se utiliza el estimador , para estimar al parámetro , se pueden presentar los siguientes casos:

a) Que el estimador sea igual al parámetro , esto es, .

b) Que el estimador sea menor que el parámetro , es decir, .

c) Que el estimador sea mayor que el parámetro , esto es, .

Como el estimador es calculado de una determinada muestra de tamaño n, seleccionada de entre todas las m muestras posibles que se pueden formar con los N individuos de la población, por tanto, se podrán formar m

estimadores .

De todos ellos, unos estarán muy cercanos a por arriba y por abajo y

otros estarán de la misma manera muy alejados de por arriba y por abajo. Ante esta distribución de los estimadores por arriba y por abajo del

parámetro , se desprende la siguiente pregunta,

¿Cuál debe ser la amplitud de aceptación para aceptar que una muestra cualquiera, sea una buena estimación del parámetro?.

La respuesta razonable y conveniente para responder a esta pregunta es la de utilizar la amplitud que esté en relación con la variabilidad de los estimadores conocida como máximo error de muestreo.

Esta amplitud está dada por la siguiente expresión:

Sí el estimador, sigue una distribución normal, se tendrá la siguiente gráfica,

C. A. Lluén Vallejos

Page 70: conceptos Basicos

70 Conceptos Básicos de Estadística

Como cada muestra tiene un error de muestreo simbolizado como ,

entonces, todas las muestras que cumplan el requisito, serán las mejores muestras.

Se puede deducir de los gráficos, que cuanto más pequeño sea el error muestral el estimador estará más cerca del parámetro. Si el error muestral es cada vez más grande, el estimador se alejará del parámetro e irá perdiendo su capacidad de buen estimador.

Cualquier tamaño de muestra es justificable si el error muestral obtenido de ella es menor que el máximo error de muestreo; en caso contrario, será necesario incrementar elementos a la muestra hasta que cumpla tal condición.

1.8.7. Probabilidad de aceptación y de significación del estimador

La probabilidad de aceptación o nivel de aceptación, es la probabilidad que mide el grado de seguridad o confianza de que el parámetro esté contenido

en el intervalo de confianza del estimador. Se simboliza como .

La probabilidad de rechazo o nivel de rechazo, es la probabilidad de que el parámetro no esté contenido en el intervalo de confianza del estimador. Se simboliza como .Para esto es necesario descomponer el área total de la distribución de probabilidad del estimador, que en este caso suponemos que es normal, en dos regiones una y una ß.

En un caso de intervalo bilateral, a la región se la conoce como nivel de significación o significancia y a la región ß como nivel de confianza. Ambas suman 1. Para su interpretación tanto como ß son expresados en tanto por ciento.

ß + = 1 ==> ß = 1 -

100 ß + 100 = 100 ==> 100 ß = 100 - 100

C. A. Lluén Vallejos

Page 71: conceptos Basicos

71

El nivel de confianza , es la probabilidad de que el intervalo de confianza del estimador contenga al parámetro. Para el caso de distribuciones de probabilidad simétricas como es el caso de la Normal o T-Student, este nivel en forma de ecuación se expresa como:

Un valor del 95% quiere decir que de 100 posibilidades, en 95 de ellas la muestra proporciona un error de muestreo menor o igual al máximo error de muestreo. En forma equivalente se puede decir que de 100 posibilidades, hay 95 posibilidades de que el intervalo para la muestra con la cual se construyó el intervalo, contiene al parámetro.

El nivel de significación , es la probabilidad de que el parámetro no esté contenido en el intervalo de confianza del estimador. Su ecuación es,

Un nivel del 5% quiere decir que de 100 posibilidades, en 5 de ellas la muestra proporciona un error de muestreo mayor al máximo error de muestreo. En forma equivalente se puede decir que de 100 posibilidades, hay 5 posibilidades de que el parámetro no estará contenido en el intervalo del estimador.

Para el caso de un intervalo al extremo izquierdo:

C. A. Lluén Vallejos

Page 72: conceptos Basicos

72 Conceptos Básicos de Estadística

Para el caso de un intervalo al extremo derecho

1.8.8. Definición de muestreo

El muestreo, es una rama de la estadística matemática que tiene por finalidad proporcionar métodos que incluyen en ellos, los esquemas de formación de las poblaciones, las fórmulas para determinar el tamaño de muestra, el proceso para seleccionar cada uno de los elementos de dicha muestra y métodos para realizar la construcción de los estimadores que sirvan para inferir a la población.

En los estudios con poblaciones que justifiquen ser grandes y su costo de toma de datos sea costosa es preferible recurrir a tomar una muestra de la población.

Si estos están basados en la teoría de probabilidades el muestreo es llamado muestreo probabilístico y si no están basados en las probabilidades es denominado muestreo no probabilístico.

1.8.8.1 Muestreo no aleatorio o no probabilístico

El muestreo no aleatorio o no probabilístico, es una clase de muestreo en donde no se puede asignar objetivamente probabilidades a los elementos de la población y por lo tanto, no es posible determinar la precisión de los resultados muestrales en términos de probabilidad.

C. A. Lluén Vallejos

Page 73: conceptos Basicos

73

Los valores que se obtengan, sólo harán referencia a la representatividad de la muestra que se esté estudiando. Entre los tipos de muestreos no aleatorios comúnmente usados se tiene al: muestreo de criterio, muestreo basado en el acaso, muestreo por cuotas y al muestreo de cuestionarios a distancia.

El muestreo de criterio, intencional o de juicio, es el proceso de selección de los elementos de la muestra de acuerdo al "juicio humano".

Sin embargo, este muestreo tiene sus restricciones por ejemplo que la persona que selecciona la muestra debe ser "un experto" y que la uniformidad de los elementos así como el tamaño de la muestra debe justificar la importancia del estudio. Se trata de alguna manera de que la muestra dé una idea de lo que ocurre en la población. "El experto" por lo tanto, según su juicio, decidirá si los elementos poseen o no los atributos de estudio y sean representativos de la población para incluirlos en la muestra. Este muestreo se podrá utilizar en los casos en que el costo o el tiempo disponible hacen necesario que la muestra sea de tamaño muy pequeño, en los sondeos previos a la obtención de muestras probabilísticas o en estudios de poca precisión.

El muestreo basado en el acaso, es el proceso de selección de elementos que por su fácil acceso y que por circunstancias casuales se encuentran cerca o están muy al alcance de la persona en el ámbito de estudio.

Una muestra basada en el acaso ocasionará poco esfuerzo y será de bajo costo. Sin embargo, este muestreo tiende a ser de menos precisión que el "muestreo de juicio" pues, no es necesario "un experto", la justificación de un tamaño de muestra adecuado ni que los elementos seleccionados presenten uniformidad. La muestra no será representativa de la población. Este proceso es útil para obtener ideas, opiniones, mediciones, etc. que pueden servir para el diseño de cuestionarios.

El muestreo por cuotas, es un muestreo que trata de controlar los posibles sesgos que pueden surgir al utilizar un muestreo no aleatorio.

Para la realización de este muestreo hay que dividir a la población en estratos y establecer cuál será la cuota de elementos que hay que asignar a cada estrato. Luego, cada estrato debe ser tratado independientemente como un muestreo "de juicio" pero sin salirse de los objetivos del estudio. Un tamaño de muestra proporcional al tamaño del estrato sería la cuota

C. A. Lluén Vallejos

Page 74: conceptos Basicos

74 Conceptos Básicos de Estadística

recomendable dada la importancia que puede tener un estrato en la población. Aun cuando el muestreo puede ser dirigido por "un experto" y un número de encuestadores igual al número de estratos, es recomendable que en cada estrato se tenga a "un experto".

El muestreo por cuestionarios a distancia, es un muestreo en donde los elementos integrantes de la muestra son desconocidos y escogidos por ejemplo de un directorio telefónico y luego entrevistados a distancia mediante un cuestionario de preguntas.

Su uso presenta mucho sesgo pues, se desconoce si los elementos que fueron entrevistados presentan una uniformidad respecto al atributo de estudio. Son usados para realizar encuestas sobre la preferencia de artículos, opiniones, etc. Algunas desventajas de su uso son: la entrega y devolución del cuestionario implican un mayor costo que las entrevistas realizadas por el encuestador, un retardo en la devolución de los cuestionarios retardan el proceso de los datos, los cuestionarios pueden ser llenados con facilidad por una persona ajena a la entrevista, etc.

El muestreo de bola de nieve, difiere del anterior en que las unidades muestrales van escogiéndose a partir de las referencias aportadas por los sujetos a los que ya se ha accedido. A su vez los nuevos casos identifican a otros individuos en su misma situación y la muestra va aumentando como una bola de nieve.

Es de gran utilidad cuando se carece de un marco de muestreo que recoja a la población de interés, especialmente en poblaciones que son difíciles de identificar y localizar.

1.8.8.2 Muestreo aleatorio o probabilístico

El muestreo aleatorio o probabilístico, es el proceso de muestreo en donde cada elemento de la población tiene una probabilidad perfectamente conocida de ser incluida en la muestra.

Sólo una muestra aleatoria proporcionará estimaciones con medida de su precisión o error de muestreo. A este tipo de muestreo se le denomina comúnmente como "Muestreo Estadístico".

Entre los tipos de muestra aleatoria se tienen a la muestra aleatoria simple, la muestra aleatoria estratificada, la muestra aleatoria polietápica de

C. A. Lluén Vallejos

Page 75: conceptos Basicos

75

conglomerados y una muestra pseudo aleatoria que es la muestra sistemática.

En una muestra aleatoria simple, las unidades de análisis deben tener cierto grado de homogeneidad y para el proceso de escogerlas cada una de ellas debe tener la misma probabilidad de ser seleccionada. Que tengan la misma probabilidad implica que ninguna de ellas debe tener más de una oportunidad de ser escogida. Si son 20 las unidades de la población y se van a seleccionarlas mediante balotas, cada una de ellas debe tener una balota y en total deben haber 20 balotas. Si hay 21 balotas alguna de ella tendrá una balota más que todas las demás y con ello una oportunidad más de ser escogida.

En una muestra aleatoria estratificada, la población total es dividida en estratos o subpoblaciones y cada estrato debe estar agrupado por todas las unidades de análisis de acuerdo a cierta homogeneidad tomando el criterio principal de homogeneizarlas por la variable principal de estudio, si no es posible, debe considerarse algún indicador o alguna variable muy relacionada con la variable de estudio. Por ejemplo, si la variable de estudio es el gasto total por familia, la variable de estratificación puede ser la misma variable o la variable gasto en alimentación. Otra de las características de esta muestra es que entre las unidades de los estratos debe existir heterogeneidad. Luego del proceso de estratificación, se toma una muestra aleatoria simple de cada estrato. La muestra total estratificada será la suma de todos los tamaños de muestra de los estratos. Este tipo de muestra es más precisa que la muestra aleatoria simple.

Un esquema de una estratificación de una población para indagar sobre la opinión de los pobladores mayores de edad respecto de la preferencia actual del Presidente de la República es la siguiente:

POBLACION DE PERSONAS EN UNA CIUDAD

ESTRATO 1 ESTRATO 2 ESTRATO 3

PERSONAS DE CLASE SOCIAL BAJA

Pueblos Jóvenes y Asentamientos Humanos

PERSONAS DE CLASE SOCIAL MEDIA

Lugares céntricos de la ciudad

PERSONAS DE CLASE SOCIAL ALTA

Urbanizaciones residenciales

C. A. Lluén Vallejos

Page 76: conceptos Basicos

1

2

3

4

5Punto de arranque

N

N-1

76 Conceptos Básicos de Estadística

Las personas dentro de cada estrato tienen similares condiciones de vida pero entre estratos son marcadamente diferentes.

En una muestra sistemática, pseudo aleatoria, las unidades de análisis de la población son tomadas sistemáticamente, cada tramo k. Para la selección, las unidades de la población son enumeradas desde 1 hasta la N y partiendo desde un punto conocido como punto de arranque r, son tomadas sistemáticamente hasta completar el tamaño de muestra, si se llega a N se comienza nuevamente desde 1, este proceso es conocido como selección circular. La única unidad de análisis que es aleatoria en esta muestra es la unidad para el punto de arranque que es la primera unidad de la muestra.

El esquema para esta selección es el siguiente:

Imaginariamente las unidades de análisis son dispuestas en cada posición del círculo (de 1 a N) si k = 2 es el tramo de recorrido y al azar resultó que la quinta unidad de la población (r = 5) es la primera de la muestra, entonces, la segunda será la que ocupe la posición sétima, la tercera la que ocupe la novena y así sucesivamente hasta completar la última unidad de la muestra.

En una muestra aleatoria de conglomerados, los elementos de la población son conglomerados y estos son construidos mediante el agrupamiento de las unidades de análisis sin ningún criterio de homogeneización. El agrupamiento por la disposición física o natural de las unidades de análisis puede ser suficiente, por ejemplo, las viviendas de una ciudad pueden ser conglomeradas según las calles, los árboles según ciertas áreas o la rivera del Lago Titicaca por algún criterio técnico de distancia a partir de donde empieza la rivera hacia adentro.

C. A. Lluén Vallejos

Page 77: conceptos Basicos

POBLACION

CONGLOMERADO 1

SUB CONGLOMERADO 1

SUB CONGLOMERADO 2

SUB SUB CONGLOMERADO 1

SUB SUB CONGLOMERADO 2

SUB SUB CONGLOMERADO 1

SUB SUB CONGLOMERADO 2

CONGLOMERADO 2

SUB CONGLOMERADO 1

SUB CONGLOMERADO 2

SUB SUB CONGLOMERADO 1

SUB SUB CONGLOMERADO 2

SUB SUB CONGLOMERADO 1

SUB SUB CONGLOMERADO 2

77

Con esta técnica del muestreo aleatorio de conglomerados se puede dar lugar a un anidamiento de muestras de conglomerados, es decir, una población puede ser dividida en conglomerados, cada conglomerado de esta división primera puede a su vez ser dividido en conglomerados y cada uno de estos conglomerados de la segunda división a su vez puede ser dividido en conglomerados y así sucesivamente hasta llegar al conglomerado que contiene a la unidad de análisis. Como se puede entender la unidad de análisis se encuentra en el conglomerado de la última etapa de conglomeración y para llegar a ella hay que seguir un proceso de muestreo polietápico o de muestras sucesivas de conglomerados.

En el siguiente esquema se puede apreciar que las unidades de la población son agrupadas en conglomerados, los conglomerados son divididos en sub conglomerados y por último estos sub conglomerados son divididos en sub sub conglomerados. Para llegar a la muestra de unidades de análisis que van a conformar la muestra de estudio debe seguirse el siguiente proceso:

1) En la primera etapa se escoge una muestra de conglomerados.

2) En la segunda etapa se toma una muestra de sub conglomerados de cada uno de los conglomerados de la muestra de conglomerados.

3) En la tercera etapa hay que tomar una muestra de sub sub conglomerados de cada uno de los sub conglomerados de la muestra de conglomerados.

4) Hay una cuarta etapa si se toman muestras aleatorias de unidades de los sub sub conglomerados elegidos. Si se toma a todas las unidades solamente hay 3 etapas.

C. A. Lluén Vallejos

Page 78: conceptos Basicos

78 Conceptos Básicos de Estadística

Un ejemplo de este muestreo polietápico es el siguiente: Como es conocido, los estudiantes de la Universidad como unidades de análisis, están conglomerados en secciones, las secciones por niveles, los niveles por Escuelas Profesionales y las Escuelas por Facultades, si se desea el estudio de algunas características de los estudiantes y se desea emplear el muestreo de conglomerados el muestreo será de 5 etapas, seleccionando en la primera etapa a la muestra de Facultades de interés, en la segunda etapa a la muestra de Escuelas de la muestra de Facultades, en la tercera etapa a la muestra de niveles de la muestra de Escuelas, en la cuarta etapa a las secciones de la muestra de niveles si hubiera varias y por último en la quinta etapa a la muestra de estudiantes de la muestra de secciones.

Dentro de cada conglomerado se puede dar lugar a una estratificación dando lugar a una muestra aleatoria de conglomerados con estratificación.

1.8.9. Diseño de la muestra

Un diseño de la muestra o diseño muestral, es un plan secuencial de actividades que se siguen a fin de estimar al parámetro.

Las actividades a seguir implican los tres procesos siguientes:

1) El proceso de determinación del tamaño de la muestra que son las tareas que se siguen para escoger el método muestral apropiado para determinar el tamaño de muestra.

2) El proceso de selección de los elementos de la muestra que debe incluir las tareas y procedimientos que permitan la selección de los elementos que van a conformar la muestra.

3) El proceso de estimación de parámetros que se refiere al cálculo de los estadísticos muestrales a ser utilizados para la estimación de los parámetros de la población.

C. A. Lluén Vallejos

Page 79: conceptos Basicos

79

CASO DE APLICACIÓN:En un distrito, en el mes siguiente, se desea realizar una investigación respecto de la proporción de consumidores de 15 a más años de edad que tienen preferencia por el gas de la bebida gaseosa “RR” comparada con otras dos cualidades de calidad, el precio y el azúcar. Por conveniencia económica, la investigación no se hará para todo el distrito, sino que se deberá tomar una muestra aleatoria de la población que se forme.

Objetivo:

Determinar la proporción de consumidores de 15 años a más en el distrito para el mes siguiente, que tienen preferencia por la gaseosa “RR.

Variable de estudio:

Preferencia por la gasificación de la gaseosa “RR en consumidores de 15 años a más edad en el distrito para el mes siguiente. Será simbolizada por:

Donde, las cualidades de preferencia son:

Gas (1)Precio (2)Azúcar (3)

Los datos para la variable en la muestra tendrán la siguiente definición:

Parámetros de estudio:

Proporción de consumidores de 15 años a más edad en el distrito para el mes siguiente, que tienen preferencia por la gaseosa “RR. Se representa por P.

Varianza de la proporción de consumidores de 15 años a más edad en el distrito para el mes siguiente, que tienen preferencia por la gaseosa “RR.

C. A. Lluén Vallejos

Page 80: conceptos Basicos

80 Conceptos Básicos de Estadística

Estimadores:

Proporción de consumidores de 15 años a más de edad en una muestra del distrito que prefieren la gaseosa “RR por el gas. Se le llama proporción muestral y se representa por p.

Varianza de la proporción de consumidores de 15 años a más de edad en una muestra del distrito que prefieren la gaseosa “RR por el gas.

Intervalo de estimación para la proporción de consumidores de 15 años a más de edad en el distrito que prefieren a la gaseosa “RR por el gas.

Unidad de análisis general:

Un consumidor de 15 a más años de edad del distrito que consume la gaseosa “RR”.

Esta definición de unidad de análisis es muy general, no aclara por ejemplo, la frecuencia de consumo que puede ser determinante para una calificación adecuada de la gaseosa.

Unidad de análisis potencial:

Un consumidor de 15 a más años de edad del distrito que consume con mucha frecuencia la bebida gaseosa. Este consumidor es potencial pues tendrá más criterio para opinar respecto de la calidad de la gaseosa.

Marco muestral:

El marco muestra será la relación de todos los consumidores potenciales del distrito en donde se deberá anotar: el nombre, la edad, la dirección, el número telefónico, etc. que permita su ubicación a fin de realizarle la encuesta.

Población objetivo o de muestreo:

Cuando se construya esta población, deberá estar formada por todos los consumidores potenciales ubicables del distrito. Cualquier otra situación que no competa a que un consumidor sea potencial dará razón a que sea depurado de la población. El tamaño de esta población será de N unidades potenciales.

Muestra aleatoria:

Estará formada por un conjunto de unidades potenciales extraída de la población objetivo o de muestreo. A fin de que la información que se

C. A. Lluén Vallejos

Page 81: conceptos Basicos

81

obtenga de las unidades potenciales sea insesgada, es conveniente que estas sean seleccionadas al azar. Mediante esta muestra se inferirá al parámetro de la población. El tamaño de esta muestra será de n unidades potenciales.

Estimación de parámetros:

La estimación del parámetro se debe realizar mediante un intervalo de confianza pero para ello es necesario hallar el estimador puntual.

Del análisis de este caso se puede deducir que, concluida la investigación, la proporción de consumidores de 15 a más años de edad que tienen preferencia por el gas de la bebida gaseosa “RR” en el distrito, debe ser estimada mediante una muestra. En resumen, todas las actividades que involucran el muestreo y la estimación se pueden sintetizar en los siguientes dos asuntos:

Diseño de la muestra:

Cálculo del tamaño de la muestra.

Selección de las unidades de muestreo.

Estimación de parámetros:

Estimación puntual.

Estimación de intervalo.

C. A. Lluén Vallejos

Page 82: conceptos Basicos

82 Conceptos Básicos de Estadística

C. A. Lluén Vallejos