libro estad-2013
DESCRIPTION
es un libro de estadisticaTRANSCRIPT
ASIGNATURA ESTADÍSTICA
DOCENTE TITULAR: MG. CARMEN BARRETO R.
AÑO 2013
CONTENIDO
Pág.
1. RECOLECCIÓN Y PRESENTACIÓN DE DATOS Y MEDIDAS ESTADÍSTICAS 1
1.1. DEFINICIÓN DE ESTADÍSTICA 1
1.2. CLASIFICACIÓN DE LA ESTADÍSTICA 1
1.3. TÉRMINOS DE ESTADÍSTICA 1
1.4. RECOLECCIÓN DE DATOS 4
1.5. DISTRIBUCIÓN DE FRECUENCIAS: DEFINICIÓN Y CLASIFICACIÓN 7
1.6. GRÁFICOS ESTADÍSTICOS 23
2.1. MEDIDAS ESTADÍSTICAS 41
2.2. MEDIDAS DE TENDENCIA CENTRAL 42
3.1. MEDIDAS DE DISPERSIÓN 56
3.2. MEDIDAS DE FORMA 74
4.1. EXPERIMENTO 86
4.2. ESPACIO MUESTRAL 86
4.3. EVENTOS 87
4.4. OPERACIONES CON EVENTOS 90
4.5. EVENTOS MUTUAMENTE EXCLUYENTES Y COLECTIVAMENTE 92
EXHAUSTIVOS
4.6. PROPIEDADES DE LAS OPERACIONES CON EVENTOS 92
4.7. PROBABILIDAD Y ENFOQUES DE PROBABILIDAD 94
4.8. REGLAS DE PROBABILIDAD 98
4.9. PROBABILIDAD CONDICIONAL 100
4.10. TABLAS DE PROBABILIDAD 112
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA __________________________________________________________________________________________
CAPITULO I
RECOLECCIÓN Y PRESENTACIÓN DE DATOS
1.1. DEFINICIÓN DE ESTADÍSTICA
La estadística es una ciencia que proporciona un conjunto métodos y técnicas
que se utilizan para recolectar, organizar, presentar, analizar e interpretar el
comportamiento de los datos con respecto a una característica materia de estudio
e investigación con la finalidad de obtener conclusiones válidas y tomar
decisiones razonables de acuerdo a tales análisis.
1.2. CLASIFICACIÓN DE LA ESTADÍSTICA
La Estadística se clasifica en dos grandes áreas: Estadística Descriptiva y
Estadística Inferencial.
a) Estadística descriptiva: Parte de la estadística que analiza y describe un
conjunto de datos de una muestra o de una población sin sacar conclusiones
de tipo general.
b) Estadística inferencial: Parte de la Estadística que infiere o induce leyes de
comportamiento para una población a través de una muestra aleatoria
seleccionada de dicha población.
_________________________________________ 1Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Recolección Organización Presentación
Cuadros
Gráficos
Análisis Descriptivo
Población(N)
Muestra(n)
Muestreo
Estadística Inferencial
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA __________________________________________________________________________________________
1.3. TÉRMINOS DE ESTADÍSTICA
Considerando que existe un conjunto de términos que se usan frecuentemente en
estadística conviene precisar el significado de algunos de ellos.
1.3.1. POBLACIÓN (N)
Es el conjunto de todos los individuos objetos u observaciones que poseen alguna
característica observable común.
Ejemplo 1:
La población de estudiantes de la Escuela de Contabilidad de la Universidad Los
Ángeles de Chimbote
Una población puede clasificarse como finita o infinita.
Población finita: Es aquella que tiene un número limitado de elementos.
Ejemplo 2:
Las edades de todos los estudiantes de la Universidad Los Ángeles de Chimbote.
Población infinita: Es aquella que tiene un número ilimitado de elementos.
Ejemplo 3:
El número de unidades producidas en un proceso de producción continúo.
1.3.2. MUESTRA (n)
Es una parte o un subconjunto representativo de la población y al proceso de
obtener la muestra se llama muestreo. La selección y el estudio de la muestra,
tiene por objeto la extracción de conclusiones que sean válidas para la población
de la cual se obtuvo dicha muestra.
Ejemplo 4:
Estudio de una muestra aleatoria de 200 estudiantes de la Escuela de
Contabilidad de la ULADECH según su nivel socio económico
1.3.3. VARIABLES
Es una característica de la población que se va investigar y puede tomar
diferentes valores.
_________________________________________ 2Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA __________________________________________________________________________________________
Las variables se clasifican en: cuantitativas y cualitativas:
Variables cuantitativas: Cuando el valor de la variable es de carácter numérico.
Las variables cuantitativas pueden ser discretas y continúas.
a.1) Variable cuantitativa discreta: Cuando el valor de la variable está
representado solo por números enteros (positivos).
Ejemplo 5:
X: número de hijos
a.2) Variable cuantitativa continua: cuando el valor de la variable puede
tomar cualquier valor dentro de un rango dado, por tanto se expresa por cualquier
número real.
Ejemplo 6:
X: Precio en soles
b) Variable cualitativa: Cuando expresan una cualidad, o atributo, tienen
carácter cualitativo, sus datos se expresan mediante una palabra, es no numérico.
La variable cualitativa puede ser: nominal u ordinal.
b.1) Variable cualitativa nominal: Son aquellas que establecen la distinción de
los elementos en las categorías sin implicar orden entre ellas.
Ejemplo 7:
X: Sexo: Masculino, Femenino.
b.2) Variable cualitativa ordinal: Son aquellas que agrupan a los objetos,
individuos, en categorías ordenadas, para establecer relaciones comparativas.
Ejemplo 8:
Y: Nivel de pobreza: No pobre, pobre, muy pobre, extremadamente pobre.
_________________________________________ 3Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA __________________________________________________________________________________________
1.3.4. UNIDAD DE OBSERVACIÓN: También se le conoce como unidad
estadística o unidad de análisis. Es el elemento u objeto indivisible de la población
que será analizado y sobre los cuales se obtendrán los datos.
Ejemplo 9:
Si se quiere estudiar el rendimiento académico de los alumnos de la Universidad
Los Ángeles de Chimbote, la unidad de observación serán los alumnos.
1.3.5. OBSERVACIONES: A los datos también se le conoce como
observaciones. Son los valores recopilados como resultado de las observaciones
de una variable.
1.3.6. PARÁMETRO: Es un valor obtenido para describir en forma resumida las
características pertinentes o más importantes de una población.
Ejemplo 10:
El sueldo promedio de todos los trabajadores de la Empresa Sider Perú de
Chimbote.
1.3.7. ESTADÍGRAFO: También se le conoce como estadístico(a). Es una
medida descriptiva de una muestra. El estadígrafo sirve como estimación del
parámetro.
Ejemplo 11:
El sueldo promedio del 25% de los empleados de la Empresa Sider Perú de
Chimbote.
1.4. RECOLECCIÓN DE DATOS
La recolección o recopilación de datos es el momento en el cual el investigador se
pone en contacto con los sujetos, objetos o elementos sometidos a estudio con el
propósito de obtener los datos o respuestas de las variables consideradas; a partir
de estos datos se prepara la información estadística, se calculará las medidas de
resumen e indicadores para el análisis estadístico.
_________________________________________ 4Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA __________________________________________________________________________________________
Para recoger la información se toma en cuenta las siguientes modalidades: Las
fuentes de información, los sistemas de recolección y las técnicas de recolección.
1.4.1. Modalidades de Recolección de Datos:
1.4.1.1. Fuentes de información:
Es el lugar, la institución o persona donde están los datos que se necesitan para
cada una de las variables o aspectos de la investigación. Las fuentes de
información pueden ser:
a) Fuentes primarias: Cuando los datos se obtienen directamente de la misma
persona o entidad utilizando ciertas técnicas.
Ejemplo 12:
Llevar a cabo una encuesta para conocer el grado de satisfacción laboral en los
trabajadores de una empresa “X”.
b) Fuentes secundarias: Cuando los datos ya han sido elaborados y procesados
por otras personas o instituciones.
Ejemplo 13:
La información estadística que publica el INEI de los diferentes ministerios del
Perú.
1.4.1.2. Sistemas de recolección: Son procedimientos que se utilizan para
recoger información.
Pueden ser:
a) Los registros: Son libros, padrones, etc. en donde se anotan en forma regular
permanente y obligatoria los hechos ocurridos.
Ejemplo 14:
Registros Civiles, RENIEC, Registros Públicos, Registros Electrónicos, etc.
b) Las encuestas: Son procedimientos de obtención de información estructurada
según criterios previos de sistematización que se efectúa con un propósito
específico en toda la población o en un sector de ella.
_________________________________________ 5Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA __________________________________________________________________________________________
Pueden ser:
b.1) Encuesta censal: Cuando abarca toda la población en estudio.
Ejemplo 15:
Censos de población y vivienda de una localidad o país.
b.2) Encuesta muestral: Cuando abarca una parte de la población en estudio.
Ejemplo 16:
Llevar a cabo una Encuesta de preferencia electoral.
1.4.1.3. Técnicas de recoleccion
Son procedimientos que se utilizan para recolectar información según la
observación, naturaleza del trabajo de investigación.
Pueden ser: La observación, el cuestionario, la entrevista, test, etc.
a) La observación: Es la acción de mirar con rigor, en forma sistemática y
profunda, con el interés de descubrir la importancia de aquello que se observa.
b) El cuestionario: Es un instrumento constituido por un conjunto de preguntas
sistemáticamente elaboradas, que se formulan al encuestado o entrevistado, con
el propósito de obtener datos de las variables consideradas en estudio.
c) La entrevista: Es un diálogo entre personas, es una técnica donde una
persona llamada entrevistador, encuestador o empadronador solicita al
entrevistado, le proporcione algunos datos e información.
d) El test : Pruebas o exámenes con ayuda de un cuestionario o escala que mide
determinadas funciones, generalmente cognitivas.
_________________________________________ 6Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
1.5. DISTRIBUCIONES DE FRECUENCIAS: DEFINICIÓN Y CLASIFICACIÓN
Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y
categorías y determinar las frecuencias de las clases, o sea, el número de
elementos que pertenecen a una clase. El ordenamiento tabular de los datos por
clases conjuntamente con las frecuencias de clases se denomina distribución de
frecuencias.
1.5.1. DEFINICIÓN:
Es un arreglo tabular en donde se presentan a los datos de una muestra o de una
población bajo un ordenamiento convencional predeterminado de acuerdo a la
característica en estudio.
1.5.1.1. Partes de una distribución de frecuencias:
CÓDIGO
TITULO: Deber ser completo y conciso
Yi fi Fi hi Hi hi% Hi%Y1 f1 F1 h1 H1 h1% H1%Y2 f2 F2 h2 H2 h2% H2%Y f3 F3 h3 H3 h3% H3%. . . . . . .. . . . . . .
Total n - 1.00 - 100 -Fuente:
a) Código: Número de identificación.
b) Título: Expresa en forma resumida la información que contiene, se coloca en
la parte superior de la tabla.
El título de un cuadro estadístico debe ser completo y conciso.
Se refiere a completo en que debe tener los cuatro elementos fundamentales:
población, variable, lugar y tiempo.
Se refiere a conciso en que debe ser breve.
________________________________________________________ 7Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Encabezado
columna
matriz Cuerpo del Cuadro
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
c) Encabezado: Primera fila del cuadro, explica las categorías y el objeto de
cada una de las columnas.
d) Columna principal o matriz: Formada por la primera columna y nos indica
también las características.
e) Cuerpo: Su formación se presenta en filas y columnas.
f) Fuente: Se coloca en la parte inferior del cuadro y nos indica el lugar en
donde se obtuvieron los datos contenidos en la tabla.
1.2. Términos elementales para construir una distribución de frecuencias:
a) Clase o intervalo de clase: Son los grupos que se forman con los valores de
la variable cuando la variable es cuantitativa discreta (clase) o continua (intervalo
de clase). Cuando la variable es cualitativa nominal u ordinal toma el nombre de
categoría.
b) Frecuencia absoluta: Es el número de veces que se repite un determinado
valor de la variable; en el caso de intervalos es el número de observaciones
comprendidas en dicho intervalo. Se representa por f i con (i=1,2... m); donde “m”
representa el número de valores distintos que toma la variable Y i o el número de
intervalos considerados (mn). Asimismo, la suma de las frecuencias absolutas
simples es igual al número total de observaciones y se expresa del siguiente
modo:
m
iim nffff
121 .....
c) Frecuencia relativa: Es el cociente de la frecuencia absoluta de cada clase
entre el número total de observaciones. Esta frecuencia se denota por ih con
(i=1,2,...m). entonces:
La frecuencia relativa simple toma valores comprendidos entre 0 y 1, es
decir:
1 ihO
________________________________________________________ 8Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
n
fh ii
nesobservacio de totalnúmero
clase cada de absoluta frecuencia
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
Asi mismo, la suma de las frecuencias relativas simples es igual 1, es decir:
m
iim hhhh
121 1...
d) Frecuencia relativa porcentual: Es la frecuencia relativa multiplicada por 100.
Se representa por %ih y se considera como el porcentaje de observaciones
correspondientes a cada clase. La frecuencia porcentual está comprendida entre
0 y 100.
e) Frecuencia absoluta acumulada: Resulta de acumular o sumar
sucesivamente las frecuencias absolutas, se representa por iF . Donde:
F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
.
.
.
Fm = f1 + f2 +… fm=n
f) Frecuencia relativa acumulada: Resulta de acumular o sumar sucesivamente
las frecuencias relativas se representa por iH . Donde :
H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
.
.
.
Hm = h1 + h2 + h3 +… hm = 1
La frecuencia relativa acumulada toma valores comprendidos entre 0 y 1 es
decir:
10 iH
________________________________________________________ 9Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
g) Frecuencia relativa acumulada aorcentual: Es la frecuencia relativa
acumulada multiplicada por 100%. Se representa por %iH y se considera como
el porcentaje de observaciones acumuladas hasta cierta clase.
1.5.2. CLASIFICACIÓN DE DISTRIBUCION DE FRECUENCIAS:
Las distribuciones de frecuencias se construyen de acuerdo a la variable y su
clasificación está dada por: distribuciones de frecuencias en puntos aislados,
distribuciones de frecuencias en intervalos de clase y distribuciones de
frecuencias por atributos o categorías, tal como se muestra en el siguiente mapa
conceptual.
________________________________________________________ 10Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
1.5.2.1. DISTRIBUCIÓN DE FRECUENCIAS EN PUNTOS AISLADOS
Se utiliza cuando la variable es cuantitativa discreta ya que generalmente los
valores de la variable son pocos, por lo que puede considerarse cada uno de ellos
como una clase.
La distribución de frecuencias absolutas toma la siguiente forma:TABLA N° 1
Distribución de frecuencias absolutas
en puntos aislados
Valores de la variables
iYFrecuencias absolutas
ifY1
Y2
.
.
.
Ym
f1 f2
.
.
.
fm
Total n
La distribución de frecuencias ampliada toma la siguiente forma:
TABLA N° 2
Distribución de frecuencias ampliada
iY if if ih iH ih iHY1
Y2
Y3
.
.
.
Ym
f1
f2
f3
.
.
.
fm
F1
F2
F3
.
.
.
Fm
h1
h2
h3
.
.
.
hm
H1
H2
H3
.
.
.
Hm
h1%
h2%
h3%
.
.
.
hm%
H1%
H2%
H3%
.
.
.
Hm%Total n - 1.00 - 100 -
Ejemplo 17:
Los siguientes datos hipotéticos corresponden a una muestra aleatoria de 30
empresas de la ciudad de Lima según su número de accidentes de trabajo
durante el año 2007:
0 3 3 3 4 4 0 2 3 12 2 3 1 3 4 1 2 2 2
3 3 2 2 2 3 1 2 2 4
________________________________________________________ 11Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
La información fue obtenida mediante una encuesta realizada por la Empresa
Datum S.A.
Se pide:
a) Identificar la unidad de observación y la variable en estudio.
b) Construir la tabla de conteo.
c) Construir una distribución de frecuencias ampliada.
Interpretar d) f3, F3, h3% y H3%.
d) Determinar cuantas empresas no han tenido accidentes de trabajo.
e) Determinar que porcentaje de empresas han tenido por lo menos 3 accidentes
de trabajo.
f) Determinar que porcentaje de empresas han tenido a lo más 2 accidentes de
trabajo.
Solución:
a) Unidad de observación: Las empresas
Variable: N° de accidentes de trabajo
b) A continuación le mostraremos como construír la tabla de conteo:
En primer lugar se observa que el número de observaciones es de tamaño 30
(n=30).
En segundo lugar identificamos el número de observación diferentes, m=5.
Estos valores son y1=0, y2=1, y3=2, y4=3 y y5=4. Los cuales se ubican (en ese
orden) en la primera columna de la tabla N° 3.
Seguidamente contamos el número de empresas con 0, 1, 2, 3 y 4 accidentes
de trabajo. Esto se hace utilizando la segunda columna de la tabla N° 3
llamada “conteo”, usando el método de los palotes que consiste en colocar
una raya vertical o tarja (/) cada vez que se aparece el valor en cuestión,
destacando cada cinco unidades con el fin de facilitar el cómputo final.
Finalmente se cuenta el número de palotes, obteniéndose las frecuencias
absolutas (fi).
En este caso:
f1= 2, f2= 4, f3= 11, f4= 9, y f5= 4
________________________________________________________ 12Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
De esta manera se ha construido tabla de conteo de las 30 empresas segun
su número de accidentes de trabajo , tal como se observa en el tabla N° 3:
Tabla N° 3
Distribución de empresas según su número de accidentes de trabajo
N° de accidentes detrabajo
iY CONTEO
N° deempresas
if0
1
2
3
4
II
IIII
IIII IIII I
IIII IIII
IIII
2
4
11
9
4Total ____ 30
Asi mismo el Cuadro N° 1 muestra una distribución de frecuencias ampliada.
Las frecuencias absolutas (f) se obtienen en el proceso de conteo, que vienen
a ser las unidades correspondientes a cada clase.
Las frecuencias acumuladas (F) se obtienen sumando en forma acumulativa
las frecuencias absolutas. Así:
F1 = f1 = 2
F2 = f1 + f2 = 2 + 4 = 6
F3 = f1 + f2 + f3 = 2 + 4 + 11 = 17
F4 = f1 + f2 + f3 + f4 = 2 + 4 + 11 + 9 = 26
F5 = f1 + f2 + f3 + f4 + f5 = 2 + 4 + 11+ 9 + 4 = 30
Las frecuencias relativas se obtienen dividiendo las frecuencias absolutas
entre el tamaño de la muestra.
________________________________________________________ 13Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
1 21 2
3 43 4
55
f f2 4h 0.07 h 0.13
n 30 n 30
f f11 9h 0.37 h 0.30
n 30 n 30
f 4h 0.13
n 30
= = = = = =
= = = = = =
= = =
La suma de las frecuencias relativas es igual a 1:5
i 1 2 3 4 5i 1
5
ii 1
h h h h h h
h 0.07 0.13 0.37 0.30 0.13 1.00
=
=
= + + + +
= + + + + =
å
å Las frecuencias relativas acumuladas se obtienen sumando en forma
acumulativa las frecuencias relativas. Así:
1 1
2 1 2
3 1 2 3
4 1 2 3 4
5 1 2 3 4 5
H h 0.07
H h h 0.07 0.13 0.20
H h h h 0.07 0.13 0.37 0.57
H h h h h 0.07 0.13 0.37 0.30 0.87
H h h h h h 0.07 0.13 0.37 0.30 0.13 1.00
= == + = + == + + = + + =
= + + + = + + + =
= + + + + = + + + + =
Las frecuencias relativas porcentuales se obtienen multiplicando por 100 las
frecuencias relativas. Así:
1 1
2 2
3 3
4 4
5 5
h % h 100 0.07 100 7
h % h 100 0.13 100 13
h % h 100 0.37 100 37
h % h 100 0.30 100 30
h % h 100 0.13 100 13
= ´ = ´ == ´ = ´ == ´ = ´ =
= ´ = ´ == ´ = ´ =
Las frecuencias relativas porcentuales acumuladas se obtienen por 100 las
frecuencias relativas acumuladas. Así:
________________________________________________________ 14Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católca Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
1 1
2 2
3 3
4 4
5 5
H % H 100 0.07 100 7
H % H 100 0.20 100 20
H % H 100 0.57 100 57
H % H 100 0.87 100 87
H % H 100 1.00 100 100
= ´ = ´ == ´ = ´ == ´ = ´ =
= ´ = ´ == ´ = ´ =
c) CUADRO N° 1
Distribución de empresas según su número de accidentes de trabajo
Lima : Año - 2007
N° de accid.
de trabajo
iY
N° de
empresas
if
Frec.
acumulada
iF
Frec.
relativa
ih
Frec.
relativa
acumulada
iH
Frec.
porcentual
%ih
Frec.
porcentual
acumulada
%iH
0
1
2
3
4
2
4
11
9
4
2
6
17
26
30
0.07
0.13
0.37
0.30
0.13
0.07
0.20
0.57
0.87
1.00
7
13
37
30
13
7
20
57
87
100Total 30 - 1.00 - 100 -
Fuente: Encuesta realizada por la Empresa Datum S.A.
b) Interpretación:
f3 : 11 empresas han tenido 2 accidentes de trabajo.
F3 : 17 empresas han tenido 2 accidentes de trabajo o menos.
h3% : El 37 % de las empresas han tenido 2 accidentes de trabajo.
H3% : El 57% de las empresas han tenido 2 accidentes de trabajo o menos.
________________________________________________________ 15Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
1.5.2.2. DISTRIBUCIÓN DE FRECUENCIAS EN INTERVALOS DE CLASE
Se utiliza generalmente cuando la variable es cuantitativa continua, aquí los
valores de las variables son números por lo que no puede considerarse cada uno
de ellos como una clase, lo cual es necesario agruparlos en intervalo de clase.
Se siguen los siguientes pasos para su construcción:
a) Determinar el rango (R): Se obtiene restando el valor máximo y el mínimo.
Así
R = Valor Máximo – Valor Mínimo
b) Determinar el número de intervalos (m): El criterio a seguir para
determinar el número de intervalos generalmente del mismo tamaño es que el
mismo sea suficientemente pequeño para lograr la simplificación deseada, pero lo
suficientemente grande para minimizar los posibles errores de clasificación.
Naturalmente, no es conveniente utilizar muchos intervalos de pequeña amplitud
ya que en un caso extremo, equivaldría a trabajar con los datos originales. Por
otra parte, un número muy reducido de intervalos, significa cierta concentración y
la pérdida de información consiguientemente, como ocurriría en otro caso, si se
considerase un solo intervalo. Se recomienda:
b.1) considerar el número de intervalos entre 5 y 20.
5 m 20
b.2) Utilizar la regla de Sturges para determinar el número de intervalos:
m = 1 + 3.33 log n
Donde: n es el número de observaciones.
a) Determinar la amplitud interválica (C): También se le conoce como ancho
del intervalo y se obtiene dividiendo el rango entre el número de intervalos.
C = R .
m
b) Determinar los límites de clase, de manera que cada observación se
clasifique sin ambigüedades en una sola clase.
________________________________________________________ 16Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
LI(i) – LS(i)
[y´0 - y´1 )
[y´1 - y´2 )
:
:
[y´m-1 - y´m)
c) Determinar las marcas de clases, la marca de clase o punto medio de cada
intervalo se halla mediante la semisuma del límite inferior y del límite superior.
Así:
2)()( ii
i
LSLIY
Los cuales presentamos a continuación:
Intervalos
LI(i) – LS(i)
Marca de clase
iY[y´0 - y´1 )
[y´1 - y´2 )
:
:
[y´m-1 - y´m)
Y1
Y2
:
:
Ym
d) Finalmente se halla frecuencia absoluta de cada clase. Así:
TABLA N° 4
Distribución de frecuencias absolutas
en intervalos de clase
Intervalos
)()( ii LSLI
Marca de clase
iy
Frecuencia absoluta
simple
if[y´0 - y´1 )
[y´1 - y´2 )
.
:
[y´m-1 - y´m)
y1
y2
:
:
ym
f1
f2
:
:
fm
Total - n
________________________________________________________ 17Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
Ejemplo 18:
Los siguientes datos corresponden a una muestra aleatoria de 20 jubilados de la
AFP Integra de la ciudad de Chimbote según su monto de pensión mensual en
soles correspondiente al mes de Enero del 2007:
500 650 650 800 700 730 760 790 520 870600 670 1000 850 720 750 780 840 400 860
La información fue obtenida de los Registros de Atención al Usuario de la AFP
Integra.
a) Determinar la unidad de observación y la variable en estudio.
b) Construir la tabla de conteo. Utilice la regla de Sturges.
c) Construir una distribución de frecuencias ampliadas.
d) Interpretar f2, F2, h2% y H2%.
e) Determinar cuantos jubilados han tenido un monto de pensión de 640 soles o
más pero menos de 880 soles.
f) Determinar que porcentaje de jubilados han tenido un monto de pensión
mensual comprendido entre 760 y 1000 soles.
Solución:
a) Unidad de observación: Los jubilados.
Variable en estudio: monto de pensión en soles.
b) Siguiendo los pasos establecidos:
Hallando el Rango (R):
R = Valor Máximo – Valor Mínimo
R = 1000 – 400 = 600
Hallando el Número de Intervalos (m):
m = 1 + 3.33 log n
n = 20 log 20 = 1.30
m = 1 + 3.33 x 1.30 = 5.33
m = 5 intervalos
________________________________________________________ 18Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
Hallando la Amplitud Interválica (C):
C = R = 600 = 120
m 5
Determinando los límites de clases y sus respectivas marcas de clase.
Monto de pensión en soles
)()( ii LSLI Marca de clase
iY
[400 – 520)
[520 – 640)
[640 – 760)
[760 – 880)
[880 – 1000]
460
580
700
820
940
c) Determinando la distribución de frecuencias absolutas:
Tabla N° 5Distribución de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007
Monto de pensión en soles
)()( ii LSLI Marca de
Clase
iy
Conteo
N° de jubilados
if
[400 – 520) 460 II 2[520 – 640) 580 II 2[640 – 760) 700 IIII II 7
[760 – 880) 820 IIII III 8[880 – 1000] 940 I 1
Total - 20
d) A continuación le mostramos la distribución de frecuencias ampliada para las
diferentes frecuencias dadas:
________________________________________________________ 19Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
CUADRO N° 2
Distribución de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007
Monto de pensión en
soles
)()( ii LSLI
Marca de
clase
iy
N° de jub.
if
IF ih iH %ih %iH
[400 – 520)
[520 – 640)
[640 – 760)
[760 – 880)
[880 – 1000]
460
580
700
820
940
2
2
7
8
1
2
4
11
19
20
0.10
0.10
0.35
0.40
0.05
0.10
0.20
0.55
0.95
1.00
10
10
35
40
5
10
20
55
95
5Total - 20 - 1.00 - 100 -
Fuente: Registros de Atención al Usuario.
e) Interpretando:
f2 : 2 jubilados han tenido un monto de pensión de 520 soles o más pero
menos de 640 soles..
F2 : 4 jubilados han tenido un monto de pensión de 400 soles o m;as pero
menos de 640 soles.
h2% : El 10% de los jubilados han tenido un monto de pensión de 520 soles
o más pero menos 640 soles.
H2% : El 20% de los jubilados han tenido un monto de pensión de 400 soles
o más pero menos de 640 soles.
f) Sumanos las frecuencias absolutas simples de los intervalos 3 y 4 obteniendo:
( 7 + 8 ) =15 trabajadores.
g) Sumamos las frecuencias porcentuales simples de los intervalos 4 y 5
obteniendo : (40% +5%) = 45%
1.5.2.3. DISTRIBUCIÓN DE FRECUENCIAS POR ATRIBUTOS O
CATEGORÍAS
Este tipo de distribución se utiliza para clasificar los datos de una variable
cualitativa nominal u ordinal.
________________________________________________________ 20Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
TABLA N° 6
Distribución de frecuencias para variables cualitativas
Variable
iX
Frecuencia
absoluta
if
Frecuencia
relativa
ih
Frecuencia relativa
porcentual
%ihx1
x2
.
,
,
xm
f1
f2
.
.
.
fm
h1
h2
.
.
.
hm
h1%
h2%
.
.
.
hm%Total n 1.00 100%
Ejemplo 19:
Los siguientes datos obtenidos mediante una encuesta realizada por la Empresa
AMC en el mes de Febrero del 2007 corresponden a una muestra aleatoria de 40
empresas de la ciudad de Chimbote según motivo del uso de Internet:
P O F F F P F RP P FO P F F F O P RP P PP P P RP O P P F O RP
RP P F RP P P P F P F
Donde:
P: “PUBLICIDAD” F: “FACTURACION”
RP: “RECEPCION DE PAGOS” O: “OTROS”
Se pide:
a) Identificar la unidad de observación y la variable en estudio.
b) Construir una distribución de frecuencias (absolutas y porcentuales).
c) Interpretar f2 y h2%.
Solución:
a) Como resultado de la clasificación y tabulación se tiene:
________________________________________________________ 21Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA______________________________________________________________________________________________
CUADRO N° 3
Distribución de empresas según su motivo de uso de Internet
Cabina Alfa Net - Chimbote
Mayo - 2005
Motivo de uso deInternet
iXN° de empresas
ifFrecuencia relativa
ihFrecuencia relativa
porcentual
%ih
Publicidad
Facturación
Recepción de Pagos
Otros
17
12
6
5
0.425
0.300
0.150
0.125
42.50
30.00
15.00
12.50
TOTAL 40 1.000 100.00 FUENTE: Encuesta realizada por la Empresa AMC
b) Interpretando:
f2 : 12 empresas manifiestan que el motivo de uso de Internet es por
facturación.
h2% : El 30% de las empresas manifiestan que el motivo de uso de Internet
es por facturación.
________________________________________________________ 22Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA_________________________________________________________________________________________
1.6. GRÁFICOS ESTADÍSTICOS
1.6.1. DEFINICIÓN: Un gráfico es la representación de un fenómeno estadístico
por medio de figuras geométricas (puntos, líneas, rectángulos, paralelepípedos,
etc.) cuyas dimensiones son proporcionales a la magnitud de los datos
representados. Su objetivo principal es la representación de los datos en forma
gráfica, que permita a simple vista darse cuenta del conjunto de elementos
presentados y de evidenciar sus variaciones y características. El gráfico es un
auxiliar del cuadro estadístico no lo sustituye, sino lo complementa.
1.6.1.1. Partes de un gráfico: Al igual que un cuadro estadístico en el gráfico
se consideran las siguientes partes:
1.6.1.2. Escalas usadas en el trazado de un gráfico: La mayoría de los
gráficos se representan en las llamadas “Sistema de Coordenadas Cartesianas”
donde hay dos ejes, X (Eje horizontal) e Y (eje vertical). En el eje X se colocan las
diferentes clases de la variable y en el eje Y se colocan las frecuencias (absolutas
o porcentuales). La escala de medida que se usan deben ser de la misma longitud
o algo mayor la horizontal que la vertical. En general, las 2 escalas deben guardar
una proporción 1 a 1 y 1 a 2, es decir, que si el eje vertical mide 10cm. el eje
_______________________________________________ 23Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
(FR
EC
UE
NC
IA)
CÓDIGO
TÍTULO
CUERPO
FUENTEVARIABLE
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA_________________________________________________________________________________________
horizontal debe medir entre 10 y 20. Esta exigencia se hace con el fin de no
distorsionar el fenómeno que se estudia.
1.6.2. CLASIFICACIÓN DE GRÁFICOS
Entre los gráficos más usuales tenemos: gráfico de bastones, histograma de
frecuencias, polígono de frecuencias, gráfico de barras simples, gráfico de
sectores circulares y gráfico Lineal, tal como se muestra en el siguiente mapa
conceptual.
_______________________________________________ 24Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA_________________________________________________________________________________________
1.6.2.1. GRÁFICOS DE BASTONES
También se le conoce como diagrama de frecuencias, se utiliza generalmente
para describir datos cuando la variable es cuantitativa discreta y su construcción
se hace levantando segmentos perpendiculares al eje de la variable y con una
altura proporcional a su frecuencia absoluta o relativa porcentual.
Ejemplo 20:
Los Gráficos N° 1 y N° 2 muestra el gráfico de bastones para frecuencias
absolutas y relativas porcentuales del Cuadro N° 1 de la pag. 15:
GRÁFICO N° 1
Empresas según s u número de accidentes de trabajo
Lima : 2007
Fuente: Encuesta realizada por la Empresa
Datum S.A.
Comentario: En el Grafico N° 1 observamos que el menor número de empresas
(2) no han tenido accidentes de trabajo y el mayor (11) ha tenido 9 accidentes de
trabajo.
_______________________________________________ 25Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Nº de accidentes de trabajo
0 1 2 3 4
12
9
6
3Nº
de
em
pre
sas
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA_________________________________________________________________________________________
GRÁFICO N° 2
Porcentaje de empresas según s u número de accidentes de trabajo
Lima : 2007
Fuente: Encuesta realizada por la Empresa
Datum S.A.
Comentario: En el Grafico N° 2 observamos que el menor porcentaje de
empresas (7%) no han tenido accidente de trabajo y el mayor porcentaje de
empresas (37%) han tenido 2 accidentes de trabajo.
1.6.2.2. HISTOGRAMA DE FRECUENCIAS
Este gráfico se utiliza para describir datos cuando la variable es cuantitativa
continua. Su construcción se hace levantando sobre el eje de la variable
rectangular que tengan por base la amplitud del intervalo de clase y una altura
proporcional a su frecuencia absoluta o relativa porcentual.
Ejemplo 21: Los Gráficos N° 3 y N° 4 muestran el histograma de frecuencias para
frecuencias absolutas y relativas porcentuales del Cuadro N° 2 de la pag. 19.
_______________________________________________ 26Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Nº de accidentes de trabajo
0 1 2 3 4
40
30
20
10
Po
rcen
taje
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA_________________________________________________________________________________________
GRÁFICO N° 3
Número de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007
Fuente: Registros de Atención al Usuario.
Comentario: En el Grafico N° 3 observamos que el menor número de jubilados
(1) han tenido un monto de pensión que varia entre 880 soles y 1000 soles y el
mayor número de jubilados (8) han tenido un monto de pensión en soles de 760
soles o más pero menos de 880 soles.
_______________________________________________ 27Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Nº
de
jub
ilad
os
0 400 520 640 760 880 1000
Monto de pensión en soles
8
6
4
2
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA_________________________________________________________________________________________
GRÁFICO N° 4
Porcentaje de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007
Fuente: Registros de Atención al Usuario.
Comentario: En el Grafico N° 4 observamos que el menor porcentaje de jubilados
(5%) han tenido un monto de pensión que varia entre 880 soles y 1000 soles y el
mayor porcentaje de jubilados (40%) han tenido un monto de pensión en soles de
760 soles o más pero menos de 880 soles.
_______________________________________________ 28Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
40
30
20
10
0 400 520 640 760 880 1000
Po
rcen
taje
Monto de pensión en soles
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA_________________________________________________________________________________________
1.6.2.3. POLÍGONO DE FRECUENCIAS
Este se utiliza también para describir datos cuando la variable es cuantitativa
continua. Su construcción se hace uniendo los puntos medios superiores de los
rectángulos en el histograma.
Ejemplo 22:
Los Gráficos N° 5 y N° 6 muestran el polígono de frecuencias para frecuencias
absolutas y frecuencias relativas porcentuales del Cuadro N° 2 de la pág. 19.
GRÁFICO N° 5
Número de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007
Fuente: Registros de Atención al Usuario.
En el Grafico N° 5 observamos que el menor número de jubilados (2) han tenido
un monto de pensión de 940 soles y el mayor número de hogares (8) han tenido
un consumo mensual de 820 soles.
_______________________________________________ 29Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Nº
de
jub
ilad
os
Monto de pensión en soles
8
6
4
2
0 340 460 580 700 820 940 1060
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA_________________________________________________________________________________________
GRÁFICO N° 6
Porcentaje de jubilados según su monto de pensión en soles
AFP INTEGRA - Chimbote: Enero - 2007
Fuente: Encuesta realizada por la Empresa Data S.A.
En el Grafico N° 6 observamos que el menor porcentaje de jubilados (5%) han
tenido un monto de pensión de 940 soles y el mayor porcentaje de jubilados
(40%) han tenido un monto de pensión de 820 soles.
_______________________________________________ 30Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Monto de pensión en soles
40
30
20
10
0 340 460 580 700 820 940 1060
Po
rce
nta
je
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
1.6.2.3. GRÁFICO DE BARRAS SIMPLES
Este gráfico se utiliza para describir datos cuando la variable es cualitativa nominal
u ordinal presentados en cuadro de entrada simple. Su construcción se hace
levantando barras proporcionales a la frecuencia absoluta o relativa porcentual de
la cualidad que representan.
Recomendaciones para su construcción:
- Todas las barras deben tener el mismo grosor.
- El espacio entre barras debe ser de la misma magnitud y constituye la mitad
del ancho de la barra.
- El ancho de la barra debe ser el doble del espacio que se deja entre barra y
barra.
- La escala de frecuencia debe empezar por cero.
- Las barras por estética deben ordenarse de mayor a menor cuando se pueda.
- No se debe recargar las barras tratando de expresar muchos productos en
cada uno de ellas.
- Si el gráfico tiene muchas barras es mejor expresarlo con un gráfico lineal.
Ejemplo 24:
Los Gráficos N° 7 y N° 8 muestran el gráfico de barras simples para frecuencias
absolutas y frecuencias relativas porcentuales del Cuadro N° 3 de la pag. 21.
_______________________________________________ 31Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
Comentario: En el Grafico N° 7 observamos que el menor número de empresas
(5) manifiestan que usan internet por otros motivos y el mayor número de
empresas (17) manifestan que el motivo de uso de internet es por publicidad.
_______________________________________________ 32Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
FUENTE: Encuesta realizada por la Empresa Consultora OMEGANET.Publicidad Facturación Recepción de
PagosOtros
0
5
10
15
20
17
12
65
GRAFICO N° 7 Empresas según su motivo de uso de Internet
Cabina Alfa Net: Chimbote - Mayo 2005
Motivo de Uso de Internet
N°
de
Em
pre
sa
s
Fuente: Encuesta realizada por la Empresa Data S.A.
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
Comentario: En el Grafico N° 8 observamos que el menor porcentaje de
empresas (12.5%) manifiestan que usan internet por otros motivos y el mayor
porcentaje de empresas (42.5%) manifestan que el motivo de uso de internet es
por publicidad.
1.6.2.4. GRÁFICO DE SECTORES CIRCULARES O PASTEL
Al igual que el gráfico de barras este gráfico se utiliza generalmente para
representar variables cualitativas (nominal u ordinal). Se usa frecuentemente
cuando se desea comparar cada categoría de la variable con respecto al total.
Para su elaboración se utiliza una circunferencia, siendo necesario que los valores
absolutos y/o porcentuales sean traducidos en grados. A cada categoría le
corresponde un sector de la circunferencia.
Hallando los ángulos para cada sector:
_______________________________________________ 33Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Fuente: Encuesta realizada por la Empresa Data S.A.
%
Publicidad Facturación Recepción de Pagos
Otros
0
9
18
27
36
45 42.5
30
1512.5
GRAFICO N° 8 Porcentaje de empresas según su motivo de uso de Internet
Cabina Alfa Net : Chimbote - Mayo 2005
Motivo de Uso de Internet
Po
rce
nta
je%
%
%%
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
Tipos de Caso Angulos(oi)
Publicidad
Facturación o2
12360 108
40a = ´ ° = °
Recepcción de Pagos o3
6360 54
40a = ´ ° = °
Otros o4
5360 45
40a = ´ ° = °
Total 360°
Se puede comprobar que la suma de los cuatro sectores da 360°.
Ejemplo 25:
Los Gráficos N° 9 y N° 10 muestran el gráfico de barras simples para frecuencias
absolutas y frecuencias relativas porcentuales del Cuadro N° 3 de la pag. 21.
_______________________________________________ 34Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Fuente: Encuesta realizada por la Empresa Data S.A.
o1
17360 153
40a = ´ ° = °
Publicidad 17
Facturación 12
Recepción de Pagos 6
Otros 5
GRAFICO N° 9 Empresas según su motivo de uso de Internet
Cabina Alfa Net : Chimbote - Mayo 2005
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
Comentario: En el Grafico N° 9 observamos que el menor número de empresas
(5) manifiestan que usan internet por otros motivos y el mayor número de
empresas (17) manifestan que el motivo de uso de internet es por publicidad.
Comentario: En el Grafico N° 10 observamos que el menor porcentaje de
empresas (12.5%) manifiestan que usan internet por otros motivos y el mayor
porcentaje de empresas (42.5%) manifestan que el motivo de uso de internet es
por publicidad.
1.6.2.5. GRÁFICO LINEALEstos gráficos se utilizan para representar series cronológicas o sea distribucionesque se desarrollan a través del tiempo. Se representan en los ejes decoordenadas cartesianas mediante líneas rectas o quebradas. En el eje horizontalse ubica el tiempo (años, meses, días, etc.) y en el eje vertical el valor de losdatos. Puede incluir más de un hecho o situación.
_______________________________________________ 35Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Fuente: Encuesta realizada por la Empresa Data S.A.
Publicidad 42.5
Facturación 30
Recepción de Pagos 15
Otros 12.5
GRAFICO N° 10Porcentaje de empresas según su motivo de uso de Internet
Cabina Alfa Net : Chimbote - Mayo 2005
%
%
%
%
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
Ejemplo 26:El Gráfico N° 11 le muestra el gráfico de líneas utilizando los datos del Cuadro N° 4.
CUADRO N° 4
Numero de usuarios mensuales de la Cabina Alfa Net
Chimbote: Año - 2005
Años EN FE M A M J J A S O N DN° de usuarios 150 210 350 400 600 450 800 650 700 350 200 500
Fuente: Encuesta realizada por la Empresa Consultora OMEGANET.
Comentario: En el Grafico N° 11 observamos que el número de usuarios de la
Cabina Alfanet presentan un crecimiento ascendente en los meses de enero a
mayo, de junio a julio el número de usuarios que llegan a dicha cabina presentan
un comportamiento irregular.
_______________________________________________ 36Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
150210
350400
600
450
800
650700
350
200
500
0
200
400
600
800
E F M A M J J A S O N D
N°
de
us
ua
rio
s
MESES
GRAFICO N° 11Numero de usuarios de la Cabina Alfa Net
Chimbote: Año - 2005
Fuente: Encuesta realizada por la Empresa Consultora OMEGANET.
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
AUTOEVALUACIÓN 01
1. Los siguientes datos corresponden a una muestra aleatoria de 30 unidades operativasde la ULADECH CATÓLICA según su número de supervisiones realizadas en el año 2012:
2 2 3 3 2 4 1 2 2 33 3 3 4 5 3 2 4 1 54 4 3 4 5 3 2 3 3 4
La información fue proporciona por la Oficina de Gerencia de Calidad ULADECHCATÓLICASe pide: a) Identificar la unidad de observación y la variable en estudio.b) Construir una tabla de distribución de frecuencias absolutas. (Tabla de Conteo) c) Construir una de distribución de frecuencias ampliada.d) Interpretar f4, F4, h4% y H4%.
e) Determinar cuántos trabajadores han tenido más de 3 supervisiones.f) Determinar qué porcentaje de trabajadores han tenido a lo más 3 supervisiones.
2. Los siguientes datos corresponden a una muestra aleatoria de 20 trabajadores de laEmpresa “Sol y Sombra” de la ciudad de Chimbote según monto de CTS en soles Juliodel 2012:
200 400 410 350 420 550 480 380 470 700250 450 500 590 600 330 650 460 580 430
Los datos fueron obtenidos de la Oficina de Personal de dicha entidad.
Se pide:a) Identificar la unidad de observación y la variable en estudio. b) Construir una distribución de frecuencias ampliada. Utilice m=5 de intervalos.c) Interpretar f2, F2, h2% y H2%. d) Determinar que porcentaje de trabajadores tienen un monto de CTS de 200 soles omás pero menos de 500 soles. (1punto)
3. Los siguientes datos corresponden a una muestra aleatoria de 40 administradores de hoteles de la ciudad de Chimbote según opinión acerca del problema que afecta la actividad turística en Marzo del 2012:
F S S I O I I I F II F I I I I O O F IO O O I I S S I I II I I I S S S I I I
Donde:
_______________________________________________ 37Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
F: Falta de promoción I: Insuficiente Infraestructura S: InseguridadO : Otros
Los datos fueron obtenidos mediante una encuesta realizada por la Empresa Apoyo S.A. a) Identificar la unidad de observación y la variable en estudio. b) Construir una distribución de frecuencias absolutas y porcentuales. c) Interpretar f2 y h2%. d) Construir un gráfico adecuado para frecuencias porcentuales. 4. Dado del siguiente cuadro:
CUADRO N° 1POBLACIÓN ECONOMICAMENTE ACTIVA OCUPADA
DE 14 A 29 AÑOS POR SEXOPERU: AÑO 2005 - 2008
AÑO 2005 2006 2007 2008
HOMBRES
2440 2582 2700 2800
MUJERES
3000 2500 2300 2200
Fuente: Encuesta de hogares. INEI
Construir un gráfico lineal y comentar. (3 puntos)
5. Identificar cada una de las siguientes variables según su clasificación:
• N° de caidas del sistema ………………………………………
• Marcas de impresoras ………………………………………
• Velocidad en mg. ……………………………..............
• Nivel socio económico ...……………………………………
6. Identifique la unidad de observación y la variable de estudio en el siguiente enunciado:
Población de usuarios de Internet según modalidad speedy de su preferencia:
Unidad de observación:………………………………………………………………Variable:………………………………………………………………
7. Determine si es una Población “N” o muestra “n” en las siguientes afirmaciones:
a) Estudio del nivel socio – económico de todos los estudiantes de la ULADECH. ( )b) Estudio del 5% de trabajadores de una empresa “X” según su sexo. ( )
_______________________________________________ 38Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA__________________________________________________________________________________________
c) Distribución del 30% de clientes del Banco de Crédito de una población de 1000 según sus ahorros mensuales en soles. ( )
d) Encuesta a 100 trabajadores de la Empresa TASA S.A según su sueldo en soles. ( )
8. De dos ejemplos de población relacionados a su campo porfesional.
9. De 4 ejemplos de variables según su clasificación
a) Variable Cuantitativa discreta: ............................................................
b) Variable cuantitiativa continua: ............................................................
c) Variable cualitativa nominal: ...........................................................
d) Variable cualitativa ordinal: ...........................................................
10. Identifique el tipo de fuente de información en las siguientes proposiciones:a) La información estadística que tiene el registro de contribuyentes de la SUNAT.
……………………………………………………………….
b) El número de arribos extranjeros registrados por el Ministerio de Comercio y Turismo.
……………………………………………………………….
11. De 1 ejemplos relacionados de fuente de información primaria y secundaria respectivamente.
......................................................................................................................
......................................................................................................................
12. De 1 ejemplo de encuesta muestral realizadas en su campo profesional.
......................................................................................................................
_______________________________________________ 39Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
CAPITULO II
MEDIDAS DE TENDENCIA CENTRAL
2.1. MEDIDAS ESTADISTICAS
2.1.1. DEFINICION:
Las medidas estadísticas son medidas de resumen que se calculan a partir de unamuestra y que describen ciertos aspectos de una serie o distribución de datos parapoder tener un mejor conocimiento de la población.
2.1.2. CLASIFICACIÓN:A continuación presentamos un mapa conceptual de la clasificación de las medidasestadísticas más usadas.
_________________________________________ 41Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
2.2. MEDIDAS DE TENDENCIA CENTRAL
2.2.1. DEFINICIÓN
Son estadígrafos que se ubican en la parte central de un conjunto de datos o de una
distribución.
Los estadígrafos de tendencia central más importantes y más usuales son: la media
aritmética, mediana y moda.
2.2.2. LA MEDIA ARITMÉTICA: También se le conoce como media o promedio. Se
obtiene sumando todos los valores de los datos observados y se divide entre el
número total de ellos.
Media Aritmética = Suma de los valores de la variable
Número total de datos
Se denota por: x o M[x
2.2.2.1. Formas de cálculo de la media aritmética:
a) Para datos no agrupados: La media aritmética para datos no agrupados está
dado por la siguiente fórmula:
Ejemplo 26:
Los siguientes datos corresponden a los sueldos mensuales en soles de 10 familias:
Xi : 650, 750, 850, 1000, 750, 820, 850, 1200, 1000, 1000
Calcular la media aritmética e interpretar.
Solución:
Sustituyendo los datos en la fórmula se tiene:
_________________________________________ 42Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
n
xx
n
ii
1
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
10
i1 2 10i 1
xx x ... x 650 + 750 + 850 + 1000 + 750 + 820 + 850 + 1200 + 1000 + 1000
x10 10 10= + + +
= = =å
x 887 soles mensuales. =
Interpretación: Los trabajadores tienen un sueldo mensual promedio de 887 soles.
b) Para datos agrupados: La media aritmética para datos agrupados está dada por
la siguiente fórmula:
n
fyy
m
iii
1
Donde "" iy es la clase o marca de clase de cada grupo o intervalo.
La media aritmética se obtiene sumando el producto de las clases o marcas de clase
por la frecuencia correspondiente y dividiendo la suma entre el número total de
datos.
b.1.) Media aritmética cuando la variable es cuantitativa discreta.
A continuación presentamos un ejemplo para calcular la media aritmética cuando la
variable es cuantitativa discreta.
Ejemplo 27: Los siguientes datos de la Tabla N° 07 corresponde a una muestra
aleatoria de 100 cabinas de Internet según su número de cibernautas que acudieron
el mes anterior:Tabla N° 07
N° de cibernautas
iy
N° de cabinas
if40 1045 2050 4055 1560 1065 5
Total 100
Calcular la media aritmética e interpretar.
_________________________________________ 43Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución:
En la siguiente tabla de trabajo le mostraremos como calcular la media aritmética
cuando la variable es discreta, debemos multiplicar los valores de cada clase con
sus respectivas frecuencias finalmente se suma esos resultados y se divide entre el
número de observaciones, tal como se muestra en la siguiente Tabla N° 8:
Tabla N° 08
N° de cibernautas
iy
N° de cabinas
if 44 ii fy 40 10 40045 20 90050 40 2000
55 15 825
60 10 60065 5 325
TOTAL 100 5050
Luego:
scibernauta 51 5.50
100
5050
100
56510601555405020451040
100
6
1
y
fyy i
ii
Interpretación: A las cabinas de Internet acuden en promedio 51 cibernautas
durante el mes anterior.
b.2.) Media aritmética cuando la variable es cuantitativa continua:
A continuación le mostraremos cono calcular la media aritmética cuando la variable
es cuantitativa continua:
Ejemplo 28:
La siguientes datos de la Tabla N° 09 corresponde a una muestra aleatoria de 300
trabajadores según su edad en años:
_________________________________________ 44Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Tabla N° 09
Edad en en años
LI - LS
N° detrabajadores
fi
[25 - 30) 40 [30 - 35) 60 [35 - 40) 100
[40 - 45) 92 [45 - 50) 8
TOTAL 300Se pide:
Calcular la media aritmética e interpretar
Solución:
Para calcular la media aritmética para datos agrupados cuando la variable es
continua debemos hallar la marca de clase o punto medio de cada intervalo y luego
ese valor hallado multiplicarlo por su respectiva frecuencia, finalmente debemos
sumar los resultados hallados y dividir entre el número total de observaciones, tal
como se muestra en la siguiente tabla N° 10:TABLA N° 10
Edad en años
)i()i( LSLI Marca de Clase
iy
N° de
trabaj.
if ii fy
[25 - 30) 27.5 40 1100 [30 - 35) 32.5 60 1950 [35 - 40) 37.5 100 3750 [40 - 45) 42.5 92 3910 [45 - 50) 47.5 8 380
Total - 300 11090
Luego:6
i ii 1
y f27.5 40 32.5 60 37.5 100 42.5 92 47.5 8
y1300 300
11090y 36.97 años.
300
=
´´ + ´ + ´ + ´ + ´
= =
= =
å
Interpretación: Los trabajadores tienen en promedio 36.97 años.
_________________________________________ 45Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
i12345
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
2.2.2.2. Características:
• Es la más conocida y más usada en el análisis estadístico.
• Para su cálculo intervienen todas las observaciones.
• Es una medida única, es decir un conjunto de datos tiene una sola media.
• Es sensible a los valores extremos demasiados altos o demasiados bajos.
• No se puede calcular cuando presenta clases abiertas en los extremos.
2.2.3. LA MEDIANA: Es una medida de tendencia central que divide al total de n
observaciones debidamente ordenadas o tabuladas en dos partes de igual tamaño,
cada una con el 50% de los datos observados.
Notación: Me.
2.2.3.1. Formas de cálculo
a) Para datos no agrupados: Para calcular la mediana, los n datos originales se
ordenan en forma ascendente o descendente, luego se halla el lugar en donde se
encuentra la mediana (lugar = (n + 1)/2) y finalmente se determina su valor. Se
presenta dos casos:
a.1.) Para un número par de datos: La mediana será el promedio de los dos
valores centrales..
Ejemplo 29:
Calcular e interpretar la mediana del Ejemplo 26 de la pag. 38.:
Xi : 650, 750, 850, 1000, 750, 820, 850, 1200, 1000, 1000
Solución:
Ordenando en forma ascendente
650 750 750 820 850 850 1000 1000 1000 12000
Lugar 5.5
Ubicando el lugar en donde se encuentra la Me
n 1 10 1Lugar 5.5
2 2
+ += = =
_________________________________________ 46Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Cuando se tiene un número par de datos la mediana será el valor será el
promedio de los dos valores centrales:
Interpretación: El 50% de los trabajadores tienen un ingreso máximo de 850
soles , no más del 50% supera dicho ingreso.
a.2.) Para un número impar de datos: La mediana será el valor que está
ocupando la posición central.
Ejemplo 30:
Los siguientes datos corresponden a los tiempos de acceso en minutos a 11
Páginas Web cargadas por la tarde en el horario de 14 a 15 horas desde un
ordenador domestico:
Xi: 2.9, 1.4, 1.2, 3.4, 1.3, 2.5, 1.6, 1.8, 2.3, 1.5, 1.0
Solución:
Ordenando los datos en forma ascendente
1.0 1.2 1.3 1.4 1.5 1.6 1.8 2.3 2.5 2.9 3.4
Lugar 6
Hallando el lugar en donde se encuentra la mediana:
Cuando se tiene un número impar de datos la mediana será el valor que está
ocupando la posición central.
_________________________________________ 47Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
850 850Me
2
Me 850 soles.
+=
=
n 1 11 1Lugar 6
2 2
+ += = =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Interpretación: El 50% de las páginas Web son cargadas en un tiempo de acceso
máximo de 1.6 minutos., el otro 50% supera dicho tiempo.
b) Para datos agrupados
b.1) La mediana cuando la variable es cuantitativa discreta: Cuando la variable
es cuantitativa discreta y los datos se encuentra agrupados la mediana será el valor
de la variable cuya frecuencia acumulada sea la primera en exceder a n/2, así:
Me = Xi tal que: Fi n/2
“i” determina clase
en donde se encuentra la Me.
Ejemplo 31:
Calcular e interpretar la mediana de los datos de la tabla N° 07 de la página 39.
Tabla N° 11
N° de cabinas
iy
N° de cibernautas
if iF40 10 1045 20 30
50 40 7055 15 8560 10 9565 5 100
Total 100 -
Aquí vemos que n = 100, luego n/2 = 50
Entonces la primera frecuencia acumulada que excede a 2
n = 50 es 70, esto es:
70 50
F3 10
“i = 3”, la mediana se encuentra en la 3ra. clase.
Me = 50 cibernautas
Interpretación: Al 50% de las cabinas acuden como máximo 50 cibernautas durante
el mes anterior, el otro 50% de las cabinas supera dicho número.
_________________________________________ 48Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
i
1
2
3
4
5
6
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
b.2.) La mediana cuando la variable es cuantitativa continua: Para calcular la
mediana cuando la variable es cuantitativa continua se utilizará la siguiente fórmula:
i
iii f
FnCLIMe 1
)(
2/
Se debe cumplir la siguiente relación:
“i” determina el intervalo en
donde se encuentra la Me.
Cuando:
21
nFi
La mediana está dado por:
Me = )(iLI
Además:
)(iLI: Límite inferior del intervalo en donde se encuentra la Me.
iC : Amplitud o ancho del intervalo en donde se encuentra la Me.
n : Número de observaciones de la muestra.
1iF : Frecuencia acumulada inmediata anterior al intervalo en donde se
encuentra la Me.
if : Frecuencia absoluta del intervalo en donde se encuentra la Me
_________________________________________ 49Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
ii Fn
F 21
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Ejemplo 32:
Calcular e interpretar la mediana de los datos de la Tabla N° 09 de la página 41:
Solución: Tabla N° 12
Edad en en años
LI - LS
N° detrabajadores
fiiF
[25 - 30) 40 40 [30 - 35) 60 100 [35 - 40) 100 200 [40 - 45) 92 292 [45 - 50) 8 300
TOTAL 300 -
Vemos que n = 300 n
1502=
y de acuerdo a la relación dada tenemos:
100 150 200
F2 150 F3
“i = 3”, la mediana se
encuentra en el 3er. intervalo.
Reemplazando el subíndice i=3 en la fórmula y los valores correspondientes
tenemos:
[ ]
[ ]
2(3) 3
3
n / 2 FMe LI C
f
150 100Me 35 5
100
Me 37.5 años.
-= + ´
-= + ´
=
Interpretación: El 50% de los trabajadores tienen una edad máxima de 37.5 años,
el otro 50% supera dicha edad.
_________________________________________ 50Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
i12345
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
2.2.3.2. Características:
La mediana es un estadígrafo que no está afectada por valores extremos muy
altos o muy bajos y por lo tanto es más representativa que la media
aritmética, o cuando las distribuciones son poco simétricas.
Es útil cuando los datos agrupados tienen clases abiertas en los extremos.
Es una medida única; esto es, una distribución tiene solamente una mediana.
2.2.4. LA MODA: Es una medida de tendencia central que corresponde al valor de
la variable que tiene frecuencia máxima.
Notación: Md.
Una distribución puede ser amodal sino tiene ninguna moda, unimodal si tiene una
moda, bimodal si tiene dos modas y multimodal si tiene tres o más modas.
En consecuencia es necesario considerar modas absolutas y modas relativas.
2.2.4.1. Formas de cálculo
a) Para datos no agrupados
La moda será el valor que se repite el mayor número de veces.
Ejemplo 33:
Calcular e interpretar la moda del Ejemplo 26 de la pag. 38.
Solución:
Observamos que el valor que se repite frecuentemente es 850 y 1000.
Entonces: Md = 850 y 1000 soles.
Interpretación: El mayor número de trabajadores tiene un sueldo mensual de 850 y
1000 soles.
Ejemplo 34:
Calcular e interpretar la moda del coeficiente intelectual expresado en puntaje del
siguiente grupo de alumnos.
Xi: 95, 100, 105, 110, 95, 100, 110, 110, 95
_________________________________________ 51Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución:
Md = 95 y 110
Interpretación:
El mayor número de alumnos tiene un coeficiente intelectual de 95 y 110 puntos. En
este caso la serie es bimodal.
b) Para datos agrupados
b.1.) La moda cuando la variable es cuantitativa discreta
La moda será clase cuya frecuencia es máxima. Así:
Md = yi Tal que: fi-1 fi fi + 1
“i” determina la clase en
donde se encuentra la Moda
Ejemplo 35:
Calcular e interpretar la moda de los datos de la tabla N° 07 de la pag. 39.
Solución:Tabla N° 13
N° de
cibernautas
iy
N° de cabinas
if
40 1045 2050 4055 1560 1065 5
Total 100
Observamos que la mayor frecuencia es 40 y se cumple que:
20 40 15
f2 f3 f4
“i” = 3 la moda se encuentra en la 3ra. clase.
Por lo tanto:
Md = 50 cibernautas
_________________________________________ 52Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
i1
2
3
4
5
6
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Interpretación: Al mayor número de cabinas acudieron 50 cibernautas durante el
mes anterior.
b.2.) La moda cuando la variable es cuantitativa continua: Para calcular la moda
cuando la variable es continua se utilizará la siguiente fórmula:
Se debe cumplir la siguiente relación:
i 1 i i 1f f f- +< >
Además:
d1 = fi – fi-1
d2 = fi – fi+1
Ejemplo 36:
Calcular e interpretar la moda de los datos dados en la tabla N°09 de la página 41.
Solución:Tabla N° 14
Edad en en años
LI - LS
N° de trabajadoresfi
[25 - 30) 40 [30 - 35) 60 [35 - 40) 100
[40 - 45) 92
[45 - 50) 8 TOTAL 300
Observamos en la tabla N° 14 que la mayor frecuencia es 100 y se cumple que:
60 100 92
f2 f3 f4
i=3, la Md. se encuentra en el 3er.
intervalo.
d1= f3 – f2 = 100 – 60 = 40
d2= f3 – f4 = 100 – 92 = 8
_________________________________________ 53Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
i12345
' i ” determina el intervalo en donde se encuentra la Moda.
1(i) i
1 2
dMd LI C
d d= + ´
+
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Reemplazando el subíndice i=3 en la fórmula y los valores correspondientes
tenemos:
1(3) 3
1 2
dMd LI C
d d
40Md 35 5
48
Md 39.17 años.
= + ´+
æ ö= + ´ç ÷è ø
=
Interpretación: El mayor número de trabajadores tiene 39.17 años.
2.2.4.2. Características:
• No se encuentra afectada por valores extremos.
• Puede usarse cuando los datos presentan clases abiertas en los extremos.
• No es significativa a menos que la distribución contenga un gran número de
datos y exista significativa repetición de alguno de ellos.
• Muchas veces la serie no tiene moda porque ningún valor se repite.
• Cuando la serie tiene dos, tres, o más modas, se hace difícil su interpretación y
comparación.AUTOEVALUACIÓN 02
1. Para lanzar un nuevo producto al mercado, una empresa estudia el tiempo publicidad, ensegundos, empleados en los medios audiovisuales por otra empresa que produce unproducto similar, los datos se muestran en la siguiente tabla:
Tiempo de publicidad ensegundos
LI - LS
N° de anunciosfi
[00 - 20) 10
[20 - 25) 30
[25 - 30) 50
[30 - 35) 40
[35 - 40) 20
Total 150
_________________________________________ 54Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Se pide calcular e interpretar:
a) La media.b) La mediana.c) La moda
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
2. La siguiente tabla corresponde a una muestra aleatoria de 30 pequeñas empresas de laciudad de Chimbote según el número de empleados:
N° de empleadosYi
N° de empresasfi
2 33 74 105 76 3
TOTAL 30Calcular e interpretar:
a) La moda b) La mediana. c) La media aritmética
3. Los siguientes datos corresponden al importe de las facturas en dólares por gastosconsumo en un hotel 3 estrellas de la ciudad de Chimbote de 11 turistas:
Xi: 500, 700, 600, 910, 510, 700, 700, 700, 650, 700, 800
a) Calcular el importe de las facturas por gastos de consumo del mayor número de turistas.b) Calcular el importe promedio de las facturas por consumo de los turistas.c) Calcular el importe de las facturas por gastos de consumo de la mitad de turistas.
4. Los siguientes datos corresponden a 11 clientes del de la Caja Municipal del Santasegún sus préstamos en dólares: Xi: 4000, 3200, 4500, 3100, 4200, 3500, 4100, 4900, 5100, 3000, 3450
Que medida de tendencia central se ajusta al conjunto de datos dato. ¿Cuál es su valor?
_________________________________________ 55Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
CAPITULO III
MEDIDAS DE DISPERSIÓN Y MEDIDAS DE FORMA
3.1. MEDIDAS DE DISPERSIÓN
3.1.1. DEFINICIÓN
Las medidas de dispersión son aquellas que cuantifican el grado de concentración o
de dispersión de los valores de la variable en torno de un valor central, generalmente
la media aritmética. Las medidas de dispersión se utilizan para dos propósitos
básicos:
a) Para verificar la confiabilidad de los promedios y
b) Para que sirva como base para el control de la variación misma.
Las medidas de dispersión que se utilizan con mayor frecuencia son:
Varianza.
Desviación estándar.
Coeficiente de variación.
3.1.2. LA VARIANZA
Es una medida que cuantifica el grado de dispersión o de variación de los valores de
una variable cuantitativa con respecto a su media aritmética. Si los valores tienden a
concentrarse alrededor de su media, la varianza será pequeña. Si los valores tienen
a distribuirse lejos de la media, la varianza será grande.
La varianza calculada a partir de una muestra se denota por s2 y referida a la
población se denota por 2 o V [x.
La varianza se define como la media aritmética de los cuadrados de las desviaciones
de los datos respecto a su media aritmética. La varianza es una medida de
dispersión con unidades de medición al cuadrado: S/.2, $2, km2, etc. La varianza
siempre es positiva.
a) La varianza para datos no agrupados:
Se utiliza la siguiente fórmula:
Para n 30
_________________________________________ 56Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
n
)xx(s
n
1i
2i
2
Para n 30 [varianza de Cochran]
1n
)xx(s
n
1i
2i
2
Ejemplo 36:
Los siguientes datos corresponden a una muestra al azar de 8 clientes según su
tiempo en minutos que han visitado la página de Internet Google:
Xi : 2.3, 4.5, 4.2, 3.2, 4.4, 2.1, 1.6, 4.3
Calcular e interpretar la varianza:
Solución:
a) Para hallar la varianza primero debemos hallar el tiempo promedio de visita de los
clientes:
utosmin3.38
6.26
8
xx
8
1ii
A continuación construiremos una tabla de trabajo para calcular la varianza:
Tabla N° 15
i ix )xx( i 2
i )xx( 1 2.3 -1.0 1.002 4.5 1.2 1.443 4.2 0.9 0.814 3.2 -0.1 0.015 4.4 1.1 1.216 2.1 -1.2 1.447 1.6 -1.7 2.898 4.3 1.0 1.00
Total 26.6 - 9.80
_________________________________________ 57Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Donde:
80.9)xx(8
1i
2i
Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=8 <
30.8
2i
2 2i 1
(x x)9.80
s 1.4min utos8 1 7
=
-= = =
-
å
Interpretación: La variabilidad de los tiempos de visita de los clientes a la pagina
Web Google respecto de su valor central es de 1.4 minutos2 .
b) La varianza para datos agrupados:
Se utiliza la siguiente formula:
Ejemplo 37 :
Los siguientes datos de la tabla que se da a continuación corresponden a 240
trabajadores de una Empresa “X” según su número de inasistencias:
Tabla N° 16N° de
inasistenciasyi
N° de trabajadores
fi
3 105 307 1009 80
11 20
Total 240
Calcular e interpretar la varianza.
_________________________________________ 58Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
m2
i i2 i 1
m2
i i2 i 1
(y y) fs ; para n 30
n
(y y) fs ; para n 30 (Varianza de Cochran)
n 1
=
=
- ´= >
- ´= £
-
å
å
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución:
a) Hallando en primer lugar el número promedio de inasistencias:
b) A continuación construiremos una tabla de trabajo para calcular la
varianza:
Tabla N° 17
yi fi
3 10 -4.58 20.98 209.85 30 - 2.58 6.66 199.87 100 - 0.58 0.34 34.09 80 1.42 2.02 161.611 20 3.42 11.70 234.0
Total 240 - - 839.2Donde:
Reemplazando dicho valor en la formula de la varianza para n=240 > 30.
_________________________________________ 59Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
5
i ii 1
y f1820
y 7.58 inasistencias240 240
=
´= = =å
i(y y)- 2i(y y)- 2
i i(y y) f- ´
25
i ii 1
(y y) f 839.2=
- ´ =å
52
2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 1
52
i i2 i 1
52
i i2 i 1
2
(y y) f(y y) f (y y) f (y y) f (y y) f (y y) f
s240 240
(y y) f20.98 10 6.66 30 0.34 100 2.02 80 11.70 20
s240 240
(y y) f209.8 199.8 34 161.6 234
s240 240
(ys
=
=
=
- ´- ´ + - ´ + - ´ + - ´ + - ´
= =
- ´´ + ´ + ´ + ´ + ´
= =
- ´+ + + +
= =
=
å
å
å
52
i ii 1
52
i i2 2i 1
y) f839.2
240 240
(y y) fs 3.5 4 inasistencias .
240
=
=
- ´=
- ´= = @
å
å
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Interpetración: La variabilidad de las inasistenicas es de 4 inasistencias2 respecto
de su valor central.
Ejemplo 38: La siguiente tabla corresponde a 280 trabajadores de una Empresa “X” según su edad enaños:
Tabla N° 18Edad en en años
LI - LS
N° de trabajadoresfi
[25 - 30) 40 [30 - 35) 50 [35 - 40) 100
[40 - 45) 50 [45 - 50) 40
TOTAL 280
Calcular e interpretar la varianza.
Solución:
Hallando en primer lugar el promedio:
A continuación construiremos una tabla de trabajo para calcular la varianza:
Tabla N° 19
Li - Ls y fi
[25 - 30) 27.5 40 -10 100 4000 [30 - 35) 32.5 50 -5 25 1250 [35 - 40) 37.5 100 0 0 0 [40 - 45) 42.5 50 5 25 1250 [45 - 50) 47.5 40 10 100 4000
Total - 280 - - 10500
Donde:
_________________________________________ 60Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
5
i ii 1
y f10500
y 37.5 años280 280
=
´= = =å
25
i ii 1
(y y) f 10500=
- ´ =å
i(y y)- 2i(y y)- 2
i i(y y) f- ´
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Reemplazando dicho valor en la formula de la varianza para n=240 > 30.
Interpetración: La variabilidad de las edades de los trabajadores es de 37.5 años 2
respecto de su valor central.
3.1.3. La desviación estándar o típica
Se define como la raíz cuadrada positiva de la varianza:
Es uno de los estadígrafos de dispersión de mayor uso, la cual se expresa en
unidades reales de la variable, es decir ya no están elevadas al cuadrado. La
desviación estándar, al igual que la varianza, es no negativa (s 0), puesto que es la
raíz positiva de la varianza. A mayor dispersión le corresponderá una mayor
desviación estándar.
_________________________________________ 61Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
52
2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 1
52
i i2 i 1
52
i i2 i 1
52
i i2 i 1
(y y) f(y y) f (y y) f (y y) f (y y) f (y y) f
s280 280
(y y) f100 40 25 50 0 100 25 50 100 40
s280 280
(y y) f4000 1250 0 1250 4000
s280 280
(y y) fs
2
=
=
=
=
- ´- ´ + - ´ + - ´ + - ´ + - ´
= =
- ´´ + ´ + ´ + ´ + ´
= =
- ´+ + + +
= =
- ´=
å
å
å
å
52
i i2 2i 1
10500
80 280
(y y) fs 37.5 años
280=
=
- ´= =å
ianzas var
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Ejemplo 39:
Calcular e interpretar la desviación estándar de los datos del Ejemplo 36 de la pag.
54..
Solución:
Interpretación: Los tiempos de visita de los clientes se alejan en promedio de su
valor central en 1.95 puntos.
Ejemplo 40 :
Calcular e interpretar la desviación del Ejemplo 37 de la pag. 55:
Solución:
3.5 1.87 2 .= = @s inasistencias
Interpretación: Las asistencias de los trabajadores se dispersan o se alejan en
promedio de su valor central en 2 inasistencias.
Ejemplo 41 :
Calcular e interpretar la desviación del Ejemplo 38 de la pag. 57:
Solución:
Interpretación: Las edades de los trabajadores se dispersan o se alejan en
promedio de su valor central en 6.12 años.
3.1.4. El coeficiente de variación
Es una medida de dispersión relativa exenta de unidades y expresada en porcentaje,
se utilizan para comparar la variación de dos distribuciones siempre que las
variables se expresen en las mismas unidades de medida y sean aproximadamente
del mismo tamaño promedio. Sin embargo, a veces es necesario comparar dos
conjuntos de datos expresados en unidades diferentes (tales como soles y
_________________________________________ 62Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
s 1.4 1.2min utos= =
37.5 6.12 .= =s años
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
kilogramos). En estos casos las medidas de dispersión absoluta no son comparables
y deben utilizarse medidas de dispersión relativa.
El coeficiente de variación de un conjunto de datos se denota por c.v. y se expresa
como:
Donde:
estándar Desviación s
aritmética Mediay
Si c.v. 15%, los datos son homogéneos, es decir tienen una baja variabilidad.
Si c.v. > 15%, los datos son heterogéneos, es decir tienen una alta variabilidad.
Ejemplo 42:
Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 36 de la
pag. 54.
Solución:
Interpretación: Las dispersiónes de los tiempos utilizados por los clientes en visitar
la página Google respecto de su valor central son heterogéneos.
Ejemplo 43:
Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 37 de la
pag. 55:
Solución:
_________________________________________ 63Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
100y
s.v.c
%15%4.361003.3
2.1.v.c
1.87. . 100 24.67% 15%
7.58c v = ´ = >
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Interpretación: Las dispersiones de las inasistencias de los trabajadores respecto
de su valor central son heterogéneos.
Ejemplo 44:
Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 38 de la
pag. 57:
Solución:
Interpretación: Las dispersiones de las edades de los trabajadores respecto de su
valor central son heterogéneos.
Ejemplo 45: Los siguientes datos corresponden a una muestra aleatoria de los gastos mensualesen soles de 7 estudiantes de administración:
Xi : 200, 250, 250, 400, 270, 300, 420
a) ¿Cuánto es la dispersión de los gastos mensuales respecto de su valor central?
b) ¿Son los gastos mensuales homogéneos?
Solución:
a) Hallando en primer lugar el promedio:7
ii 1
x2090
x 298.57soles.7 7
== = =å
b) A continuación construiremos una tabla de trabajo para calcular la
varianza:
Tabla N ° 20
i ix )xx( i 2
i )xx( 1 200 -98.57 9716.042 250 -48.57 2359.043 250 -48.57 2359.044 400 101.43 10288.045 270 -28.57 816.24
_________________________________________ 64Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
6.12. . 100 16.32% 15%
37.5= ´ = >c v
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
6 300 1.43 2.047 420 121.43 14745.24
Total 2090 - 40285.68Donde:
72
ii 1
(x x) 40285.68=
- =åReemplazando dicho valor en la formula de la varianza de Cochran ya que n=7 <
30.
c) Hallando la desviación estándar :
s 6714.28 81.94 soles.= =
d) Hallando el coeficiente de variación:
De acuerdo a las operaciones realizadas tenemos:
entonces:
Los gastos mensuales de los estudiantes no son homogéneos.
Ejemplo 46:
Los siguientes datos corresponden a una muestra aleatoria de los ahorros
mensuales en dólares de 5 clientes del Banco de Crédito del Perú:
Xi: 500, 550, 220, 340, 180
_________________________________________ 65Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
72
i2 2i 1
(x x)40285.68
s 6714.28 soles .7 1 6
=
-= = =
-
å
x 298.57 soles.
s 81.94 soles.
=
=
6.12. . 100 100 16.32% 15%
37.5= ´ = ´ = >
sc v
x
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
El gerente del Banco piensa hacer un aumento en la tasa de interés solo si los
ahorros mensuales son regulares. ¿Qué decisión tomará el gerente del Banco.
(Hallar coeficiente de variación).
Solución:
a) Hallando en primer lugar el ahorro mensual promedio:
5
ii 1
x1790
x 358dólares.5 5
== = =å
b) A continuación construiremos una tabla de trabajo para calcular la
varianza:
Tabla N° 21
i ix )xx( i 2
i )xx( 1 500 142 201642 550 192 368643 220 -138 190444 340 - 18 3245 180 -178 31684
Total 1790 - 108080
Donde:5
2i
i 1
(x x) 108080=
- =åReemplazando dicho valor en la formula de la varianza de Cochran ya que
n=5 < 30.
c) Hallando la desviación estándar :
s 27020 164.38 dólares.= =
d) Hallando el coeficiente de variación:
De acuerdo a las operaciones realizadas tenemos:
_________________________________________ 66Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
52
i2 2i 1
(x x)108080
s 27020 dólares .5 1 4
=
-= = =
-
å
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
x 358 dólares.
s 164.38 dólares.
=
=
entonces:
Los ahorros mensuales de los clientes son heterogéneos; es decir no son
regulares. Por lo tanto el gerente del banco no subirá la tasa de interés. El gerente
no subirá la tasa de interés ya que los ahorros mensuales no son regulares.
Ejemplo 47:
Los siguientes datos corresponden a una muestra aleatoria de los ahorrosmensuales en dólares de dos grupos de clientes del Banco Continental :
Tabla N° 22GRUPO 1 2 3 4 5 6
1 500 550 540 530 520 550
2 400 450 500 460 450 470
¿En que grupo los ahorros son más estables? (Hallar coeficiente de variación)
Solución:
Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada
uno de los grupos se obtiene los siguientes resultados:
Para el Grupo 1
a) Hallando el ahorro mensual promedio para el Grupo 1:6
ii 1
1
x3190
x 531.67soles.6 6
== = =å
b) Hallando la varianza:
_________________________________________ 67Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
164.38. . 100 45.92% 15%
358= = ´ = >
sc v
x
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Tabla N° 23
i ixi(x x )- 2
i(x x )-1 500 -31.67 1002.992 550 18.33 335.993 540 8.33 69.394 530 -1.67 2.795 520 -11.67 136.196 550 18.33 335.99
Total 3190 - 1883.34Donde:
62
ii 1
(x x) 1883.34=
- =åReemplazando dicho valor en la formula de la varianza de Cochran ya que
n=6 < 30.
c) Luego hallamos la desviación estándar :
1s 376.67 19.41 soles.= =
d) Finalmente hallamos el coeficiente de variación:
Para el Grupo 2
a) Hallando el ahorro mensual promedio para el Grupo 2:6
ii 1
2
x2730
x 455soles6 6
== = =å
b) Hallando la varianza:
_________________________________________ 68Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
11
1
19.41. 100 3.65% 15%
531.67= = ´ = <
sc v
x
62
i2 2i 11
(x x)1883.34
s 376.67 soles .6 1 5
=
-= = =
-
å
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Tabla N° 24
i ixi(x x )- 2
i(x x )-1 400 -55 30252 450 -5 253 500 45 20254 450 -5 255 460 5 256 470 15 225
Total 2730 - 5350Donde:
62
ii 1
(x x) 5350=
- =åReemplazando dicho valor en la formula de la varianza de Cochran ya que
n=6 < 30.
c) Luego hallamos la desviación estándar :
2s 1070 32.71 soles.= =
d) Finalmente hallamos el coeficiente de variación:
La siguiente tabla muestra los resultados obtenidos en forma resumida:
Tabla N° 25GRUPO x s .v.c
1 531.67 19.41 3.65% < 15%2 455 32.71 7.19% <15%
Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos,
se observa que en el Grupo 1 los ahorros son más estables.
_________________________________________ 69Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
62
i2 2i 12
(x x)5350
s 1070 soles .6 1 5
=
-= = =
-
å
21
2
32.71. 100 7.19% 15%
455= = ´ = <
sc v
x
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Ejemplo 48:
Los siguientes datos corresponden a dos muestras aleatorias de dos grupos detrabajdores según su sueldo mensual en soles:
Tabla N° 26 - GRUPO 1Sueldo mensual en soles
LI - LSN° de trabajadores
fi
[550 - 650) 40[650 - 750) 60[750 - 850) 100[850 - 950) 40 [950 - 1050) 20
Total 260 Tabla N° 27 - GRUPO 1
Sueldo mensual en soles LI - LS
N° de trabajadoresfi
[750 - 850) 30[850 - 950) 50[950 - 1050) 80
[1050 - 1150) 40[1150 - 1250) 10
TOTAL 210
¿Qué grupo tiene sueldos mensuales más homogéneos?
Solución:
Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada
uno de los grupos se obtiene los siguientes resultados:
Para el Grupo 1
a) Hallando en primer lugar el promedio:
b) A continuación construiremos una tabla de trabajo para calcular la
varianza:
_________________________________________ 70Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
5
i ii 1
1
y f202000
y 776.92 soles260 260
=
´= = =å
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Tabla N° 28
Li - Ls yi fi
[550 - 650) 600 40 -176.92 31300.69 1252027.6[650 - 750) 700 60 -76.92 5916.69 355001.4[750 - 850) 800 100 23.08 532.69 53269.0[850 - 950) 900 40 123.08 15148.69 605947.6
[950 - 1050) 1000 20 223.08 49764.69 995293.8 Total 260 - - 3261539.4
Donde:
Reemplazando dicho valor en la formula de la varianza para n=260 > 30.
c) Hallando la desviación estándar:
1s 12544.48 112.00 soles.= =
_________________________________________ 71Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
25
i ii 1
(y y) f 3261539.4=
- ´ =å
52
2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 11
52
i i2 i 11
52
i i2 i 11
(y y) f(y y) f (y y) f (y y) f (y y) f (y y) f
s260 260
(y y) f31300.69 40 5916.69 60 53269.0 100 15148.69 40 49764.69 20
s260 260
(y y) f1252027.6 355
s260
=
=
=
- ´- ´ + - ´ + - ´ + - ´ + - ´
= =
- ´´ + ´ + ´ + ´ + ´
= =
- ´+
= =
å
å
å
52
i i2 i 11
52
i i2 2i 11
001.4 53269.0 605947.6 995293.8
280
(y y) f3261539.4
s260 260
(y y) fs 12544.38soles
260
=
=
+ + +
- ´= =
- ´= =
å
å
i(y y)- 2i(y y)- 2
i i(y y) f- ´
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
d) Hallando el coeficiente de variación:
Para el Grupo 2
a) Hallando en primer lugar el promedio:
b) A continuación construiremos una tabla de trabajo para calcular la
varianza:
Tabla N° 29
Li - Ls yi fi
[ 750 - 850) 800 30 -176.19 31042.92 931287.60 [ 850 - 950) 900 50 - 76.19 5804.92 290246.00 [ 950 - 1050) 1000 80 23.81 566.92 45353.60[1050 - 1150) 1100 40 123.81 15328.92 613156.80 [1150 - 1250) 1200 10 223.81 50090.92 500909.16
Total - 210 - - 2380953.16
Donde:
Reemplazando dicho valor en la formula de la varianza para n=210 > 30.
_________________________________________ 72Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
11
1
s 112.00c.v 100 14.42% 15%
776.92y= = ´ = <
5
i ii 1
2
y f205000
y 976.19 soles210 210
=
´= = =å
25
i ii 1
(y y) f 2380953.16=
- ´ =å
i(y y)- 2i(y y)- 2
i i(y y) f- ´
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
c) Hallando la desviación estándar:
1s 11337.87 106.48 soles.= =
d) Hallando el coeficiente de variación:
Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada
uno de los grupos se obtiene los siguientes resultados:
Tabla N° 30GRUPO x s .v.c
1 776.92 112 14.42% < 15%2 976.19 106.47 10.91% <15%
Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos,
se observa que en el Grupo 2 los sueldos mensuales son más homogéneos.
_________________________________________ 73Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
52
2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 12
52
i i2 i 11
52
i i2 i 11
(y y) f(y y) f (y y) f (y y) f (y y) f (y y) f
s210 210
(y y) f31042.92 30 5916.69 60 566.92 80 15328.92 40 50090.92 10
s210 210
(y y) f931287.60 29024
s210
=
=
=
- ´- ´ + - ´ + - ´ + - ´ + - ´
= =
- ´´ + ´ + ´ + ´ + ´
= =
- ´+
= =
å
å
å
52
i i2 i 11
52
i i2 2i 11
6.00 45353.60 613156.80 500909.16
210
(y y) f2380953.16
s210 210
(y y) fs 11337.87soles
210
=
=
+ + +
- ´= =
- ´= =
å
å
11
1
s 106.48c.v 100 10.91% 15%
976.19y= = ´ = <
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
3.2. MEDIDAS DE FORMA
3.2.1. DEFINICIÓN
Miden la forma de distribución de los valores de la serie y se clasifican en simétricas
o asimétricas y en puntiagudas o no. Por sus características requieren que los datos
sean cuantitativos y por lo general continuos.
3.2.1. MEDIDAS DE ASIMETRIA
Son medidas que miden el grado de deformación horizontal de una serie de datos o
de distribución de frecuencias.
Se dice que una distribución de frecuencias es simétrica, si los intervalos
equidistantes del intervalo central tienen iguales frecuencias. También se dice que
una distribución es simétrica si su curva de frecuencias es simétrica con respecto al
centro de los datos.
Dos distribuciones pueden tener la misma media y la misma desviación estándar,
pero pueden diferir en el grado de asimetría.
Si la distribución es simétrica, entonces la media, la mediana y la moda coinciden.
En contraposición, si estos 3 promedios no coinciden la distribución es asimétrica.
Entre las medidas de asimetría más usuales tenemos:
- El Coeficiente de asimetría de Pearson
Se expresa como:
Si:
AS = 0 La serie de datos o la distribución es simétrica. Ver fig. 1.
AS > 0 La serie de datos o la distribución es asimétrica positiva
(sesgada a la derecha). Ver fig. 2.
AS < 0 La serie de datos o la distribución es asimétrica negativa
(sesgada a la izquierda). Ver fig. 3.
_________________________________________ 74Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
3(x Me)As
s
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
NOTA:
Si As 0, entonces se dice que la distribución es aproximadamente
simétrica o ligeramente sesgada. Será tanto más sesgada cuanto más As
se aleje de cero.
Ejemplo 49:
Calcular e interpretar el coeficiente de asimetría de los datos del Ejemplo 36 de la
página 54.
Solución:
Utilizando el coeficiente de asimetría de Pearson :
s
)Mex(3As
De los datos dados se ha obtenido:
Reemplazando en la fórmula obtenemos:
_________________________________________ 75Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
x Me Md
fig.2
= =
Distribución Asimétrica Positiva
Distribución Simétrica
Distribución Asimétrica Negativa
x Me Md
fig.3
< <
x 3.3min utos
Me 3.7 min utos
s 1.2min utos
===
Md Me x
fig. 1
< <
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Interpretación: Este valor indica que la serie de tiempos de los clientes que visitan
la página Google es asimétrica negativa.
Ejemplo 50:
Hallar el coeficiente de asimetría de Pearson del Ejemplo 37 de la página 55.
Solución:
Utilizando el coeficiente de asimetría de Pearson :
De los datos dados se ha obtenido:
Reemplazando en la fórmula obtenemos:
Interpretación: La distribución de trabajadores según su número de inasistencias es
asimétrica positiva.
En el siguiente gráfico podemos observar que que hay mayor concentración de
datos a la derecha:
_________________________________________ 76Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
12.1
)7.33.3(3As
3(7.58 7)As 0.93
1.87
-= =
y 7.58inasistencias
Me 7inasistencias
s 1.87 inasistencias
==
=
3(y Me)As
s
-=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Ejemplo 51:
Hallar el coeficiente de asimetría de Pearson del Ejemplo 38 de la página 57.
Solución:
Utilizando el coeficiente de asimetría de Pearson :
De los datos dados se ha obtenido:
Reemplazando en la fórmula obtenemos:
Interpretación: La distribución de trabajadores según su edad en años es simétrica.
_________________________________________ 77Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
3(37.5 37.5)As 0
6.12
-= =
y 37.5 años.
Me 37.5 años.
s 6.12 años.
===
100
80
60
40
20
0 3 5 7 9 11
Nº
de
tra
ba
jad
ore
s
N° de inasistencias
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
En el gráfico se observa que en hay igual concentración de datos a la izquierda y
derecha.
3.2.2. MEDIDAS DE CÚRTOSIS
La Kúrtosis es el grado de apuntamiento de una distribución. La cúrtosis se analiza
amparando la distribución con la forma de una curva normal o simétrica, con igual
media aritmética y desviación estándar de la distribución que se estudia.
Si una distribución tiene relativamente un elevado pico o apuntamiento, se llama
leptocúrtica, mientras si es achatada se denomina platicúrtica. La distribución
normal constituye una distribución mesocúrtica, tal como se puede ver en las
siguientes figuras:
_________________________________________ 78Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
100
8 0
60
40
20
0
y Me Md= =
Nº
de
trab
ajad
ore
s
0 25 30 35 40 45 50 37.5
Edad en años
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Leptocúrtica Mesocúrtica Platicúrtica
El estadígrafo para analizar el apuntamiento es el coeficiente de kúrtosis y se
expresa como:
4
4
Mk
s
Donde:4 2 2
2
m4
i i4 i 1
s (s )
s Varianza
(y y) fM
n=
=
=
- ´=å
4M se llama: “cuarto momento respecto a la media”
Si:
3K , la distribución es normal o mesocúrtica.
3K , la distribución es platicúrtica.
3K , la distribución es leptocúrtica.
_________________________________________ 79Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
fig. 4 fig. 5 fig. 6
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Ejemplo 52:
Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 37 de la pag. 55.
Solución:
a) Hallando en primer lugar el promedio de los datos dados:
b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la
cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los
valores hallados en la última columna, tal como se muestra en la siguiente tabla:
Tabla N° 31
yi fi
3 10 -4.58 440.01 4400.015 30 - 2.58 44.31 1329.307 100 - 0.58 0.11 11.009 80 1.42 4.07 325.6011 20 3.42 136.81 2736.20
Total **Expresiónerrónea **
- -** Expresiónerrónea **
Donde:
c) Luego hallamos los momentos de orden 4 (M4 ) :
_________________________________________ 80Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
5
i ii 1
y f1820
y 7.58 inasistencias240 240
=
´= = =å
i(y y)- 4i(y y)- 4
i i(y y) f- ´
45
i ii 1
(y y) f 8802.11=
- ´ =å
54
i i4 i 1
54
i i4 i 1
54
i i4 i 1
54
i i4 4i 1
(y y) f440.01 10 44.31 30 0.11 100 4.07 80 136.81 20
M240 240
(y y) f4400.1 1329.30 11 325.60 2736.20
M240 240
(y y) f8802.11
M240 240
(y y) fM 36.68 inasistencias
240
=
=
=
=
- ´´ + ´ + ´ + ´ + ´
= =
- ´+ + + +
= =
- ´= =
- ´= =
å
å
å
å
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Además:
Por lo tanto el coeficiente de cúrtosis está dado por:
4
4
Mk
s36.68
k12.25
k 2.99 3
=
=
= <
Interpretación: La distribución de trabajadores según su número de inasistencias es
platicúrtica.
Ejemplo 53:
Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 38 de la pag. 57
a) Hallando en primer lugar el promedio de los datos dados:
b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la
cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los
valores hallados en la última columna, tal como se muestra en la siguiente tabla:
Tabla N° 32
Li - Ls y fi
[25 - 30) 27.5 40 -10 10000 400000 [30 - 35) 32.5 50 -5 625 31250 [35 - 40) 37.5 100 0 0 0 [40 - 45) 42.5 50 5 625 31250 [45 - 50) 47.5 40 10 10000 400000
Total - 280 - - ** Expresiónerrónea **
_________________________________________ 81Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
i(y y)- 4i(y y)- 4
i i(y y) f- ´
5
i ii 1
y f10500
y 37.5 años280 280
=
´= = =å
2 2
4 4
s 3.5 inasistencias
Entonces :
s 12.25 inasistencias
=
=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Donde:
c) Luego hallamos los momentos de orden 4 (M4 ) :
Además:
Por lo tanto el coeficiente de cúrtosis está dado por:
La distribución de trabajadores según su edad de años es platicúrtica.
_________________________________________ 82Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
54
i i4 i 1
54
i i4 i 1
54
i i4 i 1
54
i i4 4i 1
(y y) f10000 40 625 50 0 100 625 50 10000 40
M280 280
(y y) f400000 31250 0 31250 400000
M280 280
(y y) f862500
M280 280
(y y) fM 3080.36años
280
=
=
=
=
- ´´ + ´ + ´ + ´ + ´
= =
- ´+ + + +
= =
- ´= =
- ´= =
å
å
å
å
2 2
4 4
s 37.5 años
Entonces :
s 1406.25 años
=
=
4
4
Mk
s
3080.36k
1406.25
k 2.19 3
=
=
= <
45
i ii 1
(y y) f 862500=
- ´ =å
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
AUTOEVALUACIÓN 03
1. La siguiente tabla corresponde a consumo de teléfono en soles de dos locutorios durante 7 meses:
Locutorio 1 300 250 280 270
320 290
Locutorio 2 500 800 400 300
200 700
a) Calcular la varianza para el locutorio 1.b) Calcular la varianza para el locutorio 2.c) Calcular la desviación estándar para el locutorio 1.d) Calcular la desviación estándar para el locutorio 2.e) Calcular el coeficiente de variación para el locutorio 1.f) Calcular el coeficiente de variación para el locutorio 2.g) ¿En que locutorio el consumo es más regular?
2. Los siguientes datos corresponden al índice de precios al consumidor en % (IPC)de la ciudad de Chimbote del año 2005:
AÑO E F M A M J J A S O N D
IPC 105.30
105.24 105.59
105.31
105.89 105.26 105.28
104.93 109.0 104.75 105.24
105.64
a) Calcular la varianza e interpretar.b) Calcular la desviación estándar e interpretar.c) Calcular el coeficiente de variación e interpretar.d) ¿Se han mantenido estable el IPC en la ciudad de Chimbote para el año
2005?e) Calcular el coeficiente de asimetría e interpretar
3. Dos Empresas “X” e “Y” que pertenecen al rubro financiero ha consideradoevaluar a sus trabajadores obteniéndose los siguientes resultados respecto a suscalificaciones
Empresa X Empresa YCalificación media 60 60
Desviación estándar 20 15
¿Qué empresa tiene calificaciones más estables?
_________________________________________ 83Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
4. El gerente de una empresa analiza las ventas mensuales en dólares de suspromotores en los últimos 6 meses y considera que si la desviación estándar esmenor de 747 dólares considera que sus ventas son regulares y decidirá contratarlospara los próximos 6 meses siguientes:
Xi : 5000, 4500, 4800, 4600, 6000
¿Qué decisión tomara el gerente?
5. Los siguiente tabla corresponde a las ventas mensuales en dólares de 32empresas de productos agroinustriales:
Ventas mensualesen $
LI - LS
Nº de empresas fi
[250 - 300) 6[300 - 350) 8[350 - 400) 12[400 - 450) 4[450 - 500) 2
Total 32
a) Calcular la varianza e interpretar.b) Calcular la desviación estándar e interpretar.c) Calcular el coeficiente de variación e interpretar.d) Calcular el coeficiente de asimetría e interpretar.e) Calcular el coeficiente de cúrtosis e interpretar.
6. Las siguientes tablas corresponden a 2 hoteles turísticos categoría 3 estrellas deuna misma cadena de hoteles según su consumo mensual en soles de los turistashospedados:
Hotel AConsumo mensual en
$Li - Ls
N° de turistasfi
[550 - 600) 10[600 - 650) 20[650 - 7 00) 40[700 - 750) 20[750 - 800) 10
Total 100
_________________________________________ 84Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Hotel BConsumo mensualen $
Li - Ls
N ° de turistasfi
[600 - 700) 5[700 - 800) 10[800 - 900) 15[900 - 1000) 8[1000 - 1100) 4
Total 42
a) Calcular la varianza para el Hotel A.b) Calcular la varianza para el Hotel B.c) Calcular la desviación estándar para el Hotel A.d) Calcular la desviación estándar para el Hotel B.e) Calcular el coeficiente de variación para el Hotel A.f) Calcular el coeficiente de variación para el Hotel B.¿Qué hotel es más regular respecto al consumo mensual de los turistas
hospedados?
g) Cacular el coeficiente de asimetría para ambas distribuciones, además
graficar y comentar.
h) Calcular el coeficiente de cúrtosis para ambs distribuciones, además
graficar y comentar.
_________________________________________ 85Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
CAPÍTULO IV
NOCIONES DE PROBABILIDAD
4.1. EXPERIMENTO
Un experimento es un proceso mediante el cual se obtiene el resultado de una
observación. Un experimento puede ser determinístico o aleatorio.
4.1.1. Experimento determinístico: Cuando el resultado de la observación es
determinado en forma precisa por las condiciones bajo las cuales se realiza el
experimento.
Ejemplo 54:
- Lanzar una pelota en un tanque de agua y ver si flota o se hunde.
- Soltar una piedra en el aire.
- Observar la suma de dos números naturales pares.
4.1.2. Experimento aleatorio: Un experimento es aleatorio o no determinístico,
cuando los resultados de la observación no se puede predecir con exactitud, antes
de realizar el experimento.
Ejemplo 55:
- Observar el tiempo de vida de una computadora.
- Elegir un presidente de un grupo de 50 personas.
- Lanzar un dado y ver el número que aparece en la cara superior.
4.2. ESPACIO MUESTRAL
Es el conjunto de resultados posibles de un experimento aleatorio.
= w/w es un resultado particular simple de la realización de un exp. aleat.
Los resultados posibles de un experimento se llaman puntos de muestra.
Ejemplo 56:
E1: Lanzar un dado y el observar el número que aparece en la cara superior.
1 = 1, 2, 3, 4, 5,6
E2: Observar los resultados de un partido de fútbol.
____________________________________________ 86Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
2 = gana, pierde, empata
E3= Preguntar a una ciudadano en particular su edad en años.
3= w R+/ w≥18
Los espacios muestrales se clasifican en:
a) Espacio muestral discreto: Si se tiene un número finito o infinito numerable de
elementos.
b) Espacio muestral continuo: Cuando sus elementos son todos los puntos de un
intervalo.
4.3. EVENTOS
Son subconjuntos de un espacio muestral (). En particular el espacio muestral ()
y el conjunto vacío () son eventos. Al espacio muestral () se le llama evento
seguro y al conjunto () se le llama evento imposible.
Los eventos se denotan por las letras mayúsculas del abecedario: A, B, C, etc.
4.3.1. Tipos de eventos:
a) Evento simple: Cuando contiene solamente un punto del espacio muestral.
b) Evento Compuesto: Cuando puede expresarse como la unión de dos o más
eventos simples.
Ejemplo 57:
Sea el experimento: lanzar una moneda dos veces y observar la cara superior.
a) Liste los elementos del espacio muestral.
b) Determinar los siguientes eventos:
A1: Ocurre cara en el primer lanzamiento.
A2: Ocurre sello en el segundo lanzamiento.
A3: Ocurre por lo menos una cara.
A4: Ocurre lo mismo en ambos lanzamiento.
____________________________________________ 87Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución: Diagrama del árbol
a) = (c,c), (c,s), (s,c), (s,s)
b) A1 = (c,c), (c,s)
A2 = (c,s); (s,s)
A3 = (c,s), (s,c), (c,c)
A4 = (c,c), (s,s)
Ejemplo 58:
Dado el siguiente experimento:
E: Preguntar a dos empresas que venden por Internet su fuente principal de
ingreso de comercio electrónico.
Teniendo en cuenta que fuente principal de comercio electrónico es:
P: Publicidad C: Comisiones y V: Venta de productos/Servicios
a) Liste los elementos del espacio muestral.
b) Determine los elementos de los siguientes eventos:
A: Que en ambas empresas la fuente principal de ingreso de comercio
electrónico sea por venta productos / servicios.
B: Que solamente en la segunda empresa la fuente principal de ingreso de
comercio electrónico sea por comisiones.
C: Que en ninguna empresa la fuente principal de ingreso de comercioelectrónico sea por publicidad.
D: Que la fuente principal de ingreso de comercio electrónico sea por
publicad o comisiones.
____________________________________________ 88Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
C
S
C
S
C
S
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución:
DIAGRAMA DEL ARBOL
a)
b)
____________________________________________ 89Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P
C
V
P
P
P
C
C
C
V
V
V
PP,PC,PV,CP,CC,CV,VP,VC,VVW =
B PC,VC=
D PP,PC,CP,CC=
C CC,CV,VC,VV=
A VV=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
4.4. OPERACIONES CON EVENTOS
Usando las operaciones con conjuntos podemos formar nuevos eventos. Estos
nuevos eventos serán nuevamente subconjunto del mismo espacio muestral de los
eventos dados.
a) Unión de eventos: A B
Sean A y B dos eventos cualesquiera de un espacio muestral Ω. La unión de
eventos es el evento que ocurre si A ocurre o B ocurre o ambos ocurren.
Simbólicamente:
A B = w /wA v w B
A B A B A B
b) Intersección de eventos: A B
Sean A y B dos eventos cualesquiera de un espacio muestral Ω, la intersección de
estos eventos, es el evento que ocurre si A y B ocurren simultáneamente.
Simbólicamente:
A B = w / w A w B
A B
c) Complemento de un evento: A
Si A es un evento del espacio muestral , se llama complemento del evento A, al
evento que ocurre si A no ocurre.
____________________________________________ 90Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
A B
A B
A B
A B
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Simbólicamente:
A = w / w A
d) Diferencia de Eventos: A – B
Sean A y B dos eventos de un espacio muestral Ω, se llama diferencia de los
eventos A y B, al evento formado por los elementos que son favorables a A pero que
no son favorables a B.
Simbólicamente:
A – B = w / w A w B
e) Inclusión de eventos: A B
Dado dos eventos A y B de un espacio muestral Ω, se dice que el evento A está
contenido B, si siempre que ocurre A ocurre B.
Simbólicamente: A B, si W a W B
____________________________________________ 91Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
A B
AC
A
A B A B- = Ç
A BÌ
B
A
Ω
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
4.5. EVENTOS MUTUAMENTE EXCLUYENTES Y EVENTOS
COLECTIVAMENTE EXHAUSTIVOS
a) Una colección de eventos A1, A2,..., Ak definidos sobre un mismo espacio
muestral. Se dice que son mutuamente excluyentes, si la ocurrencia de uno de ellos
excluye la ocurrencia de los otros, es decir:
i jA AÇ = i j ; i 1, 2, ......., k" ¹ =
b) Se dice que una colección de eventos A1, A2,...., Ak, definidos sobre el mismo
espacio muestral son colectivamente exhaustivos, si la unión de ellos de ello es igual
al espacio muestral.
1 21
.... ; i 1, 2, ......., kk
k ii
A A A A=
È È = È = W =
4.6. PROPIEDADES DE LAS OPERACIONES CON EVENTOS
Dado los eventos A, B y C de un espacio muestral Ω, se verifican las siguientes
propiedades básicas de unión e intersección de eventos.
a) Ley conmutativa.
A B = B A
A B = B A
b) Ley asociativa
(AB) C = A (BC)
(AB) C = A (BC)
c) Ley Distributiva
A (B C) = (A B) (A C)
A (B C) = (A B) (A C)
d) Complemento del complemento
c
(AC) = A
____________________________________________ 92Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
e) A = A = A
A AC = A A = A
f) A = A
A = A AC =
A A = A
g) Leyes de Morgan
A B A BÈ = Ç
A B A BÇ = È
i) ( ) ( )A A B A B= Ç È Ç
____________________________________________ 93Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Ω A B
A B
A BÇ
A BÇ
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
j) Si A B, entonces A B = B y A B = A
4.7. PROBABILIDAD Y ENFOQUES DE PROBABILIDAD
Frecuentemente se usa el término probabilidad para sugerir que existe duda oincertidumbre sobre lo que ocurrió, lo que ocurre ocurrirá. La experiencia humanademuestra que existe una serie de hechos, acontecimientos, experimentos cuyosresultados no se pueden determinar anticipadamente; sin embargo si es posibledefinir, estimar o predecir el probable resultado. Podemos conocer el pasado, peronunca el futuro, pero existe un permanente interés por despejar las incertidumbres.
Las situaciones que implican incertidumbre varían desde simples juegos al azar,como la ruleta, los dados, los naipes, la lotería, los tragamonedas, etc. A otrosexperimentos y acontecimientos tan variados, complejos e importantes dentro de lasciencias médicas, ciencias sociales, la economía, las industrias, los negocios, losseguros, las inversiones, etc. Permanente interesa predecir o estimar lo quesucederá en ciertas circunstancias. Un empresario decide comercializar un productosi sabe que la probabilidad de aceptación es alta. El aficionado de fútbol, puedeapostar contra su equipo favorito si sabe que la probabilidad de que gane es muypequeña. Los inversionistas no deciden invertir en un país políticamente yeconómicamente inestable si saben que porque la probabilidad de obtenerrendimientos futuros es baja. Es posible que ninguno de ellos sepa definir o medir laprobabilidad, pero si encontrará útil la idea de estimarla intuitivamente.
El propósito de esta sesión es ilustrar las formas en las que pueden medirse laposibilidad o probabilidad de ocurrencia de eventos futuros. Al mejorar la habilidadpara juzgar la ocurrencia de eventos futuros, se puede minimizar el riesgo y laespeculación arriesgada relacionada con el proceso de toma de decisiones.
4.7.1. PROBABILIDAD
Es la posibilidad numérica de la ocurrencia de un evento casual.
____________________________________________ 94Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
A
B
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
4.7.2. AXIOMAS DE PROBABILIDAD
a) La probabilidad de un evento cualquiera, es siempre positiva.
( ) 0P A ³
b) La probabilidad de un evento cierto o seguro, es la probabilidad del espacio
muestral, que equivale a la unidad.
( ) 1P W =
c) La probabilidad de la unión de una familia de eventos mutuamente excluyentes
es igual a la suma de las probabilidades de dichos eventos.
1 2 1 2
11
( ..... ) ( ) ( ) .... ( )
( )
k k
kk
i iii
P A A A P A P A P A
P A P A=
=
È È È = + +
æ öÈ =ç ÷è ø
å
4.7.3. TEOREMAS DE LOS AXIOMAS DE PROBABILIDAD
De los axiomas de probabilidad resultan los siguientes teoremas:
a) La probabilidad de un evento toma valores entre cero y uno. Es decir:
0 ( ) 1P A£ £
b) La probabilidad de un evento nulo o imposible, es cero. Es decir:
( ) 0P f =
c) La probabilidad del complemento de un evento está dada por:
( ) 1 ( )P A P A= -
d) Si el evento A es un subconjunto del evento B, entonces:
( ) ( )P A P B£
4.7.4. ENFOQUES O TIPOS DE PROBABILIDAD
Existen tres enfoques para el estudio de la probabilidad.
a) Enfoque clásico
Llamada también probabilidad a priori debido a que es posible conocer el resultado
con anterioridad, es decir, sin llevar a cabo el experimento y sólo basado en el
razonamiento lógico. Se basa en el supuesto en que cada elemento del espacio
muestral tiene la misma posibilidad de ser elegido.
____________________________________________ 95Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Para un evento A cualquiera, entonces:
Casos favorables de ocurrencia del evento A( )
Total de casos posibles
( )( )
( )
P A
n AP A
n
=
=W
Ejemplo 59:
Hallar la probabilidad de obtener cara en el lanzamiento de una moneda.
Solución:
El espacio muestral será:
, sc
Sea el evento A: obtener cara.
Luego:
( )( )
( )
1( ) 0.5
2
n AP A
n
P A
=W
= =
Ejemplo 60:
Hallar la probabilidad de obtener el número 2 en el lanzamiento de un dado.
Solución:
El espacio muestral será:
6,5,4,3,2,1
Sea el evento B: Obtener el número 2.
Luego:
____________________________________________ 96Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
( )( )
( )
1( ) 0.17
6
n BP B
n
P B
=W
= =
Las probabilidades clásica, se utiliza para experimentos simples, como los
mencionados anteriormente. En la vida real se presentan situaciones más complejas
que requieren el cálculo de probabilidad desde otro enfoque.
b) Enfoque relativo
El cálculo de este tipo de probabilidad se basa en la repetición de la ocurrencia de
un evento, al realizar una gran cantidad de pruebas o experimentos.
Para un evento A cualquiera, entonces:
Número de veces que ocurrió el evento A( )
Número total de observaciones
( )
P A
fP A
n
=
=
La probabilidad de frecuencia relativa, es llamada también empírica o a posteriori,
debido a que se obtiene el resultado después de llevar a cabo el experimento.
Ejemplo 61:
En una encuesta realizada a 1500 pequeñas empresas de la ciudad de Lima, sobre
el número de medidas de seguridad se encontró los siguientes resultados:
____________________________________________ 97Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
TABLA N° 33
N° de medidas de
seguridad
iA
N° de Empresas
if )( iAP0 100 0.071 800 0.532 300 0.203 250 0.174 50 0.03
Total 1500 1.00
a) ¿Cuál es la probabilidad de que las pequeñas empresas tengan 2 medidas de
seguridad?
P(A2)=0.20
El 20% de las empresas tienen 2 medidas de seguridad.
b) ¿Cuál es la probabilidad de que las pequeñas empresas tengan más de 2
medidas de seguridad?
P(Ai > 2) = P(A4) + P(A5) = 0.17 + 0.03 = 0.20
El 20% de las pequeñas empresas tienen más de 2 medidas de seguridad.
c) Enfoque subjetivo
Es la probabilidad asignada bajo un criterio personal, basado en cualquier tipo de
evidencia disponible.
Las probabilidades subjetivas se asignan a eventos que pueden suceder solo una
vez o muy pocas veces.
Ejemplo 62:
a) La probabilidad que una mujer llegue a ser presidenta de los EE.UU.
b) La probabilidad que el hombre viva eternamente.
c) La probabilidad que quiebre la bolsa de valores de New York.
4.8. REGLAS DE PROBABILIDADEstudiaremos la probabilidad del producto y de la suma.
____________________________________________ 98Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
A BΩ
A B
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
4.8.1. PROBABILIDAD DEL PRODUCTO: P(AB)
Se utiliza para calcular la probabilidad conjunta o simultánea de dos o más eventos.
Se toman en cuenta dos aspectos:
a) Que los eventos A y B sean dependientes,
Entonces la ocurrencia conjunta de los eventos es:
( ) ( ) ( / )P A B P A P B AÇ = ´
b) Que los eventos A y B sean independientes, se debe cumplir:
( / ) ( )P A B P A=
Entonces la ocurrencia simultánea de los eventos independientes A y B es:
( ) ( ) ( )P A B P A P BÇ = ´
4.8.2. PROBABILIDAD DE LA SUMA: P(AB)
Se usa cuando se desea averiguar la probabilidad de ocurra al menos un evento.
Se toma en cuenta dos aspectos:
a) Que los eventos sean traslapados o unidos:
____________________________________________ 99Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A B)Ç
P(A B) 0Ç ¹
( ) ( ) ( ) ( )P A B P A P B P A BÈ = + - Ç
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Si A y B son independientes, entonces:
( ) ( ) ( ) ( ) ( )P A B P A P B P A P BÈ = + - ´
b) Que los eventos A y B sean mutuamente excluyentes, la probabilidad de que
ocurra A ó B es:
( ) ( ) ( )P A B P A P BÈ = +
4.9. PROBABILIDAD CONDICIONAL
Es utilizada cuando se desea conocer la probabilidad de ocurrencia de un evento
condicionado a la ocurrencia previa de otro evento.
Se calcula mediante la fórmula:
( )( / ) con ( ) 0
( )
P A BP A B P B
P B
Ç= ¹
El símbolo / se lee: DADO, SI y expresa condición.
Donde:
P(A/B) se lee: Probabilidad deque ocurra el evento A, dado que el evento B ya
ha ocurrido.
Ejemplo 63:
Se ha determinado que la probabilidad de televidentes que ven los programas A y B
son respectivamente 0.40 y 0.5. Cada televidente ve los programas independientes
uno del otro. Si se elige al azar uno de tales televidentes ¿Qué probabilidad hay de
que vea ambos programas?
____________________________________________ 100Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
0)BA(P
A B
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución:
A: Televidentes que ven el programa A. P(A) = 0.4
B: Televidentes que ven el programa B. P(B) = 0.5
AB: Televidentes que ven el programa ambos programas.
A y B son independientes P(BA) = P(A) x P(B) = 0.2
Gráficamente observamos:
La probabilidad de que los televidentes vean ambos programas es 0.2.
Ejemplo 64:
Los alumnos del II ciclo de Ingeniería de Sistemas tienen que realizar dos pruebas,
una teórica y otra practica en la signatura de estadística. La probabilidad de que un
estudiante apruebe la parte teórica es de 0.6, la probabilidad de que apruebe la
práctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5.
1. ¿Cuál es la probabilidad de que el alumno no apruebe ninguno de los
exámenes?
2. ¿Cuál es la probabilidad de que el alumno apruebe solamente la parte teórica?
3. ¿Cuál es la probabilidad de que el alumno apruebe al menos uno de los cursos?
____________________________________________ 101Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A) 0.4=
P(A B)Ç
0.2
P(B) 0.5=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución:
Sean los eventos:
T : El alumno aprueba la parte teórica. P(T) = 0.6
C : El alumno aprueba la parte práctica. P(C) = 0.8
T C : El alumno apruebe la parte teórica y la parte práctica.
P(TC) = 0.5
a)
b)
c)
____________________________________________ 102Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
0.10 0.300.5
P(B) 0.80=
P(A B) 0.90È =
P(A) 0.60=
P(A B) P(A) P(B) P(A B)
P(A B) 0.6 0.8 0.5
P(A B) 0.9
È = + - ÇÈ = + -È =
P(B A)-
P(A B)Ç
P(A B) 0.1È =
P(A B) P(A B) 0.1È = Ç =
P(A B) P(A) P(A B)
P(A B) 0.10
- = - Ç- =
P(A B)-
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Ejemplo 65:
Si P(A)= 3/5, P(B) = 3/6 y P(A∩B) = 1/4
Calcular:
a) )B(P b) )BA(P c) )BA(P
d) )( ABP e) )B/A(P
Solución:
a)
b) P(A B) P(A) P(A B)
P(A B) 0.6 0.25
P(A B) 0.35
- = - Ç- = -- =
____________________________________________ 103Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
0.35 0.250.25
P(B) 0.5=
P(A B) 0.85È =
P(A) 0.6=
P(B A)-
P(A B)Ç
P(A B)-
P(A B) 0.15È =
P(B) 1 P(B)
P(B) 1 0.5
P(B) 0.5
= -
= -
=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
c)
d)
e)
Ejemplo 66:Si P(A) = 1/5 y P(B) = 1/4 y los eventos A y B son independientes, hallar:
a) b) )BA(P c) )B/A(P
d) e)
____________________________________________ 104Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A B) P(A) P(B) P(A B)
P(A B) 0.6 0.5 0.25
P(A B) 0.85
È = + - ÇÈ = + -È =
P(B A) P(A B)
P(A B) 1 P(A B)
P(A B) 1 0.85
P(A B) 0.15
È = È
È = - È
È = -
È =
P(A B)P(A / B)
P(B)
0.25P(A / B)
0.5
P(A / B) 0.50
Ç=
=
=
P(A B)Ç
)( BAP P(B A)-
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución:
a)
b)
c)
____________________________________________ 105Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
0.15 0.200.05
P(A B) 0.45È =
P(A) 0.2=
P(B A)-
P(A B)Ç
P(A B)-
P(A B) 0.55È =
P(A B) P(A) P(B)
P(A B) 0.2 0.25
P(A B) 0.05
Ç = ´Ç = ´Ç =
P(A B) 1 P(A B)
P(A B) 1 0.45
P(A B) 0.55
È = - È
È = -
È =
P(A B)P(A / B)
P(B)
0.05P(A / B)
0.25
P(A / B) 0.20
Ç=
=
=
P(B) 0.25=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
d)
e)
Ejemplo 67:
En la Escuela de Administración de Empresas, 3 de 4 estudiantes saben informática,
el 50% saben manejar Windows y el 30% saben manejar Linux.
a) ¿Que porcentaje saben manejar los dos sistemas?
b) ¿Que porcentaje sabe manejar solamente Windows?
c) ¿Que porcentaje sabe manejar solamente Linux?
d) ¿Que porcentaje no saben informática?
Solución:
Análisis:
i) Se sabe que 3 de 4 estudiantes saben informatica, lo que quiere decir que:
ii) Entonces 1 de 4 estudiantes no saben informática, lo que quiere decir:
iii) El 50% saben manejar windows, lo que quiere decir:
iii) El 30% saben manejar linux, lo que quiere decir:
____________________________________________ 106Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A B) P(A B) 1 P(A B)
P(A B) 1 0.45
P(A B) 0.55
Ç = È = - È
È = -
È =
P(A B) 0.25È =
P(A) 0.5=
P(B) 0.3=
P(A B) 0.75È =
P(B A) P(B) P(A B)
P(B A) 0.25 0.05
P(B A) 0.20
- = - Ç- = -- =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
iv) ¿Cuántos manejan ambos programas?
Sabemos que:
a)
El 5% de los estudiantes saben manejar los dos sistemas.
b)
El 45% de los estudiantes saben manejar solamente windows.
c)
____________________________________________ 107Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A B) ?Ç =
P(A B) P(A) P(B) P(A B)
P(A B) 0.5 0.3 0.75
P(A B) 0.05
Ç = + - ÈÇ = + -Ç =
0.45 0.250.05
P(B) 0.3=
P(A B) 0.75È =
P(A) 0.5=
P(B A)-
P(A B)Ç
P(A B)-
P(A B) 0.25È =
P(A B) P(A) P(B) P(A B)
P(A B) 0.5 0.3 0.75
P(A B) 0.05
Ç = + - ÈÇ = + -Ç =
P(A B) P(A) P(A B)
P(A B) 0.5 0.05
P(A B) 0.45
- = - Ç- = -- =
P(B A) P(B) P(A B)
P(B A) 0.3 0.05
P(B A) 0.25
- = - Ç- = -- =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
El 25% de los estudiantes saben manejar solamente linux.
d)
El 25% de los estudiantes no saben informática.
Ejemplo 68:
El 40% de las empresas de una ciudad realizan su publicidad a través de la TV. el
20% a través de Internet y el 15% en ambos medios de comunicación.
a) ¿Cuál es la probabilidad que una empresa realice su publicidad en al menos uno
de los medios de comunicación?
b) ¿Cuál es la probabililidad de que una empresa haga su publicidad solamente en
la TV.?
c) ¿Cuál es la probabilidad de que una empresa no realice publicidad en ninguno de
los medios de comunicación?
d) ¿Son los dos eventos mutuamente excluyentes?
e) ¿Son los dos eventos independientes estadísticamente?
f) ¿Son los eventos colectivamente exhaustivos?
Solución:
Sean los eventos:
A : La empresas realizan su publicidad en la TV.
P(A) = 0.4
B : La empresas realizan su publicidad por Internet.
P(B) = 0.2
A B : La empresas realizan su publicidad en ambos medios de
comunicación.
P(AB) = 0.15
____________________________________________ 108Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A B) 0.25È =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
a)
b)
c)
d) Para que los eventos sean mutuamente excluyentes se debe cumplir lo siguiente:
____________________________________________ 109Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
0.25 0.050.15
P(B) 0.2=
P(A B) 0.45È =
P(A) 0.4=
P(B A)-
P(A B)Ç
P(A B)-
P(A B) 0.55È =
P(A B) P(A) P(B) P(A B)
P(A B) 0.4 0.2 0.15
P(A B) 0.45
È = + - ÇÈ = + -È =
P(A B) P(A) P(A B)
P(A B) 0.4 0.15
P(A B) 0.25
- = - Ç- = -- =
P(A B) 1 P(A B)
P(A B) 1 0.45
P(A B) 0.55
È = - È
È = -
È =
P(A B) 0
pero
P(A B) 0.15 0
Ç =
Ç = ¹
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
e) Para que los eventos sean independientes estadísticamente se debe cumplir losiguiente:
Por lo tanto los eventos no son independientes estadísticamente.
f) Para que los eventos sean colectivamente exhautivos:
Los eventos A y B no son colectivamente exhautivos.
Ejemplo 69:
Se sabe que la probabilidad de que una persona viaje al Perú en la linea aérea
TACA es de 0.7 y de que viaje en la linea aérea STARPERU de 0.5. (Eventos
Independientes).
a) ¿Cuál es la probabilidad de que una persona viaje al Perú en ambas líneas
aéreas.
b) ¿Cuál es la probabilidad de que una persona viaje solo en la linea aérea TACA.
c) ¿Cuál es la probabilidad de una persona viaje en al menos una de las líneas
aéreas?
Solución:
____________________________________________ 110Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A B) P(A) P(B)
P(A B) 0.4 0.2
P(A B) 0.08
pero
P(A B) 0.15 0.08
P(A B) 0.05
Ç = ´Ç = ´Ç =
Ç = ¹
Ç =
A B
pero
A B (A B)
por lo tan to :
A B
È = W
W = È È È
È ¹ W
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Sean los eventos:
A : Las personas viajan al Perú en la linea aérea TACA.
P(A) = 0.7
B : Las personas viajan al Perú en la linea aérea STARPERU.
P(B) = 0.5
A B : Las personas viajan al Perú en ambas lineas aéreas.
P(AB) = 0.35
a)
b)
c)
____________________________________________ 111Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
0.35 0.050.35
P(B) 0.5=
P(A B) 0.85È =
P(A) 0.7=
P(B A)-
P(A B)Ç
P(A B)-
P(A B) 0.15È =
P(A B) P(A) P(B)
P(A B) 0.7 0.5
P(A B) 0.35
Ç = ´Ç = ´Ç =
P(A B) P(A) P(A B)
P(A B) 0.7 0.35
P(A B) 0.35
- = - Ç- = -- =
P(A B) P(A) P(B) P(A B)
P(A B) 0.7 0.5 0.35
P(A B) 0.85
È = + - ÇÈ = + -È =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
4.10. TABLAS DE PROBABILIDAD
4.10.1. DEFINICIÓN.- Son aquellas que se obtienen a través de las tablas de
contingencia aplicando los criterios dados.
La siguiente Tabla N° 34 de probabilidades muestra las probabilidades conjuntas y
marginales para una Tabla de Contingencia de manera general:
Tabla N° 34P(Bj)
P(Ai)
P(B1) P(B2) ...... P(BK) Total
P(A1) P(A1B1) P(A1B1) ...... P(A1BK) P(A1)P(A2) P(A2B1) P(A2B2) ...... P(A2BK) P(A2)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
P(Ar) P(ArB1) P(ArB2) ...... P(ArBK) P(Ar)Total P(B1) P(B2) ...... P(BK) 1
Ejemplo 70:
Se llevó acabo una encuesta con respecto a la preferencia del consumidor respecto
a tres marcas competitivas de computadoras (A, B y C) y la modalidad de Speedy
para el uso del Internet en su hogar, los resultados se muestran en la siguiente tabla:
Tabla N° 35
MARCA DE
COMPUTADORA
MODALIDAD SPEEDY
SPEEDY 200 SPEEDY 400 SPEEDY 600TOTAL
A 100 200 300 600B 300 250 400 950C 200 300 450 950
TOTAL 600 750 1150 2500
Si se elige un consumidor al azar, calcular la probabilidad de que
a) Prefieran la modalidad Speedy 400.
b) Prefiere la computadora de marca A.
c) Prefiera computadora de marca B y la modalidad Speedy 600.
____________________________________________ 112Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
d) Prefiera la computadora de marca C, si la modalidad Speedy 200
e) Prefieran la modalidad Speedy 200, si la computadora es de marca A.
f) Prefiera la computadora de la marca A o B.
Solución:
Tabla N° 36
MARCA DE
COMPUT.
MODALIDAD SPEEDYP(200) P(400) P(600) TOTAL
P(A) 100/2500=0.04 200/2500=0.08 300/2500=0.12 600/2500=0.24P(B) 300/2500=0.24 250/2500=0.12 400/2500=0.16 950/2500=038P(C) 200/2500=0.08 300/2500=012 450/2500=0.18 950/2500=0.38
TOTAL 600/2500=0.24 750/2500=0.30 1150/2500=0.46 1.00
a) P(400)=0.30
El 30% de los consumidores prefieren la modalidad Speedy 400.
b) P(A)=0.24
El 24% de los consumidores prefieren la computadora de la marca A.
c) P(B600)=0.16
El 16% de los consumidores prefieren la computadora de la marca B y la
modalidad Speedy 600.
d) 33.024.0
08.0
)200(P
)200C(P)200/C(P
El 33% de los consumidores que prefieren la modalidad Speedy 200, prefieren la
computadora la computadora de la marca C.
e) 17.024.0
04.0
)A(P
)A200(P)A/200(P
El 17% de los consumidores que prefieren la computadora de la marca A
prefieren la modalidad Speedy 200.
f) 62.038.024.0)B(P)A(P)BA(P
El 62% de los consumidores prefieren la computadora de la marca A o marca B.
____________________________________________ 113Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Ejemplo 71:
Una empresa que fabrica cámaras de video produce un modelo básico y un modelo
de lujo. El año pasado, 40% de las cámaras vendidas han sido del modelo básico.
De los compradores del modelo básico, 35% compran una garantía ampliada,
mientras que 50% de los compradores de lujo también lo hacen así.
Se pide:
11.Construir la tabla de probabilidad.
12.Si elige un comprador al azar, calcular la probabilidad de que:
b.1) Tenga una cámara de video de un modelo de lujo.
b.2) Tenga una cámara de video de un modelo de lujo, si tiene una garantía
ampliada.
b.3) Tenga una cámara de video de un modelo de básico y compre una garantía
ampliada.
b.4) Compre una garantía ampliada, si la cámara de video es de modelo de lujo.
Solución:
a) Construyendo la tabla de probabilidad:
B: El comprador compra una cámara de video de modelo básico.
P(B)=0.40
L: El comprador compra una cámara de video de modelo de lujo.
P(L)=0.60
A: El comprador compra una garantía ampliada.
:A El comprador no compra una garantía ampliada.
Además
i)
____________________________________________ 114Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A / B) 0.35
P(A B)P(A / B)
P(B)
Entonces :
P(A B) P(B) P(A / B)
P(A B) 0.40 0.35
P(A B) 0.14
=
Ç=
Ç = ´
Ç = ´
Ç =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
ii)
A través de las operaciones realizadas se obtiene la siguiente tabla de probabildad:
Tabla N° 37
Garantía
ModeloP(B) P(L) Total
P(A) 0.14 0.30 0.44
P( A ) 0.26 0.30 0.56
Total 0.40 0.60 1.00
b) Hallando las probabilidades de los eventos dados:
b.1.)
El 60% de los compradores tienen una cámara de lujo.
b.2.)
____________________________________________ 115Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(A / L) 0.50
P(A L)P(A / L)
P(L)
Entonces :
P(A L) P(L) P(A / L)
P(A L) 0.60 0.50
P(A L) 0.30
=
Ç=
Ç = ´
Ç = ´
Ç =
P(L) 0.60=
P(L A)P(L / A)
P(A)
0.30P(L / A) 0.68
0.44
Ç=
= =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
El 68% de los compradores que compran una garantía ampliada tiene una
cámara de video de lujo.
b.3.)
El 30% de los compradores compran una garantía ampliada y tienen una cámara
de video de lujo.
b.4.)
El 50% de los compradores que tienen una cámara de video de lujo, han
comprado una garantía ampliada.
Ejemplo 72:
La siguiente tabla corresponde a 1000 turistas peruanos según la forma de pago
que acostumbran en sus viajes de vacaciones y el tipo de ciudad que eligieron para
pasar sus vacaciones:
Tabla N ° 38Forma de Pago Ciudad
Cuzco Huaraz TotalEfectivo 200 150 350
Tarjeta crédito 300 200 500Cheques de viajero 100 50 150
Total 600 400 1000
a) Construya la tabla de probabilidad.
b) Si se elige un turista al azar calcular la probabilidad de que :
b.1) Pague en efectivo y elija la ciudad del Cuzco para viajar.
b.2) Elija viajar al Cuzco.
b.3) Pague con tarjeta de crédito.
b.4) Pague con tarjeta de crédito, si elige viajar a Huaraz.
b.5) No viaje al Cuzco, ni pague en efectivo.
____________________________________________ 116Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(L A) 0.30Ç =
P(A L)P(A / L)
P(L)
0.30P(A / L) 0.50
0.60
Ç=
= =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Solución:
a) Construyendo la tabla de probabilidad:
Tabla N° 39
Forma de Pago CiudadP(B1) P(B2) Total
P(A1) 0.20 0.15 0.35P(A2) 0.30 0.20 0.50P(A3) 0.10 0.05 0.15Total 0.60 0.40 1.00
b)
b.1)
El 20% de los turistas pagan en efectivo y eligen la ciudad del Cuzco para viajar.
b.2)
El 60% de los turistas eligen la ciudad del Cuzco para viajar.
b.3)
El 50% de los turistas pagan con tarjeta de crédito.
b.4)
El 50% de los turistas que eligen viajar a Huaraz, pagan con tarjeta de crédito.
____________________________________________ 117Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
1 1P(A B ) 0.20Ç =
1P(B ) 0.60=
2P(A ) 0.50=
2 22 2
2
2 2
2 2
P(A B )P(A / B )
P(B )
0.20P(A / B )
0.40
P(A / B ) 0.50
Ç=
=
=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
b.5)
El 25% de los turistas no viajan al Cuzco, ni pagan en efectivo.
Ejemplo 73:
El 35% de los créditos de un banco es para vivienda, el 50% para industrias y el
15% para consumo diverso. Resultan fallidos el 20% de los créditos para vivienda,
el 15% de los créditos para industrias y el 70% para créditos para consumo.
a) Construir la tabla de probabilidad.
b) Si se elige un crédito al azar, calcular la probabilidad de que:
b.1) resulte exitoso y sea para vivienda.
b.2) resulte exitoso, si es para industria.
b.3) resultoso exitoso.
b.4) sea para vivienda o industria
Solución:
Determinado los eventos:
V: Los crédito son para vivienda. P(V) = 0.50
I: Los créditos son para industria. P(I) = 0.35
C: Los créditos son para consumo diverso. P(C) = 0.15
E: Los créditos son éxitosos. P(E) = ?
F : Los créditos son fallidos. P(F) = ?
Además:
____________________________________________ 118Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
1 1 2 2 3 2
1 1
1 1
P(B A ) P(A B ) P(A B )
P(B A ) 0.20 0.05
P(B A ) 0.25
Ç = Ç + Ç
Ç = +
Ç =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
i) Resultan fallidos el 20% de los créditos para vivienda:
ii) Resultan fallidos el 15% de los créditos para industria:
iii) Resultan fallidos el 70% de los créditos para consumo diverso:
____________________________________________ 119Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(F / V) 0.2
Entonces :
P(F V)P(F / V)
P(V)
P(F V)0.2
0.35
P(F V) 0.07
=
Ç=
Ç=
Ç =
P(F / I) 0.15
Entonces :
P(F I)P(F / I)
P(I)
P(F I)0.15
0.5
P(F I) 0.075
=
Ç=
Ç=
Ç =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
a) Construyendo la tabla de probabilidad:
Tabla N° 39
Resultado decrédito
Tipo de crédito
P(V) P(I) P(C)Total
P(E∩V)=0.28 P(E∩I)=0.425 P(E∩C)=0.045 0.75
P(F∩V)=0.07 P(F∩I)=0.075 P(F∩C)=0.105 0.25
Total 0.35 0.50 0.15 1.00
b)
b.1)
b.2)
b.3)
____________________________________________ 120Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(E)
P(F)
P(E V) 0.28Ç =
P(E V)P(E / V)
P(V)
0.28P(E / V)
0.35
P(E / V) 0.8
Ç=
=
=
P(E) 0.75=
P(F / C) 0.7
Entonces :
P(F C)P(F / C)
P(C)
P(F C)0.7
0.15
P(F V) 0.105
=
Ç=
Ç=
Ç =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
b.4)
AUTOEVALUACIÓN 04
1. Si P(A)= 0.3, P(B) = 074 ; Sabiendo que A y B son independientes.
Calcular:
a) P( A B )È b) P( A B )- c) P( B ) d) P( B / A )
2. La clase de estadística tiene 35 estudiantes. 20 cursan la clase de matemáticas, 18 cur-san la clase de economía y 10 cursan ambas materias. Encuentre la probabilidad de que, al seleccionar un estudiante al azar, el estudiante: a) Curse economía o matemáticas. b) Ni curse matemáticas ni curse economía. c) Curse economía pero no matemáticas. d) Curse economía o matemáticas pero no ambas.
3. Hay 1000 trabajadores en la empresa Kiddie Carts International, de esos 770 son de pro-ducción, 20 son supervisores, 100 son secretarias y el resto son administrativos Supongaque se selecciona un trabajador de ese grupo, calcular la probabilidad de:
a) Sea de producción.b) No sea secretaria.c) Sea secretaria o administrativo.d) No sea de producción, ni supervisor.
4. Una bolsa tiene 20 fichas numeradas del 1 al 20. Si se saca una al azar ¿Cuál es la pro-babilidad de que la ficha extraída tenga un número que sea múltiplo de 4.
5. Se realizó una encuesta a 1200 personas según sexo en la ciudad de Chimbote paraconocer el uso del vehículo a favor de mejorar el medio ambiente
USO DE VEHICULO
SEXO Total
MASCULINO FEMENINO
Renunciar 200 100 300
Reducir 300 400 700
No haría caso 150 50 200
Total 650 550 1200
____________________________________________ 121Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3
P(V I) P(V) P(I)
P(V I) 0.35 0.50
P(V I) 0.85
È = +È = =È =
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA
Se pide:a) Construir la tabla de probabilidad. b) Si se elige una persona al azar calcular la probabilidad de que :b.1) Sea de sexo femenino y reducir el uso del vehículo. b.2) Renuncie al uso del vehículo, si es de sexo femenino. b.3) Que no haga caso al uso del vehículo.b.4) Que no renuncien al uso del vehículo, ni sean de sexo femenino.
6) El 20% de los empleados de una empresa son ingenieros y el otro 20% son economistas.El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también,mientras los que no son ingenieros ni economistas solamente el 20% ocupan un puestodirectivo. Se pide:a) Construir la tabla de probabilidad. b) Si se elige un empleado al azar calcular la probabilidad de que:b.1) No sea directivo.b.2) No sea economista, ni directivo. b.3) Sea directivo, si es ingeniero.b.4) que no sea ingeniero.
7. Determine el enfoque de probabilidad en los siguientes enunciados:
a) La probabilidad de obtener un número par en 10 fichas numeradas del 1 al 10 es 0.5.
…………………………………………
b) La probabilidad de que ocurrencia de femicidio en nuestro país va en aumento.
…………………………………………
5. REFERENCIAS BIBLIOGRÁFICAS
· Barreto, C.R, (2007). Estadística Básica – Aplicaciones (2da. Ed.), Edit. SUA Uladech. Chimbote – Perú.
· Córdova, M. (2002). Estadística Inferencial (4ta. Ed.). Edit. Moshera. Lima – Perú. · Behar, R. (2006). 55 respuestas a dudas típicas de estadística. Obtenido de
http://site.ebrary.com/lib/bibliocauladechsp/docDetail.action?docID=10135772&p00=estadistica
· De la Puente, V. (2009). Estadística descriptiva e inferencial y una introducción almétodo científico. Obtenido dehttp://site.ebrary.com/lib/bibliocauladechsp/docDetail.action?docID=10378624&p00=estadistica.
• Ruiz, D. (s.f). Manual de Estadística. Recuperado dehttp://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm.
____________________________________________ 122Elaborado por : Mg. Carmen Barreto R.Fecha : Julio 2013Versión : 3