apuntes de estadística y probabilidad elemental
TRANSCRIPT
INSTITUTO MATEMÁTICO EUCLIDES
2016
Apuntes de Estadística y
Probabilidad Elemental
Prof. Fco. Barrientos B.
[2da edición]
M O R A V I A , C O S T A R I C A
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
2
Índice
I. La Estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
II. Variables y medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4
III. Datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
IV. Gráficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11
V. Media ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
VI. Notación sigma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
VII. Desviación estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
VIII. Coeficiente de variación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20
IX. Simetría en las medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
X. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27
XI. Recorrido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28 XI.1 Recorrido intercuartílico y desviación cuartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
XII. Cajas de dispersión (o Boxplot) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31
XIII. ¿Y cómo interpreto una Caja de dispersión? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
XIV. Ejemplo para dos grupos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .33
XV. La varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
XVI. Factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .39
XVII. Principios del conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .40
XVIII. ¿Contar? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43
XIX. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
XX. Axiomas de Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
“Saber es tan agradable como dudar” –M. de Montaigne
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
3
Apuntes de Estadística y Probabilidad Elemental
Prof. F. Barrientos B. Instituto Matemático Euclides
Moravia, Costa Rica
I. La Estadística
La Estadística es una ciencia que trata del desarrollo y aplicación de mé-
todos eficientes de recolección, procesamiento, análisis e interpretación
de datos numéricos. Ella se divide en dos tipos: la Estadística Descriptiva
y la Estadística Inferencial. La primera trata de la representación (cua-
dros, gráficos, tablas, etc.) de los datos; la segunda intenta generalizar
las propiedades de un todo, llamado población, a partir de la observación
de una muestra o parte de ésta.
Una variable estadística es la característica que se observa sobre las
unidades estudiadas (personas, bacterias, salarios, etc.). Dichas variables
se dividen en dos tipos: variables cuantitativas (discretas o continuas) y
las variables cualitativas. A las primeras, se les asigna un número real
(que bien puede es entero: el número de hijos de un hogar, por ejemplo; o
también puede ser decimal: la altura de un árbol). Las cualitativas se re-
fieren a atributos de cada unidad observada (el color de ojos de una per-
sona).
Son variables cuantitativas continuas:
El peso de un burro en kilogramos.
La estatura de una persona en metros.
El salario neto de una persona en dólares.
La velocidad del viento en km/h.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
4
Son variables cuantitativas discretas:
Número de goles en un campeonato de fútbol.
Cantidad de votos que obtuvo un candidato.
Número de mascotas por hogar en una provincia.
Cantidad de estudiantes que cursan la secundaria.
Son variables cualitativas:
Nivel de estudios de los empleados.
Opinión de un cliente sobre el servicio recibido.
Estado civil de una persona mayor de edad.
Equipo de fútbol con el que simpatiza a un aficionado.
Género de una persona (masculino, femenino, etc.).
II. Variables y medidas de tendencia central
Es normal, escuchar en boca de las personas, expresiones tales como “el
precio del dólar estadounidense varía de país en país”, o bien “en Mora-
via, la temperatura en la mañana es menor que la del final de la tarde”.
Como vemos, en todas ellas se hace manifiesta la idea de que las cantida-
des (dinero, temperatura) cambian en el tiempo o lugar. Por tal razón,
podemos decir que una variable es una característica de interés acerca
de una población: la edad de los estudiantes, número de hijos de cada ho-
gar, ingresos económicos de cada familia, etc. Es claro que a cada elemen-
to de dicha población (estudiantes, países, familias, etc.) se le asigna un
dato, el cual podemos definir como el “valor” de la variable asociado a
cada elemento de dicha población (Carlos tiene 18 años; el precio de un
dólar respecto a la moneda costarricense es de 540; la familia Martínez
tiene tres mascotas; el color que más le gusta a Karen es el azul; etc.). En-
tendemos el término Población como el conjunto (o cúmulo) de indivi-
duos u objetos que se han de analizar (los estudiantes de un colegio; los
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
5
habitantes de un cantón; las temperaturas registradas en el Cerro Chirri-
pó a la medianoche; cantidad de calorías de una gaseosa de medio litro,
etc.)
Suponga, por ejemplo, que los siguientes 15 datos representan las llega-
das tardías a clase de quince jóvenes de un grupo, durante cierta semana:
3, 0, 9, 10, 3, 5, 6, 3, 0, 11, 4, 5, 3, 3, 9
¿Qué podríamos decir respecto al grupo de datos como tal? Es decir: ob-
viando el caso particular que representa cada uno, ¿qué podemos decir
respecto al grupo de estudiantes en torno a la variable llegada tardía?
Cabe señalar, primeramente, que se observa que hay un dato que es el
que más se repite: ese dato es “3” (aparece cinco veces) ¿Esto nos permi-
tiría afirmar que, en general, los estudiantes llegan tarde, al menos, 3
veces por semana?... ¡Cuidado! Como dijo el escritor argentino J. L. Bor-
ges: Toda generalización es peligrosa.
Los estudiosos de la Estadística llaman al dato que “más se repite” en un
conjunto la moda, se denota por 𝑀𝑜. Es decir, en este caso la moda de la
variable “llegadas tardías” es 𝑀𝑜 = 3.
Para iniciar nuestro estudio, empecemos ordenando los datos de menor
a mayor; a saber:
0, 0, 3, 3, 3, 3, 3, 4, 5, 5, 6, 9, 9, 10, 11
Nota. Es común que algunas personas tengan la inquietud sobre si se debe escribir un solo
“3” en lugar de cinco, o bien un único 9 en lugar de dos. Es importante recordar que, aunque
en la lista aparecen varios “3”, estos datos corresponden a diferentes personas (Carlos, Da-
niel, Pánfilo, etc.). Por lo tanto, debemos tomarlos como datos independientes. Si más de un
dato se repite la misma cantidad abundante de veces, diremos que la moda no es única.
Llamaremos media aritmética (o promedio) de los datos, denotada por
�̅�, a la sumatoria de todos los datos, dividido entre la cantidad de ellos.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
6
Es decir, en el caso que nos atañe, la media aritmética de la variable llega-
das tardías es:
�̅� =0 + 0 + 3 + 3 + 3 + 3 + 3 + 4 + 5 + 5 + 6 + 9 + 9 + 10 + 11
15
La cual se puede expresar, abreviando, como:
�̅� =𝟐 ∙ 0 + 𝟓 ∙ 3 + 4 + 𝟐 ∙ 5 + 6 + 𝟐 ∙ 9 + 10 + 11
15
Pues en los datos aparecen 2 ceros, cinco “3”, dos “5” y dos “9”.
Calculando tendríamos que:
�̅� =2 ∙ 0 + 5 ∙ 3 + 4 + 2 ∙ 5 + 6 + 2 ∙ 9 + 10 + 11
15= 4,93̅ ≈ 5
¿Qué nos dice este valor y por qué se redondea? Podemos decir, grosso
modo, que en promedio los estudiantes de ese grupo tienen en conjunto
“5 llegadas tardías por persona”. El redondeo se da porque no existen tar-
días decimales; o sea: nadie puede llegar medio tarde o un quinto tarde…
Llegamos tarde o no.
Los estudiosos de la Estadística le llaman a la moda y a la media, de una
variable cuantitativa, medidas de tendencia central. Existe una tercera
medida de tendencia central denominada la mediana, y denotada por 𝑀𝑒,
la cual se define como el valor ocupado por la posición central cuando los
datos se ordenan de acuerdo a su magnitud. En la variable del ejemplo que
analizamos, la mediana sería 𝑀𝑒 = 4. Observe con cuidado:
0, 0, 3, 3, 3, 3, 3,⏟ 7 datos
4, 5, 5, 6, 9, 9, 10, 11⏟ 7 datos
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
7
A la izquierda de “4” hay siete datos; mientras que a la derecha hay la
misma cantidad. Es decir: la mediana es el dato que separa al conjunto
de valores en dos grupos con igual cantidad de valores.
Nota. En general, podemos decir que la mediana es el dato que ocupa el lugar 𝑛+1
2, donde 𝑛 es
la cantidad de datos que tenemos. Observe que si 𝑛 es impar, entonces 𝑀𝑒 es uno de los datos
enlistados; mientras que, si 𝑛 es par, entonces la mediana sería el promedio de los dos datos
centrales de los valores analizados. Por ejemplo, si nuestros datos fueran 4, 4, 5, 6, 7, 7, 7, 10,
entonces la mediana ocuparía el lugar 8+1
2= 4,5; lo que quiere decir que la mediana está en el
lugar medio entre el dato cuarto y el quinto; a saber: 𝑀𝑒 =6+7
2= 6.5; que evidentemente no
es un dato del grupo.
Ejercicios varios
1. Determine las medidas de tendencia central (�̅�, 𝑀𝑒 y 𝑀𝑜) para los siguientes con-
juntos de datos.
(a) {23,34,23,51,24,31,31,30,23,66,50,23,38} R: �̅� = 34.38; 𝑀𝑒 = 31; 𝑀𝑜 = 23
(b) {2.4,0.6,1.1,1.9,2.6,1.7,1.1,2.3,0.9,0.6,1.1} R: �̅� = 1.48; 𝑀𝑒 = 𝑀𝑜 = 1.1
(c) {3
2,2
5, 8,
5
3,2
5,3
2, 5,
4
5,7
3,10
7,7
10, 2,1,
41
5} R: �̅� = 2.49; 𝑀𝑒 =
3
2; 𝑀𝑜 =
3
2 y
2
5
(d) {5,5.5,7,9,10,10,4.3,1,0,2.5,10,5.1,8} R: �̅� = 5.95; 𝑀𝑒 = 5.5; 𝑀𝑜 = 10
2. Si la media aritmética (o promedio, �̅�) de los primeros 𝑛 enteros positivos es 51,
determine el valor de 𝑛. R: 𝑛 = 101
3. La tabla siguiente, contiene los datos sobre la cantidad de días, por semana, que de-
dican un grupo de 20 estudiantes a hacer actividad física.
5 3 7 0 5 4 6 6 6 0 1 0 2 2 7 6 4 6 2 1
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
8
Determine el valor de las medidas de tendencia central para la variable “hacer acti-
vidad física por semana”. R: �̅� = 4; 𝑀𝑒 = 4; 𝑀𝑜 = 6
4. Los datos siguientes representan las notas obtenidas en un examen por un grupo
de estudiantes.
76 51 82 82 90 100 45 65 100 87 73 82 91 56 74 68 54 73 80 95 78 67 56 67 82 39 82 90 82 55 99 86 77 49 91
Determine el valor de las medidas de tendencia central para la variable “resultado
del examen”. R: �̅� = 75; 𝑀𝑒 = 78;
𝑀𝑜 = 82
III. Datos agrupados
Supongamos ahora, que los datos siguientes corresponden a la variable
“número de hermanos” de un grupo de 13 estudiantes de una escuela; los
datos están ordenados:
0, 0, 1, 1, 1, 2, 2, 2, 2, 4, 5, 5, 6
Note que la mayoría de estos datos se repiten. Podemos entonces, ela-
borar una especie de “tabla resumen”; así:
# hermanos
Cantidad de datos
0 2 1 3 2 4 4 1 5 2 6 1
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
9
Observe que en esta Tabla resumen, que en realidad se llama Tabla de
frecuencias, la primera columna registra, renglón por renglón, el dato
individual de la variable “número de hermanos”; la segunda contabiliza la
cantidad de datos de ese dato individual. A esa “cantidad”, los estudiosos
de la Estadística le llaman frecuencia: la frecuencia del dato “2 herma-
nos” es 4; es decir: hay 4 estudiantes que tiene dos hermanos; mientras
que, la frecuencia del dato “6 hermanos” es 1. Se observa que la moda de
los datos es “2”, pues es el dato con mayor frecuencia (𝑀𝑜 = 2).
La suma de todas las frecuencias tiene que darnos la cantidad inicial de
datos; así: 2 + 3 + 4 + 1 + 2 + 1 = 13.
Para los teóricos, la frecuencia recibe el nombre de frecuencia absoluta;
por lo tanto, la tabla anterior, se escribiría técnicamente como
Cantidad de hermanos
Frecuencia absoluta
0 2 1 3 2 4 4 1 5 2 6 1
Total 13
Note que en esta tabla se incluye un último renglón que toma en cuenta el
total de datos (13).
La frecuencia relativa es el porcentaje del total (13) que representa cada
frecuencia individual; o sea: si tomamos por ejemplo la frecuencia abso-
luta del dato “5 hermanos”, es decir 2, y calculamos qué porcentaje del to-
tal representa, tendríamos, por regla de tres,
2
13× 100 = 15,38%
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
10
Esto quiere decir que, aproximadamente, el 15% de los trece estudiantes
tienen 2 hermanos.
En general, si denotamos con 𝑓𝑖 la frecuencia absoluta de la fila “𝑖” de la
Tabla de frecuencias, entonces la frecuencia relativa se calcularía como
𝑓𝑖𝑛× 100
donde “𝑛” representa la cantidad total de datos. La tabla anterior, inclu-
yendo las frecuencias relativas sería entonces:
Cantidad
de hermanos Frecuencia
absoluta Frecuencia
relativa
0 2 15.38 1 3 23.08 2 4 30.77 4 1 7.69 5 2 15.38 6 1 7.69
Total 13 100%
Por otro lado, la media aritmética �̅� para datos agrupados se calcularía
como:
�̅� =𝑓1 ∙ 𝑥1 + 𝑓2 ∙ 𝑥2 +⋯+ 𝑓𝑘 ∙ 𝑥𝑘
𝑛
donde cada 𝑓𝑖 es la frecuencia absoluta del dato 𝑥𝑖 . Por ejemplo, en la ta-
bla anterior tendríamos que:
�̅� =𝟐 ∙ 0 + 𝟑 ∙ 1 + 𝟒 ∙ 2 + 𝟏 ∙ 4 + 𝟐 ∙ 5 + 𝟏 ∙ 6
13≈ 2 hermanos
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
11
IV. Gráficas
Es muy importante tener la posibilidad de representar en algún tipo de
gráfico la información que procesamos. Hoy, dado el desarrollo tecnológi-
co, existen diversos paquetes computacionales que nos permiten elabo-
rar gráficas de datos estadísticos. El software quizás más popular es la
Hoja Excel, de la compañía Microsoft®.
Tomemos un ejemplo. En una sección anterior, se presentó la siguiente
Tabla de frecuencias:
Cantidad de
hermanos
Frecuencia absoluta
0 2 1 3 2 4 4 1 5 2 6 1
La cual representaba la variable “cantidad de hermanos” de un grupo de
13 jóvenes.
Digitando en una hoja Excel los datos de dicha tabla (Cantidad de her-
manos y frecuencia absoluta asociada) tendríamos un gráfico como el si-
guiente:
0 1 2 3 4 5
0 hermanos
1 hermanos
2 hermanos
4 hermanos
5 hermanos
6 hermanos
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
12
En cual, en el eje horizontal se colocan las frecuencias, mientras que el eje
vertical las categorías de la variable en estudio (en este caso, “cantidad de
hermanos”). Este tipo de gráfico recibe el nombre de gráfico de barras
horizontal. Veamos otro ejemplo. La tabla adjunta representa el número
de horas semanales que dedican un grupo de estudiantes a la lectura de
algún libro de ficción.
Horas de lectura
Frecuencia absoluta
0 6 1 6 2 2 3 4 4 1 5 3
Con estos datos, podemos elaborar con Excel un gráfico de barras hori-
zontales; a saber:
Ejercicios varios
1. Suponga que tres números están en la razón 1:2:5. Si el promedio de éstos es 104,
halle los números. R: 39, 78, 195
2. Sean a y b enteros positivos tales que, 1123 ba y 2932 ba , entonces halle el
promedio de a y b. R: 4
0 1 2 3 4 5 6 7
0 horas
1 horas
2 horas
3 horas
4 horas
5 horas
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
13
3. Sean a, b y c tres números tales que cba ; 19 cb y ca 2 29 entonces halle la media aritmética de a, b y c. R: 8
4. Si el promedio de a, b, s y t es 6, y el promedio de s y t es 3, ¿cuál es el promedio de
a y b? R: 9
5. En una encuesta se le preguntó a un grupo de jóvenes cuántos días a la semana
hacían ejercicio, obteniéndose la siguiente Tabla de datos agrupados:
Cantidad de días
Frecuencia
0 3 1 10 2 10 3 4 4 2 5 1
Si 4 de los jóvenes que indicaron 2 días, en realidad hacen ejercicio 4 días a la se-
mana, ¿podemos afirmar con certeza que el promedio verdadero es mayor que el
promedio de los datos reportados? (Justifique) Elabore un gráfico de barras hori-
zontales con los datos reales. R: Sí
6. El Ministerio de Economía investigó el precio de un producto de consumo básico
en 25 locales comerciales, obteniendo los siguientes resultados:
1300 1200 1500 1200 1600
1100 1000 1400 1200 1000
1300 1500 1500 1300 1500
1000 1600 1500 1200 1000
1000 1600 1300 1500 1500
Elabore un Tabla de datos agrupados y calcule las medidas de tendencia central para la variable “precio del producto”. Elabore un gráfico de barras horizontales con los datos. R: �̅� = 1312; 𝑀𝑒 = 1300; 𝑀𝑜 = 1500
7. Cierto estudio investigó, entre un total de 200 personas, la forma principal de tras-
lado al trabajo. El gráfico siguiente representa los resultados de dicha investiga-
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
14
ción. Los datos que se presentan están en porcentajes. (Nota. La categoría “Otros” se
refiere a otros medios de transporte: caballo, tren, bicicleta, motocicleta, etc.)
De acuerdo con la información suministrada, diga si las afirmaciones siguientes
son verdaderas o falsas.
(a) De las 200 personas, solo 40 viajan en bus o taxi.
(b) Más de 100 viajan en un medio de transporte que no es un automóvil.
(c) La diferencia entre las que viajan en bus y las que lo hacen en automóvil es 20.
(d) La diferencia entre las que viajan en taxi y las que lo hacen en automóvil es 80. R: (a) F (b) F (c) F (d) V
8. El gráfico adjunto presenta la cantidad de frutas que se vendieron en el negocio de
don Marco:
De acuerdo con los datos que se presentan en este gráfico, diga si las siguientes
afirmaciones son verdaderas o falsas:
(a) La cantidad de mangos y manzanas vendidos es más de la mitad del total de
frutas vendidas. R: V
0 10 20 30 40 50 60
Automóvil
Bus
Taxi
Otros
0 2 4 6 8 10 12 14
Mangos
Manzanas
Naranjas
Piñas
Papayas
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
15
(b) La cantidad de manzanas vendidas es mayor que el 30% del total de frutas ven-
didas. R: F
(c) La cantidad de piñas y papayas vendidas es menor que la cantidad de mangos
vendidos. R: V
(d) La cantidad de mangos, manzanas y naranjas vendidos es más del 70% del total
de frutas vendidas. R: V
V. Media ponderada
En cierto colegio, durante el trimestre se aplican tres exámenes. Juan
obtuvo en cada uno de ellos 72, 83 y 89. Sin embargo, cada uno de esos
exámenes no tiene el “mismo porcentaje” de importancia en la nota final
de aprovechamiento. Digamos que el primer examen (examen parcial)
tiene un valor porcentual de 20%; mientras que el segundo examen (se-
gundo examen parcial) tiene un valor de 30%; finalmente, el último exa-
men (examen comprensivo) tiene un valor porcentual de 45%. Si quere-
mos calcular el promedio (o media o media aritmética) de las notas, te-
nemos que tomar en cuenta la ponderación de dichas notas. Esto nos lle-
va a la siguiente media, llamada media ponderada:
�̃� =72 ∙ 𝟐𝟎% + 83 ∙ 𝟑𝟎% + 89 ∙ 𝟒𝟓%
20%+ 30%+ 45%=72 ∙ 0,20 + 83 ∙ 0,30 + 89 ∙ 0,45
0,20 + 0,30 + 0,45
La cual arroja el valor de 84 (aprox.).
En general, podemos decir que si el conjunto {𝑥1, 𝑥2, … , 𝑥𝑛} contiene los
valores de una variable cuantitativa, cuyas ponderaciones respectivas
son {𝑝1, 𝑝2, … , 𝑝𝑛}, entonces la media ponderada �̃� (note que la notación
es distinta a la notación de media �̅�) de dichos valores viene dada por
�̃� =𝑥1 ∙ 𝑝1 + 𝑥2 ∙ 𝑝2 +⋯+ 𝑥𝑛 ∙ 𝑝𝑛
𝑝1 + 𝑝2 +⋯+ 𝑝𝑛
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
16
Ejercicios varios
1. El promedio de cinco números es 12. Al agregar un sexto número, el nuevo prome-
dio es 13. Determine cuál fue el número que se agregó. R: 18
2. El promedio de cinco números es 12. Al eliminar un número, el nuevo promedio es
11. Determine cuál fue el número eliminado. R: 16
3. En una encuesta para determinar el refresco favorito entre A, B y C, se obtuvo que
el 10% de los encuestados prefiere el refresco A, el 25% el refresco B, el 40% el re-
fresco C. Si se sabe que el 25% de los encuestados NO respondió la encuesta y se lo-
grara recolectar la respuesta de éstos, ¿podríamos afirmar con certeza que la mo-
da no sería A? (justifique) R: Sí
4. En una fábrica se tienen 25 cajas que pesan, en conjunto, 75kg. Si el peso de una
única caja se reduce en 1
2kg, entonces, ¿podemos con certeza afirmar que el peso
promedio de las cajas es mayor a 3kg, pero menor a 3.5kg? (Justifique) R: No
5. En la Universidad de Costa Rica, a los distintos cursos se les asigna un valor llama-
do el crédito. De esta manera, un curso con crédito de 5 tiene “mayor importancia”
académica que un curso con 2 ó 4 créditos. Por ejemplo, un curso de Actividad de-
portiva tiene 0 créditos; mientras que los cursos de Cálculo para las carreras de In-
geniería tienen 5 créditos. Suponga que Juan matriculó este semestre cuatro cur-
sos, en los que obtuvo como nota final 67, 82, 90, 71. El crédito de cada curso, res-
pectivamente, es 3, 2, 2 y 4. Determine la media ponderada de las notas de Juan. R: 75.36
VI. Notación sigma
Cuando una suma tiene una cantidad “grande” de sumandos, los matemá-
ticos prefieren simplificar su escritura utilizando la llamada notación
sigma. La letra griega “Σ” se llama sigma; la misma se utiliza para expre-
sar sumas del modo siguiente:
𝑎1 + 𝑎2 + 𝑎3 +⋯+ 𝑎𝑛−1 + 𝑎𝑛 =∑𝑎𝑖
𝑛
𝑖=1
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
17
Note que los números de la suma están etiquetados por subíndices, los
cuales van enumerando al primer sumando 𝑎1; la segundo sumando 𝑎2; y
así, sucesivamente, hasta llegar al sumando 𝑛-ésimo 𝑎𝑛 que es el último.
En la notación ∑ 𝑎𝑖𝑛𝑖=1 , el término colocado en la parte inferior “𝑖 = 1” nos
indica que la variable de numeración “𝑖” inicia en el 1; mientras que el
término colocado en la parte superior “𝑛” nos indica la cantidad de
sumandos. En este caso, al ser una suma finita, tenemos exactamente
“𝑛”, empezando con 1. Esta notación es muy útil para representar, por
ejemplo, la media aritmética, a saber:
�̅� =𝑎1 + 𝑎2 + 𝑎3 +⋯+ 𝑎𝑛−1 + 𝑎𝑛
𝑛=1
𝑛∙∑𝑎𝑖
𝑛
𝑖=1
También, la notación de la media ponderada quedaría como:
�̃� =𝑥1 ∙ 𝑝1 + 𝑥2 ∙ 𝑝2 +⋯+ 𝑥𝑛 ∙ 𝑝𝑛
𝑝1 + 𝑝2 +⋯+ 𝑝𝑛=∑ 𝑥𝑖𝑝𝑖𝑛𝑖=1
∑ 𝑝𝑖𝑛𝑖=1
Otro ejemplo, podría ser la pequeña fórmula de Gauss; a saber:
1 + 2 + 3 +⋯+ 𝑛 =∑𝑖 =𝑛(𝑛 + 1)
2
𝑛
𝑖=1
O bien la suma de los cuadrados:
12 + 22 + 32 +⋯+ 𝑛2 =∑𝑖2 =1
6𝑛(𝑛 + 1)(2𝑛 + 1)
𝑛
𝑖=1
VII. La desviación estándar
Las medidas de tendencia central (media, moda, mediana) nos permiten
ver el comportamiento general de los datos, alrededor de esas medidas.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
18
Aunque son valores importantes para la Estadística, sirven de poco para
realizar comparaciones entre distintos datos de la misma variable esta-
dística.
Veamos un ejemplo. Supongamos que dos estudiantes, A y B, obtuvieron
en seis pruebas cortas las siguientes notas:
A 60 85 83 68 79 53 B 62 59 65 100 65 59
Si calculamos la media aritmética de ambos tendríamos valores “muy cer-
canos”, a saber: �̅�𝐴 = 71; �̅�𝐵 = 68. Tal vez, alguien podría pensar errónea-
mente que ambos estudiantes tuvieron, más o menos, el mismo rendi-
miento. Pero se observa en los datos que, si la nota mínima de aproba-
ción es 70, el estudiante A ganó tres de los seis quices; mientras que B só-
lo uno, reprobando el resto con notas muy deficientes. Esto nos lleva a
pensar que la media aritmética podría no ser un buen parámetro de
comparación entre datos de la misma naturaleza.
El ejemplo anterior, debe llevarnos a la reflexión sobre si habrá algún mé-
todo seguro de comparar dos grupos de datos. Pues, si vemos las notas
del estudiante A, notamos que las mismas no están muy dispersas o leja-
nas de la media (71); caso contrario le sucede al estudiante B, el cual tie-
ne un 100 y el resto de las notas están “muy lejanas” de dicho valor. Sin
embargo, en promedio, ambos valores son muy cercanos.
La desviación estándar es una medida de variabilidad, la cual pretende
medir la dispersión de los valores de una variable estadística, respecto a
la media. En otras palabras: la desviación estándar es el promedio de la
desviación o diferencia de los datos respecto a la media �̅�. Entre mayor sea
la dispersión de los datos alrededor de la media, mayor será la desviación es-
tándar. La desviación estándar se simboliza con “𝑠” y se define como:
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
19
𝑠 = √∑ (�̅� − 𝑥𝑖)
2𝑛𝑖=1
𝑛 − 1
En donde 𝑥𝑖 denota los distintos datos, �̅� es la media o promedio y 𝑛 es la
cantidad de datos. Observe que, en la fórmula anterior, el término “�̅� −
𝑥𝑖” representa la diferencia que hay entre cada dato 𝑥𝑖 y la media �̅�; lógi-
camente, algunas de estas diferencias podrían ser negativas, por lo cual
se toma el cuadrado de dicha diferencia, a saber (�̅� − 𝑥𝑖)2. Note también
que la sumatoria “∑ (�̅� − 𝑥𝑖)2𝑛
𝑖=1 ” toma la suma de todos estos cuadrados.
Veamos un ejemplo: suponga que las notas siguientes corresponden a los
resultados obtenidos en una prueba de 10 jóvenes:
53, 58, 58, 60, 73, 88, 88, 88, 90, 97
Calculando la media de los datos obtenemos que �̅� = 75; por lo tanto, las
diferencias �̅� − 𝑥𝑖 y sus cuadrados serían las siguientes:
�̅� − 𝒙𝒊 (�̅� − 𝒙𝒊)𝟐
75 − 53 = 22 (22)2 = 484 75 − 58 = 17 (17)2 = 289 75 − 58 = 17 (17)2 = 289 75 − 60 = 15 (15)2 = 225 75 − 73 = 2 (2)2 = 4 75 − 88 = −13 (−13)2 = 169 75 − 88 = −13 (−13)2 = 169 75 − 88 = −13 (−13)2 = 169 75 − 90 = −15 (−15)2 = 225 75 − 97 = −22 (−22)2 = 484
De esta manera, tenemos que:
∑(�̅� − 𝑥𝑖)2
10
𝑖=1
= 484 + 289 + 289 +⋯+ 225 + 484 = 2507
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
20
Por lo que, la desviación estándar 𝑠 sería
𝑠 = √∑ (�̅� − 𝑥𝑖)
2𝑛𝑖=1
𝑛 − 1= √
2507
10 − 1≈ 17
Esto quiere decir que los 10 datos se encuentran, en promedio, a 17 uni-
dades de la media �̅� = 75.
Nota. En la desviación estándar, note que se divide por “𝑛 − 1” y no por “𝑛”. La desviación es-
tándar que usamos en este documento recibe el nombre de desviación estándar muestral.
La expresión √∑ (�̅�−𝑥𝑖)
2𝑛𝑖=1
𝑛 recibe el nombre de desviación estándar poblacional. La
distinción entre ambas escapa a los objetivos de estas notas introductorias. Para los lectores
más curiosos, les recomendamos consultar algún libro de Estadística Inferencial. En algunos
textos, la desviación estándar se denota por la letra griega “sigma”: 𝜎.
VIII. El coeficiente de variación
El coeficiente de variación mide la variabilidad relativa (porcentual) de
un conjunto de datos respecto a su media. Es decir:
𝐶𝑉 =𝑠
�̅�× 100
donde 𝑠 es la desviación estándar y �̅� la media aritmética de los datos.
En el ejemplo de la sección anterior, el coeficiente de variación de las no-
tas de los 10 estudiantes sería
𝐶𝑉 =𝑠
�̅�× 100 =
19
66× 100 = 29%
Nota. El coeficiente de variación sirve para comparar la variabilidad de diferentes conjuntos
de datos, y es particularmente útil cuando: (1) los datos están en unidades diferentes; (2) los
datos están en las mismas unidades, pero las medias son muy diferentes.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
21
Veamos un ejemplo: dos empresas, A y B, se dedican al negocio de las
telecomunicaciones. El precio de mercado de las acciones de empresa A
tuvo en cierto mes una media de $15000, con una desviación estándar de
$500. Para las acciones de la empresa B, en ese mismo mes, el valor me-
dio de sus acciones fue de $5000, con una desviación estándar de $300.
Si miramos los datos en bruto, notaríamos que las acciones de la empresa
A tuvo una mayor variabilidad, pues tiene una mayor desviación están-
dar; sin embargo, respecto al nivel de precios, comparando los coeficien-
tes de variación tendríamos:
𝐶𝑉𝐴 =500
15000× 100 = 3%
𝐶𝑉𝐵 =300
5000× 100 = 6%
Lo que nos llevaría a concluir que el precio de la acción B ha sido dos ve-
ces más variable que el precio de la acción A, respecto al precio medio
para cada una de las dos acciones.
Tanto la desviación estándar como el coeficiente de variación, pertenecen
a las llamadas medidas de dispersión. Existen otras dos medidas que
dejamos para estudiar más adelante: el recorrido o amplitud de los da-
tos; y la varianza, la cual consiste en el cuadrado de la desviación están-
dar, es decir: 𝑣 = 𝑠2.
Ejercicios varios
1. Considere los datos siguientes, los cuales corresponden a las notas finales de un
trimestre de un grupo de 20 estudiantes:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
22
(a) Determine las medidas de tendencia central para este conjunto de datos.
(b) Determine la desviación estándar y el coeficiente de variación. R: 𝑠 = 19; 𝐶𝑉 = 28%
2. Una empresa transnacional posee industrias en dos países. La fábrica de Costa Rica
paga a sus empleados, semanalmente, con media es $750 y una desviación están-
dar de $60; mientras que, en esa misma semana, la fábrica de Costa Pobre paga con
una media de $600 y una desviación estándar de $50. Investigue la variabilidad de
salarios en ambas fábricas y compárelas. R: Ambas fábricas tienen variabilidad aproximadamente igual en los salarios (¿por qué?)
3. En una actividad de recaudación de fondos para una escuela, cien niños deben in-
tentar vender, cada uno, cinco cartones de bingo. Cuando los niños informaron so-
bre lo vendido, se obtuvo la siguiente Tabla de distribución de frecuencias:
Cartones Niños
0 2 1 6 2 12 3 34 4 32 5 14
Determine las medidas de tendencia central, la desviación estándar y el coeficiente
de variación para la variable “cartones de bingo vendidos”. R: �̅� = 3.3; 𝑀𝑜 = 3; 𝑀𝑒 = 3; 𝑠 = 1.16; 𝐶𝑉 =35%
4. Los siguientes datos corresponden a cierta variable estadística observable: 3, 6, 2,
1, 7 y 5.
(a) Si se “suma 5” a cada número del conjunto de datos, muestre que el conjunto
nuevo de datos tiene la misma desviación estándar que el original, pero las me-
dias difieren. R: �̅�1 = 4; 𝑠1 = 2.36; �̅�2 = 9; 𝑠2 = 2.36
(b) Si multiplicamos los datos originales por dos, y sumamos luego cinco, inves-
tigue la relación entre la desviación estándar y las medias de ambos conjuntos
de datos. R: �̅�1 = 4; 𝑠1 = 2.36; �̅�2 = 13; 𝑠2 = 4.72
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
23
5. La tabla adjunta, representa los valores de las medidas de la media, la desviación
estándar y el coeficiente de variación de tres grupos de datos. Complete, correcta-
mente, la tabla. R: 𝑠 = 10; �̅� = 80; 𝐶𝑉 = 20%
Grupo �̅� 𝑠 𝐶𝑉
A 76 13% B 12 15% C 82 16
6. En cierta encuesta de hogares, se realizó una investigación sobre los “gastos fami-
liares en diversión”. Se tomó una muestra de 30 hogares en la provincia de San Jo-
sé, y se le preguntó a los jefes de familia cuánto dinero gastaban en divertirse cada
domingo. Se obtuvo los siguientes datos (en miles de colones):
12, 37, 16, 39, 18, 39, 20, 40, 20, 40, 22, 40, 26, 40, 26, 41, 27, 46, 29, 47, 30, 49, 31,
51, 33, 52, 35, 54, 36, 54
(a) Determine las medidas de tendencia central, la desviación estándar y el coefi-
ciente de variación para la variable “gastos familiares en diversión”.
R: 𝑠 = 11.8; �̅� = 35; 𝐶𝑉 = 34%
(b) En la provincia de Alajuela también se realizó dicha investigación. Se obtuvo
que el promedio (media) del gasto en esa provincia fue de 42000, con una
desviación estándar de 10,5. Compare la variabilidad del gasto en diversión en
ambas provincias. R: Hay mayor variabilidad en la provincia de S.J
7. Doña Julia tiene dos tiendas. A continuación, se registran las ventas de las últimas
11 compras (en colones) de un día en sus locales:
Tienda 1 2572
3140 2575 3200
2696 3233
2700 3250
2900 3255
3100
Tienda 2 2090 2977
2693 3100
2751 3296
2800 3321
2865 3350
2905
(a) Determine el promedio y la desviación estándar de los datos de cada tienda;
(b) Si los datos anteriores no incluyen el 10% de impuesto de ventas, ¿cuál es el nuevo promedio?
R: (a) �̅�1 = 2965.55; 𝑠1 = 281.88; �̅�2 = 2917.75; 𝑠2 = 345.40 (b) �̅�1 =3262.10; �̅�2 = 3209.52
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
24
IX. Simetría en las medidas de tendencia central
Recordemos que las tres medidas de tendencia central para una variable
cuantitativa son la moda (dato que más se repite), la mediana (dato se
separa en dos grupos de igual cantidad a los datos dados) y el promedio
(o media), la cual definimos como
�̅� =∑ 𝑥𝑖𝑛𝑖=1
𝑛
donde la variable genérica “𝑥𝑖” representa a cada uno de los 𝑛 datos de la
variable estudiada, para 1 ≤ 𝑖 ≤ 𝑛.
La pregunta que nos planteamos en estas breves notas es la siguiente: si
dichas medidas se complementan y nos permiten entender mejor la dis-
tribución de los datos, ¿en qué condiciones, cuál de ellas representa
mejor al conjunto de datos?
Para contestarla, analicemos un ejemplo primero. Considere la siguiente
tabla con dos conjunto de datos:
Datos Media Mediana Moda 2, 4, 5, 5, 5, 6, 9 5.14 5 5
2, 4, 5, 5, 5, 6, 54 11.57 5 5
Observe que la diferencia entre los dos conjuntos de datos es el último
valor (9 y 54, respectivamente). Note que tanto la mediana como la moda
quedan inalteradas por la diferencia sustancial entre los últimos datos.
En estas circunstancias, sólo la media se ve afectada por tal diferencia. Lo
que nos lleva a concluir que el promedio es una medida muy sensible a
cambios “grandes” en los datos. Otra observación importante es la si-
guiente: note que en ambos grupos de datos, la mediana es menor al
promedio lo que nos lleva a constatar que, en el caso en que 𝑀𝑒 < �̅�, la
mayor cantidad de los datos se concentran a la izquierda.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
25
Los teóricos de la Estadística resumen estas situaciones en tres casos po-
sibles, respecto a la relación entre las tres medidas de tendencia central,
las cuales se resumen en el diagrama adjunto:
Si la distribución de los datos es simétrica (ver curva central), las tres
medidas de tendencia central son iguales (o casi iguales); es decir: �̅� =
𝑀𝑒 = 𝑀𝑜. Lo que nos permite afirmar que “cualquiera” de las tres son úti-
les para representar al grupo de datos. (Este es el “caso ideal” desde el
punto vista teórico.)
Sin embargo, cuando los datos presentan valores extremos (menores o
mayores) muy bajos o muy altos la distribución es asimétrica: si la dis-
tribución tiene valores extremos muy altos, los teóricos señalan que di-
cha distribución presenta asimetría positiva (ver curva de la derecha):
en este caso �̅� > 𝑀𝑒 > 𝑀𝑜. Note que la curva se “inclina hacia la izquier-
da”. Por otro lado, si la distribución tiene valores extremos muy bajos,
los teóricos señalan que dicha distribución presenta asimetría negativa
(ver curva de la izquierda): en este caso �̅� < 𝑀𝑒 < 𝑀𝑜; y la curva se “in-
clina hacia la derecha”.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
26
Ejercicios varios
1. Considere los datos siguientes de una variable 𝑋:
8, 3, 4, 5, 2, 5, 2, 5, 6, 5, 3, 4, 5, 2, 8, 6, 3, 6, 5, 4, 8
Determine las medidas de tendencia central y estudie la simetría de la variable 𝑋. R: Simétrica, pues �̅� = 𝑀𝑒 = 𝑀𝑜
2. Indique, y justifique, qué medida de posición (o de tendencia central), sería más
útil para analizar cada uno de los siguientes casos:
(a) El gerente general de una panificadora quiere saber cuál es el tamaño del pan
baguete que debe fabricar en mayor cantidad. Para ello cuenta con datos su-
ficientes de los distintos tamaños de pan ordenados por los clientes.
(b) El gerente de ventas de una compañía de automóviles de lujo desea seleccio-
nar regiones de San José para establecer salas de exhibición ¿Debería conside-
rar la media o en la mediana del ingreso familiar por región?
(c) Un analista de la Bolsa de Valores está interesado en describir el cambio dia-
rio en el precio en el mercado de una acción de cierta compañía. Rara vez el
precio cambia más de un punto, pero hay ocasiones en que el precio cambia
hasta cuatro puntos ¿Qué medida posicional (o de tendencia central) debe
usar el analista?
(d) Cierta compañía de teléfonos celulares desea conocer si los montos facturados
en líneas telefónicas fijas (residenciales) tienen igual, mayor o menor varia-
ción que los montos facturados por concepto de líneas celulares.
(e) Un importador de teléfonos celulares desea conocer cuál es el modelo de telé-
fono que debe importar en mayor cantidad.
(f) El departamento de Recursos Humanos de cierta compañía está analizando un
nuevo modelo salarial para sus empleados. El analista ha calculado el salario
promedio que tendrían los empleados bajo dicho modelo, sin embargo, obser-
va que algunos gozarían de una salario muy elevado, mientras que otros ten-
drían un salario muy bajo, por lo que está interesado con conocer qué tan pa-
recidos son los salarios con respecto al salario promedio.
(g) Un importante empresa de inversiones habitacionales para familias de gran-
des ingresos abrió operaciones en Costa Rica. Además, está analizando la posi-
bilidad de abrir otras oficinas en otros países de la región. Con el fin de justifi-
car su decisión procedió a recolectar datos sobre ingresos de los hogares, ya
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
27
que ubicará sus agencias en aquellos países cuyos hogares tengan un ingreso
alto ¿Qué medida de posición deberá considerar?
R: (a) Moda (b) Mediana (c) Media (d) Coeficiente de variación (e) Moda (f) Desviación están-
dar (g) Mediana
3. Los datos siguientes corresponde a las bonificaciones por ventas mensuales que
reciben 16 ejecutivos de cierta empresa (en colones):
170 000; 170 000; 170 000; 170 000; 185 000; 190 000; 205 000; 215 000;
250 000; 250 000; 280 000; 280 000; 190 000; 200 000; 300 000; 300 000
(a) Determine la moda, la mediana, la media, la desviación estándar y el coeficien-
te de variación para la variable “bonificación por ventas”. R: 𝑀𝑜 = 170000; 𝑀𝑒 = 202500; �̅� = 220315.50; 𝑠 = 49; 𝐶𝑉 = 22%
(b) Investigue el tipo de simetría. R: Asimetría positiva, pues �̅� > 𝑀𝑒 > 𝑀𝑜
X. Cuartiles
Recordemos que la mediana 𝑀𝑒 divide al conjunto de datos en grupos
que contienen el 50% de las observaciones de variable estadística. Por
ejemplo, observe el siguiente conjunto de datos:
3, 3, 4, 5, 𝟗⏟𝑴𝒆
, 9, 9, 9, 12
Se observa que 𝑀𝑒 = 9, divide a los datos en un primer grupo de 50% de
los datos (3, 3, 4 y 5) menores que 𝑀𝑒; y en otro grupo, también del 50%,
mayores que 𝑀𝑒 (es decir: 9, 9, 9, 12).
Si volvemos a aplicar la idea de mediana a cada subgrupo independiente,
obtendríamos otros dos datos llamados cuartiles. Lo que quiere decir que
los cuartiles (denotados por 𝑄1 y 𝑄3, dado que 𝑄2 = 𝑀𝑒) dividen a los
subgrupos en dos grupos que contienen el 25% de los datos totales de la
variable. En el caso anterior, tendríamos que:
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
28
3, 3, 𝑸𝟏, 4, 5, 𝟗⏟𝑴𝒆=𝑸𝟐
, 9, 9, 𝑸𝟑, 9, 12
En donde 𝑄1 =3+4
2= 3.5 y 𝑄3 =
9+9
2= 9.
Nota. No hay que olvidar que tanto la mediana, y ahora los cuartiles, pueden o no ser datos
incluidos en el conjunto de datos de la variable estadística estudiada.
XI. Recorrido (o rango)
Sean 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑛 los datos ordenados en forma ascendente (de menor
a mayor) de cierta variable cuantitativa. Llamaremos mínimo a mín = 𝑥1
y máximo a máx = 𝑥𝑛; por lo que el recorrido (o rango) de los datos se-
rá
𝑅 = máx −mín = 𝑥𝑛 − 𝑥1
Por ejemplo, si consideramos los datos 23, 24, 25, 25, 35, 44, 44, 44; el re-
corrido 𝑅 será equivalente a 𝑅 = máx −mín = 44 − 23 = 21.
X.1 Recorrido intercuartílico y desviación cuartil
Si 𝑄1 y 𝑄3 son el primer y tercer cuartil, respectivamente, llamaremos re-
corrido intercuartílico a la diferencia 𝑅𝐼 = 𝑄3 − 𝑄1. Así, por ejemplo, en
el conjunto de datos:
12, 13, 17, 18, 18, 22, 23, 31, 31, 31, 45
se observa que
12, 13, 𝟏𝟕⏞𝑄1
, 18, 18, 𝟐𝟐⏞𝑀𝑒
, 23, 31, 𝟑𝟏⏞𝑄3
, 31, 45
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
29
Por lo que el recorrido intercuartílico es 𝑅𝐼 = 𝑄3 − 𝑄1 = 31 − 17 = 14.
Por otra parte, llamaremos desviación cuartil, denotada por 𝑄, al “reco-
rrido intercuartílico dividido entre 2”. O sea:
𝑄 =𝑅𝐼2=𝑄3 − 𝑄12
Esta medida de dispersión se considera una medida de variación aso-
ciada a la mediana. Veamos un ejemplo. Consideremos los datos del ejem-
plo anterior, a saber:
15, 16, 𝟏𝟕⏞𝑄1
, 18, 18, 𝟐𝟐⏞𝑀𝑒
, 23, 31, 𝟑𝟏⏞𝑄3
, 31, 39
La desviación cuartil sería: 𝑄 =𝑄3−𝑄1
2=14
2= 7. Lo que quiere decir que los
datos están, en general, a “±7” unidades de la mediana (𝑀𝑒 = 22). En otras
palabras, esto quiere decir que los datos se encuentran, más o menos,
comprendidos entre:
22 − 7 = 15 y 22 + 7 = 29
Ejercicios varios
1. Para los siguientes conjuntos de datos, determine el mínimo, el máximo, el reco-
rrido, el primer cuartil, la moda, la mediana, el tercer cuartil, el recorrido inter-
cuartílico y la desviación cuartil.
(a) 1, 5, 3, 4, 3, 3, 4, 3, 2, 1, 4
(b) 11, 44, 30, 51, 43, 35, 21, 51, 44, 33, 21, 44, 33
(c) 41, 54, 10, 8, 12, 41, 8, 41, 54, 54, 20, 42, 44, 50
R: (a) mín = 1; máx = 5; 𝑅 = 4; 𝑀𝑜 = 3; 𝑄1 = 2; 𝑄2 = 𝑀𝑒 = 3; 𝑄3 = 4; 𝑅𝐼 = 2; 𝑄 = 1
(b) mín = 11; máx = 51; 𝑅 = 40; 𝑀𝑜 = 44; 𝑄1 = 25.5; 𝑄2 = 𝑀𝑒 = 35; 𝑄3 = 44;
𝑅𝐼 = 18.5; 𝑄 = 9.25 (c) mín = 8; máx = 54; 𝑅 = 46; 𝑀𝑜 = 41 y 54; 𝑄1 = 11;
𝑄2 = 𝑀𝑒 = 41; 𝑄3 = 52; 𝑅𝐼 = 41; 𝑄 = 20.5
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
30
2. Suponga que de ciertos conjuntos de datos se conocen el mín, máx, los cuartiles y la
mediana. Determine, en cada caso, el recorrido, el recorrido intercuartílico y la des-
viación cuartil.
(a) mín = 3; máx = 17; 𝑄1 = 7; 𝑀𝑒 = 11; 𝑄3 = 19.
(b) mín = 23.13; máx = 88.12; 𝑄1 = 31.01; 𝑀𝑒 = 55.13; 𝑄3 = 80.08.
R: (a) 𝑅 = 14; 𝑅𝐼 = 12; 𝑄 = 6 (b) 𝑅 = 64.99; 𝑅𝐼 = 49.07; 𝑄 = 24.54
3. Considere la siguiente tabla de datos agrupados, con 𝑥𝑖 dato y 𝑓𝑖 la frecuencia aso-
ciada.
𝒙𝒊 𝒇𝒊 20 25 25 80 30 33 35 60 40 22 45 17 50 60 55 20
Determine el primer cuartil, la mediana y el tercer cuartil.
R: 𝑄1 = 25; 𝑄2 = 𝑀𝑒 = 35; 𝑄3 = 50
4. Clasifique la asimetría de la distribución de los datos del ejercicio 1.
R: (a) Simétrica (b) Asimétrica positiva (derecha) (c) Asimétrica negativa (izquierda)
5. Suponga que en cierto conjunto de datos se tiene que 𝑄1 = 20; 𝑄3 = 30 y �̅� = 30
¿Podría el grupo tener asimetría negativa? Explique. R: No, ¿por qué?
6. Cinco estudiantes promediaron las notas que obtuvieron en una prueba corta y ob-
tuvieron 48 ¿Es posible que alguno haya obtenido 100 de puntación? Explique.
R: Sí, ¿por qué?
7. En grupo de 9 estudiantes, uno de ellos obtuvo un 70 en un examen. Se sabe ade-
más que las modas fueron 82 y 54, que 𝑄1 = 55, 𝑄2 = 75, que 𝑄3 = 86, y que �̅� = 73.
Determine el mín y el máx. R: mín = 54; máx = 94
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
31
8. Al considerar una distribución con asimetría izquierda (negativa), ¿qué es mayor:
�̅� ó 𝑄1? ¿Es mayor �̅� ó 𝑄3? Explique.
XII. Cajas de dispersión (o Boxplot)
La representación de los datos mediante gráficos es indispensable para
una mejor interpretación de los mismos. En Estadística Descriptiva, exis-
ten una gran cantidad de tipos de gráficos: barras horizontales y vertica-
les, gráficos de pastel, histogramas, entre otros. En esta sección, utilizare-
mos los conceptos expuestos en estas notas para hacer un tipo de gráfico
denominado “Caja de dispersión o Diagrama de Caja” (o Boxplot).
Los datos que necesitamos para realizar una Caja de dispersión son los si-
guientes:
El “mín” y el “máx”.
Los cuartiles: 𝑄1, 𝑄2 y 𝑄3. Recordemos que 𝑄2 = 𝑀𝑒.
El recorrido intercuartílico, es decir: 𝑅𝐼 = 𝑄3 − 𝑄1. Y el recorrido, a saber:
𝑅 = máx − mín.
Damos a continuación un ejemplo general de un Boxplot:
𝑄1 𝑀𝑒 𝑄3
mín máx
Note que el Diagrama de Caja inicia con el menor de los datos (mín), y
termina con el mayor de ellos (máx). La “caja” principal inicial en el pri-
mer cuartil (𝑄1) y termina en el tercero (𝑄3); esto quiere decir que el “lar-
go” del Boxplot es el recorrido intercuartílico (𝑅𝐼 = 𝑄3 − 𝑄1). El “ancho” del
rectángulo es arbitrario.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
32
La línea que divide a la Caja de dispersión corresponde a la Mediana (𝑀𝑒),
la cual divide, como sabemos, a los datos en dos grupos en porcentajes
50%-50%; por lo que en el rectángulo del Boxplot están representados el
50% del total de datos.
Analicemos un ejemplo concreto. Suponga que los datos siguientes co-
rresponden al número de días de incapacidad laboral (al año), de un gru-
po de obreros de la construcción en la empresa ConstruEdi S.A:
12, 13, 13, 15, 21, 21, 21, 21, 28, 32, 32, 35, 36
Los datos están ordenados y se observa que 𝑀𝑜 = 21. La cantidad de da-
tos es 𝑛 = 13. Por lo que, la mediana es 𝑀𝑒 = 21. También mín = 12 y
máx = 36. Así,
12, 13, 13, 15, 21, 21, 𝟐𝟏⏞𝑀𝑒
, 21, 28, 32, 32, 35, 36
Calculando el primer y tercer cuartil, tenemos que
12, 13, 13, 𝟏𝟒⏞𝑄1
, 15, 21, 21, 𝟐𝟏⏞𝑀𝑒
, 21, 28, 32, 𝟑𝟐⏞𝑄3
, 32, 35, 36
(Los cuales no son datos de la lista original.) De esta manera, nuestra
Caja de dispersión nos quedaría:
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
33
Observe que el “Eje horizontal” de abajo, incluye una “escala”, la cual nos
permite ver, grosso modo, cómo se encuentran distribuidos los datos.
Nota. Esta Caja de dispersión fue generada por el programa http://www.imathas.com/stattools.
El cual es un programa gratuito de Internet.
XIII. ¿Y cómo interpreto una Caja de dispersión?
En el Diagrama de Caja del ejemplo anterior, vemos como el primer cuar-
til (𝑄1) y el “mín” están “muy cercanos”; como el primer cuartil agrupa al
25% de los datos, esto quiere decir que los primeros datos se encuentran
muy próximos entre sí, aspecto que podemos comprobar si miramos los
datos en bruto: 12, 13, 13. Caso contrario sucede en la “parte superior”
del Boxplot en donde hay una “leve”, pero mayor distancia, entre los datos
que ocupan el tercer cuartil (𝑄3); veamos: 32, 35, 36. Esto nos lleva a la
conclusión de que a menor “número de días de incapacidad”, los datos se
parecen mucho. Por otro lado, a mayor “número de días de incapacidad”
los trabajadores se alejan entre sí. Si miramos la Caja de dispersión nota-
remos que los datos se agrupan en mayor cantidad a la “derecha de la
mediana” (𝑀𝑒 = 𝑄2 = 21), lo que quiere decir que los datos mayores
(número de días de incapacidad laboral) se encuentran por encima de la
mediana. Esto podría analizarse diciendo que el mayor número de
trabajares se incapacitan “muchos días” al año. Las razones del por qué
ya escapan a los datos dados en el análisis, pues tienen que ver con
situaciones propias de la actividad que desarrolla la empresa ConstruEdi
S.A.
XIV. Ejemplo para dos grupos de datos
Suponga que el profesor Aquiles Canto da clases de Literatura opcional a
dos grupo de estudiantes: 9A y 9B. En cierto trabajo escrito, se obtuvie-
ron las siguientes notas:
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
34
9A 56, 65, 65, 75, 89, 90, 92, 92, 92, 92, 100 9B 50, 55, 68, 68, 68, 88, 89, 91, 93, 100, 100
Representemos ambos conjuntos de datos en dos Cajas de dispersión para
comparar los resultados.
Para el 9A tenemos los datos: mín = 56; máx = 100; 𝑀𝑒 = 90; 𝑀𝑜 = 92;
𝑄1 = 65; 𝑄3 = 92; 𝑅𝐼 = 27; 𝑅 = 44; 𝑄 = 13.5
Mientras que, para el 9B tenemos los datos: mín = 50; máx = 100; 𝑀𝑒 =
88; 𝑀𝑜 = 68; 𝑄1 = 68; 𝑄3 = 93; 𝑅𝐼 = 25; 𝑅 = 50; 𝑄 = 12.5.
Con estos datos, tenemos los siguientes Diagramas de Cajas para ambas
secciones:
Lo importante de estas Cajas es ubicar e interpretar la posición de la me-
diana y los cuartiles. Observe que, en el 9A la mediana es 𝑀𝑒 = 90, mien-
tras que en el 9B, 𝑀𝑒 = 68 ¡Y como la mediana agrupa al 50% de los da-
tos! Note que en el caso del 9A el 50% de los datos está por encima de la
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
35
nota 90; mientras que en el 9B dicho porcentaje está a partir de la nota
68. Es notorio también el hecho de que, en el 9B, 𝑄1 = 𝑀𝑒 = 68, lo que
quiere decir que el 50% de las notas del 9B están en intervalo [50,68]; lo
que nos lleva a la conclusión de que el “mejor rendimiento” en la tarea se
encuentra en el grupo 9A. Las razones del por qué se encuentra relacio-
nado con el desempeño que observa del profesor en ambas secciones, las
cuales escapan a nuestro análisis, pues no contamos con datos sufícien-
tes.
Ejercicios varios
1. A la pregunta sobre el número de “litros de gaseosa mensuales que consume una
persona” en cierta oficina, se obtuvo la siguiente Caja de Dispersión.
(a) Calcule el recorrido y el recorrido intercuartílico. R: 12 y 7
(b) La Oficina de Salud Ocupacional quiere realizar una campaña que cubra al
25% de los encuestados con mayor consumo ¿A partir de cuántos litros deberá
diseñar la campaña? R: A partir de 8 litros
(c) Supongamos que 18 personas consumen entre 1 y 2 litros, ¿a cuántas personas
se les realizó la encuesta? R: 72 personas
2. En una muestra de 200 personas, respecto a la variable edad, el recorrido inter-
cuartílico es 28, y 50 de las personas tienen menos de 18 años.
(a) ¿Qué porcentaje representa esas 50 personas? R: 25%
(b) Calcule el primer cuartil. R: 𝑄1 = 18
(c) Calcule el tercer cuartil. R: 𝑄2 = 46
(d) ¿Cuántas personas tienen más de 46 años? R: 25%
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
36
3. En una población de 150 personas de una empresa, respecto a la variable salario, el
recorrido es 1 000 000, el salario mínimo es 250 000. La mediana 300 000 y
la media (promedio) 450 000.
(a) ¿Cuál es el salario de la persona que gana más? R: 1 250 000
(b) ¿Qué porcentaje de las personas gana menos de 300 000? R: 50%
(c) Compare el número de personas que ganan más del promedio con el número de
personas que ganan menos del promedio ¿Cuál es mayor y por qué? R: 𝑀𝑒 < �̅�, por lo que hay más personas que ganan menos del promedio
4. Considere el conjunto de datos:
18, 18, 19, 19, 20, 22, 22, 23, 27, 28, 28, 31, 34, 34, 36
Cuyo Diagrama de Caja es el siguiente:
A 𝐵 𝐶 𝐷 E
(a) Determine la media de los datos. R: �̅� = 25,3
(b) Determine el valor numérico de A, B, C, D y E. R: 𝐴 = 18; 𝐵 = 19; 𝐶 = 23; 𝐷 = 31; 𝐸 = 36
(c) ¿Qué porcentaje de los datos están entre 18 y 31? R: 75%
(d) Determine el recorrido, el recorrido intercualtílico y la desviación cuartil. R: 𝑅 = 6; 𝑅𝐼 = 12
XV. La varianza
La varianza es otra de las medidas de dispersión, las cuales repasamos a
continuación: desviación estándar, recorrido, coeficiente de variación y
desviación cuartil. Esta medida se define como
𝑣 =∑ (�̅� − 𝑥𝑖)
2𝑛𝑖=1
𝑛 − 1
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
37
Se observa claramente que 𝑣 = 𝑠2; es decir: la varianza es el cuadrado de
la desviación estándar. Es decir: la varianza se define como la media de
los cuadrados de las desviaciones de los datos respecto a la media. Si
utilizamos la notación sigma, varianza se define como 𝑣 = 𝜎2.
Si consideramos los datos de cierta variable estadística 𝑋: 23, 25, 25, 30,
42, 45; tenemos que �̅� ≈ 32. Por lo que:
∑(�̅� − 𝑥𝑖)2 = 92 + 72 +⋯+ (−10)2 +
6
𝑖=1
(−13)2 = 452
De esta manera, la varianza sería:
𝑣 =∑ (�̅� − 𝑥𝑖)
26𝑖=1
𝑛 − 1=452
6 − 1= 90.4
Ejercicios varios
1. La masa media (promedio) de los niños de una clase es de 58,2kg, y su desviación
estándar es 3,1kg. La masa media de las niñas de esa clase es de 52,4kg y su desvia-
ción estándar es 5,2kg ¿Cuál de las dos masas medias presenta más variación? R: Las niñas (calcule el coeficiente de variación)
2. Andrea y Patricia quieren poner en práctica los conocimientos adquiridos en el
curso Estadística Descriptiva del cole. El desglose de sus notas en Cívica se presen-
ta en el siguiente cuadro:
Rubro evaluación Porcentaje Notas de Andrea Notas de Patricia Prueba escrita 35 63 72 Trabajo cotidiano 15 84 70 Proyecto 40 60 71 Asistencia 5 98 95 Concepto 5 100 97
Total 100
Si la nota de aprovechamiento debe ser superior o igual a 70, ¿aprobaron ambas
alumnas el período? R: No
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
38
3. A un grupo de niños escolares se les preguntó sobre el número de frutas que con-sumían diariamente, obteniéndose los siguientes resultados:
4, 3, 0, 1, 2, 0, 2, 3, 2, 2, 4, 2, 1, 4
(a) Complete, correctamente, la Tabla de frecuencias siguiente:
Número de frutas
Frecuencia
0 2 1 2 5
3 2 4
(b) La cantidad de datos corresponde a la siguiente: ________. R: 14
(c) La moda de los datos corresponde a la siguiente: _________. R: 2
(d) La mediana de los datos corresponde a la siguiente: _________. R: 2
(e) La media (promedio) de los datos corresponde a la siguiente: _________. R: 2,14
(f) La frecuencia relativa del dato “4 frutas” corresponde a la siguiente: _______. R: 21%
(g) Si la desviación estándar de los datos es 1.35, entonces el Coeficiente de variación corresponde al siguiente valor: ___________. R: 63%
(h) Si 3 de los niños que contestaron “2 frutas” en realidad consumen 4 frutas, en-tonces la mediana de los datos sería el valor siguiente: ___________. R: 3
4. Suponga que 15 datos de cierta variable cuantitativa 𝑋 suman 480. Si se sabe que,
la desviación estándar de dichos datos es 5, halle el Coeficiente de variación. R: 16%
5. Suponga que los tres datos de una variable estadística 𝑋 son 12, 32 y 2. Las pon-
deraciones de esos datos son 3, 5 y 𝑝, respectivamente. Si el valor de la media pon-derada es 12, halle el valor numérico de “𝑝”. R: 𝑝 = 10
6. Suponga que la media de los primeros 𝑛 enteros positivos es 18. Halle el valor de 𝑛
y 𝑀𝑒 . R: 𝑛 = 35; 𝑀𝑒 = 18
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
39
7. La media de cuatro números es 13. Si se agrega un quinto número, el promedio se-ría 31. Halle el valor numérico del número agregado. R: 103
XVI. Factorial
Definición 1. Suponga que 𝑛 es un entero positivo. Definimos el factorial
de 𝑛, denotado por 𝑛!, como 𝑛! = 1 ∙ 2 ∙ 3 ∙ 4⋯𝑛. Definimos 0! = 1.
Es decir: el factorial de 𝑛 es el producto de los 𝑛 primeros enteros positi-
vos. Por ejemplo: 4! = 1 ∙ 2 ∙ 3 ∙ 4 = 24; también 10! = 1 ∙ 2 ∙ 3⋯9 ∙ 10 =
3 628 800. Por definición, como vimos arriba, 0! = 1.
Ejercicios varios
1. Simplifique las expresiones siguientes.
(a) 13!
11! R: 156
(b) 7!
10! R:
1
720
(c) 16!
14! R: 240
(d) 8!
10! R:
1
90
(e) 7!
3!∙2! R: 420
(f) 5!∙3!∙0!
9! R:
1
504
(g) 8!
2!∙5!∙2! R: 84
(h) 𝑛!
(𝑛−1)! R: 𝑛
(i) (𝑛+2)!
𝑛! R: (𝑛 + 1)(𝑛 + 2)
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
40
(j) (𝑛+1)!
(𝑛−1)! R: 𝑛(𝑛 + 1)
(k) (𝑛−1)!
(𝑛+2)! R:
1
𝑛(𝑛+1)(𝑛+2)
(l) 3!∙(𝑛−1)!
(𝑛+1)! R:
6
𝑛(𝑛+1)
(m) 6!∙(𝑛−1)!
(𝑛−2)!∙3! R: 120(𝑛 − 1)
(n) 22!∙4!
2!∙19!∙5! R: 924
(ñ) 8!∙(𝑛+4)!
(𝑛+2)!∙5! R: 336(𝑛 + 3)(𝑛 + 4)
(o) 3!∙8!∙(𝑛−2)!
(𝑛+1)!∙6! R:
336
𝑛(𝑛−1)(𝑛+1)
2. Determine el dígito de las unidades simples del número 𝑁, siendo R: 3
𝑁 = 1! + 2! + 3! + 4! + 5! + ⋯+ 2017!
3. Determine el mayor exponente de 3 en el número 15! R: 6
XVII. Principios del conteo
Principio de la suma. Suponga que un proceso puede ser llevado a cabo de
dos formas distintas, de las cuales la primera de las formas puede hacerse
de 𝑛 maneras distintas, mientras que, la segunda de las formas puede reali-
zarse de 𝑚 formas diferentes; entonces, el número de maneras de realizar
el proceso es 𝑛 +𝑚.
Este principio, que parece muy abstracto, en realidad tiene fundamentos
cotidianos muy concretos. Veamos: suponga que una sección del colegio
tiene 14 estudiantes mujeres y 17 estudiantes varones, ¿de cuántas for-
mas puede el profesor guía elegir un representante de la sección para el
próximo acto cívico? La respuesta es muy obvia: tiene un total de 31 posi-
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
41
bilidades (14 + 17 = 31); dado que puede elegir una niña o bien, un niño,
de 14 y 17 estudiantes, respectivamente. Otro ejemplo: Juan observó que
en la tienda deportiva Mr. Chanclas había 7 pantalonetas playeras de su
talla; mientras que en la tienda Chata S.A encontró 9 de estas pantalone-
tas, ¿de cuántas maneras puede Juan elegir una pantaloneta playera?
Pues obviamente que de 16 formas posibles (7 + 9 = 16); dado que pue-
de o bien elegir una de siete en la primera tienda, o una de 9 en la segun-
da.
Nota. El Principio de la suma puede ser generalizado para un proceso dividido en 𝑘 etapas, de
las cuales la primera forma puede llevarse de 𝑛1 formas distintas; la segunda de 𝑛2 formas
distintas, y así sucesivamente hasta llegar al caso 𝑘, el cual puede realizarse de 𝑛𝑘 formas dis-
tintas; con la condición de que cada una de las formas sean excluyentes dos a dos, o sea:
𝐶𝑖 ∩ 𝐶𝑗 = ∅. Lo que pone como condición que no haya elementos “repetidos” entre las distin-
tas formas de realizar el proceso.
Veamos un último ejemplo: suponga que tenemos las cifras 7, 6, 9 y 2 ¿De
cuántas se pueden formar números enteros pares de dos dígitos distintos
con las cifras dadas? Recordemos que un número entero es par, si la cifra
de las unidades simples es cero o par. En este caso, sólo las cifras 6 y 2 son
pares; por lo que nos aventuramos a analizar sólo dos casos; a saber los
números de la forma ___6, o bien los números de la forma ___2; donde el
espacio de la izquierda indica la cifra de las decenas simples. Los núme-
ros que podemos formar en el primer caso serían 76, 96 y 26; mientras
que, en el segundo caso tendríamos 72, 62 y 92. Como se pueden dar
ambos casos, y los casos son excluyentes entre sí, por el Principio de la
suma habría un total de 3 + 3 = 6 formas; pues hay 3 formas de escribir
números pares terminados en 6, o bien, hay también 3 formas de escribir
números pares terminados en 2.
Principio del producto. Para entender mejor este principio, presentamos
la siguiente situación. Suponga que Eduardo debe asistir a la clase de
educación física mañana; en su armario tiene 3 camisetas y 4 pantalo-
netas. Como lógicamente para “estar presentable”, necesita de una panta-
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
42
loneta y una camiseta para asistir a dicha clase, ¿de cuántas maneras pue-
de combinar las prendas de que dispone Eduardo para asistir a la clase de
educación física? Note que la ilustración siguiente da cuenta de la solu-
ción:
En eso se basa el Principio del producto: como la manera de elegir una ca-
miseta tiene 3 formas posibles y la de elegir una pantaloneta es de 4, en-
tonces habrá un total 3 × 4 = 12 formas de que Eduardo pueda llegar con
la vestimenta idónea para práctica física. Por lo tanto, podemos resumir
el Principio del producto como sigue:
Suponga que la realización de un proceso se divide en 2 etapas. Si la prime-
ra etapa se puede realizar de 𝑛 formas distintas, y luego de efectuada, la 2da
etapa se puede realizar de 𝑚 formas distintas, entonces el número total de
formas en que se puede realizar el proceso es 𝑛 ∙ 𝑚.
Nota. El Principio del producto no debe tomarse a la ligera; es importante hacer notar que la
condición para determinar las maneras de realizar la segunda etapa, se asume que ya se rea-
lizó la primera. Por otro lado, es evidente que este principio no solo se aplica a procesos divi-
didos en dos etapas, sino a procesos que pueden ser desarrollados en 𝑘 etapas.
Analicemos un último ejemplo: suponga que tenemos las cifras 1, 4, 2, 3,
7 y 9 ¿Cuántos números pares de 6 cifras distintas se puede formar con
dichas cifras? Este es un problema cuya solución involucra a los dos prin-
cipios mencionados más arriba. Como en las cifras dadas aparecen sólo
dos cifras pares (4 y 2), y un número entero es par, si la cifra de las uni-
dades simples es par, empezamos estudiando los números de seis cifras
terminados en “4”; es decir, números de la forma ABCDE4, donde las
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
43
letras designan dígitos. Como tenemos cinco cifras (1, 2, 3, 7 y 9, pues el 4
ocupa de manera fija las unidades simples) que pueden ocupar la cifra
“A”, por el Principio del producto, esta “primera etapa” del proceso de
construcción tiene 5 formas distintas de realizarse; para la cifra “B”, la se-
gunda etapa, habrá ahora 4 formas distintas de elegir al representante de
esa “casilla”; razonando así, sucesivamente, tendríamos un total de 5 ∙ 4 ∙
3 ∙ 2 ∙ 1 = 5! = 120 formas distintas para construir números pares de seis
dígitos terminados en “4”. Un razonamiento idéntico, pero fijando a “2”
en el espacio de las unidades simples, nos daría también un total de 120
números pares de seis dígitos, pero terminados en “2”. Por el Principio de
la suma, como se puede dar el primer caso (los terminados en 4), o bien
el segundo caso (los terminados en 2), habría un total de 120 + 120 =
240 formas posibles de obtener números pares de 6 cifras distintas con
las cifras 1, 4, 2, 3, 7 y 9.
XVIII. ¿Contar?
No se sienta ofendido por la pregunta, ¡por supuesto que todos sabemos
contar! Sin embargo, nos proponemos contar configuraciones “un poco
más complejas” que las conocidas y aplicadas en la escuela o en la pulpe-
ría.
Veamos un ejemplo: tenemos cinco letras (A, B, C, D, E) y una línea con 4
espacios: ______, ______, ______, ______. Pregunta: las letras anteriores, ¿de
cuántas formas se pueden colocar en los espacios de la línea dada, sin que
se puedan repetir letras? Pensemos un poco… podríamos tener configu-
raciones tales como: ABCD, ABCE, BCDE… Conclusión: ¡habría muchas
formas! Si somos muy testarudos nos ponemos “manualmente” a calcu-
larlas, sin embargo, al ratito, nos daríamos cuenta que son una cantidad
grande de configuraciones; de hecho son: 5𝑃4 = 120… O sea: ¡120 filas o
configuraciones posibles! ¡Santo Dios!... Pero, ¿qué es eso de 5𝑃4?
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
44
Los matemáticos llaman “permutación de 5 objetos tomados de 4 en 4” a
la expresión 5𝑃4 ¿Qué es una permutación?
Definición 1. Suponga que tenemos 𝑛 objetos distinguibles (o sea: pode-
mos diferenciarlos unos de otros). Suponga ahora que de esos 𝑛, tomamos 𝑟
de ellos (𝑟 ≤ 𝑛). Llamaremos permutación de 𝑛 objetos, tomados de 𝑟 en 𝑟,
a un arreglo lineal de esos 𝑛 objetos.
Teorema 1. El número de permutaciones que se pueden hacer con 𝑛 ob-
jetos, tomados de 𝑟 en 𝑟, con 𝑟 ≤ 𝑛, viene dado por
𝑛𝑃𝑟 =𝑛!
(𝑛 − 𝑟)!
Por tal razón, la “cantidad de filas de cuatro letras distintas que se pue-
den formar con las letras A, B, C, D, E es 120”. En efecto:
5𝑃4 =5!
(5 − 4)!=120
1= 120
Es importante hacer notar que la permutación ABCD es distinta de ABDC,
aunque sólo hayan cambiado de posición C y D. Lo que quiere decir que el
orden es importante en una permutación. Además, reiteramos el hecho
de que los cinco objetos (letras) de este problema son distinguibles; es
decir: no hay objetos repetidos… ¿Qué pasará si hay repeticiones?
Teorema 2. Suponga que se tienen 𝑛 objetos de los cuales hay 𝑚1 repeti-
dos, 𝑚2 repetidos,…, 𝑚𝑘 repetidos, con 𝑚1 +𝑚2 +⋯+𝑚𝑘 = 𝑛. Entonces
las permutaciones que se pueden hacer con los 𝑛 objetos, viene dado por
𝑛𝑃𝑚1, 𝑚2, … ,𝑚𝑘 =𝑛!
𝑚1! ∙ 𝑚2!⋯𝑚𝑘!
Por ejemplo, si nos piden reacomodar las letras de la palabra HALLAR pa-
ra obtener “otras palabras” (con o sin sentido), nos daríamos cuenta de
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
45
algunas configuraciones produciría la “misma palabra”, pues al haber
letras repetidas, se producirían palabras idénticas. Aplicamos, en este ca-
so, el teorema anterior: observamos que la letra A aparece repetida dos
veces; lo mismo que la letra L. Por lo tanto, las permutaciones de las le-
tras de la palabra HALLAR, tomadas todas ellas, sería:
6𝑃2,2 =6!
2! ∙ 2!=720
4= 180
Tomemos otro ejemplo. Considere la cuadrícula siguiente y suponga que
cierto viajero quiere ir de A a B, utilizando como caminos posibles los la-
dos de los cuadraditos pequeños. Si sólo puede moverse “a la derecha o
hacia arriba”, ¿de cuántas formas puede realizar el trayecto?
B
A
Observe que para ir de A a B, el viajero debe moverse siempre “cinco lí-
neas a la izquierda” y “tres líneas hacia arriba”. Si designamos con “𝑑”
moverse un lugar a la derecha, y con “𝑎” un lugar hacia arriba, entonces
una trayectoria posibles sería “𝑑𝑎𝑑𝑑𝑎𝑑𝑑𝑎”. Notamos de inmediato que el
total de trayectorias posibles son “las permutaciones de 8 letras d y a, de
las cuales hay 5 repeticiones de d y 3 repeticiones de a”: es decir son las
permutaciones con repeticiones. Por lo tanto, el número de maneras de
hacer el viaje A a B es
𝑛𝑃𝑚1, … ,𝑚𝑘 =𝑛!
𝑚1! ∙ 𝑚2!⋯𝑚𝑘! ⟹ 8𝑃3,5 =
8!
3! ∙ 5!= 56
Es decir: el viajante cuenta con 56 formas de hacer el trayecto de A a B,
con la condición: sólo puede moverse “a la derecha o hacia arriba.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
46
Definición 2. Suponga que tenemos 𝑛 objetos distinguibles (o sea: pode-
mos diferenciarlos unos de otros). Suponga ahora que de esos 𝑛, tomamos 𝑟
de ellos (𝑟 ≤ 𝑛). Llamaremos combinación de 𝑛 objetos, tomados de 𝑟 en 𝑟,
a un arreglo lineal de esos 𝑛 objetos, en el cual el orden no tiene impor-
tancia.
¡La diferencia entre permutación y combinación es clara! En la primera
importa el orden en la configuración, en la segunda, no. Es decir: ABCD y
ABDC representan permutaciones distintas, pero la misma combinación.
Teorema 3. El número de combinaciones que se pueden hacer con 𝑛
objetos, tomados de 𝑟 en 𝑟, con 𝑟 ≤ 𝑛, viene dado por
𝑛𝐶𝑟 =𝑛!
𝑟! ∙ (𝑛 − 𝑟)!
Es claro que el factor 𝑟! del denominador “elimina” las permutaciones re-
petidas”, dado que en las combinaciones no importa el orden de la confi-
guración.
Un ejemplo: tenemos otra vez las mismas cinco letras (A, B, C, D, E); que-
remos determinar el número de combinaciones que se pueden hacer con
ellas, si las tomamos de 4 en 4. Veamos:
5𝐶4 =5!
4! ∙ (5 − 4)!=120
24= 5
¡Es notorio que el número de combinaciones 5𝐶4 es muy inferior al nú-
mero 5𝑃4! ¡La diferencia es 115! De hecho, si miramos bien la relación
que hay entre ellas es 𝑟! ∙ 𝑛𝐶𝑟 = 𝑛𝑃𝑟. Es decir: el número de las permuta-
ciones es “𝑟! veces” el número de las combinaciones.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
47
Análisis de ejemplos
Pasemos ahora a analizar algunos ejemplos ilustrativos de lo estudiado
hasta ahora.
Ejemplo 1. Suponga que una butaca del cine tiene seis espacios dispo-
nibles.
(a) Determine el número de maneras en que se pueden sentar Pánfilo, Cai-
fás y Gala en dicha butaca.
Solución. Es claro que habrá 6𝑃3 = 120 formas; pues el problema es equi-
valente a ordenar tres “objetos” de seis lugares posibles.
(b) Determine el número de maneras si Caifás ocupa el 5to sillón de manera
fija.
Solución. Si Caifás está fijo en el 5to asiento, esto reduce significativamen-
te el número de permutaciones, pues sus amigos, Pánfilo y Gala, tienen
sólo las cinco restantes sillas para sentarse; por lo tanto: 5𝑃2 = 20.
Nota. Es claro que en las dos situaciones anteriores, el orden de las personas en la bu-
taca es importante; de ahí que estudiemos permutaciones.
(c) Suponga ahora que al mismo tiempo que llegan Pánfilo, Caifás y Gala,
se presentan otras tres personas ¿De cuántas maneras se pueden sentar
en la butaca, si los tres amigos quieren sentarse siempre juntos?
Solución. Podemos ver el grupo de tres amigos como un solo “bloque”:
𝑃𝐶𝐺. Por lo que las otras tres personas nuevas deberán acomodarse en
los tres espacios restantes. Así, tendríamos que los tres amigos se pueden
sentar juntos de 3𝑃3 = 6 formas; de igual forma: los tres nuevos perso-
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
48
najes se pueden sentar de 3𝑃3. Por último, el número total de formas en
que se pueden dar ambas situaciones es 3𝑃3 ∙ 3𝑃3 = 36.
(d) Suponga ahora que Caifás se enoja con sus amigos y no desea sentarse
junto a ellos ¿De cuántas maneras se pueden sentar en la butaca, to-
mando en cuenta a los tres nuevos personajes?
Solución. Dejamos al estudiante esta investigación; eso sí, le aclaramos
que tiene que poner a prueba su ingenio ¡Suerte! R: 144
formas
Ejemplo 2. Suponga que en un grupo comunitario, hay 26 representantes
de Barrio México, 11 representantes de Barrio Moreno y 20 representantes
de Barrio Cristo Rey. Se desea formar una Comisión formada por 10 inte-
grantes, de los cuales 4 sean de Barrio México, 2 sean de Barrio Moreno y 4
sean de Barrio Cristo Rey. Determine el número de formar en que se puede
conformar dicha Comisión.
Solución. Es claro que el orden de los integrantes de cada barrio en la Co-
misión es irrelevante. Por lo tanto, el número de maneras de elegir los 4
miembros de 26 representantes de Barrio México es 26𝐶4 = 14950. De la
misma forma, para los 2 miembros de Barrio Moreno tenemos que 11𝐶2
= 55. Y en el caso de Barrio Cristo Rey: 20𝐶4 = 4845. Así, el número total
de formas en que se dan las tres condiciones es 26𝐶4 ∙ 11𝐶2 ∙ 20𝐶4 lo que
nos daría un total de 3.983.801.250 formas… ¡Cifra escalofriante!
Ejemplo 3. Considere el conjunto 𝑆 = {1,2,3,4, … ,20}; o sea: el conjunto de
los primeros veinte enteros positivos. Suponga que se van a tomar subcon-
juntos de 𝑆 formados por 5 elementos; determine el número de estos sub-
conjuntos en los que aparece el número 4 como elemento.
Solución. Podemos considerar el subconjunto genérico {4, 𝑋, 𝑌, 𝑍,𝑊},
donde las letras denotan los restantes cuatro elementos tomados de 𝑆.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
49
Además, recordemos que el orden de los elementos de un conjunto care-
ce de importancia, por lo que el conjunto anterior es idéntico a {𝑋, 4, 𝑌,
𝑍,𝑊}, o bien a {𝑋, 𝑍, 𝑌,𝑊, 4}. Si el cuatro es un elemento fijo, entonces los
restantes cuatro elementos deben ser seleccionados de los 19 números
de S, distintos de 4. Es decir: que el número de subconjuntos sería 19𝐶4
= 3876.
Ejemplo 4. Se necesita seleccionar un grupo de 13 personas escogidas de
un equipo de 19, pero dos de ellas son Julia y Julio, los cuales son exnovios y
no desean estar ambos en dicho grupo ¿De cuántas maneras se pueden for-
mar los grupos?
Solución. Note que 19𝐶13 = 27132 es el total de modos de escoger trece
personas de las 19 posibles; incluyendo los casos en los que Julio y Julio
están en el mismo grupo. Dejemos ahora fijos en el grupo a Julio y Julia; lo
cual nos indica que las 17 personas restantes deben “rifarse” los once es-
pacios que quedan; es decir: en 17𝐶11 casos figuran la pareja de exnovios
en el grupo. Por lo tanto, habrá 19𝐶13 − 17𝐶11 = 14756 grupos posi-
bles.
Ejemplo 5. En cierto colegio se tienen 16 grupos de 7mo, 11 grupos de 8vo y
9 grupos de 9no. Se desea elegir 5 grupos para que asistan a una actividad.
De cuántas maneras se pueden elegir los cinco grupos si:
(a) No hay restricción sobre ningún grupo.
Solución. Como hay 36 grupos en total y el orden no tiene importancia,
entonces habría 36𝐶5 = 376992 formas.
(b) Se deben elegir dos grupos de sétimo, dos de 8vo y uno de 9no.
Solución. El número de maneras de elegir 2 grupos de 16 posibles de 7mo
viene dado por 16𝐶2 = 120; por otro lado, para elegir 2 de 8vo: 11𝐶2 =
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
50
55 formas. Y de noveno habrá 9𝐶1 = 9. Así el total de maneras en que se
dan todos estos resultados es 120 ∙ 55 ∙ 9 = 59400 formas.
(c) Se deben elegir al menos tres grupos de sétimo.
Solución. Ese “al menos” podemos interpretarlo como “tres o más grupos
de 7mo”. Habría que analizar varios casos: (i) si van tres grupos de sétimo,
los otros dos grupos podrían ser de 8vo o de noveno; o bien podría ser un
grupo de 8vo y uno de 9no; (ii) si van cuatro grupos de 7mo, entonces sólo
podría ir un grupo de 8vo o bien un grupo de 9no; (iii) podrían ir sólo gru-
pos de 7mo (o sea: que los 5 grupos sean exclusivamente de 7mo año). Vea-
mos el caso (i): hay 16𝐶3 de elegir 3 grupos de los 16 grupos de 7mo, y
habría 11𝐶2 formar de elegir los dos grupos que hacen falta, pero de 8vo;
de la misma manera, habría 9𝐶2 formas de elegir dos grupos de 9no; por
lo tanto, el número de maneras en que se pueden dar lo primero o lo se-
gundo es:
(16𝐶3 ∙ 11𝐶2) + (16𝐶3 ∙ 9𝐶2) = 50960 formas
Si van, a parte de los tres grupos de 7mo, uno de 8vo y uno de 9no, habría un
total de
16𝐶3 ∙ 11𝐶1 ∙ 9𝐶1 = 55440 formas
Vamos con el caso (ii): si van 4 grupos de sétimo, habría 16𝐶4 formas de
hacer dicha elección; por lo que quedaría para el quinto grupo restante
dos posibilidades: que sea de 8vo o bien que sea de 9no. Por lo tanto, el nú-
mero de formas en que se puede dar esta situación sería:
(16𝐶4 ∙ 11𝐶1) + (16𝐶4 ∙ 9𝐶1) = 36400 formas
Por último, el caso (iii): en este caso los cinco grupos elegidos son de 7mo
año; es decir: 16𝐶5 = 4368. Sumando todos estos casos, tendríamos un
total de 147168 formas posibles.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
51
(d) Se deben elegir a lo sumo dos grupos de 8vo.
Solución. Debemos interpretar ese “a lo sumo” como “máximo” dos
grupos de 8vo; lo que limita nuestro estudio a 3 casos: (i) que no vaya nin-
gún grupo de 8vo, (ii) que vaya uno, o bien, (iii) que vayan dos grupos, no
más. Mire con cuidado la tabla siguiente:
8vo 7mo 9no 7mo y 9no 7mo y 9no 7mo y 9no 7mo y 9no
0 16𝐶5 9𝐶5 16𝐶4 ∙ 9𝐶1 16𝐶3 ∙ 9𝐶2 16𝐶2 ∙ 9𝐶3 16𝐶1 ∙ 9𝐶4
11𝐶1 16𝐶4 9𝐶4 16𝐶3 ∙ 9𝐶1 16𝐶2 ∙ 9𝐶2 16𝐶1 ∙ 9𝐶3
11𝐶2 16𝐶3 9𝐶3 16𝐶2 ∙ 9𝐶1 16𝐶1 ∙ 9𝐶2
La primera columna de la izquierda indica los grupos de 8vo que pueden
ser elegidos: ninguno, uno o como máximo dos. Las dos columnas si-
guientes incluyen los casos en que van grupos de 7mo y 9no; las restantes
columnas toman en cuenta las diversas configuraciones en las que pue-
den elegirse simultáneamente grupos de 7mo y 9no. Analicemos el caso de
la tercera fila. En ella se nos dice que se van a elegir un grupo de 8vo de 11
posibles; es lógico que los restantes 4 grupos pueden ser elegidos de los
niveles de 7mo ó 9no como 16𝐶4, para el primer caso, y 9𝐶4 para 9no. Es
decir, habrá un total de formas “11𝐶1 ∙ 16𝐶4 + 11𝐶1 ∙ 9𝐶4”. Por otro lado,
podrían ir junto al grupo elegido de 8vo, tres grupos de 7mo y uno de 9no,
así tendríamos “11𝐶1 ∙ 16𝐶3 ∙ 9𝐶1” formas, y así sucesivamente. En resu-
men, si no es elegido ningún grupo de 8vo para la actividad (fila 2 de la ta-
bla), habrá un total de formas:
16𝐶5 + 9𝐶5 + 16𝐶4 ∙ 9𝐶1 + 16𝐶3 ∙ 9𝐶2 + 16𝐶2 ∙ 9𝐶3 + 16𝐶1 ∙ 9𝐶4 = 53130
Por otro lado, si se elige un grupo de 8vo, tendríamos un total de formas:
11𝐶1 ∙ 16𝐶4 + 11𝐶1 ∙ 9𝐶4 + 11𝐶1 ∙ 16𝐶3 ∙ 9𝐶1 + 11𝐶1 ∙ 16𝐶2 ∙ 9𝐶2 + 11𝐶1 ∙ 16𝐶1 ∙ 9𝐶3
= 139150
Por último, si asisten como máximo dos grupos de 8vo, se daría la situa-
ción siguiente:
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
52
11𝐶2 ∙ 16𝐶3 + 11𝐶2 ∙ 9𝐶3 + 11𝐶2 ∙ 16𝐶2 ∙ 9𝐶1 + 11𝐶2 ∙ 16𝐶1 ∙ 9𝐶2 = 126500
Por lo tanto, en total hay 318780 formas de que como máximo asistan
dos grupos de 8vo, de cinco posibles, a la actividad.
Nota. A lo largo del tiempo, las notaciones para permutaciones y combinaciones han tenido
modificaciones. Por ejemplo, en este documento denotamos la permutación de la forma 𝑛𝑃𝑟;
en algunos textos este mismo concepto se denota por 𝑃(𝑛, 𝑟). Por otro lado, la notación (𝑛𝑟) se
utiliza para designar las combinaciones de 𝑛 objetos tomados de 𝑟 en 𝑟; esta última notación
recibe el nombre de coeficiente binomial, por estar relacionado con el desarrollo del producto
notable (𝑎 + 𝑏)𝑛.
Ejercicios varios
1. En una urna hay cuatro tipos de figuras geométricas: triángulos, círculos, cuadra-
dos y trapecios ¿Cuántas figuras hay que sacar de la urna, para la tener la certeza
de sacar tres tipos iguales de figuras? R/ 9
2. En una caja hay 10 pares de calcetines color café y 10 pares de calcetines negros.
En otra caja, hay 10 pares de guantes de boxeo café y otro tanto negros ¿Cuántos
calcetines, como mínimo, es necesario sacara de cada caja, para tener la certeza de
que al menos un par de calcetines y un par de guantes son del mismo color?
R/ 3 calcetines y 21 guantes
3. (a) Determine la cantidad de números de cuatro dígitos que se pueden formar con
los elementos del conjunto {3,5,6,7,4} (b) ¿Cuántos de éstos números tienen todos
sus dígitos distintos? (c) ¿Cuántos de éstos últimos son impares?
R/ (a) 625 (b) 120 (c) 72
4. ¿Cuántos números de cuatro cifras tienen todas sus cifras pares? R: 500
5. Juan, María y Carlos juegan con unas cartas: Juan tiene 4 cuatro cartas, María tiene
siete. (a) Carlos debe elegir una carta de alguno de ellos dos, ¿de cuántas maneras
puede hacerlo (b) Carlos debe elegir una carta de cada uno ellos, ¿de cuántas for-
mas puede hacerlo? R: (a) 11 (b) 28
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
53
6. Determine la cantidad de números pares de dígitos distintos que se pueden for-
mar con los elementos del conjunto {1,2,3,4}. R/ 32
7. Utilizando los elementos del conjunto {1,0,3,4,6,9,5} conjunto determine cuántos
números pares de tres dígitos distintos pueden formarse. R/ 80
8. Si no se permiten repeticiones, (a) ¿cuántos números de 3 cifras pueden formarse
a partir de los seis dígitos 2, 3, 5, 6, 7 y 9? (b) ¿Cuántos de éstos números son me-
nores que 400? (c) ¿Cuántos de ellos son pares? (d) ¿Cuántos son impares? (e)
¿Cuántos son múltiplos de cinco? R/ (a) 120 (b) 40 (c) 40 (d) 80 (e) 20
9. Encontrar el número de maneras en el cual 5 libros grandes, 4 libros medianos y 3
libros pequeños pueden colocarse en un estante, de tal manera que todos los del
mismo tamaño estén juntos. R/ 103.680 formas
10. ¿De cuántas maneras 3 niños y 2 niñas pueden sentarse en una fila, si las niñas de-
ben estar siempre juntas? R/ 48
11. En la librería de Pánfilo hay tres ejemplares de la Aritmética de Baldor, dos ejem-
plares iguales del Paco y Lola y cuatro tomos idénticos de El Quijote cervantino.
Determine cuántas selecciones pueden hacerse de esos libros tomados algunos,
pero no todos ellos. R/ 58
12. ¿Qué sucedería en el ejercicio anterior si los ejemplares de cada libro fueran todos
distintos? (Por ejemplo, suponiendo que todos son de casas editoriales diferen-
tes). R/ 50
13. Se llaman números palíndromos a los números naturales que leídos de izquierda a
derecha, o viceversa, son el mismo número (por ejemplo: 22, 121, 5665, 26862).
Determine la cantidad de números de cinco cifras que formen números palíndro-
mos. R/ 900
14. Considerar todos los números naturales mayores que cero de tres cifras diferen-
tes. (a) ¿Cuántos son mayores de 700? (b) ¿Cuántos son impares (c) ¿Cuántos son
pares? (d) ¿Cuántos son divisibles por 5? R/ (a) 216 (b) 320 (c) 328 (d) 136
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
54
15. Encontrar el número de maneras en las cuales 4 niños y 4 niñas pueden sentarse
en una fila si los niños deben estar juntos y las niñas también. (b) Resolver el pro-
blema si las niñas y niños se sientan alrededor de una mesa. R/ (a) 1152 (b) 144
16. (a) Encontrar el número de palabras de cuatro letras distintas (con o sin sentido)
que pueden formarse a partir de las letras de la palabra “PRESTAL” (b) ¿cuántas
de ellas contendrán solamente consonantes? (c) ¿cuántas de ellas comenzarán y
finalizarán con una letra consonante? (d) ¿cuántas comenzarán con una letra
vocal? (e) ¿cuántas comenzarán con T y finalizarán con una letra vocal? (f) ¿cuán-
tas palabras contendrán la letra R? (g) ¿cuántas comenzarán con la letra T y tam-
bién contendrán S? (h) ¿cuántas contendrán ambas vocales?
R/ (a) 840 (b) 120 (c) 400 (d) 240 (e) 40 (f) 480 (g) 60 (h) 240
17. Suponga que el alfabeto de la tribu Turingniana está integrado por las siguientes
letras: {𝑎, 7,%, 𝑏,∗}. (a) Halle el número de “palabras” que se pueden formar con
estas letras (tome como máximo las palabras de 5 letras) (b) ¿Cuántas palabras
tienen todas sus letras distintas? (c) ¿Cuántas palabras de 3 letras inician con “∗”?
18. Hay seis carreteras entre San José y Alajuela y cuatro carreteras entre Alajuela a
Guanacaste. Si Caifás quiere hacer un viaje de San José a Guanacaste de ida y de
vuelta, pasando por Alajuela, sin usar de regreso la misma carretera, ¿cuál es el
número de maneras de realizar dicho viaje? R/ 360 formas
19. ¿De cuántos modos pueden disponerse las letras de la palabra “ECUADOR”, to-
mando las siete letras? R/ 5040
20. (a) ¿Cuántos números de tres cifras pueden formarse si la cifra de las decenas de-
be ser impar? (b) ¿Cuántos números de tres cifras se pueden formar que no con-
tengan ni el 3 ni el 6 ni el 9 como cifras? R/ (a) 450 (b) 294
21. Se tiene un libro de aritmética, uno de álgebra, uno de geometría, uno de física y
uno biología ¿De cuántos modos pueden disponerse en un estante si el de geome-
tría siempre está en el medio? R/ 24
22. ¿Cuántos números distintos mayores que 2000 y menores que 3000 se pueden
formar con los dígitos 2, 3, 5 y 6? R/ 6
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
55
23. ¿Cuántos números distintos de cinco cifras que empiecen por 1 y terminen en 8 se
pueden formar con los números 1, 2, 3, 4, 5, 6, 7, 8? R/ 120
24. ¿Cuántos números de cinco cifras se pueden formar de tal modo que tengan las
tres primeras cifras impares y las dos últimas pares, sin repetirse ninguna y con-
siderando el cero como par? R/ 1200
25. Suponga que el código genético de un anárquico, organismo microscópico del pla-
neta X, está dado por la secuencia INDEPENDENCIA. Determine el número de per-
mutaciones que tiene el código genético de ese ser vivo. R: 43.243.200
26. Juan, el bibliotecario, tiene 20 libros de literatura y 6 libros de ciencias. Desea colo-
carlos en un estante pero descubre que sólo hay espacio para cinco de ellos. Decide que en el estante haya 3 libros de literatura y 2 libros de ciencias, ¿de cuántas ma-neras puede acomodar dichos libros en el estante? R: 2.052.000 formas
27. A la cumbre del MMC (Medio Mitad del Centro) asistieron 3 ticos, 4 salvadoreños, 4 nicaragüenses y dos panameños ¿De cuántas maneras se pueden poner en fila, pa-ra la foto de despedida, si los de la misma nacionalidad deben estar juntos?
R: 165.888 formas
28. Resuelva la ecuación 5 ∙ (𝑛𝐶5) = 𝑛𝐶6. R: 𝑛 = 35
29. Para 𝑥 ∈ ℤ+; resuelva la ecuación 𝑥𝑃𝑚 = 120 ∙ (𝑥𝐶𝑚). R: 𝑚 = 5
30. Una clase tiene 9 niños y tres niñas (i) ¿De cuántas maneras puede el maestro esco-
ger un comité de 4? (ii) ¿Cuántos de estos comités tendrán al menos una niña? (iii)
¿Cuántos de estos tendrán exactamente una niña? R/ (i) 495 (ii) 369 (iii) 252
31. Suponga que hay 10 puntos en un plano, de modo que no haya tres alineados
¿Cuántas rectas determinan esos puntos? R/ 45
32. ¿De cuántas formas se pueden distribuir 5 bolas distintas en tres cajas? R: 60
33. Se extraen dos bolas, sucesivamente, de una urna que contiene 6 bolas idénticas.
Determine el número de maneras en que se puede realizar la extracción (a) sin de-
volución (b) con devolución. R: (a) 30 (b) 36
34. Suponga que hay 12 puntos en un plano, de modo que no haya tres alineados
¿Cuántos triángulos determinan esos puntos? R/ 220
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
56
35. Diez jóvenes se reúnen en un parque; desean jugar básquetbol ¿De cuántas mane-
ras distintas se pueden formar dos equipos de 5 jugadores? R/ 126
36. En un Club de tenis hay 10 hombres y 10 mujeres. Se desea formar un torneo en el cual un equipo de dos hombres debe enfrentar a otro equipo de 2 mujeres (en-cuentros de dobles) ¿De cuántas formas distintas se puede organizar el torneo?
R: 2025 formas
37. Juan desea colocar 4 libros de matemáticas, seis de física y dos de química en un estante ¿De cuántas maneras se puede hacer si (i) los libros de la misma materia deben estar juntos, (ii) sólo los de matemáticas tienen que estar juntos?
R: (i) 207.360 (ii) 8.709.120 38. Un estudiante debe realizar una examen de 10 preguntas, de las cuales tiene que
elegir 7 ¿De cuántas maneras puede hacerlo, si las 4 primeras son obligatorias?
R: 20
39. Una señora tiene 11 amigos y amigas cercanos (i) ¿De cuántas maneras puede in-
vitar a cinco de ellos a cenar? (ii) ¿De cuántas maneras si dos de ellos están casa-
dos y no van a asistir separadamente? (iii) ¿De cuántas maneras si 2 de ellos no se
hablan y no van a asistir juntos? R/ (i) 462 (ii) 210 (iii) 378
40. Hay 10 puntos A, B, … en un plano, no estando 3 en la misma línea (i) ¿Cuántas lí-
neas pueden determinarse por los puntos? (ii) ¿Cuántas de esas líneas no pasarán
por A o B? (iii) ¿Cuántos triángulos se determinan por los puntos? (iv) ¿Cuántos de
esos triángulos contienen el punto A? (v) ¿Cuántos de esos triángulos contienen el
lado AB? R/ (i) 45 (ii) 28 (iii) 120 (iv) 36 (v) 8
41. Allan Brito, el electricista, tiene en su taller 20 medidores de voltaje. Si él debe ins-
talar 4 de ellos en la tienda A; cuatro en la tienda B, y tres en la tienda C, determine
el número de formas en que Mr. Brito puede realizar este encargo.
R: 1.939.938.000 formas
42. Considere el conjunto {3,0,4,6,9,5}. Determine cuántos números impares, de cua-
tro cifras distintas, se pueden formar con los elementos de dicho conjunto. R: 144
43. Juan desea colocar 4 libros de matemáticas, seis de física y dos de química en un estante ¿De cuántas maneras se puede hacer si (i) los libros de la misma materia deben estar juntos, (ii) sólo los de matemáticas tienen que estar juntos?
R: (i) 207.360 (ii) 8.709.120
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
57
44. Un estudiante debe realizar una examen de 10 preguntas, de las cuales tiene que
elegir 7 ¿De cuántas maneras puede hacerlo, si las 4 primeras son obligatorias?
R: 20
45. Un estudiante debe responder 10 de 13 preguntas en un examen (i) ¿Cuántas se-
lecciones tiene? (ii) ¿Cuántas si debe responder a las dos primeras preguntas? (iii)
¿Cuántas si debe responder a la primera o a la segunda pregunta, pero no ambas?
(iv) ¿Cuántas si debe responder exactamente 3 de las 5 primeras preguntas? (v)
¿Cuántas si debe responder, por lo menos, 3 de las 5 primeras preguntas?
R/ (i) 286 (ii) 165 (iii) 110 (iv) 80 (v) 276
XIX. Probabilidad
Es común escuchar enunciados que involucren el concepto de probabi-
lidad. En los noticieros nos dicen cosas tales como:
(a) El Instituto Meteorológico informa que hay un 5% de probabilidad de
que llueva esta mañana.
(b) Las personas que comen más frutas y verduras, tienen menos proba-
bilidades de desarrollar cáncer.
(c) La FIFA estimó que la Selección de Costa Rica tiene una probabilidad
del 51% de ganar la próxima Copa Centroamericana.
De esos enunciados, nosotros deducimos conclusiones como las siguien-
tes:
(a) ¡Ah 5%! No voy a llevar el paraguas al trabajo.
(b) Debo de empezar a comer más seguido frutas y verduras, por mi sa-
lud.
(c) ¡No parece que Costa Rica vaya a ganarle a todos!
Todos entendemos que la probabilidad es una especie de medida mate-
mática que intenta evaluar lo que es “posible”: evaluar la posibilidad de
que cierto evento suceda o no.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
58
Una manera de dar esta estimación, normalmente, es utilizando porcen-
tajes. Recuerde que:
𝐴% significa 𝐴
100
Los sucesos que tienen 100% de probabilidad se consideran seguros; por
ejemplo: la probabilidad de que salga escudo o corona en el lanzamiento
de una moneda es el 100%, dado que estas son sólo las dos posibilidades
que se pueden dar en ese experimento; mientras que la probabilidad de
que salga un 5 en el lanzamiento de un dado, ya no puede ser un suceso
100% seguro, pues hay otras alternativas posibles. Los sucesos que tiene
probabilidad 0% (probabilidad nula) son sucesos que se llaman imposi-
bles; por ejemplo: la probabilidad de obtener un 8 en el lanzamiento de
un dado es 0%, es un suceso imposible, pues un dado está enumerado del
1 al 6 (¡tiene seis caras!).
La probabilidad de un suceso es la estimación matemática de que éste
suceda; esto no debe confundirse con la posibilidad de que dicho evento
se dé. Es decir: aunque las probabilidades de sacar el premio de la lotería
navideña sean “muy bajas” para un jugador, no significa que éste no vaya
a poder ganar la lotería, pues esto sí es posible.
Es claro, que si una persona compra “muchos” números de lotería su pro-
babilidad aumenta, mejora; por ejemplo: si en una rifa de cien números
Juan compara 65 números, es muy probable que Juan obtenga el premio.
(¡Suponiendo que es un juego limpio!)
Algunos teóricos de la probabilidad sostienen que una probabilidad su-
perior al 50% en un evento del azar, lo hace un suceso “muy probable”,
en caso contrario el suceso es “improbable”. En este documento asumi-
remos ese presupuesto teórico, que más adelante el estudiante puede
cuestionar, criticar e investigar libremente al respecto.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
59
Análisis de ejemplos
Escribir, en cada caso, si el enunciado es un suceso imposible, improbable,
igualmente probable, probable o seguro.
(a) Obtener un 8 en el lanzamiento de un dado no cargado ¡Suceso impo-
sible! Dado que en un dado las caras están enumeradas del 1 al 6. (No
cargado significa que no es un dado tramposo; o sea: que no está di-
señado para que algunos números tengan “ventaja” sobre otros.)
(b) Seleccionar un mes del año con exactamente 30 días ¡Suceso impro-
bable! Pues el año tiene apenas 4 meses que reúnen esa condición de
12 posibles. (No olvide que improbable no es sinónimo de imposible.)
(c) Obtener una corona en el lanzamiento de una moneda no cargada ¡Su-
ceso igualmente probable! Pues la probabilidad de éste es el 50%, da-
do que en el lanzamiento de una moneda sólo se pueden obtener dos
casos posibles: escudo o corona, y los dos son igualmente probables.
(d) Obtener un número del 1 al 6 en el lanzamiento de un dado ¡Suceso
igualmente probable! Pues en el lanzamiento de dado, estos los todos
los posibles sucesos que se puedan dar; es decir: en el lanzamiento de
un dado “siempre” se obtiene ó 1 ó 2 ó 3 ó 4 ó 5 ó 6, y todos estos son
igualmente probables.
(e) Seleccionar a un estudiante del 7-A que tenga celular ¡Suceso proba-
ble! Pues (¡supongamos!) que de los 25 estudiantes de esa sección,
hay 22 de ellos que tienen teléfono celular, o sea: la probabilidad de
selección supera al 50%, lo que lo hace un suceso “altamente” proba-
ble.
(f) Obtener un número del 1 al 6 en el lanzamiento de un dado ¡Suceso se-
guro! (Note que en este caso no importa si el dado está cargado o no.)
En ciencias, un experimento es una actividad en la que hay posibilidad de
que ocurran diferentes resultados. Los diferentes resultados que pueden
ocurrir reciben el nombre de eventos posibles del experimento. Los cien-
tíficos llaman espacio muestral de un experimento, a todos los resulta-
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
60
dos posibles que se pueden dar. Se acostumbra usar llaves “{ }” para
mostrar los espacios muestrales de los experimentos. Veamos algunos
ejemplos:
(a) En el lanzamiento de una moneda, el espacio muestral sería: {corona,
escudo}, pues estos son todos los resultados posibles que se pueden
obtener en un lanzamiento.
(b) Mientras que en el lanzamiento de un dado, el espacio muestral sería
{1,2,3,4,5,6}.
(c) Si en lugar de lanzar una moneda, lanzamos dos monedas en orden
(primero una, luego la otra) y denotamos con “C = corona” y “E = es-
cudo”, entonces el espacio muestral sería:
{𝐸𝐸, 𝐶𝐶, 𝐸𝐶, 𝐶𝐸}
Dado que se pueden dar todas esas situaciones: que salga primero es-
cudo y luego también, que salga primero escudo y luego corona, etc.
(d) Carlos tiene tres camisetas limpias en la secadora: una blanca, otra
negra y una azul; entonces, si desea elegir una de ellas, su espacio
muestral será: {blanca, negra, azul}.
(e) La compañía Intel elegirá dos de los cuatro finalistas de la Feria Na-
cional de Ciencias para un viaje a Perú. Si ellos son Carlos, Pedro, Ana,
Lucia, entonces el espacio muestral será, abreviadamente, {C, P, A, L}.
Pasamos ahora a dar la definición de probabilidad.
Definición 3 (de Bernoulli). Si un evento puede ocurrir de “s” maneras de
un total de “n” posibles, diremos entonces que la probabilidad “P” de dicho
evento es
𝑃 =𝑠
𝑛
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
61
Análisis de ejemplos
Ejemplo 1. Sabemos que el espacio muestral del lanzamiento de un dado
es {1,2,3,4,5,6}. Queremos averiguar cuál es la probabilidad que tiene el
siguiente evento: Obtener un número par. En este caso note que hay 3 ca-
sos posibles (2, 4 y 6), es decir s = 3; entonces la probabilidad de este
evento sería:
𝑃 =3
6=1
2
Es decir: 1
2= 0,5. Multiplicando por 100, tendríamos que 0,5 ∙ 100 =
50% ¡Claro! La mitad de los números del espacio muestral es par. Es de-
cir: los eventos “obtener un número par” u “obtener un número impar” en
este experimento son igualmente probables (50% a 50%).
Ejemplo 2. Supongamos que se lanza una moneda al aire tres veces. Se
quieren determinar las probabilidades de los siguientes eventos: (a) ob-
tener puras coronas, (b) obtener exactamente dos escudos; (c) que sal-
gan por lo menos dos coronas. Veamos, primero hay que encontrar el es-
pacio muestral de este experimento, o sea: el conjunto que reúne todos
los casos posibles que se pueden dar. Así:
{𝐶𝐶𝐶, 𝐶𝐶𝐸, 𝐸𝐶𝐶, 𝐶𝐸𝐶, 𝐸𝐶𝐸, 𝐶𝐸𝐸, 𝐸𝐸𝐶, 𝐸𝐸𝐸}
Vamos a ahora a calcular la probabilidad de (a): la probabilidad de “obte-
ner puras coronas”, es
𝑃 =1
8
Dado que sólo hay un caso posible de un total de ocho. Podemos, ver que 1
8= 0,125 = 12,5% ¡Lo que nos dice que es un evento improbable!
Vamos con (b): la probabilidad de “obtener dos escudos” sería
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
62
𝑃 =3
8
Dado que sólo hay tres casos posibles de un total de ocho (Estos son:
ECE, EEC y CEE). Podemos, ver que 3
8= 0,375 = 37,5% (¡lo que nos dice
que es un evento improbable!, pero más probable que el anterior). Para
(c), la probabilidad de “que salgan por lo menos dos coronas” tenemos
que:
𝑃 =4
8=1
2= 50%
Ejemplo 3. Suponga que en un laboratorio se ha fabricado una caja en la
cual se han colocado dos ratas. Si se sabe que la caja tiene tres posibles
salidas (A, B y C), determine la probabilidad de que (a) al menos una rata
salga por A; (b) las dos ratas salen por una misma salida. Al igual que el
ejemplo anterior, vamos a encontrar primeramente, el espacio muestral
del experimento:
{𝐴𝐴, 𝐴𝐵, 𝐴𝐶, 𝐵𝐴, 𝐶𝐴, 𝐵𝐵, 𝐵𝐶, 𝐶𝐵, 𝐶𝐶}
Entonces para (a) tenemos que: la probabilidad de que “al menos una
rata salga por A” es
𝑃 =5
9= 0,555… = 0, 5̅ ≈ 55,5%
¡Lo que lo hace un evento probable! Por otro lado, para (b): la probabi-
lidad de que “las dos ratas salgan por la misma salida”:
𝑃 =3
9=1
3= 0,333… = 0, 3̅ ≈ 33,3%
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
63
Insistimos: no debe confundirse improbable con imposible.
Ejemplo 4. Felipe y Ramona juegan a lanzar un dado, cada uno, dos ve-
ces consecutivas. Felipe ganará si el total de puntos de sus lanzamientos
es 7; Ramona ganará, si el total de puntos de sus lanzamientos es cinco
¿Puede decirse que este es un juego justo?
¡No! Hagamos una tabla con todos los puntajes posibles del juego: la pri-
mera fila de la tabla representa los puntajes posibles en el primer lanza-
miento; mientras que la primera columna representa los puntajes posi-
bles del segundo lanzamiento; los otros datos corresponden a la suma de
los puntajes totales obtenidos en ambos lanzamientos, a saber:
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Se observa que Felipe tiene “cierta ventaja” sobre Ramona, pues hay más
posibilidades de que obtengamos siete de que se obtenga un 5 como pun-
taje total; por lo que la probabilidad de que Felipe gane es:
𝑃 =6
36=1
6= 0,1666… = 0,16̅ ≈ 16,6%
Pues de los 36 casos posibles, sólo 6 veces se obtiene 7. Mientras que en
el caso de Ramona, la probabilidad sería:
𝑃 =4
36=1
9= 0,1111… = 0, 1̅ ≈ 11,1%
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
64
Dado que, en este caso, sólo hay 4 posibilidades de obtener 5 de 36 posi-
bles ¡Lo que nos dice que hay una leve ventaja de Felipe sobre Ramona!
Aunque, es importante hacer notar, de que ambos son eventos improba-
bles, dado que su probabilidad es inferior al 50%.
XX. Axiomas de probabilidad
Definición. Sean 𝐴 y 𝐵 dos conjuntos. Diremos que son mutuamente exclu-
yentes, sí y solo sí, 𝐴 ∩ 𝐵 = ∅.
Por ejemplo, si 𝐴 = {1, 𝑑, 𝑡} y 𝐵 = {𝑚, 𝑛, 𝑎, ℎ} es claro que ambos conjun-
tos no tienen elementos en común, por lo que 𝐴 ∩ 𝐵 = ∅.
En Teoría de probabilidades, si tenemos un experimento del azar que in-
cluye diversos resultados posibles, diremos que dos (o más) de esos
eventos son mutuamente excluyentes, si la intersección de éstos es vacía.
Pensemos en el ejemplo 4 de la sección anterior, sobre Felipe, Ramona y
el dado. Si designamos con A al evento “sacar un 7 de puntaje; mientras
que con B al evento de “sacar un 5 de puntaje”, notaríamos que 𝐴 ∩ 𝐵 =
∅. Esto quiere decir, que en el experimento “lanzar un dado dos veces”,
los eventos A y B son mutuamente excluyentes.
Pasamos a dar una definición “más formal” de probabilidad que la idea
intuitiva de Bernoulli.
Definición. Sea 𝐸 un experimento de azar y 𝑆 el espacio muestral asociado
a 𝐸. A cada evento 𝐵, con 𝐵 ⊆ 𝑆, se asigna un número real, denotado por
𝑃(𝐵), que cumple las siguientes propiedades:
(a) 0 ≤ 𝑃(𝐵) ≤ 1;
(b) 𝑃(𝑆) = 1;
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
65
(c) Si M y N son eventos mutuamente excluyentes, entonces 𝑃(𝑀 ∪ 𝑁) =
𝑃(𝑀) + 𝑃(𝑁);
(d) 𝑃(𝐵𝑐) = 1 − 𝑃(𝐵); donde 𝐵𝑐 se llama el complemento de 𝐵, es decir:
𝐵𝑐 = 𝑆 − 𝐵.
Analicemos, punto por punto, estos conceptos. La parte (a) nos dice que
la probabilidad de un evento es siempre un número entre 0 y 1, inclusi-
ve. Recordemos que si 𝑃(𝐵) es 1, entonces se llama seguro; mientras que
si 𝑃(𝐵) es 0 se llama imposible. La parte (b) establece que la probabi-
lidad del espacio muestral es un evento seguro 𝑃(𝑆) = 1, dado que S
incluye todos los posibles resultados del experimento. Si M y N son even-
tos mutuamente excluyentes, entonces la probabilidad de que suceda M ó
N es la suma de las probabilidades; esto está establecido en la parte (c).
Por último, en la parte (d), la probabilidad del evento contrario a B, es
decir: el complemento de B, denotado por 𝐵𝑐, es la diferencia entre el
evento 𝑃(𝑆) y el evento 𝑃(𝐵).
Tomemos un ejemplo: suponga que se tiene un grupo de siete personas,
de las cuales hay 3 mujeres y cuatro hombres. Queremos investigar el ex-
perimiento “elegir dos personas al azar”. Si representamos los hombres
con H y a las mujeres con M, nuestro espacio muestral tendría 7𝐶2 = 21
elementos. Así:
𝑆 = {𝐻1𝐻2, 𝐻1𝐻3, 𝐻1𝐻4, 𝐻1𝑀1, 𝐻1𝑀2, … , 𝐻4𝑀2, 𝐻4𝑀3, 𝑀1𝑀2,𝑀1𝑀3, 𝑀2𝑀3}
Pensemos en la probabilidad de los siguientes eventos:
(a) La probabilidad de que ambas sean hombres. Elegir dos hombres de 4
sería 4𝐶2 = 6. Por lo tanto, la probabilidad de este evento sería:
𝑃(𝐵) =6
21=2
7
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
66
(b) La probabilidad de que ambas no sean hombres. En esta ocasión pode-
mos usar la regla 𝑃(𝐵𝑐) = 1 − 𝑃(𝐵), dado que este suceso es el con-
trario del anterior problema:
𝑃(𝐵𝑐) = 1 − 𝑃(𝐵) ⇒ 𝑃(𝐵𝑐) = 1 −2
7=5
7
(c) La probabilidad de que sean dos hombres o dos mujeres. Note que este
evento en realidad está formado por dos eventos mutuamente exclu-
yentes; por el punto (c) de la definición anterior, tendríamos:
𝑃(𝑀 ∪ 𝑁) = 𝑃(𝑀) + 𝑃(𝑁) ⇒ 𝑃(𝑀 ∪ 𝑁) =2
7+1
7=3
7
(d) La probabilidad de elegir dos personas del grupo. Este es un evento se-
guro, dado que la probabilidad de que esto se dé incluye a todo el es-
pacio muestral. Así, por la parte (b) de la definición anterior, sabemos
que 𝑃(𝑆) = 1.
Pregunta: ¿Qué sucedería en la parte (c) de la definición anterior si M y N
no fueran eventos mutuamente excluyentes? En este caso, debemos tener
presente que algunos eventos podrán estar tanto en M como en N, por lo
que la regla (c) quedaría:
𝑃(𝑀 ∪ 𝑁) = 𝑃(𝑀) + 𝑃(𝑁) − 𝑃(𝑀 ∩ 𝑁)
Veamos un ejemplo. Suponga que la tabla siguiente contiene los datos so-
bre 100 clientes de una tienda. En ella se detalla cuántos de estos son
compradores de cierto producto.
Hombres (H) Mujeres (M) Total Compradores (C) 3 17 20 No compradores 27 53 80 Total 30 70 100
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
67
Problema: ¿Cuál es la probabilidad de elegir un hombre o un comprador?
Note que los eventos “hombre” (H) y “comprador” (C) no son mutua-
mente excluyentes, dado que hay hombres compradores. En otras pala-
bras: decir “hombre” no excluye la posibilidad del evento “comprador”.
Por lo tanto, usando la regla anterior para eventos no mutuamente exclu-
yentes, tendríamos que:
𝑃(𝐻 ∪ 𝐶) = 𝑃(𝐻) + 𝑃(𝐶) − 𝑃(𝐻 ∩ 𝐶)
𝑃(𝐻 ∪ 𝐶) =30
100+
20
100−
3
100=
47
100= 47%
Ejercicios varios
1. Se va a lanzar una moneda consecutivamente 5 veces. Determine la probabilidad
de que en las cinco oportunidades salga corona. R: 1
32
2. Considere el conjunto {1,2,3,4, … ,99,100}. Determine la probabilidad de que al ele-
gir un número éste sea menor que 25. R: 6
25
3. Una urna contiene 6 bolas rojas, 4 blancas y 5 azules ¿Cuál es la probabilidad de
que al extraer una, no sea roja? R: 3
5
4. Una urna contiene 4 bolas blancas y cinco bolas negras. Se extraen al azar, y en
sucesión, 3 bolas. Halle la probabilidad de que las tres bolas sean negras. R: 5
42
5. Juan escribe en papelitos independientes los números 1, 2, 3 y 4, los cuales se de-
positan en una urna. Si se extraen dos de ellos al azar, ¿cuál es la probabilidad de
que la suma de los números sea par? R: 1
3
6. Cinco bolas, enumeradas del 1 al 5, se colocan en una urna. Si se extraen dos de
ellas al azar, halle la probabilidad de que la diferencia de los números sea “1”.
R: 2
5
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
68
7. Las letras de la palabra CARLOS se colocan al azar en un renglón. Determine la pro-
babilidad de que las vocales queden juntas. R: 1
3
8. En el desordenado armario de Juan hay cinco pares de zapatos. Si se eligen al azar
dos zapatos, ¿cuál es la probabilidad de que correspondan a un mismo par? R: 1
9
9. Un grupo consta de diez hombres y veinte mujeres, de los cuales la mitad de los
hombres y la mitad de las mujeres tienen ojos castaños. Halle la probabilidad de
que una persona escogida al azar sea un hombre o tenga ojos castaños. R: 2
3
10. Se escogen al azar 3 lámparas entre 15 de las cuales 5 son defectuosas. Halle la
probabilidad de que…
(a) ninguna sea defectuosa; R: 24
91
(b) una exactamente sea defectuosa; R: 45
91
(c) una, por lo menos, sea defectuosa. R: 67
91
11. Suponga que en cierto experimento del azar solo se pueden dar tres resultados po-
sibles, digamos 𝑎1, 𝑎2 y 𝑎3. Además, suponga que la probabilidad de ocurrencia de
𝑎1 es dos veces más probable que la de 𝑎2, la cual, a su vez, es dos veces más proba-
ble que la de 𝑎3. Determine las probabilidades respectivas.
Solución. Designemos con 𝑝1, 𝑝2 y 𝑝3 las probabilidades respectivas de los eventos 𝑎1, 𝑎2 y
𝑎3. Sabemos, por la parte (b) de la definición formal de probabilidad, que 𝑝1 + 𝑝2 + 𝑝3 = 1.
Pero, por la información suministrada en el problema tenemos que:
𝑝1 = 2𝑝2 y 𝑝2 = 2𝑝3
Sustituyendo en 𝑝1 + 𝑝2 + 𝑝3 = 1, tenemos la ecuación
𝑝3 + 2𝑝3 + 4𝑝3 = 1 ⇒ 𝑝3 =1
7
Por lo tanto, las probabilidades respectivas serían 𝑝3 =1
7 ; 𝑝2 =
2
7 y 𝑝1 =
4
7. ⎕
12. Utilice el ejercicio anterior para resolver la situación siguiente. Suponga que se tie-
ne un dado cargado (es decir: un dado que se usa para hacer trampa, pues el peso
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
69
del mismo no es uniforme). Si se sabe que: (a) la probabilidad de obtener 1 es la
misma que la de obtener 2 y 3; (b) la probabilidad de sacar 1 es el doble de la de
sacar 4; (c) la probabilidad de sacar 4 es el triple de la obtener 5; (d) la probabi-
lidad de obtener 5 es la misma de sacar 6; determine la probabilidad de cada cara
de dicho dado.
13. Se seleccionan al azar dos cartas entre diez cartas enumeradas de 1 a 10. Hallar la
probabilidad de que la suma sea impar si…
(e) las dos cartas se sacan juntas; R: 5
9
(f) se saca unas tras la otra sin sustitución; R: 5
9
(g) igual a lo anterior, pero con sustitución. R: 1
2
14. Se selecciona una carta entre cincuenta cartas enumeradas de 1 a 50. Hallar la pro-
babilidad de que el número de carta elegida sea (a) divisible por 5; (b) primo; y (c)
termine en dos. R: (a) 1
5; (b)
3
10; (c)
1
10
15. Suponga que seis parejas de casados se encuentran en una reunión social.
(a) Si se eligen dos personas al azar, hallar la probabilidad de que (i) sean espo-
sos; (ii) uno sea hombre y la otra mujer. R: (i) 1
11; (ii)
6
11
(b) Si se eligen cuatro personas al azar, hallar la probabilidad de que (i) se elijan dos parejas de casados; (ii) ninguna pareja de casados entre los 4; (iii) haya
exactamente una pareja de casados entre los 4. R: (i) 1
33; (ii)
16
33; (iii)
16
33
16. De las diez niñas del 7B, tres tienen ojos azules. Si se eligen dos niñas al azar, ¿cuál
es la probabilidad de que (a) las dos tengan ojos azules; (b) ninguna tenga ojos
azules; (c) por lo menos una tenga ojos azules? R: (a) 1
15; (b)
7
15; (c)
8
15
17. Tres tornillos y tres tuercas están en una caja. Si se eligen dos piezas del interior,
determine la probabilidad de sacar una tuerca y un tornillo. R: 3
5
18. Diez estudiantes (Juan, Carlos, Laura, Petronila,…) están en una clase. Si se escoge
una directiva de tres estudiantes al azar, hallar la probabilidad de que (a) Juan
pertenezca a la directiva; (b) Laura y Juan pertenezcan a la directiva; (c) Laura o
Juan pertenezcan a la directiva. R: (a) 3
10 (b)
1
15 (c)
8
15
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
70
19. Un grupo de niños exploradores está integrado por seis niñas y 10 niños. Suponga
que se deben elegir 3 para una expedición a cierta montaña. Hallar la probabilidad
de (i) seleccionar tres niños; (ii) seleccionar exactamente 2 niños; (iii) seleccionar
por lo menos un niño; (iv) seleccionar exactamente dos niñas.
R: (i) 3
14 (ii)
27
56 (iii)
27
28 (iv)
15
56
20. De 120 estudiantes, 60 estudian francés, 50 estudian español y 20 estudian francés
y español. Si se escoge un estudiante al azar, determine la probabilidad de que el
estudiante no estudie ni francés ni español. R: 1
4
21. Tres niños y 3 niñas se sientan en una fila. Hallar la probabilidad de que (i) las tres
niñas se sienten juntas, (ii) los niños y las niñas se sienten de forma alternada.
R: (i) 1
5 (ii)
1
10
22. En la Lotería de California, un jugador debe escoger seis números -en el orden que
desee- de una tabla que contiene los 53 primeros números enteros positivos. Gana
un premio mayor de $1.000.000 quien acierte esos 6 números. El precio de cada
boleto de lotería es de $1. (a) ¿Cuánto dinero deberá invertir un jugador que quie-
ra ganar con toda certeza el premio mayor? (b) ¿Cuál es la probabilidad de ganar
dicho premio? R: (b) 0,000004% (aprox)
23. Una pareja de esposos planea tener 4 hijos. Suponiendo que es igualmente proba-
ble tener un niño o una niña, determine la probabilidad de que la pareja tenga (i)
sólo niños; (ii) dos niños y dos niñas; (iii) sean del mismo género (todos niños o to-
das niñas); (iv) cuando menos, dos niñas. R: (i) 1
16 (ii)
3
8 (iii)
1
8 (iv)
11
16
24. Pánfilo debe realizar una prueba escrita. Debe elegir tres preguntas de un examen
que consta de 13 problemas, de los cuales 4 son de álgebra, 3 son de geometría y 6
son de aritmética. Determine la probabilidad de que… (Clasifique los eventos, se-
gún la teoría vista en clase)
(a) las tres sean de aritmética; R: 7%, suceso improbable
(b) elija una pregunta por cada tema; R: 25%, suceso improbable
(c) como máximo, dos sean de geometría. R: 100%, suceso seguro
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
71
25. En una empresa hay dos departamentos: el de Contabilidad y el de Ventas. En el
primero trabajan 7 colaboradores; mientras que en el segundo trabajan 8. El jefe
quiere elegir a un grupo de 5 colaboradores para enviarlos a un congreso. Deter-
mine la probabilidad de que…
(a) sean del Dept. de Ventas; R: 2%
(b) sean tres del Dept. Ventas y dos del Dept. de Contabilidad; R: 39%
(c) como máximo, dos sean del Dept. de Ventas. R: 43%
26. En la piñata de cumpleaños de Juan hay 7 caramelos, cinco paletas y 8 galletas. De-
termine la probabilidad de que al tomar dos de ellas al azar, al menos una de estas
golosinas sea una paleta. R: 17
38
27. En una urna hay 4 bolas negras, una bola azul y siete bolas verdes. Se extraen dos
bolas al azar, simultáneamente. Determine la probabilidad de que…
(a) ambas sean negras. R: 1
11
(b) al menos una sea verde. R: 28
33
28. Pánfilo tiene cuatro camisas verdes, dos negras y tres azules. Además, tiene tres gorras negras, cuatro rojas y dos verdes. Él deberá escoger una camisa y una gorra al azar. Determine la probabilidad de que (a) tanto la gorra como la camisa sean verdes; (b) la gorra y la camisa sean del mismo color; (c) la camisa sea roja y la go-
rra negra. R: (a) 8
81 (b)
14
81 (c) 0
FUENTES BIBLIOGRAFICAS Curso de Estadística descriptiva: teoría y práctica C. Fernández C.; F. Fuentes G. Editorial Ariel. Ariel Economía. España. 1995.
Introducción a la Estadística Descriptiva
J. Trejos Z.; E. Moya V. Ediciones Guayacán. Costa Rica. 2009.
Probabilidad y aplicaciones estadísticas
P. Meyer Addison-Wesley. E.U.A. 1992.
Matemática para Bachillerato
L. Gómez. Editorial Pimas. Costa Rica. 2015.
Tel. 8341-2325 Introducción a la Estadística y Probabilidad Prof. F. Barrientos B.
72
Algunas fórmulas importantes
Moda
𝑀𝑜 = Dato con mayor frecuencia
Mediana
𝑀𝑒 = Dato central
Media
�̅� =𝑥1 + 𝑥2 + 𝑥3 +⋯+ 𝑥𝑛
𝑛
Media Ponderada
�̃� =𝑥1 ∙ 𝑝1 + 𝑥2 ∙ 𝑝2 +⋯+ 𝑥𝑛 ∙ 𝑝𝑛
𝑝1 + 𝑝2 +⋯+ 𝑝𝑛
Permutaciones
𝑛𝑃𝑟 =𝑛!
(𝑛 − 𝑟)!
Combinaciones
(𝑛𝑟) = 𝑛𝐶𝑟 =
𝑛!
(𝑛 − 𝑟)!
Probabilidad de Bernoulli
𝑃 =𝑛
𝑚
Permutaciones con repeticiones
𝑛𝑃𝑚1,𝑚2, … ,𝑚𝑘 =𝑛!
𝑚1! ∙ 𝑚2!⋯𝑚𝑘!
Axiomas de probabilidad
(a) 0 ≤ 𝑃(𝐵) ≤ 1; (b) 𝑃(𝑆) = 1; (c) 𝑃(𝑀 ∪ 𝑁) = 𝑃(𝑀) + 𝑃(𝑁), (d) 𝑃(𝐵𝑐) = 1 − 𝑃(𝐵)
Prof. Fco. Barrientos B. Instituto Matemático Euclides
Moravia, Costa Rica Centro Comercial La Placita Moraviana
Tel. 8341-2325 Mail: [email protected]