nombre de la norma - utselvautselva.edu.mx/pai/1/2009/55.3 guia del profesor para... · web viewsi...

MATEMÁTICAS PARA INGENIEROS

GUÍA DEL PROFESOR

SECRETARÍA DE EDUCACIÓN PÚBLICASUBSECRETARÍA DE EDUCACIÓN SUPERIOR E INVESTIGACIÓN CIENTÍFICA

SUBSISTEMA DE UNIVERSIDADES TECNOLÓGICASCOORDINACIÓN GENERAL DE UNIVERSIDADES TECNOLÓGICAS

ELABORÓ: GRUPO DE DIRECTORES DE LA CARRERA DE PROCESOS AGROINDUSTRIALES. REVISÓ: COMISIÓN ACADÉMICA NACIONAL DEL ÁREA

AGRO-INDUSTRIAL ALIMENTARIA.

APROBÓ:COORDINACIÓN GENERAL DE UNIVERSIDADES TECNOLÓGICAS

FECHA DE ENTRADA EN VIGOR: SEPTIEMBRE 2003

1

Revisión no. 0. Fecha de revisión: septiembre, 2003. Página 2 de 1907 F-CADI-SA-MA-11-GP-A

I. DIRECTORIO

DR. REYES TAMES GUERRA

SECRETARÍO DE EDUCACIÓN PÚBLICA

DR. JULIO RUBIO OCA

SUBSECRETARIO DE EDUCACIÓN SUPERIOR E INVESTIGACIÓN CIENTÍFICA

DR. ARTURO NAVA JAIMES

COORDINADOR GENERAL DE UNIVERSIDADES TECNOLÓGICAS

RECONOCIMIENTOSING. JAVIER TOCHIHUITL VÁZQUEZ UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ

ING. DIEGO A. GARCÍA RODRÍGUEZ UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ

ING. VICTOR MORALES GUZMÁN UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ

ING. MA. DEL ROSARIO ROSAS C. UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ

ING. ANGELINA ALONSO CAMPOS UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ

T.S.U. JANET BLANCAS UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ

MATEMÁTICAS PARA INGENIEROS D.R. 20001

ESTA OBRA, SUS CARACTERÍSTICAS Y DERECHOS SON PROPIEDAD DE LA: COORDINACIÓN GENERAL DE UNIVERSIDADES TECNOLÓGICAS (CGUT) FRANCISCO PETRARCA No. 321, COL. CHAPULTEPEC MORALES, MÉXICO D.F.LOS DERECHOS DE PUBLICACIÓN PERTENECEN A LA CGUT. QUEDA PROHIBIDA SU REPRODUCCIÓN PARCIAL O TOTAL POR CUALQUIER MEDIO, SIN AUTORIZACIÓN PREVIA Y POR ESCRITO DEL TITULAR DE LOS DERECHOS.

ISBN (EN TRÁMITE)IMPRESO EN MÉXICO.

2

ÍNDICE

# CONTENIDO PÁGINA

I. DIRECTORIO Y RECONOCIMIENTOS 2

II. ÍNDICE 3

III. INTRODUCCIÓN DE LA ASIGNATURA 4

IV. UNIDADES TEMÁTICAS

UNIDAD I. INTRODUCCIÓN UNIDAD II. ORGANIZACIÓN Y PRESENTACIÓN DE DATOSUNIDAD III. MEDIDAS DESCRIPTIVASUNIDAD IV. MODELOS PROBABILÍSTICOSUNIDAD V. PRUEBAS DE HIPÓTESISUNIDAD VI. ANÁLISIS DE LA VARIANZAUNIDAD VII. REGRESIÓN LINEAL

5517295

111130148

V. REFERENCIAS 177

VI. GLOSARIO 177

VII. ANEXOS

Ejercicios

178

3

III. INTRODUCCIÓN DE LA ASIGNATURA

Dentro de las asignaturas que corresponden al Área de Ciencias Básicas Aplicadas para la formación de

Técnico Superior Universitario en Procesos Agroindustriales encontramos la de Matemáticas para

ingenieros. Dicha asignatura tiene el objetivo de: aplicar herramientas estadísticas en el análisis de

información que se genera de mediciones de procesos alimentarios, para proponer soluciones en

problemas de control de calidad e interpretar resultados de experimentos realizados, para formular

conclusiones con nivel de escala probable.

El programa que comprende está asignatura esta formada por siete unidades. La primera corresponde a

una introducción a la Probabilidad, la segunda a la Organización y presentación de datos, la tercera a

Medidas descriptivas, la cuarta a Modelos probabilísticos, la quinta a Pruebas de hipótesis, la sexta a

Análisis de la varianza y la séptima a Regresión lineal.

La asignatura de Matemáticas para ingenieros tiene como finalidad el estudio de la Probabilidad y

Estadística, así como sus aplicaciones a la resolución de problemas directamente ligados con la carrera

de Procesos Agroindustriales, los cuales están enfocados hacia el conocimiento de la estadística

propiamente que se utiliza en las empresas. Considerando que las herramientas del control estadístico

del proceso para la toma de decisiones son conocimientos fundamentales para el futuro Técnico

Superior Universitario.

4

CAPITULO 1

INTRODUCCIÓN A LA PROBABILIDAD

INTRODUCCIÓN

El alumno abordará en esta unidad temática los conceptos de probabilidad, aplicándolo al experimento aleatorio y espacio muestral. Conocerá y distinguirá una población de datos, determinando su muestra, ordenando los datos, tabulándolos y graficando estos datos para su interpretación; estas herramientas estadísticas apoyaran a su formación, ya que podrá ordenar e interpretar un conjunto de datos.

OBJETIVO Y CRITERIOS DE APRENDIZAJE Página

1. - Ilustrar el concepto de experimento aleatorio con el del espacio muestral.1.1 Diferenciar el concepto de experimento aleatorio con el del espacio muestral.

77

DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE)

1.1.1 Distinguir el concepto de experimento aleatorio con el del espacio muestral.

OBJETIVO Y CRITERIOS DE APRENDIZAJE2. Definir el concepto de población y muestra2.1 Distinguir el concepto de población y muestra.

1616


2.1.1. Usar el concepto de población y muestra

OBJETIVO Y CRITERIOS DE APRENDIZAJE3. Definir el concepto de probabilidad y relacionarlo con el de frecuencia relativa.3.1 Analizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa.

2727


3.1.1. Utilizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa.

OBJETIVO Y CRITERIOS DE APRENDIZAJE4. Definir el concepto de probabilidad y relacionarlo con el de la frecuencia relativa.4.1 Diferenciar el concepto de probabilidad y relacionarlo con el de la frecuencia relativa...

3232


4.1.1. Emplear la fórmula de probabilidad condicional en problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro

OBJETIVO Y CRITERIOS DE APRENDIZAJE5. Definir el Teorema de Bayes 45

5

5.1 Utilizar el teorema de Bayes en problemas del ámbito profesional que involucren probabilidades subjetivas.

45


5.1.1. Emplear en problemas del ámbito profesional que involucren probabilidades subjetivas y aplicar el teorema de Bayes en su solución.

DEMOSTRACIÓN DE HABILIDADES FINALESTa. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral

posible.Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o datos de muestrasPa. 1 Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro.Pa. 2 Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren probabilidades subjetivas y aplicar el Teorema de Bayes en su solución

6

TEMA 1

Objetivo de aprendizaje.1. Ilustrar y relacionar el concepto de experimento aleatorio con el del espacio muestral.

Criterio de Aprendizaje.1.1 Diferenciar el concepto de experimento aleatorio con el del espacio muestral.

Didáctica de enseñanza.Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible.

La historia de la probabilidad comienza en el siglo XVII cuando Fermat y Pascal tratan de resolver algunos problemas relacionados con los juegos de azar.

Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el caballero De Méré y publicó (en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo Aleae, (Calculating in Games of Chance), un tratado sobre juegos de azar.

Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, se publicaron varios documentos de este tipo. Jakob Bernouilli (1654-1705) Ars Conjectandi (publicado en 1713 aunque escrito sobre 1690) y Auguste De Moivre (1667-1754) contribuyeron de forma importante a este desarrollo.

En 1812 Pierre Laplace publicó Théorie analytique des probabilités en el que expone un análisis matemático sobre los juegos de azar.

Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada como una forma de matemática. A principios del siglo XX el matemático ruso A. Kolmogorov la definió de forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la actualidad es parte de una teoría más amplia como es la teoría de la medida.

En estas notas, entenderemos por experimento aleatorio cualquier situación que, realizada en las mismas condiciones, sea imposible de predecir el resultado que obtengamos.

Experimento Aleatorio: Es aquel que se realiza sin tener el conocimiento previo de los resultados que se obtendrán del mismo.

Serán experimentos aleatorios, por ejemplo, los siguientes:

Lanzar un dado y considerar el resultado obtenido Extraer una carta (o varias) de una baraja Lanzar dos dados y hallar la suma de cada una de las caras obtenidas Se lanza una moneda.

Si sale cara se extrae de una urna U 1, con una determinada composición de bolas de colores, una bola y si sale cruz de extrae de una urna U 2, con otra determinada composición de bolas de colores, una bola. A continuación se considera el color de la bola extraído.

7

Los tres primeros son ejemplos de experimentos aleatorios simples y el último un ejemplo de experimento aleatorio compuesto

Se definen las siguientes operaciones con sucesos de un determinado experimento aleatorio

Unión de dos sucesos A, B es el suceso que se verifica si se verifica A o se verifica B o ambos. La unión de los sucesos A y B la designaremos por (A o B) (cuando no haya lugar a confusión lo expresaremos sin paréntesis es decir A o B) Intersección de dos sucesos A, B es el suceso que se verifica si se verifica A y se verifica B. La intersección de los sucesos A y B la designaremos por (A y B) (cuando no haya lugar a confusión lo expresaremos sin paréntesis es decir A y B) Diferencia de dos sucesos A, B es el suceso que se realiza cuando se realiza A y no B. La diferencia de los sucesos A y B la designaremos por A - B = (A y Bc )

Igualmente podemos considerar la diferencia B - A

Lanzamos un dado y consideramos los sucesos A = {“obtener número par”} = {2, 4, 6}B = {“obtener múltiplo de 3”} = {3, 6}

Puedes comprobar las operaciones unión, intersección y diferencias de dichos sucesos pasando el ratón sobre los correspondientes diagramas

Unión:{“números pares o múltiplos de 3”} = {2, 3, 4, 6}

Intersección:{“números pares y múltiplos de 3”} = {6}

8

Diferencia B - A{“múltiplos de 3 y no números pares”} = {3}

Diferencia A - B{“números pares y no múltiplos de 3”} = {2, 4}

Puedes comprobar las diferencias simétricas pasando el ratón sobre el diagrama

Se lanza una moneda tres veces y se consideran los sucesos

A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++}B = {“sale alguna cara”} = {ccc, cc+, c+c, c++, +cc, +c+, ++c}

Unión(A o B) = {“salen al menos dos cruces o sale alguna cara”} = {+++, c++, +c+, ++c, ccc, cc+, c+c, +cc}

Intersección(A y B) = {“salen al menos dos cruces y sale alguna cara”} = {c++, +c+, ++c}

DiferenciasA - B = (A y Bc) = {“salen al menos dos cruces y no sale alguna cara”}B - A = (B y Ac) = {“sale alguna cara y no salen al menos dos cruces”}

Algunas consideraciones básicas con sucesos que serán útiles para la resolución de problemas Sucesos incompatibles y complementarios

9

Si A es un suceso de un determinado experimento aleatorio cuyo espacio muestral es E, entonces A y su complementario son incompatibles, es decir

(A y Ac) = Ø Además (A o Ac) = E

Si lanzamos un dado y A es el suceso A = {“obtener múltiplo de 3”} = {3, 6}

Entonces Ac = {“no obtener múltiplo de 3”} = {1, 2, 4, 5} por lo que

(A o Ac) = {1, 2, 3, 4, 5, 6} = E y (A y Ac) = Ø

Dos sucesos complementarios son incompatibles, pero el recíproco no es cierto, es decir dos sucesos incompatibles no tienen por qué ser complementarios.

Por ejemplo, los sucesos A = {“obtener múltiplo de 3”} = {3, 6} y

B = {“obtener múltiplo de 5”} = {5} son incompatibles pero no complementarios.

Dados dos sucesos A y B de un determinado experimento aleatorio que no sean incompatibles los sucesos (A - B), (B - A) y (A y B) son incompatibles

Además podemos expresar tanto A como B como unión de dos sucesos incompatibles A = (A - B) o (A y B)B = (B - A) o (A y B)

También podemos expresar el suceso (A o B) como unión de tres sucesos incompatibles (A o B) = (A - B) o (A y B) o (B - A) Suceso contenido en otro

10

Consideremos el experimento aleatorio consistente en lanzar tres monedas y los sucesos A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++}B = {“salen dos cruces”} = {c++, +c+, ++c}

El suceso B es un subconjunto del suceso A. Si se verifica A necesariamente se verifica B. En este sentido, diremos que el suceso B está contenido en el suceso A.

Es interesante observar en el caso anterior que se verifican las inclusiones siguientes: (A y B) está contenido en A(A y B) está contenido en B

Leyes de De Morgan

Dos propiedades importantes que, a veces, resultan útiles en la resolución de problemas son las siguientes:

El complementario de la unión de dos sucesos es la intersección de los complementarios de dichos sucesos (A o B) c = Ac y Bc

1. El complementario de la intersección de dos sucesos es la unión de los complementarios de dichos sucesos (A y B) c = Ac o Bc

Consideremos el experimento aleatorio consistente en lanzar dos dados (o un dado dos veces) y sumar la puntuación obtenida.

E = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

El conjunto formado por todas las posibles sumas que pueden obtenerse se denomina Espacio Muestral de dicho experimento aleatorio y suele designarse por E. Cada uno de los elementos de E es un suceso elemental.

A partir de dicho subconjunto podemos considerar distintos subconjuntos de E.

A = {2, 4, 6, 8, 10, 12} = {“obtener suma par”} B = {2, 5, 7, 11} = {“obtener una suma que sea número primo”} C = {10, 11, 12} = {“obtener una suma mayor o igual que 10”} D = {3, 6, 9, 12} = {“obtener suma múltiplo de 3”} F = {2, 3} = {“que la suma que sea 2 ó 3”} Ø = {“obtener una suma mayor que 15”} suceso imposible E = {“Obtener una suma mayor o igual que 2 y menor o igual que 12”} suceso seguro M = {7} = {“Obtener un 7”}

Entre los sucesos apuntados, existen sucesos simples (o elementales) (por ejemplo el M) y otros sucesos compuestos constituidos por varios sucesos elementales. El conjunto de todos estos sucesos, incluidos los sucesos seguro e imposible, se denomina Espacio de Sucesos (constituido por todos los subconjuntos que pueden formarse a partir del espacio muestral E) que suele designarse por P (E).

Puede probarse que si el número de elementos de E es n, entonces P (E) tiene 2 n elementos. 11

A veces, suele ser útil utilizar un gráfico como el de la figura para hallar el espacio muestral de un determinado experimento aleatorio.

El diagrama de árbol de la figura corresponde al experimento aleatorio de lanzar una moneda tres veces (o tres monedas) y considerar el resultado obtenido.

El espacio muestral se obtiene fácilmente sin más que ir recorriendo todas las ramas y es

E = {CCC, CC+, C + C, C++, +CC, + C +, ++C, +++}

Son sucesos de dichos experimento aleatorio A = {CCC, CC +, C + C, C++, +CC, +C +, ++C} = {“obtener al menos una cara”} B = {CC+, C + C, +CC} = {“obtener dos caras”} Ø = {“obtener 5 cruces”} suceso imposible C = {C++, + C +, ++C, +++} = {“obtener más cruces que caras”}

Se considera el experimento aleatorio consistente en lanzar una moneda. Si sale cara se extrae de una urna que contiene bolas azules y rojas una bola y si sale cruz se extrae una bola de otra urna que contiene bolas rojas y verdes.

El espacio muestral de dicho experimento aleatorio es

E = {(C, R), (C, A), (+,R), (+,V)}

El espacio de sucesos consta de 2 4 = 16 elementos que son12

P (E) = {{(C, R)}, {(C, A)}, {(+, R)}, {(+, V)}, {(C, R), (C, A)}, {(C, R), (+, R)}, {(C, R), (+, V)}, {(C, A), (+, R)}, {(C, R), (+, V)}, {(+, R), (+, V)}, {(C, R), (C, A), (+, R)},{(C, R), (C, A), (+, V)}, {(C, R), (+, R), (+, V)}, {(C, A), (+, R), (+, V)}, Ø, E}

Experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos veces).

Espacio muestral del experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos veces) y observar el resultado

Como E tiene 36 elementos el espacio de sucesos tiene 236 sucesos.

En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida sea 7” es S = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}

13

En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida es número primo” es

S = {(1,1), (1,2), (2,1), (1,4), (2,3), (3,2), (4,1), (1,6), (2,5), (3,4), (4,3), (5,2), (6,1), (5,6), (6,5)}

En el experimento aleatorio del lanzamiento de dos dados, el suceso “en los dos lanzamientos se obtiene número primo” es

S = {(2,2), (2,3), (2,5), (3,2), (3,3), (3,5), (5,2), (5,3), (5,5),}

Complementario de un suceso A es el suceso que se verifica si no se verifica A.

El complementario de A, lo designamos por Ac y también por (no A)

En el experimento aleatorio consistente en lanzar dos dados y considerar la suma de ambos, los sucesos {“obtener suma par”} y {“obtener suma impar”} son complementarios. También son complementarios los sucesos {“obtener suma mayor o igual que 5”} y {“obtener suma menor que 5”}.

En el experimento aleatorio consistente en lanzar dos monedas los sucesos {“obtener al menos una cara”} y {“no obtener ninguna cara”} son complementarios.

El complementario del suceso A = {“en los dos lanzamientos se obtiene número primo”} (en amarillo) es el suceso B = {“en alguno de los dos lanzamientos (o en ambos) no se obtiene número primo”} (en verde)

14

Evidencia parcialTa. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible.

Evaluación parcialEntrega de Ta.1

15

TEMA 2

Objetivo de aprendizaje.2. Definir el concepto de población y muestra.

Criterio de Aprendizaje.2.1 Distinguir el concepto de población y muestra.

Didáctica de enseñanza.

Población: es el conjunto de datos que caracteriza el fenómeno que se desea estudiar. Una población está determinada por sus características definitorias. Por lo tanto, el conjunto de elementos que posea esta característica se denomina población o universo. Población es la totalidad del fenómeno a estudiar, donde las unidades de población poseen una característica común, la que se estudia y da origen a los datos de la investigación.

Muestra: es un subconjunto de la población a estudiar, el cual es necesario que sea representativo de toda la población.

Entonces, una población es el conjunto de todas las cosas que concuerdan con una serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos los elementos de una población.

Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre una población determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la población en su conjunto. La exactitud de la información recolectada depende en gran manera de la forma en que fue seleccionada la muestra.

Cuando no es posible medir cada uno de los individuos de una población, se toma una muestra representativa de la misma.

La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las características que definen la población de la que fue extraída, lo cual nos indica que es representativa.

Por lo tanto, la validez de la generalización depende de la validez y tamaño de la muestra.

Leyes del método de muestreo.

El método de muestreo se basa en ciertas leyes que le otorgan su fundamento científico, las cuales son: Ley de los grandes números: si en una prueba, la probabilidad de un acontecimiento o suceso es P, y si éste se repite una gran cantidad de veces, la relación entre las veces que se produce el suceso y la cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la probabilidad P.

Cálculo de probabilidades: La probabilidad de un hecho o suceso es la relación entre el número de casos favorables (p) a este hecho con la cantidad de casos posibles, suponiendo que todos los casos son igualmente posibles. El método de establecer la probabilidad es lo que se denomina cálculo de probabilidad.

De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven de base más directamente al método de muestreo:

16

Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de un conjunto N, es casi seguro que tenga las características del grupo más grande.

Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se refiere al hecho de que en la mayoría de los fenómenos, cuando una parte varía en una dirección, es probable que una parte igual del mismo grupo, varíe en dirección opuesta.

Ley de la permanencia de los números pequeños: si una muestra suficientemente grande es representativa de la población, una segunda muestra de igual magnitud deberá ser semejante a la primera; y, si en la primera muestra se encuentran pocos individuos con características raras, es de esperar encontrar igual proporción en la segunda muestra.

Tipos de muestras.

Muestreo aleatorio simple: la forma más común de obtener una muestra es la selección al azar. Es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe emplearse para su constitución una tabla de números aleatorios.

Muestreo estratificado: una muestra es estratificada cuando los elementos de la muestra son proporcionales a su presencia en la población. La presencia de un elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se divide a la población en varios grupos o estratos con el fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la selección de los elementos o unidades representantes, se utiliza el método de muestreo aleatorio.

Muestreo por cuotas: se divide a la población en estratos o categorías, y se asigna una cuota para las diferentes categorías y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra debe ser proporcional a la población, y en ella deberán tenerse en cuenta las diferentes categorías. El muestreo por cuotas se presta a distorsiones, al quedar a criterio del investigador la selección de las categorías.

Muestreo intencionado: también recibe el nombre de sesgado. El investigador selecciona los elementos que a su juicio son representativos, lo que exige un conocimiento previo de la población que se investiga.

Muestreo mixto: se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las unidades de la muestra en forma aleatoria y después aplicar el muestreo por cuotas.

Muestreo tipo: la muestra tipo (master simple) es una aplicación combinada y especial de los tipos de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al disponer de tiempo, la muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituirá el módulo general del cual se extraerá la muestra definitiva conforme a la necesidad específica de cada investigación.

Para ilustrar, tomemos el siguiente ejemplo: Supóngase que se tienen que estudiar las edades una población de radioescuchas, por ser tan grande la cantidad de ellos, solamente se encuestan a 350 de ellos, los cuales en este caso serán la muestra de dicha población.

17

Las muestras representativas de su población son aquellas que poseen las mismas características de la población que se desea estudiar.

Las poblaciones pueden ser finitas o infinitas

Poblaciones infinitas: Todos los juegos o fenómenos cuyos resultados están indeterminados cuantitativamente ó aquellas poblaciones que por su gran número de elementos, resulta prácticamente imposible trabajar con todos ellos.

Poblaciones finitas: Todos los juegos o fenómenos cuyos resultados están determinados cuantitativamente, ya que se pueden conocer cantidades específicas.

Función: Es establecer una relación entre dos elementos distintos, como son población y tiempo, con base en esto podemos decir que la población esta en función del tiempo: p= f (t), también recibe el nombre de función explícita, y consta de una variable independiente (t), y una variable dependiente(p).Así podemos decir que B= a una función implícita ya que consta de dos variables independientes (p,t), esto quiere decir: que B esta en función del paso del tiempo, es decir : B=f(p.t).

Gráfica: Una gráfica es una representación de la relación entre variables, muchos tipos de gráficos aparecen en estadística, según la naturaleza de los datos involucrados y el propósito de la gráfica, es la de representar los valores tabulados obtenidos de los muestreos o los datos del total de la población.

Constante: Un elemento constante es aquel que durante un intervalo definido siempre va a valer lo mismo, conservando sus características.

Variable: Es un elemento que durante un intervalo definido se va a comportar de distintas formas. Las variables que se manejan en estadística moderna son aleatorias.

Variable Aleatoria: Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio.

Existen Variables continuas y Variables discretas.

Variable Continua: Es un rango que puede concebirse como un continuo de valores.

Variables discretas: Son aquellas que toman determinado valor exacto como: El No. De hijos de una familia.

Ecuación: Las ecuaciones son enunciados del tipo A = B donde A = miembro ó lado izquierdo, y B = miembro derecho al cual se le pueden hacer una serie de operaciones.

Filas de datos: Consiste en datos que no han sido ordenados y que simplemente han sido tomados como tal. Un ejemplo sería: Estatura de los estudiantes, que posteriormente se agrupan numéricamente.

Ordenación: Consiste en ordenar datos en forma creciente y decreciente y la diferencia entre el mayor y el menor de los datos recibe el nombre de rango.

Distribución de frecuencia:

18

Al resumir grandes colecciones de datos, es útil distribuirlos en clases o categorías, y determinar el número de individuos que pertenecen a cada clase llamado frecuencia de clase.

Una disposición tabular de los datos por clases junto con las frecuencias correspondientes de clase se llama distribuidores de frecuencia o tablas de frecuencia.

Tipos de intervalos: Un intervalo de clase que, al menos en teoría carece de Limite Superior o Limite Inferior indicado. Se llama intervalo de Clase Abierto, ejemplo: refiriéndonos a edades de 65 años o más.

Muestras con remplazamiento y sin remplazamiento

Supóngase que f(x) es una población, donde X1, X2, X3... Xn son las muestras. Se dice que es una muestra X1 sin remplazamiento, si X1 se analiza sin regresarla a la población, si por el contrario se analiza la muestra y se regresa a la población antes de realizar cualquier otro experimento, será una muestra con remplazamiento.

Ejemplo 1)Supóngase que se tienen 12 canicas4 ROJAS 4 VERDES 4 NEGRAS

¿Qué probabilidad existe de extraer una canica roja, con remplazamiento y sin remplazamiento?a) Con remplazamiento: 4 / 12b) Sin remplazamiento: 4 / 11

Variables aleatorias ó muestras aleatoriasSuponga una población f(x) donde X1, X2, X3,...,Xn son las muestras.

Se llama muestreo sin reemplazo cuando de una población tomamos X muestras sin devolverlas.

Se llama muestreo con reemplazo cuando una población f ( x ) toma una o varias muestras ingresándola a la población.

Suponga una población f( x ) donde f( x ) son 1000 resistencias de diferentes valores, si tomamos de muestras 10 resistencias las analizamos y posteriormente las regresamos estamos hablando de muestras con remplazamiento, esto sería un ejemplo de población infinita que resulta de una población finita.

Muestras Aleatorias:

Lógicamente la confiabilidad de las conclusiones extraídas concernientes a una población depende de si la población ha sido escogida correctamente de tal modo de que represente la población lo

19

X1 X2

X3 X4

Xn

suficientemente bien, uno de los problemas importantes de la diferencia estadística es como recoger una muestra.

Una forma de hacer esto para poblaciones finitas es asegurarse de que cada miembro de la población tenga igual oportunidad de encontrarse en la muestra lo cual se conoce como muestra Aleatoria.

Ejemplos de Población, muestra y conceptos

Ejemplo 1:

Determine si se trata de población finita o infinita:

a) Población de libros de la biblioteca de la UT.Población finita, porque el número de libros se puede contar.

b) Población de varones de México entre 18 y 22 años. La población es muy grande pero se puede contar por lo tanto es finita. Para contabilizar el número de varones entre 18 y 22 años se puede recurrir al INEGI, que es la oficina de censo de la población y la vivienda y se podría obtener la información requerida.

c) Población de todas las personas que podrían tomar aspirinas. La población es infinita.

d) Población de todos los focos de 40 watts que serán producidos por la compañía Sylvania.

La población es infinita, no puede predecirse cual será la producción.

Ejemplo 2:

a) Escribe mínimo 3 ejemplos de variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD):

VA ===> Personalidad, carácter, paciencia, I.D. de cada alumno (aunque es un número entero es atributo de una persona), número de empleado, RFC.

VCC ===> Edad, peso, altura, estatura, temperatura, calificaciones, promedio, medida de inteligencia.

VCD ===> Hijos, propiedades, 1 año, número de parientes, número de producción de autos, número de alumnos, número de calculadoras vendidas, carreras, universidades, unidades de las materias

b) Una muestra que consta de 4 personas en un gimnasio fue cuestionada sobre "el color de short que gustaba vestir para hacer ejercicio", la "marca" y la "talla" que usa. Los datos recolectados fueron:

Short de color rojo, verde, negro y azul. Estos datos fueron reescritos con clave: Verde = 2, lila = 3 y azul = 3, rojo = 4

Las tallas fueron: 38, 32, 36, 34

Las marcas fueron: Cristian Dyor, Guess, Love y Patito respectivamente.

20

Detectar las variables, el promedio de cada variable y el tipo de variable.

Solución:

P1) Se detectan las variable V1 = Color del short V2 = Marca V3 = Talla P2) La V1 (Color del short) es cualitativa multinomial. P3) Promedio

A pesar de que los datos fueron reescritos como 1, 2, 3, 4, no tendría sentido encontrar el promedio de la muestra sumando y dividiendo entre 4: (verde + lila + azul + rojo)/4 o como (1 + 2 + 3 + 4)/4. Esto último a pesar de ser un número sigue siendo variable cualitativa y el resultado del promedio no tiene sentido.

P4) La V2 (Marca) es cualitativa multinomial. P5) Promedio. Obtener el promedio de las marcas no tiene sentido. P6) La V3 (Talla) es cuantitativa discreta. P7) Promedio. (38 + 32 + 36 + 34)/4 = 35

Ejemplo 3:

a) Un fabricante de medicamentos está interesado en la proporción de personas que padecen hipertensión (presión arterial elevada) cuya condición pueda ser controlada por un nuevo producto desarrollado por la empresa. Se condujo un estudio en el que participaron 5000 personas que padecen de hipertensión, y se encontró que 80% de las personas pueden controlar su hipertensión con el medicamento. Suponiendo que las 5000 personas son representativas del grupo de hipertensión, conteste las siguientes preguntas:

1) ¿Cuál es la población? 2) ¿Cuál es la muestra? 3) Identifique el parámetro de interés 4) Identifique la estadística y proporcione su valor 5) ¿Se conoce el valor del parámetro?

Solución: 1) ¿Cuál es la población? Todas las personas que padecen hipertensión (presión arterial elevada), cuya presión pueda ser controlada por un nuevo producto desarrollado por la empresa.

2) ¿Cuál es la muestra? Un estudio de 5000 personas que padecen de hipertensión.

21

3) Identifique el parámetro de interés. La proporción de la población que padecen hipertensión y que puede ser controlada por un nuevo producto desarrollado por la empresa. Dicho de otra manera, es la proporción de la población para la que es eficaz el medicamento.

4) Identifique la estadística y proporcione su valor. La proporción de la población para la que es eficaz el medicamento es del 80%.

5) ¿Se conoce el valor del parámetro? No se conoce y difícilmente se puede encontrar.

b) Un comunicólogo desea calcular el "rating" del noticiario de "Joaquín López Doriga". Se condujo un estudio en el que participaron 1000 televidentes, y se encontró que el 60% de las personas ven el noticiario. Suponiendo que las 1000 personas son representativas del grupo de televidentes, conteste las siguientes preguntas:

1) ¿Cuál es la población? 2) ¿Cuál es la muestra? 3) Identifique el parámetro de interés 4) Identifique la estadística y proporcione su valor

Solución: 1) ¿Cuál es la población? Todos los televidentes.

2) ¿Cuál es la muestra? Un estudio de 1000 televidentes.

3) Identifique el parámetro de interés. El "rating" del noticiario de” Joaquín López Doriga". O la proporción de la población que ve el noticiario de” Joaquín López Doriga".

4) Identifique la estadística y proporcione su valor. La proporción de la población que ve el noticiario de” Joaquín López Doriga" es del 60%.

c) Un técnico de control de calidad selecciona piezas ensambladas de una línea de montaje y registra la siguiente información de cada pieza:

A: Defectuosa o no defectuosa

B: El número de identificación del trabajador que ensambló la pieza

C: El peso de la pieza

1) ¿Cuál es la población?

2) La población ¿es finita o infinita?

3) ¿Cuál es la muestra?

4) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD):

Solución: 1) ¿Cuál es la población? Todas las piezas ensambladas de una línea de montaje.

22

2) La población ¿es finita o infinita? Infinita. 3) ¿Cuál es la muestra? Las piezas seleccionadas y ensambladas de una línea de montaje.

4) Clasifique las respuestas para cada una de las tres variables como variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD):

A: Defectuosa o no defectuosa. VA. Variable atributiva binomial.

B: El número de identificación del trabajador que ensambló la pieza. VA. Variable atributiva Multinomial.

C: El peso de la pieza. VCC.

d) Se hizo un estudio con 500 estudiantes de la UDLA y se registro la siguiente información de cada uno:

A: Número de identificación (ID) B: Edad C: Estatura D: Asiste "Si" o "No" a discotecas los jueves en la noche

Suponiendo que los 500 estudiantes son representativos de este estudio, se encontró que el 70 % asiste a discotecas los jueves en la noche. Conteste las siguientes preguntas

1) ¿Cuál es la población? 2) ¿Cuál es la muestra? 3) Identifique el parámetro de interés. 4) Identifique la estadística y proporcione su valor. 5) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD).

Solución:

1) ¿Cuál es la población? Todos los estudiantes de la UT.

2) ¿Cuál es la muestra? 500 Número de estudiantes de la UT.

3) Identifique el parámetro de interés. La proporción de la población que asiste a una discoteca.

4) Identifique la estadística y proporcione su valor. La proporción de la población que asiste a una discoteca cuyo porcentaje es del 70%.

5) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD).

A: Número de identificación (ID). VA. Variable atributiva Multinomial. 23

B: Edad. VCC C: Estatura. VCC D: Asiste "Si" o "No" a discotecas los jueves en la noche. Variable atributiva Binomial.

Número de estudiantes de la UT que va a las discotecas los jueves en la noche.

Al contabilizar las respuestas "Si" o "No" asiste a discotecas los jueves en la noche, se convierte en el número de estudiantes que va las discotecas. VCD

e) Un estudio está interesado en determinar algo sobre el promedio del valor en $ de las computadoras que pertenecen al cuerpo docente de la UT. Diga:

1) ¿Cuál es la población? 2) La población es ¿finita o infinita? 3) Dar una muestra 4) ¿Cuál es la variable? 5) ¿Que tipo de variable es la variable? 6) Dar un dato 7) Dar todos los datos de la muestra 8) ¿Cuál es el experimento? 9) ¿Cuál es el parámetro? 10) ¿Cuál es la estadística que se encuentra?

Solución: 1) ¿Cuál es la población? Colección de todas las computadoras que pertenecen a todos los miembros del cuerpo docente de la universidad.

2) La población es ¿finita o infinita? El número de profesores de la UT puede contarse, por lo que se trata de una población finita.

3) Dar una muestra Cualquier subconjunto de esa población. Por ejemplo, todas las computadoras que pertenecen a los profesores del departamento de Ingeniería en Sistemas Computacionales.

4) ¿Cuál es la variable? "El valor en $ de cada computadora en particular"

5) ¿Que tipo de variable es la variable? Variable cuantitativa continua (VCC)

6) Dar un dato Por ejemplo la computadora de la "Doctora Pilar Gómez" que está valuada en $15,000.

7) Dar todos los datos de la muestra 9 personas constituyen el departamento de Ingeniería en Sistemas Computacionales, cuyas computadoras valen:$15000, $20000, $18000, $35000, $22000, $16000, $30000, $25000, $8000

8) ¿Cuál es el experimento? 24

Los métodos aplicados para seleccionar las computadoras que integran la muestra y determinar el valor de cada computadora de la muestra. El método aplicado fue preguntando a cada miembro del departamento. Otra forma de realizarlo sería preguntando por medio de un memorándum o por medio de un e-mail.

9) ¿Cuál es el parámetro? Es sobre el que se está buscando información, es decir, el promedio del valor de todas las computadoras de la población: prom = (15000 + 20000 + 18000 + 35000 + 22000 + 16000 + 30000 + 25000 + 8000)/9 = prom = $21,000

10) ¿Cuál es la estadística que se encuentra? Es el valor promedio de todas las computadoras de la muestra

f) La siguiente tabla representa las características de todos los empleados de tiempo completo de la fábrica de Shampoo "Patito" al 1o. de enero del año en curso.

No. de empleado

Empleados Color ojos

Sexo Puesto Años de Servicio

Salario Anual en $

1 Ana azul M Ingeniero 2 700002 Miguel café H Comunicólogo 10 700003 Andrea negro M Mecánico 23 650004 Jorge negro H Secretaria 5 200005 Eva azul M Obrera 8 180006 Alejandro verde H Vigilante 10 140007 Teresa negro M Obrera 2 180008 Susana café M Conserje 7 12000

Diga: 1) ¿Cuál es la población? 2) La población es ¿finita o infinita? 3) Dar una muestra 4) ¿Cuál es la(s) variable(s)? 5) ¿Que tipo de variable(s) es (son)? 6) Dar un dato 7) Dar todos los datos de una muestra

Solución:

1) ¿Cuál es la población? Es posible obtener en este ejemplo varias poblaciones, dado que hay 6 variables (los encabezados de las columnas), esta tabla contiene 6 poblaciones. Las poblaciones son: Población de empleados por Número de empleado , la población de empleados por Color ojos, la población de empleados por Sexo, la población de empleados por Puesto, la población de empleados por Años de Servicio y la población de empleados por Salario Anual.

25

2) La población es ¿finita o infinita? Todas las poblaciones constan de 8 empleados por lo que es finita.

3) Dar una muestra Los últimos 3 salarios de la población de empleados por Salario Anual.

4) ¿Cuál es la(s) variable(s)? Los encabezados de las columnas 1 y de la 2 a la 6 muestran algunas características de las unidades elementales (personas) que son precisamente las variables: número de empleado, color de ojos, sexo, puesto, Años de Servicio y Salario Anual.

5) ¿Que tipo de variable(s) es (son)? Variables Cualitativas: Número de empleado, color de ojos, sexo, puesto. Variables Cualitativas Binomial: sexo Variables Cualitativas Multinomiales: Número de empleado, color de ojos, puesto. Variables Cuantitativas: Años de Servicio y Salario Anual. Variables Cuantitativas Discretas: No hay. Variables Cuantitativas Continuas: Años de Servicio y Salario Anual.

6) Dar un dato Sueldo anual = $65000

7) Dar todos los datos de una muestra Los últimos 3 salarios de la población de empleados por Salario Anual, son: $1400, $18000, $12000

26

TEMA 3

Objetivo de aprendizaje.3. Definir el concepto de probabilidad y relacionarlo con el de frecuencia relativa.

Criterio de Aprendizaje.3.1 Analizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa

Didáctica de enseñanza.Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o datos de muestras

Supóngase un experimento cualquiera, por ejemplo, el número dos en el lanzamiento de un dado. El conjunto de todos los resultados posibles se llama universo o espacio de la muestra, en este caso, los números de 1 a 6 en el lanzamiento del dado en cuestión.

Usualmente se utiliza el concepto de frecuencia para ilustrar el concepto de probabilidad. Supóngase que se estudian n resultados de un experimento, de los cuales m se consideran ocurrencias exitosas de un resultado deseado, E y P(E) denota la probabilidad de ocurrencia de dicho resultado; la relación entre el número de resultados exitosos m y el número de resultados posibles n, es una medida aproximada de la probabilidad de ese resultado, es decir:

Esto es rigurosamente cierto cuando n es muy grande. Más formalmente, se deberá escribir así:

Donde:P(E): Probabilidad que el resultado E ocurra.E: Resultado que interesa analizar.M: Número de veces que ocurre E.n: Número de veces que se ejecuta el experimento.

Por ejemplo, si se desea saber cuál es la probabilidad de ocurrencia de que aparezca el número 2 en la cara superior cuando se lanza un dado, se podrían hacer lanzamientos seguidos y anotar cuántas veces aparece cada número, en particular el 2. Si esto se repite varias veces, entonces la relación entre el número de veces que apareció el 2 y el número de lanzamientos será un estimativo de la probabilidad. Esta frecuencia relativa tiende a un número; en el caso de un dado que no esté cargado, esta frecuencia tiende a 1/6.

Una variable aleatoria está definida por una función que asigna un valor de dicha variable aleatoria a cada punto del universo. Por ejemplo, la variable aleatoria puede ser el valor que aparezca en la cara superior del dado, o el cuadrado de este valor, etc. En este ejemplo, E=2, m es el número de veces que aparece el número 2 y n es el número de lanzamientos.

Propiedades básicas de la probabilidad

27

A continuación se presentan algunas propiedades básicas de la probabilidad.

1) La probabilidad de un resultado del universo es una cantidad menor o igual que uno y mayor o igual que cero. Esto se explica porque la probabilidad está definida por la proporción entre un número de casos “exitosos” y el número total de casos. El número de casos “exitosos” es menor que el número total de casos.

EjercicioLanzar una moneda 50 veces. Construir y completar en la hoja de cálculo la siguiente tabla de ejemplo:

Construir una gráfica de los resultados con n en las abcisas y m/n en las ordenadas, como se ilustra a continuación.

FRECUENCIA RELATIVA ACUMULADA DEL LANZAMIENTO DE UNA MONEDA

2) La probabilidad de un resultado que no puede ocurrir, o sea que no pertenece al universo, es cero.

3) La probabilidad del universo es uno. Es decir, la probabilidad de que ocurra alguno de los resultados de todo el conjunto posible de ellos es P(E1+E2+...+Em) y es igual a 1, donde (E1,E2,...,Em), son todos los resultados posibles, mutuamente excluyentes y exhaustivos del universo.

Nota: Se dice que unos resultados son mutuamente excluyentes cuando la ocurrencia de cualquiera de ellos elimina la ocurrencia de cualquier otro.

Todos los resultados posibles mi suman n, o sea:

28

m1+m2+m3+...mk = n (3)

Si esta ecuación se divide por n, entonces la suma de las frecuencias relativas es igual a 1.

m1/n+m2/n+m3/n+...mk/n = n/n = 1 (4)Así pues en el límite:

P(E1)+P(E2)+P(E3)+...P(Ek) = 1 (5)

4) Si E y F son resultados mutuamente excluyentes, o sea que sólo uno de ellos puede ocurrir, entonces la probabilidad de que ocurra E o F es P (E+F) = P (E) + P(F). Nuevamente, en el lanzamiento de un dado de seis caras numeradas de 1 a 6, sólo un número aparecerá en la cara superior, por lo tanto, los resultados (E2) y (E6), o sea que aparezca 2 en un caso o que aparezca 6 en el otro, son resultados mutuamente excluyentes. La probabilidad de que ocurra E2 o E6 es de 1/6+1/6 o sea, 1/3.

5) Si E y F son resultados independientes, esto es, que la ocurrencia de uno no afecta la ocurrencia del otro, la probabilidad de que ocurran simultáneamente P(EF), es P(E) x P(F). Tomando como ejemplo el dado de seis caras, el hecho que en el primer lanzamiento del dado aparezca un 2, no influye para que en el segundo lanzamiento aparezca cierto número; los lanzamientos son resultados independientes. Entonces, la probabilidad de que en el primer lanzamiento aparezca un 2 y en el segundo aparezca un 6 será 1/6x1/6, o sea, 1/36.

NOTA: Obsérvese que cuando se trata de resultados mutuamente excluyentes y se desea saber la probabilidad de que uno de los dos ocurra, se expresa con frases ligadas por o; en el caso de resultados independientes y si se desea calcular la probabilidad de que ambos ocurran, las frases se ligan con y. Estas propiedades son formales pero coinciden con las nociones intuitivas de probabilidad.

Eventos y sus probabilidades

En la realidad los hechos no son tan simples como en el ejemplo del dado. Ocurren combinaciones que complican un poco la situación. El cálculo de sus probabilidades es más complejo.

Eventos y sus probabilidadesLa realidad es compleja y ocurren combinaciones de resultados; la combinación de varios resultados origina un evento. A través de un ejemplo se ilustrará esta idea.

EjemploSupóngase que se desea analizar los resultados de una inversión $1.000 a tres años. El resultado de cada año es la ocurrencia de un ingreso por valor de $600 o $0. Los resultados posibles son:

(NNN) = m1(NNS) = m2(NSN) = m3(NSS) = m4(SNN) = m5(SSN) = m6(SNS) = m7(SSS) = m8

El orden de las letras se refiere año 1, 2 ó 3 y S indica si hay ingreso y N si no lo hay.29

(NSS) significa un flujo de caja como este:

Y así para los demás casos. Las probabilidades de que el resultado sea cero son:P(N)1 = ,3P(N)2 = ,3P(N)3 = ,3

NOTA: Se supone que los eventos son independientes entre sí. Esto significa que el resultado positivo de un año no influye en la probabilidad de que, en los años siguientes, el resultado sea también positivo. Esto en la realidad puede que no ocurra. Sin embargo, para efectos del análisis, se hará caso omiso de esta consideración.

Entonces, las probabilidades asociadas a cada resultado combinado son:

Estos resultados se denominarán puntos. Los eventos serán una combinación cualquiera de puntos. Así se puede pensar en el evento, “por lo menos un año con ingreso”, el cual incluiría los puntos m2, m3,

30

m4, m5, m6, m7 y m8, o en el evento “a lo sumo un año con ingreso cero”, el cual incluiría los puntos m4, m6, m7 y m8.

Si la probabilidad de que ocurra el ingreso es diferente a 70%, hay que introducir los valores adecuados en los cálculos.

La probabilidad de estos eventos será la suma de la probabilidad de los puntos. En el primer evento, la probabilidad será de:

0,063+0,063+0,147+0,063+0,147+0,147+0,343 = 0,973

En el segundo caso de:

0,147+0,147+0,147+0,343 = 0,784

Evidencia parcialTa. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o datos de muestras


31

TEMA 4

Objetivo de aprendizaje.4. Definir el concepto de probabilidad y relacionarlo con el de la frecuencia relativa.

Criterio de Aprendizaje.4.1. Diferenciar el concepto de probabilidad y relacionarlo con el de la frecuencia relativa.

Didáctica de enseñanza.Pa. 1 Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro.

Probabilidad condicionalGeneralmente hablando, la probabilidad condicional de un evento A dado otro evento B, denotada P(A|B) es la probabilidad de que el evento A ocurra cuando sabemos que el evento B ocurrió. Esta es razón por la cual se llama condicional a esta probabilidad. La probabilidad de que el evento A ocurra está condicionada por la ocurrencia de B. Esta información adicional sobre A se incluye en el cómputo de su probabilidad condicional cuando analizamos los resultados posibles que se pueden observar cuando sabemos que B ha ocurrido.

Probabilidad condicional como la razón de dos áreasEn algún punto de nuestras vidas, hemos jugado tirando dardos a un tablero. Supongamos que tenemos un tablero como el de al lado y tiramos un dardo. Usualmente, mientras más cerca del centro aterrice el dardo más puntos anotamos. Si sabemos que el dardo aterrizó en A, ¿cuán probable es que haya aterrizado en B?

Por simplicidad, supondremos que tenemos muy buena puntería y que el dardo siempre cae en el tablero S. Esto significa que la probabilidad de que el dardo aterrice en el tablero es 1. Suponemos además, que S, A, B, C se refieren a los discos completos y no tan sólo a la franja. Así S es un disco que contiene al disco A, el que a su vez incluye el disco B. Este último incluye el disco C.

Podemos relacionar la probabilidad de que un dardo aterrice en cualquier región directamente al área de la región. Les asignaremos probabilidades a las varias regiones en la tabla tomando la razón del área de la región al área del tablero. Esta asignación es razonable, ya que mientras más grande es la región, más probable debe ser que el dardo aterrice allí. Estamos considerando el área del tablero S como una unidad contra la cual comparar las otras áreas, además, si comparamos el área de S consigo misma obtendremos una razón de 1, por esto es razonable decir que el área de S es igual a su probabilidad, 1. Con esta suposición, el área de cada disco es igual a la probabilidad de que el dardo caiga en el disco.

32

Denotaremos el evento que el dardo aterrice en la región S, A, B o C por el nombre de la región. Supongamos que la razón del área de región A a S es 1/2, de la región B a S es 1/10 y de la región C a S es 1/60. Según la asignación de probabilidad que hicimos, tenemos que P(A) = 1/2, P (B) = 1/10, P (C) = 1/60 y P (S) = 1.

Ahora hacemos el siguiente experimento: igual que con el juego de colocar la cola al burro, nos vendamos los ojos y lanzamos el dardo. Un juez nos dice que aterrizó en la región A. Entonces preguntamos ¿cuál es la probabilidad de que haya aterrizado en B? Si no hacemos uso del hecho de que el dardo aterrizó en A, contestaremos la probabilidad buscada es 1/10. Pero sabemos que el dardo aterrizó en A, que B está contenido totalmente en A y que el área de B es una quinta parte del área de A, entonces la respuesta correcta es 1/5, estableciendo que P (B|A) = (1/10)/(1/2) = 1/5.

Esta expresión se justifica con el siguiente argumento. Como sabemos que el dardo ha aterrizado en A, el área de A ahora llega a ser una nueva unidad contra la cual medir otras áreas, esto explica el denominador. El numerador corresponde al área en común de las regiones A y B. Dado el hecho que el dardo aterrizó en A, la única manera en que el dardo puede aterrizar también en la región B es que haya aterrizado en ambas regiones. Ahora la región B está contenida en la región A, por lo cual A∩B= B y P (A∩B) = P (B).

Pregunta¿Cuál es la probabilidad que el dardo haya aterrizado en A si sabemos que aterrizó en B?

Como sabemos que B está contenido totalmente en A, vemos que si el dardo aterriza en B entonces tiene que haber aterrizado en A. Siguiendo este razonamiento tenemos:

P (A|B)= (área de A también en B)/ (área de B)= (área de B)/ (área de B)= 1.

PreguntaSi el dardo aterrizó fuera de B, ¿cuál es la probabilidad que haya aterrizado en C?

Un tablero general de dardosEl tablero de la derecha nos presenta una situación más general. En este caso ninguna región (excepto S) contiene totalmente cualquier otra región, pero los argumentos todavía son válidos. Supongamos que las áreas de S, A, B y C son como antes. Supongamos ahora que el área en la intersección de las regiones A y B es 1/ 30. Todavía podemos preguntar las mismas preguntas.

33

Para calcular P (B|A) debemos darnos cuenta de que B tiene un pedazo pequeño en común con la región A. Este pedazo tiene área igual a 1/ 30. Si sabemos que el dardo aterrizó en A, para que haya caído en B, debe haber aterrizado en esta pequeña región en común. La región A es nuestra unidad de comparación. Comparamos el área en la intersección de A y B con el área de A para obtener nuestra contestación. Así P (B|A) es igual a la proporción (1/ 30) / ( 1/2)= 1/ 15. Este resultado se puede interpretar como el número de veces que la región en común entre A y B cabe en la región A.

La respuesta a P (A|B) no es tan fácil de hallar como antes. Sabemos ahora que el dardo aterriza en la región B. Debemos hallar la proporción del área de la intersección de A y B al área de B. Ahora la región B es nuestra unidad y así P (A|B) es igual a (1/30) / (1/10)= 1/3.

Un ejercicio fácil de resolver es hallar P (A|C). Como A y C son disjuntos, si el dardo aterrizó en C sabemos que es imposible que haya aterrizado también en A, por esta razón la probabilidad buscada debe ser cero.

Una representación relacionadaOtra forma de representar la probabilidad condicional se puede ver en el siguiente ejemplo. Supongamos que tomamos una muestra al azar de 100 estudiantes y obtenemos los siguientes resultados:

15 mujeres reciben ayuda económica y trabajan45 mujeres reciben ayuda económica20 mujeres trabajan55 de los estudiantes son mujeres25 estudiantes reciben ayuda económica y trabajan60 estudiantes reciben ayuda económica40 estudiantes trabajan

Se puede traducir estos datos en proporciones o porcentajes y representar en un diagrama de Venn tal como a la derecha. El conjunto W representa todas las mujeres en la muestra, F el conjunto representa los estudiantes que reciben ayuda económica y J el conjunto de estudiantes en la muestra que trabajan.

34

Nos proponemos seleccionar al azar una persona de estos 100 estudiantes en la muestra. Entonces podemos hablar acerca de la probabilidad que la persona seleccionada es una mujer, por ejemplo. Sin temor a confundirnos, usaremos los nombres F, J y W para denotar el evento que la persona seleccionada recibe ayuda económica, trabaja o es una mujer, respectivamente.

Entonces P (W)= .30 + .05 + .05 + .15 = .55, por ejemplo. De este diagrama de Venn podemos contestar rápidamente muchas preguntas que a primera vista parecen ser muy complicados, tal como, ¿qué proporción de estudiantes son mujeres que no trabajan y reciben ayuda económica? Esta pregunta es equivalente a encontrar P (W y F y no J). La solución, .30 se encuentra en la intersección de los tres conjuntos W, no J, F.

La probabilidad condicional se ve en situaciones donde queremos saber, por ejemplo‚ qué proporción de estudiantes que trabajan son mujeres. Esto es equivalente a encontrar P (W | J). La proporción de estudiantes que trabajan es .40, la proporción de mujeres que trabajan es .20. De esta manera la proporción de mujeres de entre todos los estudiantes que trabajan‚ es .20/ .40= .50, es decir, la mitad de los estudiantes que trabajan son mujeres. Igual a las ideas desarrolladas previamente podemos escribir la solución como P (W | J ) = P (W y J)/ P (J) = .20/ .40 = .50.

El diagrama de Venn que representa los resultados obtenidos en la encuesta parece también un tablero de dardos. La probabilidad de que el dardo caiga en cualquiera de esas regiones está dada por la proporción de estudiantes representados en esa región.

Probabilidad condicional y el conteo de resultadosLanzamos dos dados balanceados, uno rojo y el otro verde. El espacio muestral de este experimento consta de 36 pares ordenados tal como en la tabla más abajo.

Dejemos que R y G denoten el valor observado en la cara del dado rojo y en el dado verde, respectivamente y X la suma de los valores observados, es decir, X = R + G. Si suponemos que los dados están balanceados, entonces los 36 resultados distintos del experimento son igualmente probables. Por la forma como se lleva a cabo el experimento, vemos que el valor observado en un dado no está relacionado con el valor en el otro dado, es decir. El valor obtenido en un dado es independiente del obtenido en el otro. De estas suposiciones tenemos que P (R = r) = P (G = g) = 1/ 6 y que P (R= r, G= g)= 1/ 36 para r, g= 1,2, ..., 6.

En esta situación muchas preguntas acerca de la probabilidad de eventos particulares se pueden reducir a contar el número de elementos en el conjunto apropiado.

35

Espacio muestral de los resultados al tirar dos dados

PreguntaEncontremos la probabilidad que el número de puntos en el dado rojo es menor o igual a 3: P(R 3).

Para encontrar esta probabilidad debemos contar el número de pares en la tabla para los cuales R ≤3. Vemos que hay 18 de estos pares de un total de 36 pares posibles así obtenemos P (R ≤3)= 18/ 36= 1/2.

Pregunta¿Cuál es la probabilidad que la suma X de los valores observados en los dos dados es menor de 6, es decir, P (X< 6)?

El número de pares donde observamos esta situación es 10, de un total de 36 pares posibles, por eso debemos tener P(X < 6) = P (X ≤5)= 10/ 36. Supongamos estás en tu casa y un amigo te invita a jugar un juego donde se lanzan dos dados, tal como Parchís. A ti te interesa que la suma de los puntos en los dados sea 9. Tiras los dados, pero no miras el resultado. Tu amigo te dice que la suma de los dados es mayor de 7. ¿Te dice algo este dato? ¿Cuáles son ahora tus oportunidades de haber obtenido 9? Si hubiera dicho que la suma era menor de siete sabrías de seguro que perdiste.

Necesitamos calcular P ( X= 9 | X> 7). Antes de tirar los dados, sabías que la probabilidad de ganar, P(X=9) era igual a 4/ 36. ¿Cambió esto? En la Tabla 2 están señalados todos los pares donde X > 7 y los pares donde X = 9.

Regiones donde X > 7 y X = 9

36

Como sabemos que X > 7 el resultado observado debe estar dentro del triángulo azul. Allí hay 15 pares distintos de los cuales cuatro son consistentes con X= 9, por esto P (X = 9| X> 7)= 4/ 15‚ esto significa que tus oportunidades de haber ganado han aumentado.

El resultado se puede obtener de la siguiente forma. La proporción de pares donde X > 7 es 15/ 36. La proporción de pares donde X > 7 y X = 9 es 4/ 36, siguiendo las ideas anteriores tenemos que P ( X = 9| X > 7) = (4/36) ¸ (15/ 36) = 4/ 15. Igual que antes esta representación se asemeja a un tablero de dardos y el resultado se obtiene al comparar el "área" de la región que representa X = 9 con el "área" de la región que representa X > 9. De igual manera, también se asemeja a un diagrama de Venn.

Considera la probabilidad de que en el dado Rojo se observe un tres si sabemos que la suma de los dados es 5, es decir, P (R = 3 | X= 5). De la Tabla 1 se puede ver que P (X = 5)= 4/ 36, P (R = 3)= 6/ 36 y P( X = 5 y R = 3) = 1/36. La suma X es igual a cinco sólo cuando se observa uno de los cuatro pares: (1,4), (2,3), (3,2), (4,1). De esos, sólo uno es compatible con que el dado rojo sea igual a 3, por esta razón, P (R = 3| X= 5)= 1/ 4. Este resultado implica que el evento {R = 3} afecta la probabilidad de que el evento {X = 5} ocurra. Antes de hacer el experimento, la probabilidad de observar {R=3} es 1/6, pero ahora sabemos que {X=5} ocurrió y por lo tanto la probabilidad de observar {R=3} es ahora 1/4.

Pregunta¿Qué hubiera pasado si el evento que condiciona hubiera sido X= 7?

De la tabla se puede ver que P (R = 3 | X = 7) = 1/6 = P (R = 3). Es decir, el saber que {X=7} ocurrió no nos ofrece información alguna sobre la probabilidad de que {R=3} ocurra.

Probabilidad condicional y árbolesOtra manera natural y útil de estudiar probabilidad condicional es por medio de una estructura de árbol. Esta forma de visualizar el experimento es particularmente pertinente cuando éste se ejecuta en etapas. Toma por ejemplo el experimento de seleccionar a la vez dos canicas al azar de una caja que contiene 2 rojas y 3 azules. Este experimento es equivalente al de seleccionar al azar una canica, y entonces, sin reemplazar la primera, seleccionar al azar otra canica. Este proceso se puede visualizar fácilmente por medio de un árbol.

En cada nodo del árbol representamos el número de canicas rojas y azules que quedan en la caja. Las ramas que emanan de cada nodo representan los dos resultados posibles que se pueden obtener cuando se selecciona una canica al azar: rojo o azul. Cada rama es rotulada por el resultado obtenido y por la probabilidad condicional de observar ese resultado. Los nodos al final representan los estados finales posibles que podemos obtener como resultado del experimento. Estos nodos finales se llaman hojas.

37

Diagrama de árbol que ilustra el experimento de seleccionar dos canicas de una caja

Pregunta¿Cuál es la probabilidad que la segunda canica seleccionada sea roja dado que la primera es azul?

Si la primera canica fue azul, ahora quedan en la caja dos canicas rojas y dos azules. De ahí seleccionamos otra canica. La probabilidad de que una canica seleccionada de esa caja sea roja es 2/4.

Para facilitar el trabajo denotamos el evento de que la primera canica seleccionada es roja por R1 y el evento de que la segunda sea roja por R2. Hacemos lo propio para las canicas azules. Esta representación es útil para encontrar probabilidades conjuntas y marginales.

Por ejemplo, la probabilidad que la primera canica sea roja y la segunda azul, denotada P (R1 y B2) es el producto de las probabilidades que rotulan el camino de la raíz del árbol y que son consistentes con los resultados R1 y B2. Entonces P (R1 y B2) = 2/5 x 3/4 = 6/20.

Si nos interesamos por la probabilidad marginal de que la segunda canica sea roja, P(R2), tenemos que darnos cuenta de que hay dos caminos posibles en que la segunda canica es roja. Estos dos caminos dependen del resultado que se observó cuando seleccionamos la primera canica, que pudo haber sido rojo o azul. Así observamos una canica roja en la segunda selección cuando cualquiera de los dos eventos conjuntos (B1 y R2) ó (R1 y R2) ocurren. Estos son eventos son disjuntos por lo cual P ( R2 ) = P (B1 y R2) + P (R1 y R2) = 6/20+ 2/20 = 8/20.

Los árboles son especialmente útiles para encontrar probabilidades condicionales tal como P( R1 | B2 ). Esta probabilidad se puede entender si pensamos en un experimento donde escogemos una canica al azar, sin mirarla, la escondemos y luego seleccionamos al azar otra canica. Si la segunda canica seleccionada es azul, ¿cuál es la probabilidad que la canica que escogimos primero era roja?

Una forma de contestar esta pregunta es usando la Regla de Bayes, que aún no hemos estudiado. Otra forma es la siguiente. Imaginemos que antes de comenzar el experimento quitamos una canica azul. Esa será la canica azul que escogeremos como segunda selección, la hemos reservado de antemano. Ahora, en esta caja imaginaria hay 2 canicas rojas y 2 azules, por esta razón la probabilidad P (R1 | B2) debe ser igual a (número de canicas rojas) / (número total de canicas) = 2/4.

Probabilidad condicional en generalEstos ejemplos motivan la definición matemática de probabilidad condicional de que un evento A ocurra cuando sabemos que el evento B ocurrió como:

PreguntaVerifica que la medida P( • | B) satisface los axiomas de probabilidad, es decir, si B es un evento fijo en el espacio muestral S, entonces P( • | B) es una medida de probabilidad.

Con la representación del árbol vimos como obtener la probabilidad conjunta de dos eventos A, B. Por ejemplo, vimos que para obtener la probabilidad de que la primera canica fuera roja y la segunda fuera azul, P(R1 y B2) multiplicamos P ( B2 | R1 ) por la cantidad P (R1) a lo largo de las ramas apropiadas

38

del árbol. Esta operación se justifica ahora por nuestra definición de probabilidad condicional. Si A, B son dos eventos cualquiera en un espacio muestral S, tenemos la regla de multiplicación.

Teorema 1 (Regla de multiplicación)Si A , B son dos eventos cualquiera en un espacio muestral S donde P(B) > 0, tenemos P(A y B) = P(A | B) P(B).

PruebaUsa la definición de probabilidad condicional.

Ejemplo 1Tienes los cuatro ases de la baraja en tus manos {A♠, A♣, A♥, A♦}. Sabemos que dos de esas barajas son rojas y las otras dos son de color negro. Sin mirar, un amigo selecciona una baraja primero luego de las restantes tres selecciona una segunda baraja. Queremos encontrar la probabilidad del evento que ambas barajas seleccionadas sean rojas, {A♥, A♦}. La única forma en que ambas barajas serán rojas es que la primera sea roja y dado que la primera fue roja, la segunda debe ser roja también. La probabilidad de que la primera sea roja es 2/4. Si la primera fue roja, la probabilidad de que la segunda sea roja es entonces 1/3. Por lo tanto P(ambas barajas son rojas)=2/4 ´ 1/3 = 2/12.

PreguntaEnumera el espacio muestral de este experimento. ¿Cuál representación sería más útil? Expresa el problema del Ejemplo 1 en forma de símbolos, usando la regla de multiplicación.

Ejemplo 2El almacén de la UT recibe 100 togas para su graduación. El fabricante había llamado a la escuela para anticiparle que entre esas 100 togas hay 10 que son de un tamaño equivocado, muy pequeñas para estudiantes de escuela superior. Seleccionamos dos togas al azar. ¿Cuál es la probabilidad de que ambas sean muy pequeñas?

Seguimos el mismo argumento de arriba para resolver este ejercicio. La probabilidad de que la primera seleccionada sea muy pequeña es 10/100. Una vez seleccionada la primera toga pequeña, seleccionamos la siguiente toga de las restantes 99, de las cuales ahora 9 son muy pequeñas. Así, la probabilidad de que ambas sean muy pequeñas es 10/100 ´ 9/99.

¿Qué tal si seleccionamos 3 togas? ¿Cuál es la probabilidad de que las tres sean muy pequeñas? Podemos representar este experimento con un árbol que tiene 8 ramas (¿cómo?). Esto nos permite extender el argumento de antes. En este caso la probabilidad deseada es 10/100 ´ 9/99 ´ 8/98.

Esta situación facilita el generalizar la regla de multiplicación. Para facilitar la discusión representemos por T1 el evento de que la primera toga sea muy pequeña, por T2 el evento de que la segunda sea muy pequeña y por T3 el evento de que la tercera toga sea muy pequeña. Vemos que 10/100 es la probabilidad de que la primera toga sea pequeña, es decir P( T1 ). El valor 9/99 representa la probabilidad de que la segunda sea pequeña si la primera fue pequeña, P( T2 | T1 ). El valor 8/98 es un poco más complicado. Para obtener la tercera toga pequeña en sucesión, debimos haber seleccionado la primera y la segunda togas pequeñas, así, 8/98 es el resultado de calcular P( T3 | T1 y T2 ).

La probabilidad de que las tres togas sean pequeñas es entonces P( T1 y T2 y T3 ) = P( T1 ) P( T2 | T1) P( T3 | T1 y T2 ). Este resultado se puede escribir ahora como un teorema.

39

Teorema 2Sean A, B, C eventos cualquiera en un espacio muestral S tal que P(A) > 0 y P(A∩B) > 0. Entonces P( A∩B∩C ) = P(A) P(A | B) P(C | A∩B).

Prueba.P( A∩B∩C ) = P( (A∩B)∩C ) = P( C | A∩B) P(A∩B), usando la regla de multiplicación para los eventos C y A∩B. Usamos nuevamente esa regla para calcular P( A∩B ) = P(A | B) P(B) y sustituimos arriba para obtener el resultado.

PreguntaUsa inducción matemática para generalizar esta regla para n eventos.

40

Práctica 1Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro.

Instrucciones: resuelve correctamente los ejercicios que se enlistan.Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios.

1. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. Selecciona una canica al azar y anota su color.

a. Representa el experimento usando un árbol.b. Enumera el espacio muestral.c. Usa la notación y operaciones de conjuntos para representar el evento de que la canica seleccionada:

i. sea negra.ii. sea blanca.iii. no sea negraiv. sea blanca o negrav. sea negra y blanca.

d. Ilustra los eventos de arriba en el árbol que representa el experimento y en un diagrama de Venn.e. Encuentra la probabilidad de que la canica seleccionada:


2. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. Selecciona una canica al azar, anota su color y devuélvela a la caja. Selecciona otra canica y anota su color.

a. Representa el experimento usando un árbol.b. Enumera el espacio muestral.c. Encuentra la probabilidad de que la primera canica seleccionada:


d. Usa la notación y operaciones de conjuntos para representar el evento de que:i. ambas canicas seleccionadas sean negras.

ii. una de las canicas seleccionadas sea blanca.iii. ninguna canica sea blanca.iv. la segunda canica sea blanca si la primera fue negra.v. la primera canica sea blanca si la segunda no fue blanca.vi. la segunda canica es blanca.

e. Encuentra la probabilidad de que:i. ambas canicas seleccionadas sean negras.ii. una de las canicas selecionadas sea blanca.iii. ninguna canica sea blanca.iv. la primera canica es blanca y la segunda es negra,

41

v. la segunda canica sea blanca si la primera fue negra.vi. la primera canica sea blanca si la segunda no fue blanca.

f. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda canica sea blanca? Explica.g. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente excluyentes? Explica.

3. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. Selecciona una canica al azar, anota su color, esta vez no la devuelvas a la caja. Selecciona otra canica y anota su color.

a. Enumera el espacio muestral.b. Encuentra la probabilidad de que:

i. ambas canicas seleccionadas sean negras.ii. una de las canicas seleccionadas sea blanca.iii. ninguna canica sea blanca.iv. la primera canica no es ni blanca ni negra.v. la primera canica es blanca y la segunda es negra.vi. la segunda canica sea blanca si la primera fue negra.vii. la primera canica sea blanca si la segunda no fue blanca.viii. la segunda canica es blanca.

c. ¿En qué se distingue este experimento del efectuado en el problema número 2?d. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda canica sea blanca? Explica.e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente excluyentes? Explica.

4. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. Selecciona una canica al azar, anota su color, devuélvela a la caja y añade a la caja dos canicas del mismo color de la canica seleccionada. Selecciona otra canica y anota su color.

a. Representa el experimento usando un árbol.b. Enumera el espacio muestral.c. Encuentra la probabilidad de que:

i. ambas canicas seleccionadas sean negras.ii. una de las canicas seleccionadas sea blanca.iii. ninguna canica sea blanca.iv. la primera canica no es ni blanca ni negra.

42

v. la primera canica es blanca y la segunda es negra.vi. la segunda canica sea blanca si la primera fue negra.vii. la primera canica sea blanca si la segunda no fue blanca.viii. la segunda canica sea negra.

d. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda canica sea blanca? Explica.e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente excluyentes? Explica.

5. Considera una caja con seis canicas. Dos de las canicas son blancas, una es roja y las restantes son negras. Selecciona una canica al azar, anota su color, devuélvela a la caja y añade a la caja dos canicas del mismo color de la canica seleccionada. Selecciona otra canica y anota su color.

a. Representa el experimento usando un árbol.b. Enumera el espacio muestral.c. Encuentra la probabilidad de que:

i. ambas canicas seleccionadas sean rojas.ii. una de las canicas seleccionadas sea blanca.iii. ninguna canica sea blanca.iv. la primera canica no es ni blanca ni negra.v. la primera canica es blanca y la segunda es roja.vi. la segunda canica sea roja si la primera fue roja.vii. la primera canica sea negra si la segunda no fue blanca.viii. las dos canicas sean de colores distintos.ix. las dos canicas sean del mismo color.x. la segunda canica sea negra.

d. ¿Es el evento de que la primera canica sea roja independiente del evento de que la segunda canica sea blanca? ¿Son estos eventos mutuamente excluyentes? Explica.e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente excluyentes? Explica.

6. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. A la misma vez, selecciona dos canicas al azar y anota sus colores.

a. Representa el experimento usando un árbol.b. Enumera el espacio muestral.c. Usa la notación y operaciones de conjuntos para representar el evento de que las canicas seleccionadas:

i. ambas sean negras.ii. ninguna sea negra.iii. sean de colores distintos.

d. Ilustra los eventos de arriba en el árbol que representa el experimento.e. Encuentra la probabilidad de que las canicas seleccionadas:

i. ambas sean negras.ii. ninguna sea blanca.

43

iii. sean de colores distintos.f. ¿Tiene alguna relación este problema con el número 3 arriba? Explica.

Hacemos un experimento con dos cajas. La caja A tiene siete canicas. En esta caja, dos de las canicas son blancas, tres son rojas y dos son negras. La caja B tiene seis canicas. Cuatro de las canicas en B son rojas y dos son negras. Se tira un dado para decidir de cuál caja se selecciona una canica al azar. Si se observa el evento {1,2,3,4} se selecciona una canica de la caja A. En el caso de observar el evento {5,6} se selecciona al azar una canica de la caja B.

a. Representa el experimento usando un árbol.b. Enumera el espacio muestral.c. Usa la notación y operaciones de conjuntos para representar el evento de que la canica seleccionada:

i. sea negra.ii. no sea roja.iii. sea negra ó blanca.iv. provenga de la caja Av. sea roja y venga de la caja B.vi. sea blanca y venga de la caja B.

d. Ilustra los eventos de arriba en el árbol que representa el experimento.e. Encuentra la probabilidad de que la canica seleccionada:

i. sea negra.ii. no sea roja.iii. sea negra ó blanca.iv. provenga de la caja Av. sea roja y venga de la caja B.vi. sea blanca y venga de la caja A.vii. sea negra dado que viene de la caja B.viii. sea blanca dado que viene de la caja B.ix. haya provenido de la caja B dado que es blanca.x. haya provenido de la caja A dado que es roja.

f. ¿Puedes generalizar tus resultados en ix y x? Explica.

44

TEMA 5

Objetivo de aprendizaje.5. Definir el Teorema de Bayes.

Criterio de Aprendizaje.5.1. Utilizar el teorema de Bayes en problemas del ámbito profesional que involucren probabilidades subjetivas.

Didáctica de enseñanza.Pa. 2 Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren probabilidades subjetivas y aplicar el Teorema de Bayes en su solución

Un problema que nos sirve de introducción

En el distrito universitario de Jauja los estudiantes se distribuyen entre las tres carreras que pueden cursarse del siguiente modo: el 20% estudian arquitectura, el 35% medicina y el 45% economía. El porcentaje de alumnos que finalizan sus estudios en cada caso es del 5%, 12% y del 18%. Elegido un alumno al azar determinar la probabilidad de que haya acabado los estudios.

Como Sea T el suceso "finalizar los estudios". Como

E = A1 o A2 o A3 T = (T y E) = T y (A1 o A2 o A3) =

= (T y A1) o (T y A2) o (T y A3) Resulta

p(T) = p(T y A1) + p(T y A2) + (T y A3) Y por tanto

p(T) = = p(A1) × p(T/A1) + + p(A2) × p(T/A2) + + p(A3) × p(T/A3)

Vemos todo esto mediante un diagrama de flujo y calculamos la probabilidad de que un alumno elegido al azar haya terminado los estudios.

Si A1, A2, y A3 son, respectivamente, los sucesos "estudiar arquitectura", "estudiar medicina" y "estudiar economía" resulta

p(Ai) = 1

Y los sucesos A1, A2, y A3 son incompatibles (no existen estudiantes que cursen dos carreras).Además

45

E = A1 o A2 o A3

En estas condiciones podemos aplicar el razonamiento de la columna de la izquierda.

A partir del razonamiento anterior podemos enunciar el siguiente teorema que es conocido como teorema de la probabilidad total

Si los sucesos A1, A2, A3 ... An son una partición ( ) del espacio

Muestral E y T un suceso de S, entonces

Otro ejemplo y una pregunta

46

La fábrica de enlatados PI S.A. produce 5000 envases diarios. La máquina A produce 3000 de estos envases, de los que el 2% son defectuosos y la máquina B produce los 2000 restantes de los que se sabe que el 4% son defectuosos. Determinar la probabilidad de que un envase elegido al azar sea defectuoso.

Si D es el suceso "seleccionar un envase defectuoso" y (no D) = "seleccionar un envase no defectuoso", el diagrama siguiente nos muestra el camino

Aplicando el teorema anterior resulta: p(D) = p(A y D) + p(B y D) = p(A) × p(D/A) + p(B) × p(D/B) = 0,028

Y ahora la pregunta ¿Si el envase seleccionado es defectuoso, qué probabilidad hay de que proceda de la máquina A? ¿Y de la B?

Es decir, sabemos que la botella seleccionada es defectuosa

La respuesta a dicha cuestión viene dada por la denominada fórmula de Bayes

Probabilidad de que provenga de la máquina ACalculamos la probabilidad p(A/D) es decir, la probabilidad de que provenga de la máquina A en el supuesto que el envase es defectuoso:

Probabilidad de que provenga de la máquina B

Calculamos la probabilidad p(B/D) es decir, la probabilidad de que provenga de la máquina B en el supuesto que el envase es defectuoso:

Las expresiones

47

Son las de la "fórmula de Bayes" para cada uno de las preguntas formuladas. Estas expresiones pueden generalizarse fácilmente para un conjunto finito de sucesos con las condiciones indicadas.

Podemos hacernos ahora varias preguntas que son fáciles de contestar. Por ejemplo:

¿Si el envase no es defectuoso, qué probabilidad hay de que provenga de la máquina A?. ¿Y de la B?.

O bien, teniendo en cuenta el primer ejercicio, ¿si un alumno seleccionado ha finalizado la carrera, qué probabilidad hay que haya estudiado arquitectura?. ¿Y medicina?

Y además ya estamos en condiciones de resolver el problema enunciado en la portada.

Thomas Bayes nació en Londres, Inglaterra. Su padre fue ministro presbiteriano. Posiblemente De Moivre fue su maestro particular, pues se sabe que por ese entonces ejercía como profesor en Londres.

Bayes fue ordenado ministro presbiteriano y muere en 1761. Sus restos descansan en el cementerio londinense de Bunhill Fields. La traducción de la inscripción en su tumba es

Reverendo Thomas Bayes.

Hijo de los conocidos Joshua y Ann Bayes. 7 de abril de 1761. En reconocimiento al importante trabajo que realizó Thomas Bayes en probabilidad. Su tumba fue restaurada en 1969 con donativos de estadísticos de todo el mundo.

Miembro de la Royal Society desde 1742, Bayes fue uno de los primeros en utilizar la probabilidad inductivamente y establecer una base matemática para la inferencia probabilística. Publicó los trabajos: Divine Providence and Government Is the Happiness of His Creatures (1731) An Introduction to the

Doctrine of Fluxions, and a Defence of The Analyst (1736)

En 1763, dos años después de su muerte, se publica Essay Towards Solving a Problem in the Doctrine of Chances, en el que trataba el problema de las causas a través de los efectos observados, y donde se enuncia el teorema que lleva su nombre. El trabajo fue entregado a la Royal Society por Richard Price y es la base de la técnica bayesiana.

48

En una urna hay 5 bolas, 3 azules y 2 verdes. Se saca una bola de la urna y sin mirarla, se guarda. A continuación se vuelve a sacar otra bola que es verde. ¿Cuál es la probabilidad de que la primera haya sido verde?. Y si la segunda hubiera sido azul, ¿cuál es la probabilidad de que la primera sea verde?. ¿Y azul?.

Un diagrama nos aclara la situación

En donde (A1 y A2), es el suceso "sacar azul la primera bola y azul la segunda" y análogamente los restantes (A1 y V2), (V1 y A2), (V1 y V2).

Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido verde) Aplicamos el teorema de Bayes y resulta:

Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido azul) Aplicamos el teorema de Bayes y resulta:

Probabilidad de que la primera haya sido azul (en el supuesto que la segunda ha sido azul)Aplicamos el teorema de Bayes y resulta:

49

Práctica 2

Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren probabilidades subjetivas y aplicar el Teorema de Bayes en su solución


1) Los alumnos de la Universidad Tecnológica, proceden de 3 localidades A, B y C, siendo un 20% de A, un 30% de B y el resto de C. El 80% de los alumnos de A cursa 1º cuatrimestre y el resto 4º. El 50% de los alumnos de B cursa 1º cuatrimestre y el resto 4º. El 60% de los alumnos de C cursa 1º cuatrimestre y el resto 4º.

(a) Seleccionado, al azar, un alumno la Universidad Tecnológica, ¿cuál es la probabilidad de que sea de 4º?

(b) Si elegimos, al azar, un alumno la Universidad Tecnológica y éste es un alumno de 1º, ¿cuál es la probabilidad de que proceda de la localidad B?

2) Según la estadística de los resultados en las Prueba de Acceso en una provincia andaluza, en septiembre de 2001, el número de alumnas presentadas es de 840, de las que han aprobado un 70%, mientras que el número de alumnos presentados es 668, habiendo aprobado un 75% de estos.

(a) Elegida, al azar, una persona presentada a las Pruebas, ¿cuál es la probabilidad de que haya aprobado?

(b) Sabiendo que una persona ha aprobado, ¿cuál es la probabilidad de que sea varón?

50

CAPITULO 2

ORGANIZACIÓN Y PRESENTACIÓN DE

DATOS

INTRODUCCIÓN

El propósito de la presente unidad es que el alumno adquiera la habilidad para ordenar y tabular datos, construyendo con ellos diversas gráficas que le permitirán calcular sus medidas de tendencia central y dispersión, así como utilizar los fundamentos matemáticos de probabilidad para resolver algunos problemas de Procesos Agroindustriales que se presentan en las empresas.


1- . Reconocer los métodos tabulares de presentación de datos.1.1. . Ilustrar y describir tablas de frecuencias relativas y absolutas.1.2. . Ilustrar y describir tablas para representar dos conjuntos de datos.

525252


1.1.1. Utilizar las tablas de frecuencias relativas y absolutas, de datos.1.2.1. Utilizar tablas para representar dos conjuntos de datos.

OBJETIVO Y CRITERIOS DE APRENDIZAJE2. Diferenciar los métodos gráficos empleados para organizar datos2.1. Ilustrar los métodos gráficos empleados para organizar datos.

6060


2.1.1 Utilizar métodos gráficos empleados para organizar datos.

DEMOSTRACIÓN DE HABILIDADES FINALESTa. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así como también tablas para representar dos conjuntos de datos.Pa. 3 Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de frecuencias.

59

70

51

TEMA 1

Objetivo de aprendizaje.1. Reconocer los métodos tabulares de presentación de datos.

Criterio de Aprendizaje.1.1. Ilustrar y describir tablas de frecuencias relativas y absolutas.1.2. Ilustrar y describir tablas para representar dos conjuntos de datos.

Didáctica de enseñanza.Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así como también tablas para representar dos conjuntos de datos.

Consideremos una población estadística de n individuos, descrita según un carácter o variable C cuyas

modalidades han sido agrupadas en un número k de clases, que denotamos mediante .

Para cada una de las clases ci, , introducimos las siguientes magnitudes:

Frecuencia absolutaDe la clase ci es el número ni, de observaciones que presentan una modalidad perteneciente a esa clase.

Frecuencia relativa De la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el número total de observaciones, es decir

Obsérvese que fi es el tanto por uno de observaciones que están en la clase ci. Multiplicado por 100% representa el porcentaje de la población que comprende esa clase.

Frecuencia absoluta acumulada Ni, se calcula sobre variables cuantitativas o cuasicuantitativas, y es el número de elementos de la población cuya modalidad es inferior o equivalente a la modalidad ci:

Frecuencia relativa acumulada Fi, se calcula sobre variables cuantitativas o cuasicuantitativas, siendo el tanto por uno de los elementos de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir,

Como todas las modalidades son exhaustivas e incompatibles ha de ocurrir que

52

O lo que es lo mismo,

Frecuencia absoluta (ni): Número de elementos que presentan la clase xi.

Frecuencia relativa: .

Frecuencia absoluta acumulada: .

Frecuencia relativa acumulada:

Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias correspondientes a cada una de ellas. Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general es la siguiente:

Modali. Frec. Abs. Frec. Rel. Frec. Abs. Acumu. Frec. Rel. Acumu.

C ni fi Ni Fi

c1 n1 N1 = n1

... ... ... ... ...

cj nj

... ... ... ... ...

ck nk Nk = n Fk = 1

n 1

Ejemplo Calcular los datos que faltan en la siguiente tabla:

li-1 -- li ni fi Ni

53

0 -- 10 60 f1 60

10 -- 20 n2 0,4 N2

20 -- 30 30 f3 170

30 -- 100 n4 0,1 N4

100 -- 200 n5 f5 200

n Solución: Sabemos que la última frecuencia acumulada es igual al total de observaciones, luego n=200.

Como N3=170 y n3=30, entonces N2=N3-n3=170-30=140.

Además al ser n1=60, tenemos que n2=N2-n1=140-60=80.

Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia relativa correspondiente:

Así: N4=n4+N3=20+170 =190.

Este último cálculo nos permite obtener n5=N5-N4=200-190=10.

Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:

Escribimos entonces la tabla completa: li-1 -- li ni fi Ni

0 -- 10 60 0,3 60

10 -- 20 80 0,4 140

20 -- 30 30 0,15 170

30 -- 100 20 0,1 190

100 -- 200 10 0,05 200

200

54

Elección de las clases En cuanto a la elección de las clases, deben seguirse los siguientes criterios en función del tipo de variable que estudiemos:

Cuando se trate de variables cualitativas o cuasicuantitativas, las clases ci serán de tipo nominal; En el caso de variables cuantitativas, existen dos posibilidades:

o Si la variable es discreta, las clases serán valores numéricos ; o Si la variable es continua las clases vendrán definidas mediante lo que denominamos intervalos. En este caso, las modalidades que contiene una clase son todos los valores numéricos posibles contenidos en el intervalo, el cual viene normalmente definido de la forma

O bien

En estos casos llamaremos amplitud del intervalo a las cantidades ai = li-li-1

Y marca de clase ci, a un punto representativo del intervalo. Si éste es acotado, tomamos como marca de clase al punto más representativo, es decir al punto medio del intervalo,

La marca de clase no es más que una forma abreviada de representar un intervalo mediante uno de sus puntos. Por ello hemos tomado como representante, el punto medio del mismo. Esto está plenamente justificado si recordamos que cuando se mide una variable continua como el peso, la cantidad con cierto número de decimales que expresa esta medición, no es el valor exacto de la variable, sino una medida que contiene cierto margen de error, y por tanto representa a todo un intervalo del cual ella es el centro.

En el caso de variables continuas, la forma de la tabla estadística es la siguiente:

Interv. M. clase Frec. Abs. Frec. Rel. Frec. Abs. Acum. Frec. Rel. Acum.

C ni fi Ni Fi

l0 -- l1 c1 n1 N1 = n1 F1 = f1

... ... ... ... ... ...

lj-1 -- lj cj nj Nj= Nj-1+nj Fj = Fj-1 + fj

... ... ... ... ... ...

lk-1 -- lk ck nk Nk=n Fk =1

n 1

55

Elección de intervalos para variables continuas A la hora de seleccionar los intervalos para las variables continuas, se plantean varios problemas como son el número de intervalos a elegir y sus tamaños respectivos. La notación más común que usaremos para un intervalo sea

El primer intervalo, l0 -- l1, podemos a cerrarlo en el extremo inferior para no excluir la observación más pequeña, l0

Éste es un convenio que tomaremos en las páginas que siguen. El considerar los intervalos por el lado izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que expondremos.

El número de intervalos, k, a utilizar no está determinado de forma fija y por tanto tomaremos un k que nos permita trabajar cómodamente y ver bien la estructura de los datos; Como referencia nosotros tomaremos una de los siguientes valores aproximados:

Por ejemplo si el número de observaciones que tenemos es n=100, un buen criterio es agrupar las

observaciones en intervalos. Sin embargo si tenemos n=1.000.000, será mas razonable

elegir intervalos, que .

La amplitud de cada intervalo ai = li -li-1

Suele tomarse constante, considerando la observación más pequeña y más grande de la población

(respectivamente y ) para calcular la amplitud total, A, de la población

A= lk - l0

de forma que la amplitud de cada intervalo sea:

Así la división en intervalos podría hacerse tomando:

56

Observación Podría ocurrir que la cantidad a fuese un número muy desagradable a la hora de escribir los intervalos (ej. a=10,325467). En este caso, es recomendable variar simétricamente los extremos,

, de forma que se tenga que a es un número más simple (ej. a=10).

Recorrido:

Amplitud: ai= li - li-1

Marca de clase:

Frecuencias rectificadas: ;

Ejemplo Sobre un grupo de n=21 personas se realizan las siguientes observaciones de sus pesos, medidos en kilogramos:

58 42 51 54 40 39 49

56 58 57 59 63 58 66

70 72 71 69 70 68 64

Agrupar los datos en una tabla estadística.

Solución: En primer lugar hay que observar que si denominamos X a la variable ``peso de cada persona'' esta es una variable de tipo cuantitativa y continua. Por tanto a la hora de ser ordenados los resultados en una tabla estadística, esto se ha de hacer agrupándolos en intervalos de longitud conveniente. Esto nos lleva a perder cierto grado de precisión. Para que la perdida de información no sea muy relevante seguimos

el criterio de utilizar intervalos (no son demasiadas las observaciones). En este punto podemos tomar bien k=4 o bien k=5. Arbitrariamente se elige una de estas dos posibilidades. Por ejemplo, vamos a tomar k=5.

Lo siguiente es determinar la longitud de cada intervalo, ai . Lo más cómodo es tomar la misma longitud en todos los intervalos, ai=a (aunque esto no tiene por qué ser necesariamente así), donde

57

Entonces tomaremos k=5 intervalos de longitud a=6,6comenzando por l0=xmin=39 y terminando en l5=33:

Intervalos M. clase f.a. f.r. f.a.a. f.r.a.

li-1 -- li ci ni fi Ni Fi

i=1 39 -- 45,6 42,3 3 0,1428 3 0,1428

i=2 45,6 -- 52,2 48,9 2 0,0952 5 0,2381

i=3 52,2 -- 58,8 55,5 6 0,2857 11 0,5238

i=4 58,8 -- 65,4 62,1 3 0,1428 14 0,6667

i=5 65,4 -- 72 68,7 7 0,3333 21

21

Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con cantidades más simples a la hora de construir los intervalos, es la siguiente. Como la regla para elegir l0 y l5 no es muy estricta podemos hacer la siguiente elección:

ya que así la tabla estadística no contiene decimales en la expresión de los intervalos, y el exceso d, cometido al ampliar el rango de las observaciones desde A hasta A', se reparte del mismo modo a los lados de las observaciones menores y mayores:

Intervalos M. clase f.a. f.r. f.a.a. f.r.a.

li-1 -- li ci ni fi Ni Fi

i=1 38 -- 45 41,5 3 0,1428 3 0,1428

i=2 45 -- 52 48,5 2 0,0952 5 0,2381

i=3 52 -- 59 55,5 7 0,3333 12 0,5714

i=4 59 -- 66 62,5 3 0,1428 15 0,7143

i=5 66 -- 73 69,5 6 0,2857 21

21

58

Evidencia parcialTa. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así como también tablas para representar dos conjuntos de datos.


59

TEMA 2

Objetivo de aprendizaje.2. Diferenciar los métodos gráficos empleados para organizar datos.

Criterio de Aprendizaje.2.1. Ilustrar los métodos gráficos empleados para organizar datos.

Didáctica de enseñanza.Pa. 3 Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de frecuencias.

Gráficos para variables cualitativas

Los gráficos más usuales para representar variables de tipo nominal son los siguientes:

Diagramas de barras: En la siguiendo la figura, representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades, como las mostradas en la figura posterior. Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas.

Figura: Diagrama de barras para una variable cualitativa.

Figura: Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha de tener en cuenta que la altura de cada barra es proporcional al número de observaciones (frecuencias relativas).

60

Diagramas de sectores Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa .

Figura: Diagrama de sectores.

El arco de cada porción se calcula usando la regla de tres:

Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama

semicircular, al igual que en la figura anterior. Sean los tamaños respectivos de las 2 poblaciones. La población más pequeña se representa con un semicírculo de radio r1y la mayor con otro de radio r2. La relación existente entre los radios, es la que se obtiene de suponer que la relación entre las áreas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es decir:

61

http://ftp.medprev.uma.es/libro/node9.htm#fig01-04

Figura: Diagrama de sectores para comparar dos poblaciones

Pictogramas Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. Estos gráficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la siguiente figura.

Figura: Pictograma. Las áreas son proporcionales a las frecuencias.

El escalamiento de los dibujos debe ser tal que el área de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. Este tipo de gráficos suele usarse en los medios de comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una explicación compleja.

62

Gráficos para variables cuantitativas

Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:

Diagramas diferenciales: Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada.

Diagramas integrales: Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.

Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben.

Gráficos para variables discretas Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente están representados en la figura del ejercicio siguiente.

Ejemplo Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X, obteniéndose los siguientes resultados:

Representar gráficamente el resultado. Solución: En primer lugar observamos que la variable X es cuantitativa discreta, presentando las modalidades:

Ordenamos a continuación los datos en una tabla estadística, y se representa la misma en la figura

Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama integral (creciente) contabiliza el número de observaciones de la variable inferiores o iguales a cada punto del eje de abcisas.

63

xi ni fi Ni Fi

0 1 1/8 1 1/8

1 3 3/8 4 4/8

2 3 3/8 7 7/8

3 1 1/8 8 8/8

n=8 1

Ejemplo Clasificadas 12 familias por su número de hijos se obtuvo:

Número de hijos (xi) 1 2 3 4

Frecuencias (ni) 1 3 5 3

Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama acumulativo creciente.

Solución: En primer lugar, escribimos la tabla de frecuencias en el modo habitual: Variable F. Absolutas F. Relativas F. Acumuladas

xi ni fi Ni

1 1 0,083 1

2 3 0,250 4

3 5 0,416 9

4 3 0,250 12

12 1

64

Con las columnas relativas a xi y ni realizamos el diagrama de barras para frecuencias absolutas, lo que se muestra en la figura siguiente. Como puede verse es idéntico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la información procedente de las columnas xi y Ni.

Figura: Diagramas de frecuencias para una variable discreta

Gráficos para variables continuas

Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.

Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.

El polígono de frecuencias se construye fácilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante líneas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase. Obsérvese que de este modo, el polígono de frecuencias tiene en común con el histograma el que las áreas de las gráficas sobre un intervalo son idénticas. Veanse ambas gráficas diferenciales representadas en la parte superior de la figura siguiente.

65


El diagrama integral para una variable continua se denomina también polígono de frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias absolutas es una primitiva del histograma. Véase la parte inferior de la figura siguiente, en la que se representa a modo de ilustración los diagramas correspondientes a la variable cuantitativa continua expresada en la tabla siguiente:

Intervalos ci ni Ni

0 -- 2 1 2 2

2 -- 4 3 1 3

4 -- 6 5 4 7

6 -- 8 7 3 10

8 - 10 9 2 12

12

Figura: Diagramas diferenciales e integrales para una variable continua.

66


Ejemplo La siguiente distribución se refiere a la duración en horas (completas) de un lote de 500 tubos:

Duración en horas Número de tubos

300 -- 500 50

500 -- 700 150

700 -- 1.100 275

más de 1.100 25

Total 500

Representar el histograma de frecuencias relativas y el polígono de frecuencias. Trazar la curva de frecuencias relativas acumuladas. Determinar el número mínimo de tubos que tienen una duración inferior a 900 horas.

Solución: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero al tener un rango tan amplio de valores resulta más conveniente agruparla en intervalos, como si de una variable continua se tratase. La consecuencia es una ligera perdida de precisión.

El último intervalo está abierto por el límite superior. Dado que en él hay 25 observaciones puede ser conveniente cerrarlo con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen una amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300 horas.

Antes de realizar el histograma conviene hacer una observación importante. El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura, pero en este caso el tercer intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área en un rectángulo de base doble (lo que reduce su altura a la mitad).

Así será conveniente añadir a la habitual tabla de frecuencias una columna que represente a las amplitudes ai de cada intervalo, y otra de frecuencias relativas rectificadas, fi', para representar la altura del histograma. Los gráficos requeridos se representan en las figuras siguientes.

Intervalos ai ni fi fi' Fi

300 -- 500 200 50 0,10 0,10 0,10

500 -- 700 200 150 0,30 0,30 0,40

700 -- 1.100 400 275 0,55 0,275 0,95

1.100 -- 1.300 200 25 0,05 0,05 1,00

n=500

67

Figura: Histograma. Obsérvese que la altura del histograma en cada intervalo es fi' que coincide en

todos con fisalvo en el intervalo 700 -- 1.100 en el que ya que la amplitud de ese intervalo es doble a la de los demás.

Figura: Diagrama acumulativo de frecuencias relativas

Por otro lado, mirando la figura anterior se ve que sumando frecuencias relativas, hasta las 900 horas de duración hay 0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.

Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al valor 900 en el diagrama de frecuencias acumuladas.

Como en total son 500 tubos, el número de tubos con una duración igual o menor que 900 horas es

, redondeando, 338 tubos.

Tabla: Principales diagramas según el tipo de variable.68


Tipo de variable Diagrama

V. Cualitativa Barras, sectores, pictogramas

V. Discreta Diferencial (barras)

Integral (en escalera)

V. Continua Diferencial (histograma, polígono de frecuencias)

Integral (diagramas acumulados)

69

Práctica 3Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de frecuencias.


A) En el siguiente conjunto de datos, se proporcionan los diámetros de melocotones (Prunus persica L. Batsch.) en centímetros

4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.

1. Construir una distribución de frecuencia, de diámetros.

2. Encontrar las frecuencias relativas.

3. Encontrar las frecuencias acumuladas.

4. Encontrar las frecuencias relativas acumuladas.

5. Dibujar un histograma con los datos.

6. ¿Por qué se ha utilizado un histograma para representar estos datos, en lugar de una gráfica de barras?

B) Una empresa maltera recibe mensualmente 50 lotes de cebada, los cuales se les mide su peso hectolítrico (lb/bu), y se les clasifica según la siguiente tabla:

Estado Rango de aceptabilidad (lb/bu)Buen estado 54 - 56Aceptable 51 - 53Aceptable con restricciones 48 - 50Rechazo Todo aquel fuera de los tres rangos anteriores

Los datos obtenidos son los siguientes:

55.8, 48, 54, 50, 51, 50, 56, 58, 59, 49, 49.9, 55, 58, 60, 45, 58, 59, 52, 54, 56, 48, 49, 56, 51, 52, 48, 59, 53, 51, 50, 58, 56, 54, 57, 56, 52, 49, 46, 56, 45, 49, 58, 59, 52, 56, 54, 52, 57, 49, 56

1. Construir una distribución de frecuencia.

2. Encontrar las frecuencias relativas.

3. Encontrar las frecuencias acumuladas.

4. Encontrar las frecuencias relativas acumuladas.

70

5. Elige y elabora un gráfico con los datos, que ayuden a interpretar los el conjunto de datos.

6.- ¿Cuáles son las ventajas de realizar gráficos de un conjunto de datos?

71

CAPITULO 3

MEDIDAS DESCRIPTIVAS

INTRODUCCIÓN

En este capítulo se abordarán las medidas de tendencia central, que se conocen como medidas de posición, se refieren al punto medio de una distribución. Generalmente el objetivo principal de las medidas de tendencia central es describir las características típicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque la acumulación más alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central más comunes son: La media aritmética (comúnmente conocida como media o promedio); la mediana: la cual es el puntaje que es ubica en el centro de una distribución; la moda (que es el puntaje que se presenta con mayor frecuencia en una distribución); entre otras.


1. Definir y explicar los conceptos y fórmulas de la media aritmética, mediana y moda.1.1. Practicar y analizar la media aritmética, mediana y moda de un conjunto de datos.

74

74


1.1.1. Calcular y obtener la media aritmética, mediana y moda de un conjunto de datos.

OBJETIVO Y CRITERIOS DE APRENDIZAJE2. Definir y explicar las fórmulas y conceptos de amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación.2.1. Practicar y analizar amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación de una muestra de datos y de una tabla de frecuencias.

79

79

2.1.1. Calcular y obtener de una muestra de datos y de una tabla de frecuencias: amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación.

OBJETIVO Y CRITERIOS DE APRENDIZAJE3. Enunciar las ventajas y desventajas de las medidas de tendencia central y de dispersión3.1 Analizar las medidas de tendencia central de un conjunto de datos de acuerdo a su naturaleza.

84

84


3.1.1. Aplicar las medidas de tendencia central de un conjunto de datos de acuerdo a su naturaleza.

OBJETIVO Y CRITERIOS DE APRENDIZAJE4. Definir el concepto de covarianza y correlación4.1. Practicar y analizar la covarianza y correlación de dos muestras de datos y

8787

72

determinar si las dos están relacionadas.DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE

APRENDIZAJE)4.1.1. Calcular y obtener la covarianza y correlación de dos muestras de datos y determinar si las dos están relacionadas.

DEMOSTRACIÓN DE HABILIDADES FINALESTa. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda.Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o

rango, desviación media, varianza, desviación Estándar y coeficiente de variación

Pa.4 En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de variación.Pa. 5 Calcular y obtener covarianza y correlación de un conjunto de datos.

7883

86

92

73

TEMA 1

Objetivo de aprendizaje.1. Definir y explicar los conceptos y fórmulas de la media aritmética, mediana y moda.

Criterio de Aprendizaje.1.1. Practicar y analizar la media aritmética, mediana y moda de un conjunto de datos.

Didáctica de enseñanza.Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda.

Media aritmética

Es el promedio más comúnmente usado, este puede ser simple o ponderado.

La media aritmética simple esta dada por la formula Σ X/n y que significa: la suma de todos los valores y el resultado se divide entre el número de observaciones; y que además el valor de la media representa un valor con respecto a toda la información.

Una muestra de una población consiste en n observaciones, con una media de x. Las medidas que calculamos para una muestra se conocen como estadística.

La notación es diferente cuando calculamos medidas para la población entera, es decir, para el grupo que contiene a todos los elementos que estamos describiendo. La media de una población se simboliza con μ. El número de elementos de una población se denota con la letra mayúscula cursiva N. Por lo general, en estadística se utilizan letras del alfabeto latino para simbolizar la información sobre las muestras y letras del griego para referirnos a la información sobre poblaciones.

Por ejemplo:

Media de una serie de datos.10, 13, 10, 13, 14, 10, 13, 10, 15

Media de la población:

μ = ∑x / N

Para calcular esta media, sumamos todas las observaciones. Los estadísticos se refieren a este tipo de datos como datos no agrupados.

Media Aritmética Ponderada o media de datos agrupados

Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es valido asignar "pesos" o "ponderaciones" de acuerdo a la importancia de cada dato.

74

Una distribución de frecuencias consta de datos agrupados en clases. Cada valor de una observación cae dentro de alguna de las clases. No sabemos el valor individual de cada observación. A partir de la información de la tabla, podemos calcular fácilmente una estimación del valor de la media de estos datos agrupados.

Para encontrar la media aritmética de datos agrupados, primero calculamos el punto medio de cada clase. Para lograr que los puntos medios queden en cifras cerradas, redondeamos las cantidades. Después, multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase, sumamos todos los resultados y dividimos esta suma entre el número total de observaciones de la muestra.

.μ= ∑ (f x) / nf = frecuencia de observaciones de cada clasex= punto medio de cada clase de la muestran = número de observaciones de la muestra

En la serie del ejemplo anterior aparecen los números; pero cada uno con diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva frecuencia o ponderación y se suman estos productos, se obtendrá la misma suma que si se hubieran sumado uno por uno

Sin ponderar Cálculo ponderado

Número x Número x Frecuencia Producto (fx)

10 10 4 40

13 13 3 39

14 14 1 14

15 15 1 15

Suma = 52 9 108

52/4 = 13 108/9 = 12

Mediana

La mediana es un solo valor calculado a partir del conjunto de datos que mide la observación central de éstos. Esta sola observación es la más central o la que está más en medio en el conjunto de números. La mitad de los elementos están por encima de este punto y la otra mitad está por debajo.

Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o ascendente. Si el conjunto de datos contiene un número impar de elementos, el de en medio en el arreglo es la mediana. Si hay un número par de observaciones, la mediana es el promedio de los dos elementos de en medio.

Mediana = (n + 1) / 2

A continuación se muestran los criterios para construir la mediana:

75

Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los dos criterios conduce al mismo resultado. Si el número de valores es impar, la mediana es el valor medio, el cual corresponde al dato. Cuando el número de valores en el conjunto es par, no existe un solo valor medio, si no que existen dos valores medios, en tal caso, la mediana es el promedio de los valores.

Algunas propiedades de la mediana son:

1.- Es única.2.- Es simple.3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la media.

Por ejemplo:

Dados los siguientes datos:1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3

Para la obtención de la mediana se deberán de ordenar. Tomemos el criterio de orden ascendente con lo que, se tiene:

0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4,

Se observa que el número de datos es igual a 15 datos, siendo el número de datos impar se elige el dato que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1.

Ejemplo 2. 3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5

Se observa que el número de datos es par, por los que se promedian los dos valores centrales es decir el 5 y el 16 y el valor obtenido será la mediana del conjunto de datos.

Mediana a partir de datos agrupados:

1. Encontrar qué observación de la distribución está más al centro (Mediana = (n + 1) / 2). 2. Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento más central. 3. Determinar el número de elementos de la clase y la localización de la clase que contiene al elemento mediano. 4. Determinar el ancho de cada paso para pasar de una observación a otra en la clase mediana, dividiendo el intervalo de cada clase entre el número de elementos contenido en la clase. 5. Determinar el número de pasos que hay desde el límite inferior de la clase mediana hasta el elemento correspondiente a la mediana. 6. Calcular el valor estimado del elemento mediano multiplicando el número de pasos que se necesitan para llegar a la observación mediana por el ancho de cada paso. Al producto sumarle el valor del límite inferior de la clase mediana. 7. Si existe un número par de observaciones en la distribución, tomar el promedio de los valores obtenidos para el elemento mediano calculados en el paso número 6. Un método más sencillo:

76

Med = {[(n + 1) / 2 – (F + 1)] / fm} w + Lm

Donde:n = número total de elementos de la distribuciónF = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase medianafm = frecuencia de la clase medianaw = ancho de intervalo de claseLm = límite inferior del intervalo de clase mediano

Moda

La moda es la medida que se relaciona con la frecuencia con que se presenta el dato o los datos con mayor incidencia, con lo que se considera la posibilidad de que exista más de una moda para un conjunto de datos. La notación más frecuente es la siguiente: Mo . Esta medida se puede aparecer tanto para datos cualitativos como cuantitativos. Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene mas de un dato repetido se dice que es multimodal y un último caso es cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal.

La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la mediana, pues en realidad no se calcula mediante algún proceso aritmético ordinario. La moda es aquel valor que más se repite en el conjunto de datos.

En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el valor más frecuente del conjunto de datos. Es por esta razón que rara vez se utiliza la moda de un conjunto de datos no agrupados como medida de tendencia central.

Por esta razón, siempre que se utiliza la moda como medida de tendencia central de un conjunto de datos, debemos calcular la moda de datos agrupados (buscar la clase modal).

Ejemplos:

1.- Determinar la moda del siguiente conjunto de datos: a).- 1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3La moda de este conjunto de datos es igual a 3 y si considera unimodal

b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la más alta frecuencia, por lo que la muestra es bimodal

c).- 1, 2, 3, 4, 5, 6, 7, 8, 9La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal.

Moda de datos agrupados:

Cuando los datos ya se encuentran agrupados en una distribución de frecuencias, podemos poner que la moda está localizada en la clase que contiene el mayor número de elementos, es decir, en la clase que tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal:

77

Mo = Lmo + [d1 / (d1 + d2 )] w

Lmo = límite inferior de la clase modal.d1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por debajo de ella.d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por encima de ella.w = ancho del intervalo de la clase modal.

Evidencia parcialTa. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda.


78

TEMA 2

Objetivo de aprendizaje.2. Definir y explicar las fórmulas y conceptos de amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación.

Criterio de Aprendizaje.2.1. Practicar y analizar amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación de una muestra de datos y de una tabla de frecuencias.

Didáctica de enseñanza.Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación

media, varianza, desviación Estándar y coeficiente de variación

Las medidas de tendencia central son de un gran valor representativo para una masa de observaciones. Pero el valor de esas medidas dependerá de cuan variable sea la masa de información. Por eso se establecen medidas que tratan de explicar la dispersión de los datos y son: la desviación estándar, el coeficiente de variación, el error estándar y los límites de confianza. Una medida de dispersión conveniente deberá tomar en consideración todos los datos de la serie sopesando cada dato por su distancia al centro de la distribución.

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad.

La dispersión es importante porque: 1. Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. 2. Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas. 3. Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

Rango

Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes: No utiliza todas las observaciones (sólo dos de ellas); Se puede ver muy afectada por alguna observación extrema; El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca disminuye.

79

Desviación media

Se define la desviación media como la media de las diferencias en valor absoluto de los valores de la variable a la media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces

Si los datos están agrupados en una tabla estadística es más sencillo usar la relación

Como se observa, la desviación media guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista geométrico, la distancia que induce la desviación media en el espacio de observaciones no es la natural (no permite definir ángulos entre dos conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de hacer inferencia a la población.

Varianza

Para calcular la varianza de una población, dividimos la suma de las distancias al cuadrado entre la media y cada elemento de la población entre el número total de observaciones de dicha población.

= (x - μ)2 / N

= varianza de la población.x = elemento u observación.μ = media de la población.N = número total de elementos de la población.

Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son intuitivamente claras o fáciles de interpretar. Por esta razón, tenemos que hacer un cambio significativo en la varianza para calcular una medida útil de la desviación, que sea menos confusa. Esta medida se conoce como la desviación estándar, y es la raíz cuadrada de la varianza. La desviación estándar, entonces, está en las mismas unidades que los datos originales.

La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética.

Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la

manera de simbolizarla es .

Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza

80

La varianza es una medida primaria de variabilidad utilizada en varias pruebas estadísticas. Su cálculo es simplemente elevar al cuadrado la desviación estándar.

Desviación estándar

La desviación estándar es la medida de dispersión mas usada en estadística, tanto en aspectos descriptivos como analíticos. En su forma conceptual, la desviación estándar se define así:

Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media.

Desviación estándar para datos sin agrupar

Una manera que aparece como muy natural para construir una medida de dispersión sería promediar las desviaciones de la media.

Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el nombre de desvío estándar, o desviación típica y es representada por la siguiente fórmula:

La desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan medido con escalas de intervalos o razones.

A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su media. Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más “homogéneo” que si el valor de la desviación estándar fuera más grande. O sea que a menor dispersión mayor homogeneidad y a mayor dispersión, menor homogeneidad.

La raíz cuadrada de un número positivo puede ser tanto positiva como negativa. Cuando tomamos la raíz cuadrada de la varianza para calcular la desviación estándar, los estadísticos solamente consideran la raíz cuadrada positiva.

La desviación estándar nos permite determinar, con un buen grado de precisión, dónde están localizados los valores de una distribución de frecuencias con relación a la media. El teorema de Chebyshev dice que no importa qué forma tenga la distribución, al menos 75% de los valores caen

81

dentro de + 2 desviaciones estándar a partir de la media de la distribución, y al menos 89% de los valores caen dentro de + 3 desviaciones estándar a partir de la media.

Con más precisión: Aproximadamente 68% de los valores de la población cae dentro de + 1 desviación estándar a partir de la media. Aproximadamente 95% de los valores estará dentro de + 2 desviaciones estándar a partir de la media. Aproximadamente 99% de los valores estará en el intervalo que va desde tres desviaciones estándar por debajo de la media hasta tres desviaciones estándar por arriba de la media.

Resultado estándar:

La desviación estándar es también útil para describir qué tan lejos las observaciones individuales de una distribución de frecuencias se apartan de la media de la distribución. Una medida que se conoce como resultado estándar nos da el número de desviaciones estándar que una observación en particular ocupa por debajo o por encima de la media:

Resultado estándar = (x - μ ) /s

Cálculo de la varianza y la desviación estándar utilizando datos agrupados:

= f(x - )2 / N

= varianza de la población.x = punto medio de cada una de las clases. = media de la población.N = número total de elementos de la población.f = frecuencia de cada una de las clases.

Desviación estándar de una muestra:

Para calcular la varianza y la desviación estándar de una muestra, utilizamos las mismas fórmulas, sustituyendo por y N con n – 1.

s2 = (x - )2 / (n – 1)

¿Por qué utilizamos n – 1 como denominador en lugar de N? Los especialistas en estadística pueden demostrar que si tomamos muchas muestras de una población dada, si encontramos la varianza de la muestra para cada muestra y promediamos los resultados, entonces este promedio no tiende a tomar el valor de la varianza de la población, a menos que tomemos n – 1 como denominador de los cálculos.

Coeficiente de variación

Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de

82

variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.

Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variación.

El coeficiente de variación es una medida relativa de dispersión que nos permite hacer comparaciones de diferentes grupos con diferentes unidades de medida o diferentes magnitudes y obtener mejores conclusiones.

Evidencia parcialTa. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación

media, varianza, desviación Estándar y coeficiente de variación


83

TEMA 3

Objetivo de aprendizaje.3. Enunciar las ventajas y desventajas de las medidas de tendencia central y de dispersión

Criterio de Aprendizaje.3.1 Analizar las medidas de tendencia central de un conjunto de datos de acuerdo a su naturaleza

Didáctica de enseñanza.Pa.4 En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de variación.

Ventajas y desventajas de la media aritmética.

La media aritmética, en su carácter de un solo número que representa a un conjunto de datos completo, tiene importantes ventajas:

Se trata de un concepto familiar para la mayoría de las personas y es intuitivamente claro. 1. Cada conjunto de datos tiene una media, es una medida que puede calcularse y es única debido a que cada conjunto de datos posee una y sólo una media. 2. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.

Desventajas:

1. Puede verse afectada por valores extremos que no son representativos del resto de los datos. 2. Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro cálculo. 3. Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala.

La media aritmética, a menudo, puede mal interpretarse si los datos no entran en un grupo homogéneo.

Ventajas y desventajas de la mediana:

Los valores extremos no afectan a la mediana tan intensamente como a la media. La mediana es fácil de entender y se puede calcular a partir de cualquier tipo de datos – incluso a partir de datos agrupados con clases de extremo abierto – a menos que la mediana entre en una clase de extremo abierto.

Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas, en lugar de números.

Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que aquellos que utilizan la media. Debido a que la mediana es una posición promedio, debemos ordenar los datos antes de llevar a cabo cualquier cálculo. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran número de elementos. Por consiguiente, si deseamos utilizar una estadística de muestra para estimar un parámetro de población, la media es más fácil de usar que la mediana.

84

Ventajas y desventajas de la moda:

La moda, al igual que la mediana, se puede utilizar como una posición central para datos tanto cualitativos como cuantitativos.

También, al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos. Incluso si los valores extremos son muy altos o muy bajos, nosotros escogemos el valor más frecuente del conjunto de datos como el valor modal. Podemos utilizar la moda sin importar qué tan grandes o qué tan pequeños sean los valores del conjunto de datos, e independientemente de cuál sea su dispersión.

La podemos utilizar aun cuando una o más clases sean de extremo abierto.

Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene valores que se presenten más de una vez. En otras ocasiones, cada valor es la moda, pues cada uno de ellos se presenta el mismo número de veces. Otra desventaja consiste en que cuando los datos contienen dos, tres o más modas, resultan difíciles de interpretar y comparar.

Comparación entre la media, la mediana y la moda.

Cuando trabajamos un problema de estadística, debemos decidir si vamos a utilizar la media, la mediana o la moda como medidas de tendencia central. Las distribuciones simétricas que sólo contienen una moda, siempre tienen el mismo valor para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida de tendencia central, pues ya está hecha la selección.

En una distribución positivamente sesgada (es decir, sesgada hacia la derecha), la moda todavía se encuentra en el punto más alto de la distribución, la mediana está hacia la derecha de la moda y la media se encuentra todavía más a la derecha de la moda y la mediana.

En una distribución negativamente sesgada, la moda sigue siendo el punto más alto de la distribución, la mediana está hacia la izquierda de ella y la media se encuentra todavía más a la izquierda de la moda y la mediana.

Cuando la población está sesgada negativa o positivamente, con frecuencia la mediana resulta ser la mejor medida de posición, debido a que siempre está entre la moda y la media. La mediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores extremos como la media.

La selección de la media, la mediana o la moda, en ocasiones, depende de la práctica común de una industria en particular (salario medio de los obreros, precio mediano de una casa, familia modal para el diseño de automóviles).

85

Práctica 4En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de variación.


1. Encuentre la media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de variación; de los siguientes conjuntos de datos:

a) 3, 4, 4, 6, 6, 6, 8, 8, 12

b) 8, 40, 48, 62, 65, 65, 80, 83, 92

c) 27 30 25 34 30 32 26 31 29 30 32 30 33 3225 33 34 27 30 31

d) Se evalúa la calidad de mermelada de guayaba, según los expertos el mínimo puntaje para que una mermelada fuese considerada de buena calidad era si calificaba con 169.5 puntos de 190 posibles evalué los siguientes datos de 60 muestras analizadas.

161 161 162 162 165 165 165 165 165 165 166 166168 168 169 169 169 169 169 169 170 170 170 170170 170 170 171 171 171 171 171 171 171 171 172172 172 172 172 172 172 175 175 175 175 176 176177 177 178 180 180 181 181 185 185 185 189 189

86

TEMA 4

Objetivo de aprendizaje.4. Definir el concepto de covarianza y correlación

Criterio de Aprendizaje.4.1. Practicar y analizar la covarianza y correlación de dos muestras de datos y determinar si las dos están relacionadas.

Didáctica de enseñanza.Pa. 5 Calcular y obtener covarianza y correlación de un conjunto de datos.

Si observamos con atención los términos

vemos que las cantidades y van al cuadrado y por tanto no pueden ser negativas.

La covarianza , es una manera de generalizar la varianza y se define como:

Como se ve, la fórmula es muy parecida a las de las varianzas. Es sencillo comprobar que se verifica la

siguiente expresión de , más útil en la práctica:

Proposición

Si las observaciones no están ordenadas en una tabla de doble entrada, entonces se tiene que

87

o lo que es lo mismo

Ejemplo

Se han clasificado 100 familias según el número de hijos varones ( ) o hembras ( ), en la tabla siguiente:

0 1 2 3 4

0 4 6 9 4 1

1 5 10 7 4 2

2 7 8 5 3 1

3 5 5 3 2 1

4 2 3 2 1 0

1. Hallar las medias, varianzas y desviaciones típicas marginales.

2. ¿Qué número medio de hijas hay en aquellas familias que tienen 2 hijos?

3. ¿Qué número medio de hijos varones hay en aquellas familias que no tienen hijas?

4. ¿Qué número medio de hijos varones tienen aquellas familias que a lo sumo tienen 2 hijas?

5. Hallar la covarianza

Solución:

En primer lugar, definimos las variables X= número de hijos varones, e Y=número de hijas y construimos la tabla con las frecuencias marginales, y con otras cantidades que nos son útiles en el cálculo de medias y varianzas:

88

y1 y2 y3 y4 y5

0 1 2 3 4

4 6 9 4 1 24 0 0 0

5 10 7 4 2 28 28 28 44

7 8 5 3 1 24 48 96 62

5 5 3 2 1 16 48 144 63

2 3 2 1 0 8 32 128 40

23 32 26 14 5 100 156 396 209

0 32 52 42 20 146

0 32 104 126 80 342

de este modo, las medias marginales son

Calculamos después las varianzas marginales

que nos dan directamente las desviaciones típicas marginales,

El número medio de hijas en las familias con 2 hijos varones se obtiene calculando la distribución

condicionada de 89

n3j n3j yj

7 0

8 8

5 10

3 9

1 4

24 31

Del mismo modo, el número medio de hijos varones de las familias sin hijas, se calcula con la

distribución condicionada

ni1 ni1 xi

4 0

5 5

7 14

5 15

2 8

23 42

El número medio de hijos varones en las familias que a lo sumo tienen dos hijas, se calcula usando las marginales de la tabla obtenida a partir de las columnas y1, y2 e y3

90

ni1 ni2 ni3 ni1+ni2+ni3 (ni1+ni2+ni3) xi

4 6 9 19 19

5 10 7 22 22

7 8 5 20 40

5 5 3 13 39

2 3 2 7 28

81 129

La covarianza es:

91

Práctica 5 Calcular y obtener covarianza y correlación de un conjunto de datos.


1) Las siguientes notas, son las calificaciones de 25 alumnos en las asignaturas de Matemáticas y Termodinámica:

B 4 5 5 5 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9 9 9 9 10

Q 3 5 5 6 7 7 7 7 7 7 8 8 8 7 7 8 8 8 8 8 8 8 10

10

10

a) Obtener la tabla de frecuencias conjunta.b) ¿Qué proporción de alumnos obtienen más de un cinco en ambas asignaturas? ¿Qué proporción de alumnos obtienen más de un cinco en Matemáticas? ¿Y en Termodinámica?c) ¿Son independientes las calificaciones en Termodinámica y en Matemáticas?d) Representa gráficamente, comenta el resultado.e) Hallar el coeficiente de correlación.

2) Para realizar un estudio sobre la utilización de una impresora en un determinado departamento se midió en un día los minutos transcurridos entre las sucesivas utilizaciones (X) y el número de páginas impresas (Y), obteniéndose los siguientes resultados:

X 9 9 4 6 8 9 7 6 9 9 9 8 8 9 8 9Y 3 8 3 8 3 8 8 8 3 8 12 12 8 8 8 12X 9 9 10 9 15 10 12 12 10 10 12 10 10 12 12 10Y 12 20 8 20 8 8 20 8 8 12 8 20 20 3 3 20

a) Escribir la distribución de frecuencias conjunta. ¿Cuál es el porcentaje de veces que transcurre más de nueve minutos desde la anterior utilización y se imprimen menos de doce páginas? ¿Cuántas veces se imprimen menos de doce páginas y transcurren nueve minutos desde la anterior utilización?b) Frecuencias marginales. ¿Cuántas veces se imprimen como mucho doce páginas? ¿Cuántas páginas como máximo se imprimen en el 80% de las ocasiones?c) Hallar la distribución de frecuencias del número de páginas impresas condicionada a que han transcurrido nueve minutos entre sucesivas utilizaciones.d) Dibujar el diagrama de dispersión.

3) De la distribución bidimensional (xi,yi,nij) se sabe que para 100 observaciones:

a) ¿Cuánto vale la covarianza entre X e Y?

b) ¿Y la covarianza de (U,Z), si se tiene que X= y

92

4) Las estaturas y pesos de los 50 niños nacidos en una maternidad durante una semana fueron los siguientes:

E 50 51 53 50 51 48 50 49 52 52 49 50 52 51 52 49P 3.2 4.1 4.5 3 3.6 2.9 3.8 3.8 3.6 3.9 3 3.8 4.1 3.5 4.0 3.150 51 50 51 52 53 52 52 51 50 51 54 50 51 51 51 523.1 4.3 3.3 3.9 3.7 4.1 4.2 3.5 3.8 3.6 3.4 4.6 3.5 3.6 3.1 4 3.851 52 51 50 51 49 51 48 50 52 53 52 50 52 51 51 514.2 4 4.4 3.9 3.7 3.4 3.3 2.7 3.4 3.6 4.4 4.3 3.3 4.2 4.2 3.3 3.7

a) Constrúyase una tabla de doble entrada, agrupando los pesos en intervalos de 0.5 kg.b) ¿Es la estatura independiente del peso?

5) En el examen de una asignatura que consta de parte teórica y parte práctica, las calificaciones de nueve alumnos fueron:

Teoría 5 7 6 9 3 1 2 4 6Práctica

6 5 8 6 4 2 1 3 7

Calcular la covarianza y el coeficiente de correlación lineal. Dibujar la nube de puntos. Comentar los resultados.

6) Se desea investigar el ganado caprino y el ganado ovino de un país. En la tabla de doble entrada adjunta se presentan los resultados de un estudio de 100 explotaciones ganaderas, seleccionadas aleatoriamente del censo agropecuario. Se proporcionan las frecuencias conjuntas del número de cabezas (en miles) de cabras (X) y ovejas (Y) que poseen las explotaciones.

X\Y

0 1 2 3 4

0 4 6 9 4 11 5 10 7 4 22 7 8 5 3 13 5 5 3 2 14 2 3 2 1 0

a) Hallar las medias, varianzas y desviaciones típicas marginales.b) Hallar el número medio de ovejas condicionado a que en la explotación hay 2000 cabras.c) Hallar el número medio de cabras que tienen aquellas explotaciones que sabemos que no tienen ovejas.d) Hallar la covarianza y el coeficiente de correlación entre ambas variables.

93

7) Se realiza una prueba a 20 aspirantes a un puesto de grabador consistente en un dictado con cierto tiempo de duración (en minutos, que será variable para cada aspirante) y luego contar el número de errores cometidos al transcribirlo a un ordenador. Los resultados fueron:

Tº 7 6 5 4 5 8 7 8 9 6 5 8 6 8 7 8 7 6 6 9Err

8 7 6 6 7 10 9 9 10 8 6 10 8 9 8 8 7 8 6 8

a) Construir la tabla de correlación.b) Para la variable tiempo calcular: media, mediana, moda, recorrido, recorrido intercuartílico y coeficiente de variación.c) Covarianza.d) Número medio de errores de los aspirantes sometidos a un dictado de 6 minutos.e) Porcentaje de aspirantes que cometen menos de 8 errores de entre los que son sometidos a un dictado de más de 6 minutos.

8) La siguiente tabla muestra la talla de calzado y los pesos de 55 estudiantes:

Talla 39 40 40 40 41 41 41 41 42 42 42 42 43 43 44Peso 55 60 65 70 60 65 70 85 65 70 75 80 65 75 85Nºestudia.

1 3 3 4 3 4 6 1 8 8 7 2 2 1 2

a) Calcular la tabla de doble entrada de la distribución conjunta (tabla de correlación).b) Calcula la distribución del peso condicionado a una talla de 42. Para esta distribución condicionada calcula: mediana, tercer cuartil y nonagésimo percentil.c) ¿Son independientes el peso y la talla de calzado?d) Determina la covarianza.

9) Se trató a 5 enfermos de hepatitis con un mismo fármaco, variando el tratamiento en las cantidades diarias suministradas. Medido el número de días que cada enfermo tardó en sanar, se tiene:

mg. de fármaco

10 20 30 40 50

Días en sanar

200 180 150 120 100

Calcular la covarianza entre estas dos variables.

94

CAPITULO 4

MODELOS PROBABILÍSTICOS

INTRODUCCIÓN

Probabilidad, rama de las matemáticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que ocurra un determinado suceso. La probabilidad está basada en el estudio de la combinatoria y es fundamento necesario de la estadística.

La definición de variable aleatoria permite el uso de un lenguaje común que ayuda a entender de una forma sistemática los experimentos aleatorios. En la medida en que se analizan distintos tipos de experimentos aleatorios se comienza a notar que el comportamiento de muchos de ellos es bastante similar entre sí. Comienzan a repetirse características de una variable aleatoria a otra lo que conlleva a continuar la sistematización del análisis al verificar esas características comunes. Este análisis lleva a definir modelos probabilísticos particulares que permiten explicar fenómenos aleatorios que tienen un comportamiento similar entre sí.

Un modelo es una simplificación de la realidad. Un modelo probabilístico es un modelo matemático que describe el comportamiento de una variable aleatoria. Es una función que depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una población en particular y que se denominan parámetros del modelo.


1. Definir los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.1.1. Ilustrar los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.

97

97


1.1.1. Diferenciar los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.

OBJETIVO Y CRITERIOS DE APRENDIZAJE2. Definir las variables aleatorias continuas y discretas.2.1. Ilustrar las variables aleatorias continuas y discretas.

9797


2.1.1. Diferenciar las variables aleatorias continuas y discretas.OBJETIVO Y CRITERIOS DE APRENDIZAJE

3. Definir los conceptos y expresar las funciones de probabilidad: uniforme, binomial, hipergeométrica y Poisson.3.1. Calcular mediante tablas de esas distribuciones discretas un conjunto de datos.

102

102DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE

APRENDIZAJE)3.1.1. Analizar los resultados obtenidos del cálculo mediante tablas de esas distribuciones discretas un conjunto de datos

95

OBJETIVO Y CRITERIOS DE APRENDIZAJE4. Describir las consideraciones para elegir un modelo probabilístico discreto 4.1. Seleccionar el modelo probabilístico discreto de acuerdo a la naturaleza de un conjunto de datos.

102102


4.1.1. Analizar el modelo probabilístico discreto seleccionado para un conjunto de datos.

OBJETIVO Y CRITERIOS DE APRENDIZAJE5. Definir y expresar la distribución de probabilidades: Normal, Ji cuadrada, t de student y F.5.1. Calcular mediante tablas de distribuciones continuas, la probabilidad de la ocurrencia de un evento.

108

108


5.1.1. Analizar los resultados obtenidos del cálculo mediante tablas de distribuciones continuas, la probabilidad de la ocurrencia de un evento.

OBJETIVO Y CRITERIOS DE APRENDIZAJE6. Describir las circunstancias en que se elige un modelo probabilístico continuo.6.1. Seleccionar el modelo probabilístico continuo de acuerdo a la naturaleza de un conjunto de datos.

108108


6.1.1. Analizar el modelo probabilístico continuo de acuerdo a la naturaleza de un conjunto de datos.

DEMOSTRACIÓN DE HABILIDADES FINALESTa.6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto.Ta.7 Solución de ejercicioPa.6 Determine la probabilidad de que uno de estos dispositivos seleccionados al azar contenga del ejercicio dado.

101107110

96

TEMA 1

Objetivo de aprendizaje.1. Definir los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.

Criterio de Aprendizaje.1.1. Ilustrar los conceptos de variable aleatoria, parámetros función y distribución de probabilidades.


TEMA 2

Objetivo de aprendizaje.2. Definir las variables aleatorias continuas y discretas.Criterio de Aprendizaje.2.1. Ilustrar las variables aleatorias continuas y discretas.

Didáctica de enseñanza.Ta. 6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto.

El modelo uniforme discreto es una variable aleatoria donde todos sus valores tienen igual probabilidad de ocurrencia.

El modelo uniforme continuo es una variable aleatoria donde la probabilidad de que un evento ocurra en un intervalo de ancho t es proporcional a ese intervalo.

La variable aleatoria se define al asignar a cada evento elemental un número entero. La numeración de los posibles valores de la variable se inicia en uno y termina en el número ‘n’ de eventos elementales asociados al experimento aleatorio.

En la presente unidad se pretende que el alumno adquiera la habilidad del manejo de las anteriores herramientas estadísticas.

Variable Aleatoria:

Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio.

Una variable aleatoria es el resultado numérico de un experimento aleatorio. Por ejemplo, podemos considerar X el número resultante de tirar un dado; o podemos tirar 6 dados y tomar X como la suma de los seis valores resultantes. La distribución de una variable aleatoria es la colección de posibles resultados con sus probabilidades asociadas. Esto puede ser descrito por una tabla, una formula, o un histograma de probabilidades

Si repetimos un experimento muchas veces, podremos calcular el histograma de frecuencias, el cual es un grafico de barra que muestra el número de veces que cada valor de X fue observado. Esto debería darnos una aproximación del histograma de probabilidades.

Ejemplo.

97

Probabilidades para n Dados.

Supongamos que tiramos seis n dados regulares balanceados. Si X es la suma de los valores que aparecen en los n dados, Que son las probabilidades asociadas a cada valor de X dentro de los posibles valores de X = n , ... , 6n?

En el caso de n=1, esas posibilidades son todas 1/6. Para dos dados, es más fácil considerar una tabla con los posibles resultados:

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Ahora, podemos considerar la suma asociada a esos resultados: 2 3 4 5 6 7

3 4 5 6 7 8

4 5 6 7 8 9

5 6 7 8 9 10

6 7 8 9 10 11

7 8 9 10 11 12

Como hay 36 resultados posibles, todos igualmente probables, podemos ver que las probabilidades son:

X frecuencia P(X)

2 1 1/36

3 2 2/36

4 3 3/36

5 4 4/36

6 5 5/36

7 6 6/36

8 5 5/36

9 4 4/36

10 3 3/36

11 2 2/36

12 1 1/36

98

Si hubiera más de dos dados, hacer tablas como las anteriores es difícil. El número de posibles resultados seria 6n, sin embargo basta contar el número de veces que cada suma se da entre los 6n

posibles resultados para calcular la probabilidad de cada suma. Esto es fácil de hacer si consideramos la función generadora para el número de veces que cada suma aparece:

f(x) = (x + x2 + x3 + x4 + x 5+x6)n

Por Ejemplo, para n=2 se tiene que:

(x + x2 + x3 + x4 + x 5+x6)2= x 2+2x3+3x4+4x5+5x6+6x7+5x8+4x9+3x10+2x11+x12

El coeficiente de xn es el número de veces que la i-ésima suma se da.

Ejercicio.

Probabilidades para n mondas con dos caras águila o sol que son definidas por valor 1 y 2 respectivamente. Supongamos que tiramos cinco n monedas. Si X es la suma de los valores que aparecen en los n monedas, Que son las probabilidades asociadas a cada valor de X dentro de los posibles valores de X = n, ... , 5n?

En el caso de n =2, esas posibilidades son todas 1/5. Considere una tabla con los posibles resultados. Determine la posibilidad de que se obtenga la suma asociada a esos resultados y determine las propiedades del cada evento.

Variable Aleatoria:

Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio.

Existen Variables continuas y Variables discretas.

Variables discretas:

Son aquellas que toman determinado valor exacto como: El No. De hijos de una familia.

Variable Continua :

Es un rango que puede concebirse como un continuo de valores.

Parámetros: cantidades que aparecen en la formulación de un modelo, relacionadas con las propiedades de la variable aleatoria en estudio.

Modelo o distribución de probabilidades: función que distribuye probabilidades entre los valores de una variable aleatoria.

Variables aleatorias continuas y discretas.

99

Una variable aleatoria es una función que asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio.

Las variables aleatorias se denotan con una letra mayúscula, tal como , y con una letra minúscula, como , el valor posible de . El conjunto de los posibles valores de la variable aleatoria recibe el nombre de rango de .

Una variable aleatoria discreta es una variable aleatoria con un rango finito.

Ejemplo:

Se evalúa un nuevo proceso para la fabricación de partes moldeadas en plástico en términos de la coloración y reducción de tamaño. Una de las primeras corridas del proceso proporciona la información para el espacio muestral y las probabilidades que aparecen en la siguiente tabla:

Coloración Reducción de tamaño Probabilidadaprobado aprobado 0.64aprobado inaceptable 0.16inaceptable aprobado 0.16inaceptable inaceptable 0.04

Supóngase que el interés recae en resumir los resultados de este experimento aleatorio con el número de características (de coloración y reducción de tamaño) que son aprobadas. Por lo cual, se define una variable aleatoria, , para ser igual al número de características aprobadas.

La cuarta columna de la siguiente tabla, contiene los valores de asignados a cada resultado del experimento. Por ejemplo al resultado (aprobado, aprobado) se le ha asignado .

Coloración Reducción de tamaño Probabilidad xaprobado aprobado 0.64 2aprobado inaceptable 0.16 1inaceptable aprobado 0.16 1inaceptable inaceptable 0.04 0

En todos los procesos productivos las características del producto deben ser medidas para asegura que el producto cuenta con las características especificadas en su diseño. En la práctica pueden presentarse pequeñas variaciones en las longitudes medidas, por muchas causas, tales como vibraciones, fluctuaciones de temperatura, diferencias entre quienes toman las mediciones, calibraciones, desgaste en la herramienta de corte, desgaste en los cojinetes y cambios en la materia prima. Incluso el procedimiento de medición puede producir variaciones en los resultados finales.

En estos tipos de experimentos, las mediciones de interés la corriente en el alambre de cobre, la longitud de una parte maquinada puede representarse con una variable aleatoria. Es razonable modelar el rango de los avalores posibles de la variable aleatoria con un intervalo (finito o infinito) de números reales. Por ejemplo, para la longitud de una parte maquinada, este modelo permite que las mediciones del experimento produzcan cualquier valor dentro de un intervalo de números reales. Dado que el rango es cualquier valor en el intervalo, el modelo es adecuado para cualquier precisión utilizada al efectuar las mediciones. Sin embargo, como el número de valores posibles de la variable aleatoria X es infinito no contable, X tiene una distribución muy diferente de las de las variables aleatorias discretas estudiadas en el capítulo anterior. El rango de X incluye todos los valores contenidos en un intervalo

100

de números reales; esto es, el rango de X puede concebirse como un continuo de valores. En consecuencia, se tiene la siguiente definición.

Evidencia parcialTa. 6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto.


101

TEMA 3

Objetivo de aprendizaje.3. Definir los conceptos y expresar las funciones de probabilidad: uniforme, binomial, hipergeométrica y Poisson.

Criterio de Aprendizaje.3.1. Calcular mediante tablas de esas distribuciones discretas un conjunto de datos.


TEMA 4

Objetivo de aprendizaje.4. Describir las consideraciones para elegir un modelo probabilístico discreto

Criterio de Aprendizaje.4.1. Seleccionar el modelo probabilístico discreto de acuerdo a la naturaleza de un conjunto de datos.

Didáctica de enseñanza.Pa.6 Determine la probabilidad de que uno de estos dispositivos seleccionados al azar, contenga el ejercicio dado.

Modelo Uniforme.

Al analizar un experimento aleatorio en el cual el espacio muestral es un conjunto discreto y finito y utilizar la definición clásica de probabilidades para el proceso de asignación de probabilidades a los eventos elementales, se concluye que todos ellos tienen igual probabilidad dada por el inverso del número de eventos elementales. Esta es la base de la definición de un modelo uniforme discreto.

El modelo uniforme discreto es una variable aleatoria donde todos sus valores tienen igual probabilidad de ocurrencia. La numeración de los posibles valores de la variable se inicia en uno y termina en el número ‘n’ de eventos elementales asociados al experimento aleatorio. La regla de asignación se indica en la siguiente ecuación.

…1

El modelo uniforme discreto se denotará como UD(n). La asignación de probabilidades de cada valor de la variable está dada por la ecuación.

…2

Como consecuencia de la Ecuación 2, la función de distribución acumulativa de probabilidades, la función de densidad de probabilidades y la función de probabilidad vienen dadas por las ecuaciones 3, 4 y 5, respectivamente.

102

…3

…4

…5

La siguiente tabla muestra los valores esperados más importantes correspondientes al modelo uniforme discreto.

Valores Esperados más Importantes para el Modelo Uniforme Discreto.

Ejercicio: Considere el experimento aleatorio de lanzar una moneda honesta. Si al resultado ‘sello’ se le asigna el valor uno y al resultado ‘cara’ se le asigna el valor dos entonces la variable aleatoria definida se corresponde con el modelo uniforme discreto n = 2.

Ejercicio: Considere la variable aleatoria definida para el experimento aleatorio de lanzar un dado honesto. Esta variable corresponde al modelo uniforme discreto con n = 6.

Distribución binomial.

Un proceso de manufacturas electrónicas produce miles de diodos diariamente. En promedio, el 1% de estos diodos no se apega a las especificaciones. Cada hora, un inspector selecciona una muestra aleatoria de 50 diodos y los clasifica como conformes o disconformes. Sea x la variable aleatoria que representa el número de piezas con disconformidad en la muestra; entonces la distribución de probabilidad de x es:

103

Donde que es el número de combinaciones de 50 partes tomadas x cada vez. Esta

es una distribución discreta, ya que el número observado de disconformidades es y se denomina distribución binómica o binomial.

Podemos calcular la probabilidad de encontrar a lo más una pieza disconforme en la pieza:

De encontrar 1 o no encontrar ninguna.

Distribución Exponencial

La variable aleatoria X que es igual a la distancia entre ocurrencias sucesivas de un proceso Poisson con media , tiene una distribución exponencial con parámetro . La función de densidad de probabilidad de X es:

Para

La distribución exponencial obtiene su nombre de la función exponencial que aparece en la función de densidad de probabilidad. Para cualquier valor de la distribución exponencial tiene mucho sesgo. Los resultados siguientes se obtienen con facilidad y la deducción de éstos se deja como ejercicio.

Si la variable aleatoria X tiene una distribución exponencial con parámetro , entonces

Y

Ejemplo:

La vida útil de un foco es una variable exponencial con un promedio de 500 hrs. Calcula la probabilidad de que la vida de un foco cualquiera:

a) Este entre 400 y 700 hrs.

104

La probabilidad de que el foco dure entre 400 y 700 hrs. Es de 20.28%

b) Sea menor que el promedio.

=0.6321-0=0.6321

Ejercicio

La vida de anaquel de producto enlatado es exponencial en funciona al tratamiento térmico que se aplique en el proceso. La vida de anaquel es una variable exponencial con un promedio de 520 días. Calcula la probabilidad de que la vida de anaquel de cualquier producto enlatado:

1. Que se ubique entre 450 y 800 días.2. Que sea menor que el promedio.

La probabilidad de que un foco dure menos que el promedio (500 hrs. ) es de 63.21%

Distribución de Poisson

Una aplicación clásica de la distribución de Poisson en el control de calidad es como un modelo del número de defectos o disconformidades que ocurren en una unidad del producto por ejemplo, supóngase que el número de defectos por unidad en las conexiones de conductores en un dispositivo electrónico de semiconductores tiene distribución de Poisson, con parámetro = 4 (o sea 4 defectos en promedio cada unidad). Entonces, la probabilidad de que uno de estos dispositivos seleccionados al azar contenga 2 defectos o menos (incluso ninguno) es:

105

x P(x)0 0.01831 0.07332 0.14653 0.19544 0.19545 0.15636 0.10427 0.05958 0.02989 0.013210 0.005311 0.001912 0.000613 0.000214 0.000015 0.000016 0.0000. 0.0000. 0.0000. 0.0000

Existe 23.81% de probabilidad de encontrar dos, uno o ninguno.

106

Resultado .2381

Práctica 6

Determine la probabilidad de que uno de estos dispositivos seleccionados al azar, contenga el ejercicio dado.


En una agroindustria seleccionadora de manzana se aplico el control de calidad es como un modelo del número de defectos o disconformidades que ocurren en una unidad del empaque, supóngase que el número de defectos por caja tiene distribución de Poisson, con parámetro = 2 (o sea 2 defectos en promedio cada unidad).

1. Determine la probabilidad de que uno de estos dispositivos seleccionados al azar contenga 2.

107

TEMA 5

Objetivo de aprendizaje.5. Definir y expresar la distribución de probabilidades: Normal, Ji cuadrada, t de student y F.

Criterio de Aprendizaje.5.1. Calcular mediante tablas de distribuciones continuas, la probabilidad de la ocurrencia de un evento.


TEMA 6

Objetivo de aprendizaje.6. Describir las circunstancias en que se elige un modelo probabilístico continuo.

Criterio de Aprendizaje.6.1. Seleccionar el modelo probabilístico continuo de acuerdo a la naturaleza de un conjunto de datos.

Didáctica de enseñanza.Ta.7 Solución de ejercicio

Distribución Normal

Sin lugar a dudas, la distribución más utilizada para modelar experimentos aleatorios es la distribución normal. Esta distribución puede obtenerse al considerar el modelo básico de una variable aleatoria binomial cuando el número de ensayos se vuelve cada vez más grande. Este fue el enfoque original seguido por De Moivre en 1733. Desafortunadamente, su trabajo se perdió por algún tiempo, y Karl Gauus Desarrolló, de manera independiente, la distribución normal casi cien años después. Aunque más tarde se dio crédito a De Moivre, la distribución normal también se conoce como distribución Gaussiana.

Una variable aleatoria X con función de densidad de probabilidad normal:

Ejemplo.

La resistencia a la tensión del papel utilizado en la fabricación de bolsas para las compras es una característica de calidad importante, se sabe que la resistencia (x) tiene distribución normal, con media

(psi, del inglés poud per square inch) y desviación estándar , lo que se denota

por . El comprador de las bolsas necesita una resistencia de por lo menos . La probabilidad de que una bolsa producida con este papel satisfaga o exceda esta especificación es

. Nótese que

108

Para evaluar esta probabilidad a partir de las tablas de distribución estándar hay que estandarizar el punto 35 y se encuentra que:

Por consiguiente la probabilidad buscada es

La probabilidad de que una bolsa exceda las es de 99.38%

Ejercicio.

Un parámetro a evaluar como control de calidad en los empaque de manzana Red Deliciuos la textura. Mediante un penetrómetro se sabe que la resistencia (x) tiene distribución normal, con media

(psi, del inglés poud per square inch) y desviación estándar , lo que se denota

por . El comprador de manzana necesita una resistencia de por lo menos 38 lb/plg2. Determine la probabilidad de que una manzana empacada satisfaga o exceda esta especificación.

Distribución T-Student

Supóngase que se toma una muestra de una población normal con media y varianza . Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución de

es una distribución normal estándar. Supóngase que la varianza de la población es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza por S? La distribución t proporciona la respuesta a esta pregunta.

Sea <Z una variable aleatoria con distribución N(0,1) y V una variable aleatoria jicuadrada con k grados de libertad. Si Z y V son independientes, entonces la variable aleatoria

Tiene la función de densidad de probabilidad

y se dice que sigue la distribución t con k grados de libertad, lo que se abrevia como .

109

La media y la varianza de la distribución t son = 0 y para que k>2, respectivamente.

Ejemplo:

Un químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación muestrea 25 lotes cada mes. Si el valor calculado cae entre y , queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media gramos por milímetro y una desviación estándar muestral

gramos? Suponga que la distribución de rendimientos es aproximadamente normal.

De las tablas se extrae el valor para 24 grados de libertad. Por tanto, el fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor entre –1.711 y 1.711. Si

, entonces,

un valor muy por arriba de 1.771. La probabilidad de obtener un valor , con , igual o mayor que 2.25 es aproximadamente 0.02. Si , el valor de calculado de la muestra sería más razonable. De aquí que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.

Ta.7 Solución de ejercicio

En una agroindustria de lácteos se realiza un análisis de acidez a leche caliente (recién ordeñada). El resultado arroja una acidez expresada en º Dornikc superior a 18. Lo que indica que la materia prima esta altamente contaminada y disminuirán en medida correctiva el precio a los productores. Para verificar esta afirmación los productores muestrea 25 lotes cada mes. Si el valor calculado cae entre

y , queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media 19 º D y una desviación estándar muestra 3 2 º D. ¿ A que conclusión llegaría si la distribución de acidez es aproximadamente normal?

110

CAPITULO 5PRUEBAS DE HIPÓTESIS

INTRODUCCIÓN

A menudo, el problema que enfrenta el científico o el ingeniero no es tanto la estimación de un parámetro poblacional, sino más bien la formación de un procedimiento de decisión que se base en los datos que pueda producir una conclusión acerca de algún sistema científico. Por ejemplo, un investigador médico puede decidir sobre la base de evidencia experimental si beber café aumenta el riego de cáncer en humanos; un ingeniero puede tener que decidir sobre la base de datos muestrales si hay una diferencia entre la precisión de dos tipos de medidores; o un sociólogo puede desear reunir los datos apropiados que le permitan decidir si el tipo sanguíneo de una persona y el color de los ojos son variables independientes. En cada uno de estos casos el científico o el ingeniero postula o conjetura algo acerca de un sistema. Además, cada uno debe incluir el uso de datos experimentales y la toma de decisiones basadas en éstos. De manera formal, en cada caso, la conjetura se puede poner en forma de hipótesis estadística. Los procedimientos que conducen a la aceptación o rechazo de hipótesis estadísticas como éstas comprenden un área principal de la inferencia estadística y son los que y trataremos en la presente unidad.


1. Describir la naturaleza de una prueba de hipótesis y los tipos de hipótesis: una y dos colas.1.1. Practicar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de contrastabilidad.

113

113


1.1.1. Diferenciar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de contrastabilidad.

OBJETIVO Y CRITERIOS DE APRENDIZAJE2. Ilustrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis.2.1. Demostrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis

113

113


2.1.1. Diferenciar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis.

OBJETIVO Y CRITERIOS DE APRENDIZAJE3. Describir el procedimiento para realizar prueba de hipótesis sobre la media de una distribución normal y los casos en los que se emplea esta prueba.3.1. Practicar pruebas de hipótesis sobre la media de una muestra de datos, así como

118

118111

el procedimiento de prueba para aceptar o rechazar la hipótesis e interpretar los resultados.


3.1.1. Aplicar pruebas de hipótesis sobre la media de una muestra de datos, así como el procedimiento de prueba para aceptar o rechazar la hipótesis e interpretar los resultados.

OBJETIVO Y CRITERIOS DE APRENDIZAJE4. Describir el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba.4.1. Practicar el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba.

123

123


4.1.1. Aplicar el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba.

OBJETIVO Y CRITERIOS DE APRENDIZAJE5. Describir el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba.5.1 Practicar el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba.

126

126


5.1.1. Aplicar el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba.

DEMOSTRACIÓN DE HABILIDADES FINALESTa.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en alguna agroindustria. Además considere las opciones de error tipo I y error tipo II.Ta.9 Realizar el ejercicio, probando la hipótesis.In 1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normalPa.7 Elaborar ejercicios sobre prueba de hipótesis p

117

122125

129

112

TEMA 1

Objetivo de aprendizaje.1. Describir la naturaleza de una prueba de hipótesis y los tipos de hipótesis: una y dos colas.

Criterio de Aprendizaje.1.1. Practicar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de contrastabilidad.


TEMA 2

Objetivo de aprendizaje.2. Ilustrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis.

Criterio de Aprendizaje.2.1. Demostrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis

Didáctica de enseñanza.Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en alguna agroindustria. Además considere las opciones de error tipo I y error tipo II.

Pruebas de hipótesis.

Primero, definamos con precisión que entendemos por hipótesis estadística.

Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones.

La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta certidumbre a menos que examinemos toda la población. Esto, por supuesto, sería poco práctico en la mayoría de las situaciones. En su lugar, tomamos una muestra aleatoria de la población de interés y utilizamos los datos contenidos en esta muestra para proporcionar evidencia que apoye o no a la hipótesis. La evidencia de la muestra que es inconsistente con la hipótesis que se establece conduce al rechazo de ésta, mientras que la evidencia que la apoya conduce a su aceptación.

Debe quedar claro al estudioso de la materia que el diseño de un procedimiento de decisión se debe hacer con la idea en mente de la probabilidad de una conclusión errónea. Por ejemplo, suponga que la conjetura (hipótesis) que postula el técnico es que la fracción de defectuosos en cierto proceso es 0.10. El experimento es la observación de una muestra aleatoria del producto en cuestión. Suponga que se prueban 100 artículos y se encuentra que 12 están defectuosos. Es razonable concluir que esta evidencia no rechaza la condición , y por ello puede conducir a la aceptación de la hipótesis. Sin embargo, tampoco rechaza o incluso . Como resultado, el lector se debe acostumbrar a comprender que la aceptación de una hipótesis simplemente implica que los datos no dan suficiente evidencia para rechazarla. Por otro lado, el rechazo implica que la evidencia muestral la refuta. Puesto de otra forma, el rechazo significa que hay una pequeña probabilidad de obtener la información muestral observada cuando, de hecho, la hipótesis es verdadera. Por ejemplo, en nuestra hipótesis de proporción de defectuosos, una muestra de100 que revela 20 artículos defectuosos es ciertamente evidencia de rechazo. ¿Por qué? Si, en realidad, , la probabilidad de obtener 20 o más defectuosos es aproximadamente 0.0035. Con el pequeño riesgo resultante de una conclusión errónea, parecería seguro rechazar la hipótesis de que . En otras palabras, el rechazo de una hipótesis

113

tiende a casi “excluir” la hipótesis. Por otro lado, es muy importante enfatizar que la aceptación o, más bien, la falla al rechazo no excluyen otras posibilidades. Como resultado, el analista de los datos establece una conclusión firme cuando se rechaza una hipótesis.

El planteamiento formal de una hipótesis a menudo está influido por la estructura de la probabilidad de una conclusión errónea. Si el científico se interesa en apoyar con fuerza una opinión, desea llegar a la opinión en la forma de rechazo de una hipótesis. Si el investigador médico desea mostrar fuerte evidencia a favor de la opinión de que beber café aumenta el riesgo de contraer cáncer , la hipótesis a aprobar debe ser de la forma “ no hay aumento en el riesgo de contraer cáncer como producto de beber café”. Como resultado, la opinión se alcanza por medio de un rechazo. De manera similar, para apoyar la afirmación de que un tipo de medidores es más preciso que otro, el ingeniero prueba la hipótesis de que no hay diferencia en la precisión de los dos tipos de medidor.

Hipótesis nula y alternativa

La estructura de la prueba de hipótesis se formulará con el uso del término hipótesis nula. Éste se refiere a cualquier hipótesis que deseamos probar y se denota con conduce a la aceptación de una hipótesis alternativa, que se denota con . Una hipótesis nula con respecto a un parámetro poblacional siempre se establecerá de modo que especifique un valor exacto del parámetro, mientras que la hipótesis alternativa permite la posibilidad de varios valores. De aquí, si es la hipótesis nula

para una población binominal, la hipótesis alternativa sería una de las siguientes:

O,

Pruebas de Hipótesis

Hipótesis

Afirmación acerca de los parámetros de la población.

Hipótesis nula

Es una afirmación acerca de los valores de uno o más parámetros de la población. Se pone a prueba

usando la evidencia muestral. Establece que la diferencia entre el parámetro poblacional y el

estadístico muestral se debe a la variación aleatoria del muestreo. Se denota por H0.

Hipótesis Alterna o alternativa

Es la afirmación sobre los parámetros de la población que es cierta si la hipótesis nula es falsa

(rechazada). Se denota por H1.

Región de rechazo

También llamada región crítica. Es el rango de valores de un estadístico muestral que conducirá al

rechazo de la hipótesis nula, bajo el nivel de significancia dado. 114

Error de tipo I

Se incurre en este error cuando incorrectamente se rechaza la hipótesis nula. Denotamos por a la

probabilidad de que se cometa un error de tipo I.

Error de tipo II

Se incurre en este error cuando incorrectamente no se rechaza la hipótesis nula. Denotamos por b la

probabilidad de que se cometa un error de tipo II.

Colas

Una prueba de una cola es una en la que la hipótesis alternativa indica una dirección. Una prueba de

dos colas es aquella en la que la hipótesis alternativa no especifica dirección.

Prueba de Hipótesis:

1. Se Especifica H0 y H1, y un nivel aceptable de a (Nivel de significancia de una prueba de Hipótesis).

2. Se define un estadístico muestral (estadístico de prueba) y la región de rechazo para la hipótesis nula

(regla de decisión).

3. Se recogen los datos de la muestra y se calcula el estadístico de prueba.

4. Se decide rechazar o no rechazar la hipótesis nula.

5. Interpretar los resultados en el marco del problema.

Estadístico de prueba

Es un estadístico de la muestra cuya distribución muestral puede ser especificada para la hipótesis nula

o para la hipótesis alternativa, aunque para la hipótesis alternativa esto pueda ser bastante complejo.

Después de especificar el nivel de significancia a, la distribución muestral de este estadístico de prueba

puede usarse para definir la región de rechazo.

Ejemplo:

115

Según la FEDEFUT, el peso promedio de un jugador nuevo de la Liga Nacional de Fútbol es de 168.

Ahora, la nutricionista del equipo XYZ piensa que el peso promedio del equipo XYZ es diferente que

168. Como se están haciendo reclutamientos, escoge una muestra aleatoria del peso de 40 candidatos.

Asuma que s = 23

H0: = 168

H1: ¹ 168

Nivel de significancia (probabilidad de rechazar la hipótesis nula cuando esta es cierta): 0.05.

La media y la desviación estándar de la muestra

El estadístico de prueba es la media muestral. Entonces rechazaríamos la hipótesis nula, si el promedio

muestral es mayor que un valor C1 o menor que un valor C2, para un nivel de significancia del 5%.

Si H0 es verdadera, entonces la media muestral tiene una distribución normal con media igual a 168

y una desviación estándar , donde s es la desviación estándar de la población.

Siendo simétrica la curva normal, Se tiene que Z1 = 1.96 y Z2 = - 1.96, entonces C1 = 175.13 y C2 =

160.87

Si no conociéramos s, utilizamos la distribución t de 40 - 1 grados de libertad.

116

TINV(0.025, 39) = 2.3315

C1 = 177.2161

C2 = 158.78

Conclusión: no se rechaza la hipótesis nula.

En general, la hipótesis nula se construye para ser la hipótesis que siendo cierta, ninguna decisión

concerniente a un cambio se hará (cambio nulo). Rechazar la hipótesis nula significa tomar decisiones

que conllevan un cambio, y por lo tanto, representaran un costo. En este sentido, incurrir en un error de

tipo I conlleva una mayor preocupación.

La hipótesis alternativa describe condiciones para las cuales algo debe hacerse. Es la hipótesis de

investigación o acción. En un ambiente de investigación o experimental, la hipótesis alternativa es la

que queremos establecer, al rechazar la hipótesis nula, con un nivel suficientemente bajo de

significancia tal que es improbable que la nueva hipótesis sea erróneamente aceptada.

Es importante entonces el especificar un nivel adecuado de significancia. Cometer un error del tipo I

tiene mayores consecuencias, entonces se escoge un valor pequeño de a. 0.1, 0.05, 0.01, más

comúnmente 0.05.

Hay una relación inversa entre a y b. A menos de que se aumente el tamaño de la muestra, se puede

reducir a solamente aumentandob. Ahora bien, conviene determinar en cada experimento cuales son

las consecuencias de cometer un error de tipo II.

Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en alguna agroindustria. Además considere las opciones de error tipo I y error tipo II.

117

TEMA 3

Objetivo de aprendizaje.3. Describir el procedimiento para realizar prueba de hipótesis sobre la media de una distribución normal y los casos en los que se emplea esta prueba.

Criterio de Aprendizaje.3.1. Practicar pruebas de hipótesis sobre la media de una muestra de datos, así como el procedimiento de prueba para aceptar o rechazar la hipótesis e interpretar los resultados.

Didáctica de enseñanza.Ta.9 Realizar el ejercicio, probando la hipótesis.

Pruebas de Hipótesis sobre la Media, Varianza Conocida

En este tema se consideran pruebas de hipótesis sobre la media de una población (o la media de una distribución de probabilidad), donde la varianza de la población es conocida.

Las suposiciones para esta prueba son mínimas. La población o distribución de interés tiene media y varianza , con conocida. El estadístico de prueba se basa en la media muestral , por lo que también se supondrá que la población está distribuida de manera normal o que se aplican las condiciones del teorema del límite central. Esto significa que la distribución de es aproximadamente normal con media y varianza /n.

Desarrollo del procedimiento de prueba

Supóngase que se desea probar la hipótesis

Donde es una constante específica. Se tiene una muestra aleatoria De la población. Puesto que tiene una distribución aproximadamente normal con media y desviación

estándar si la hipótesis nula es verdadera, entonces puede construirse una región crítica con

base en el valor calculado de la media muestral .

Habitualmente, es más conveniente estandarizar la media muestral y utilizar una estadística de prueba basada en la distribución normal estándar. Esto es, el procedimiento de prueba para utiliza el estadístico de prueba

Si la hipótesis nula es verdadera, , de donde se desprende que la distribución de es la distribución normal estándar denotada por N . En consecuencia, si es cierta, la

118

probabilidad de que la estadística de prueba caiga entre y es . (Recuérdese que

es el punto que corresponde al porcentaje de la distribución normal estándar). Nótese que la probabilidad de que la estadística de prueba caiga en la región o cuando

es verdadera, es . Es evidente que una muestra que produce un valor del estadístico de prueba que cae en las colas de la distribución de será inusual si es cierta; por tanto, esto es un indicador de que es falso. En consecuencia, debe rechazarse si

Por otra parte, no puede rechazarse si

La ecuación 5 define la región de aceptación de , y las ecuaciones 3 y 4 definen la región crítica o región de rechazo. La probabilidad del error tipo I para este procedimiento de prueba es .

En general, es más fácil comprender la región crítica y el procedimiento de prueba cuando la estadística de prueba es más que . Sin embargo, la misma región crítica siempre puede escribirse en términos del valor calculado de la media muestral . Un procedimiento idéntico al anterior es el siguiente:

Rechazar si o

Donde

Ejemplo:

Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un combustible sólido. Una de las características importantes de este producto es la rapidez de combustión. Las especificaciones requieren que la rapidez promedio de combustión sea 50 cm/s. Se sabe que la desviación estándar de esta rapidez es cm./s. El experimentador decide especificar una probabilidad para el error tipo I, o nivel de significancia, de selecciona una muestra aleatoria de n = 25 y obtiene una rapidez promedio muestral de combustión de ¿ A qué conclusiones debe llegar?

La solución de este problema puede hallarse siguiendo el procedimiento de ocho pasos:

1. El parámetro de interés es la rapidez promedio de combustión.

2.3.

119

(3)

(4)

(5)

4.

5. La estadística de prueba es

6. Rechazar si o . Nótese que esto es consecuencia del paso 4, donde se especifica , de modo que las fronteras de la región crítica son y

7. Cálculos: Puesto que y ,

8. Conclusión: Dado que , se rechaza con nivel de significancia de 0.05.

Planteado de manera más completa, se concluye que, con base en una muestra de 25 mediciones, la rapidez promedio de combustión es diferente de 50 cm/s. De hecho, existe una evidencia fuerte que la rapidez promedio de combustión es mayor que 50 cm/s.

Ejercicio

1. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo gaussiano. Deseamos contrastar con un nivel de significación de si la altura media es diferente de 174 cm. Para ello nos basamos en un estudio en el que con una muestra de n=25 personas se obtuvo:

2. Consideramos el mismo ejercicio anterior. Comprobado que se rechaza el hecho de que la altura media de la población sea igual a 174 cm. Realizar el contraste sobre si la altura media es menor de 174 cm.

Pruebas de Hipótesis sobre las Medias de dos Distribuciones Normales, Varianzas Desconocidas.

Ahora se considerarán pruebas de hipótesis sobre la igualdad de las medias , y de dos distribuciones normales donde las varianzas y son desconocidas. Para probar esta hipótesis se usará una estadística . Se requiere la hipótesis de normalidad para desarrollar el procedimiento de prueba, pero los alejamientos moderados de la normalidad no tendrán efectos adversos sobre el procedimiento.

Ejemplo

Índices de Octano en CarreteraFormula 1 Formula 2

120

( con tetraetil-plomo) (Sin plomo)89.5 89.590.0 91.591.0 91.091.5 89.092.5 91.591.0 92.089.0 92.089.5 90.591.0 90.092.0 91.0

Se desea probar la hipótesis de que el índice octánico medio de la formulación 1 (con plomo) es igual al índice de octano medio para la formulación 2; o sea,

Rechazar si

Usando tenemos

121

La decisión es aceptar

Ejercicio

Establecer las pruebas de hipótesis sobre la igualdad de las medias , y de dos distribuciones normales donde las varianzas y son desconocidas. Para probar esta hipótesis se usará una estadística . Se requiere la hipótesis de normalidad para desarrollar el procedimiento de prueba, pero los alejamientos moderados de la normalidad no tendrán efectos adversos sobre el procedimiento.

Ta.9 Realizar el ejercicio, probando la hipótesis.

Presencia de Plomo en la lecheLeche de la laguna(ppm)

Leche del Valle del Mezquital(ppm)

0.0895 0.08950.090 0.09150.091 0.09100.095 0.08900.0925 0.09150.0910 0.0920.0890 0.0920.0895 0.09050.0910 0.0900.0920 0.091

Se desea probar la hipótesis de que el contenido de plomo entre los productos originados de la laguna y del Valle del Mezquital es diferente.

122

TEMA 4

Objetivo de aprendizaje.4. Describir el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba.

Criterio de Aprendizaje.4.1. Practicar el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba.

Didáctica de enseñanza.In 1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal

Pruebas de Hipótesis sobre la Varianza

Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. En esta sección se presentan dos procedimientos; uno se basa en la hipótesis de que la población es normal, mientras que el otro es una prueba para una muestra grande que no requiere la suposición de normalidad.

Procedimientos de Prueba para una Población Normal

Supóngase que se desea probar la hipótesis de que la varianza de una población normal es igual a un valor específico, por ejemplo, . Sea una muestra aleatoria de n observaciones tomadas de esta población. Para probar.

Se utiliza el estadístico de prueba

Donde es la varianza muestral. Ahora, si es verdadera, entonces el estadístico de prueba sigue una distribución ji-cuadrada con grados de libertad. Por consiguiente, se calcula el valor

de la estadística de prueba , y la hipótesis debe rechazarse si

O si

123

(1)

(2

(3)

(4)

Donde y son los puntos que corresponden a los porcentajes inferior y superior de la distribución ji-cuadrada con grados de libertad, respectivamente.

El mismo estadístico de prueba se utiliza para hipótesis alternativas unilaterales. Para la hipótesis unilateral.

Se rechaza si

Para la hipótesis unilateral

Se rechaza si

Ejemplo:

Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada para llenar las botellas. De manera específica, es deseable que la desviación estándar del proceso de llenado sea menor que 0.5 onzas de líquido; de otro modo, existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral (Onzas de fluido) . Si la varianza del volumen de llenado es mayor que 0.01 (onzas de fluido) , entonces existe una proporción inaceptable de botellas que serán llenadas con una cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el fabricante tiene un problema con el llenado de las botellas? Utilícese .

Al utilizar el procedimiento de ocho pasos se tiene lo siguiente:

1. El parámetro de interés es la varianza de la población .2.3.4.5. El estadístico de prueba es

124

(5

(6)

(7

(8

6. Se rechaza si 7. Cálculos:

8. Conclusiones: Puesto que , se concluye que no hay ninguna evidencia fuerte de que la varianza del volumen de llenado sea mayor que 0.01 (onzas de fluido)

In.1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal

125

TEMA 5

Objetivo de aprendizaje.5. Describir el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba.

Criterio de Aprendizaje.5.1 Practicar el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba.

Didáctica de enseñanza.Pa.7 Elaborar ejercicios sobre prueba de hipótesis p

Prueba de hipótesis sobre una distribución binomial.

Existen muchas formas de ejemplificar la probabilidad de que ocurra un evento y su aplicación en un modelo binomial. Por ejemplo, cuando un grupo de productos se elabora en forma independiente y se evalúa de acuerdo a su conformación como articulo defectuoso y no defectuoso; o cuando se hace una prueba de preferencia entre el producto para ver si agrada o no al consumidor. La comparación entre la conformación probable entre estas dos clases hace posible seleccionar o inferir cual es la tendencia proporcional..

La distribución binomial.Esta distribución describe una variedad de procesos y describe datos discretos, no continuos, que son resultado de un experimento conocido como proceso de Bernoulli.

Prueba de hipótesis sobre p de una muestra de datos de una distribución binomial.Supongamos que tenemos dos muestras independientes tomadas sobre dos poblaciones, en la que estudiamos una variable de tipo dicotómico (Bernoulli):

Si X1 y X2 contabilizan en cada caso el número de éxitos en cada muestra se tiene que cada una de ellas se distribuye como una variable aleatoria binomial:

De modo que los estimadores de las proporciones en cada población tienen distribuciones que de un modo aproximado son normales (cuando n1 y n2 son bastante grandes)

126

El contraste que nos interesa realizar es el de si la diferencia entre las proporciones en cada población es una cantidad conocida

Si H0 fuese cierta se tendría que

Desafortunadamente ni p1 ni p2 son conocidos de antemano y utilizamos sus estimadores, lo que da lugar a un error que es pequeño cuando los tamaños muestrales son importantes:

Contraste bilateral

El contraste bilateral sobre la diferencia de proporciones es

Entonces se define

Y se rechaza la hipótesis nula si o si

Contrastes unilaterales

En el contraste

127

Se rechazará H0 si . Para el test contrario

Se rechaza H0 si .

Ejemplo

El gerente de ventas de una empresa agroindustrial asegura que la venta del producto depende del color que se use en el empaque. Con el propósito de evaluar a la anterior consideración se estableció un experimento donde 25 amas de casa elegidas aleatoriamente en forma independiente seleccionaron a su agrado una muestra del producto en comparación: empaque color rojo y empaque color azul.

Solución:

Los resultados indicaron que las amas de casa prefirieron el producto con empaque azul. Al esperar que el color del empaque no influye en la selección del producto se espera una conformación de proporcionalidad igual al 50 % ( P = (0.5 y q =0.5 ). a un nivel de significancia a=0.05.

Ho: P = 0.5Ha: P ¹ 0.5

Ahora bien, si se tiene que n = 25 y T = 18 y el nivel de significancia es a=0.05., al región crítica se considera a/2=0.025

P1= 18/25= 0.72

P2=7/25 = 0.28 = 0.72-0.28= 0.44

Z calculada = 0.0432 por lo tanto se concluye que la

128

Práctica 7

Elaborar ejercicios sobre prueba de hipótesis p


En todos los problemas que siguen a continuación, se supone que las muestras han sido elegidas de modo independiente, y que las cantidades cuantitativas que se miden, se distribuyen de modo gaussiano. En temas posteriores se verá cómo contrastar si estas premisas pueden ser aceptadas o no al examinar las muestras.

Ejercicio 1.

El calcio se presenta normalmente en la sangre de los mamíferos en concentraciones de alrededor de 6 mg por cada 100 ml del total de sangre. La desviación típica normal de ésta variable es 1 mg de calcio por cada 100 ml del volumen total de sangre. Una variabilidad mayor a ésta puede ocasionar graves trastornos en la coagulación de la sangre. Una serie de nueve pruebas sobre un paciente revelaron una media muestral de 6,2 mg de calcio por 100 ml del volumen total de sangre, y una desviación típica muestral de 2 mg de calcio por cada 100 ml de sangre. ¿Hay alguna evidencia, para un nivel α=0.05, de que el nivel medio de calcio para este paciente sea más alto del normal?

Ejercicio 2.

El número de accidentes mortales en una ciudad es, en promedio, de 12 mensuales. Tras una campaña de señalización y adecentamiento de las vías urbanas se contabilizaron en 6 meses sucesivos 8, 11, 9, 7, 10, 9 accidentes mortales. ¿Fue efectiva la campaña?

Ejercicio 3.

El promedio de las puntuaciones de un número elevado de alumnos de Bioestadística es de 6,50. Un determinado año se examinaron 50 alumnos con resultados promedio de 7,25 y desviación típica de 1. ¿Variaron las calificaciones?

Ejercicio 4.

El peso medio de mujeres de 30 a 40 años es de 53 kg. Un estudio realizado en 16 mujeres de tales edades que siguen una dieta vegetariana da y . ¿Modifica la dieta el peso medio?

Ejercicio 5.

Una población infantil se dice que es susceptible de recibir una campaña de educación e higiene si su porcentaje de niños con dientes cariados es superior al 15%. Una población con 12.637 niños, ¿debe hacerse la campaña si de 387 de ellos 70 tenían algún diente cariado?

129

CAPITULO 6ANÁLISIS DE LA VARIANZA

INTRODUCCIÓN

El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student.

El método que resuelve ambos problemas es el anova, aunque es algo más que esto: es un método que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseño de experimentos y, de alguna manera, es la base del análisis multivariante.


1. Analizar las causas del error experimental durante las mediciones.1.1. Ilustrar y formular modelo lineal a partir de mediciones experimentales o datos de texto.

132132


1.1.1. Utilizar un modelo lineal a partir de mediciones experimentales o datos de texto

OBJETIVO Y CRITERIOS DE APRENDIZAJE2. Reconocer las fuentes de variación, describir el procedimiento del análisis de varianza y explicar el concepto de grado de libertad.2.1. Ilustrar y diferenciar las fuentes de variación, el procedimiento del análisis de varianza y el concepto de grado de libertad.

134

134


2.1.1. Utilizar las fuentes de variación, el procedimiento del análisis de varianza y el concepto de grado de libertad.

OBJETIVO Y CRITERIOS DE APRENDIZAJE3. Definir el tamaño de muestra, la unidad experimental y número de repeticiones.3.1. Practicar para definir en un conjunto de datos el tamaño de muestra, la unidad experimental y número de repeticiones.

136136


3.1.1. Emplear en un conjunto de datos el tamaño de muestra, la unidad experimental y número de repeticiones..

OBJETIVO Y CRITERIOS DE APRENDIZAJE4. Identificar de acuerdo a la estructura de los datos, el experimento completamente al azar, el experimento en bloques al azar y el experimento factorial.4.1. Diferenciar de acuerdo a la estructura de los datos, el experimento completamente al azar, el experimento en bloques al azar y el experimento factorial.

136

136


4.1.1. Emplear de acuerdo a la estructura de los datos, el experimento completamente 130

http://www.hrc.es/bioest/ch_medias.html

al azar, el experimento en bloques al azar y el experimento factorial.OBJETIVO Y CRITERIOS DE APRENDIZAJE

5. Describir el procedimiento del análisis de varianza para ese tipo de experimentos.5.1 Diferenciar el procedimiento del análisis de varianza para ese tipo de experimentos.

136136


5.1.1. Determinar el procedimiento del análisis de varianza para ese tipo de experimentos.

DEMOSTRACIÓN DE HABILIDADES FINALESPa.8 Análisis de varianza (ANOVA) 146

131

TEMA 1

Objetivo de aprendizaje.1. Analizar las causas del error experimental durante las mediciones.

Criterio de Aprendizaje.1.1. Ilustrar y formular modelo lineal a partir de mediciones experimentales o datos de texto.


Modelo Matemático Lineal

Causas del error experimental

Al conducir un experimento una persona encuentra uno o más de tres tipos generales de errores: error humano, error sistemático, y error al azar.

Error humano (un error) ocurre cuando el experimentador, incurre en una equivocación. Los ejemplos serían cuando se instala un experimento incorrectamente, cuando se lee mal un instrumento, o cuando se incurre en una equivocación en un cálculo.

Error sistemático, es un error inherente en el experimento instalado que hace sesgar a los resultados en la misma dirección, es decir, siempre demasiado grande o siempre demasiado pequeño. Algunos errores sistemáticos pueden ser corregidos fácilmente. Por ejemplo, si un equilibrio lee 0,25 g cuando no hay masa en ella, esto introduciría un error sistemático a cada medida, todo sería demasiado grande por 0,25 g. Esto puede ser corregido poniendo a cero el equilibrio.

Todos los experimentos tienen error al azar, que ocurre porque ninguna medición no se puede hacer con precisión infinita. Los errores al azar harán una serie de medidas demasiado grande y a veces demasiado pequeña. Un ejemplo del error al azar podía ser al hacer sincronizaciones con un cronómetro. Usted puede parar a veces el reloj demasiado pronto, o a veces demasiado tarde. Cualquier caso introduce error al azar en sus medidas. (nota que cuando un ser humano está implicado en el proceso real de la medida, el/ella puede introducir el error experimental válido que no está dentro de la definición del error humano. Su tiempo de reacción finito no es un error; es una limitación de una porción del proceso experimental, del ser humano haciendo la medida.) El error al azar puede ser reducido haciendo un promedio de varias mediciones.

Análisis del error

Una forma para analizar error experimental con un % del cálculo del error. El % del error es útil cuando se tiene un solo resultado experimental que se desee comparar con un valor estándar, o cuando se tienen dos valores experimentales obtenidos por diversos medios que se deseen comparar. El % del error se calcula según la fórmula siguiente.

% 100 x # std.

# std.- # expt. = error %

"expt. #" es su valor experimental, y el "std. #" es el valor del standard o del referente. Usando esta fórmula, un resultado positivo indica que su resultado fuera más grande que el estándar, mientras que un resultado negativo implica un resultado experimental más pequeño que el estándar. Mientras que %

132

del error le dice el tamaño relativo de su error, no le da ninguna pista en cuanto al tipo de ese error (error al azar o error sistemático)).

En ciertos casos uno puede utilizar una cantidad estadística llamada la desviación de estándar , denotada generalmente por la sigma griega minúscula de la letra, σ , o la abreviatura std.,

Podemos resumir: - % pequeños del error, dentro de uno o de dos σ estándar:, principalmente al azar.- % pequeños del error, no dentro de dos o de tres σ estándar: principalmente sistemático.- % grandes del error, dentro de uno o de dos σ estándar: grande, principalmente errores del random.- % grandes del error, no dentro de dos o de tres σ estándar: principalmente sistemático.

133

TEMA 2

Objetivo de aprendizaje.2. Reconocer las fuentes de variación, describir el procedimiento del análisis de varianza y explicar el concepto de grado de libertad.

Criterio de Aprendizaje.2.1. Ilustrar y diferenciar las fuentes de variación, el procedimiento del análisis de varianza y el concepto de grado de libertad.


Análisis de varianza del modelo lineal

De acuerdo con la hipótesis nula, según la cual se supone que las medidas poblacionales de los tres grupos son iguales, se puede obtener una medición de la variación total o suma de los cuadrados, sumando las diferencias elevadas al cuadrado entre cada observación y una medida global sobre la base de todas las observaciones. La variación total se calcularía como:

Supóngase que el gerente de producción de una planta en la cual se fabrica y envasa cereal en cajas de 368 gramos, considera sustituir una máquina antigua que afecta directamente la producción. Es más supóngase que tres productores le han permitido usar sus equipos para efectuar pruebas , y cuyos precios de compra y contratos de mantenimientos son totalmente iguales . Para tomar la decisión de compra , el gerente de producción decide llevar a cabo un experimento para determinar las diferentas más importantes entre las tres macas de equipo en el tiempo promedio (en segundos) que necesitan los obreros para su producción. Se asignan en forma aleatoria 15 operarios con experiencia, capacidad y edades similares, para recibir adiestramiento en una de las tres máquinas de modo que cada máquina tenga cinco operadores. Después de una capacitación adecuada , suficiente y practica, el gerente de producción mide el tiempo que necesitan los operadores para trabajar con sus equipos respectivos.

En la siguiente tabla se presentan los resultados de este experimento.

MÁQUINA1 2 325.40 23.40 20.0026.31 21.80 22.2024.10 23.50 19.7523.74 22.75 20.6025.10 21.60 20.40

Media 24.93 22.61 20.59

Se expresa la hipótesis nula y alternativa en la forma siguiente:

H0: 1 = 2 =3 = ...= c Todas las medias son igualesH1: No todas las medias son iguales

Para el caso del ejemplo las hipótesis nula y alternativa serian:

134

H0: 1 = 2 =3 = ...= c Todas las máquinas son igualesH1: No todas las máquinas son iguales

En la tabla se observa que existen diferencias en las medias maestrales para las tres máquinas. La pregunta es si estos datos son lo suficientemente diferentes para que el gerente de producción llegue a la conclusión de que los promedios poblacionales no son todos iguales.

Grados de libertad

Para calcular s2 se necesita conocer primero la media. Por consiguiente se puede decir que solo n-1 de los valores de muestra están “libres” para variar. Es decir , hay n-1 grados de libertad.

135

TEMA 3

Objetivo de aprendizaje.3. Definir el tamaño de muestra, la unidad experimental y número de repeticiones.

Criterio de Aprendizaje.3.1. Practicar para definir en un conjunto de datos el tamaño de muestra, la unidad experimental y número de repeticiones.

Didáctica de enseñanza.TEMA 4

Objetivo de aprendizaje.4. Identificar de acuerdo a la estructura de los datos, el experimento completamente al azar, el experimento en bloques al azar y el experimento factorial.

Criterio de Aprendizaje.4.1. Diferenciar de acuerdo a la estructura de los datos, el experimento completamente al azar, el experimento en bloques al azar y el experimento factorial.


TEMA 5

Objetivo de aprendizaje.5. Describir el procedimiento del análisis de varianza para ese tipo de experimentos.

Criterio de Aprendizaje.5.1 Diferenciar el procedimiento del análisis de varianza para ese tipo de experimentos.

Didáctica de enseñanza.Pa.8 Análisis de varianza (ANOVA)

Diseño de experimentos

Los experimentos son usados por los investigadores en todas las áreas de la ciencia ya se para describir algo acerca de un proceso en particular o para comparar el efecto de varias condiciones sobre algún fenómeno.

Para el diseño y análisis de experimentos se requiere que toda persona involucrada en el experimento tenga una idea clara de lo que exactamente se será estudiado , como serán colectados los datos y al menos una idea cualitativa de cómo serán analizados los datos.

A continuación se describe una generalización del procedimiento recomendado para el diseño de experimentos:1. Establecimiento del problema y objetivos. Un claro establecimiento del problema frecuentemente contribuye a un buen entendimiento del fenómeno y a la solución final del problema. Es necesario desarrollar todas las ideas acerca de los objetivos del experimento.

136

2. Selección de factores y niveles el experimento debe seleccionar el factor o los factores (variable o variables independientes) que serán investigados en el experimento. También se deberá seleccionar los valores o niveles del factor o factores que se usaran en el experimento y que definen los tratamientos. Al definir los tratamientos se esta definiendo al denominado especio de exploración o región de exploración.

3. Definir a la unidad experimental. La unidad experimental es aquella subdivisión menor del material experimental y que puede definir un tratamiento diferente. Para la selección de las unidades experimentales debe tomarse en cuenta el especto práctico, no puede considerarse representativo el uso de una planta para comparar dosis de fertilizante. En el aspecto estadístico debe tomarse en cuenta el tamaño de la unidad experimental y el número de repeticiones para la precisión del experimento. Se entiende por número de repeticiones al número de unidades experimentales que se repiten con el mismo tratamiento.

4. Definir las observaciones o mediciones. En general selección de variables respuesta.

5. Elección del diseño experimental. El diseño experimental es la forma de asignar los tratamientos o las unidades experimentales, esto determina un modelo o un análisis a seguir. El experimentador debe determinar la diferencia en la respuesta verdadera que desea detectar, así como la magnitud de riesgo que esta dispuesto a tolerar , con lo cual un tamaño de muestra apropiado puede ser seleccionado.

También debe determinar el orden en el cual los datos deberán ser recolectados y el método de aleatorización que será empleado.

Generalmente en diseños experimentales las ideas centrales guían a la elección de aleatorización y bloqueo.

El bloqueo es la inclusión en el diseño de algunos factores que aunque no son de interés, si pueden ser causa de una fuerte variación en las unidades experimentales y que no pueden mantenerse constantes para todas las unidades experimentales del experimento. Un bloque es un grupo de unidades experimentales que son más o menos homogéneas, de modo que la asignación de tratamientos diferentes a dichas unidades produzca en las observaciones un efecto más fácil de distinguir de otros factores aleatorios.

Se llama bloque completo a un grupo de unidades experimentales que contienen todos los tratamientos del experimento y bloque incompleto si contiene solo una parte de todos los tratamientos. Para el caso de dos tratamientos , los bloques completos son parejas de unidades experimentales semejantes y se les denomina observaciones apareadas.

La aleatorización es un medio de impartir insesgamiento a los estimadores, a pesar de tener unidades experimentales heterogéneas, es decir que todos los factores no estudiados, ni controlados explícitamente en el modelo y que causan variación las unidades experimentales, son “controlados” por la aleatorización.

6. Determinar el número de repeticiones. Las repeticiones son las veces que se reproduce cada tratamiento en la unidad experimental. Las repeticiones permiten obtener una estimación de la varianza del error experimental e incrementan la precisión del experimento ya que de hecho son el tamaño de muestra de cada una de las poblaciones estudiadas.

137

7. Proyecto de resultados y análisis. Estos aspectos deben determinarse antes de efectuar el experimento , para que puedan señalarse cuales son las suposiciones básicas del modelo y determinar si el experimento cumple satisfactoriamente tales suposiciones.

8. Efectuar el experimento y colección de datos. Debe tenerse cuidado en a especificación de los pasos prácticos a seguir y tener formas especialmente diseñadas para capta las observaciones.

9. Efectuar el análisis estadístico. Para este análisis existen programas de computadora , pero deben complementase con graficas, cuadros o lagunas rutinas de calculo extra que sean fácilmente explicables.

Obtención de conclusiones. Si el experimentador o investigador tiene poco conocimiento de la estadística, entonces debe ser auxiliado por un estadístico para la interpretación de los análisis

El modelo.

Las observaciones pueden expresarse en general mediante el siguiente modelo estadístico lineal:Yij = +i + εij

i = 1,2,...t j= 1,2,...n

Que es el diseño estadístico completamente aleatorizado y donde:

Yij : es la i-ésima observación tomada bajo el tratamiento i-ésimo.

μ: Es el parámetro común a todos los tratamientos (media general)

I : Es el parámetro del i-ésimo tratamiento denominado “ efecto del i-ésimo tratamiento”.

εij = Es el componente de error aleatorio ocasionado por todos los factores no constantes en cada una de las poblaciones estudiadas.

t: es el número de tratamientos (poblaciones)

n: Es el número de observaciones o tamaño de muestra de la i-ésima población.

El interés por desarrollar el análisis de varianza radica en que se desea probar la hipótesis sobre la igualdad de los efectos de los tratamientos, es decir:

Ho: 1 =2=3 ...=t vs Ha: 1≠ j para al menos i ≠ j

Si Ho es cierta entonces cada observación puede ser representada como:

Yij = + εij

El procedimiento del análisis de varianza se resume en el cuadro siguiente:

F.V G.L SC CM F0

TRATAMIENTOS t-1 SCTr CMTr=SCTr/(t-¡) CMTr/CME

138

ERROR nt-t SCE CME= SCE/(nt-t)

TOTAL nt-1 SCT

La suma de cuadrados puede obtenerse como sigue:

SCT =

SCTr = .

SCE = SCT – SCTr

Diseño experimental completamente aleatorizado

Es el diseño experimental más sencillo, y se origina por la asignación aleatoria de los tratamientos a un conjunto de unidades experimentales previamente establecidas. En este diseño pueden probarse cualquier número de tratamientos resultando deseable, aunque no esencial, asignar al mismo número de unidades experimentales a cada tratamiento.

Es un diseño experimental de mucha utilidad en todos los campos de la ciencia, siempre y cuando se consiga homogeneidad del material experimental y del sitio donde se vaya a desarrollar el experimento. Se podrían enumerar una serie de ventajas y desventajas del diseño:

Ventajas:

1.- Tanto la planificación como el análisis son los más simples si se les compara con los otros diseños conocidos.

2.- Produce el máximo número de grados de libertad para el error, lo que es muy útil en pequeños ensayos.

3.- Cuando existe un número desigual de replicaciones por tratamientos, no es causa de complicaciones en el análisis estadístico.

4.- Es de fácil manejo tanto en el campo como en el laboratorio.

Desventajas:

1.- Solo puede usarse con material experimental muy homogéneo.

2.- Su utilidad es restringida en los experimentos de campo, debido a la heterogeneidad del suelo, que puede ser muy grande. Para evitar que la misma enmascare los resultados del experimento, debe recurrirse a diseños muy eficientes.

139

3.- Presenta desventajas cuando el material no es homogéneo, ya que no se puede aumentar mucho el tamaño del experimento, debido a que esto motiva variaciones muy altas, que enmascaran el efecto del tratamiento.

En cuanto al número de observaciones para cada tratamiento o factor, se determina en base a los costos y a la potencia de la prueba.

Seguidamente se presenta con un ejemplo, los pasos a seguir para la realización del análisis en este tipo de diseño, donde se incluyen: modelo lineal aditivo, supuestos, hipótesis a probar.

En el presente cuadro se muestran los resultados (área intestinal en dmª), en un ensayo donde se prueba el efecto de 4 desparasitantes en cerdos estabulados.

Desparasitantes

OBS(n) 1 2 3 41 4.87 3.30 6.80 1.282 4.60 2.25 5.70 3.883 1.33 5.85 4.62 5.004 5.58 6.16 3.80 3.255 5.88 8.35 2.75 1.566 2.81 5.93 4.93 4.257 4.10 1.50 4.93 4.468 5.63 5.85 3.80 5.53total 34.84 38.19 37.33 29.21 139.53

n= número de observaciones por desparasitantes = 8

N= número total de observaciones = 32

Modelo lineal:

Yij iji

Yij: observación j-ésima del i-ésimo tratamiento.

μ: media general

i: efecto del i-ésimo tratamiento

εij: error experimental de la j-ésima observación en el i-ésimo tratamiento.

i=1,2,...,t

j=1,2,...,n

140

MODELO I MODELO II

i

i

t

10

2s si ~ NID(0, 2)

sij ~ NID(0, 2) sij ~ NID(0, 2)

Hipótesis:

MODELO I MODELO II

Ho iHa

:: i 0

¹

0

Ho i

Ha

:

:

i 0

2s s

¹

02

El modelo I se utiliza para tratamientos fijos como el caso del ejemplo, el modelo II, se aplica para aquellos tratamientos elegidos al azar.

Esquema del análisis de varianza:

F. V. G .L SC CMI CMII

TRATAMIENTOS t - 1 2

1

Yini

tFC.

- s

2

1

-

n

t

i 2 2s s n i

ERROR t n( )- 1 diferencia

2s

2s

TOTAL nt - 1 2

11Yij

j

n

i

tFC

-

FCn t

Yijj

n

i

t

( )

.

2

11

SCtrat

- 2

34 802

38 192

37 332

29 218

2139 53

326 139. . . . . .

Suma de cuadrados totales:

SCtot - 2

4 872

4 602

4 462

5 53

2139 53

3292 596. . ....... . .

. .

141

Suma de cuadrados del error experimental

SCEE SCtot SCtrat - 86 457.

Cuadrados medio del tratamiento

CMtratSCtrat

t

-

12 0463.

Cuadrado medio del error experimental:

CMEESCEE

t n

-

( ).

13 0877

Análisis de Varianza:

F DE V G DE L SC CM F0

Tratamientos 3 6.139 2.0463 0.662Error 28 86.457 3.0877Total 31

Prueba de hipótesis:

FCCMtrat

CMEE 0 662.

Fteoricon t

-2 2 1

2s

s

( )

Para probar la hipótesis compare el F calculado (0,662) con el F tabulado , este se encuentra en la tabla de "F", con los grados de libertad del numerador (tratamiento) y los grados de libertad del denominador (error experimental), y con un nivel de significación o probabilidad de cometer error tipo I ().Ftab,5% = 2.95 Ftab , 1% = 4,57Fcal = 0.662

De acuerdo a la no significación de F, se acepta la Ho: i=0, es decir, no hay diferencia entre los tratamientos (desparasitantes) estudiados; las áreas intestinales promedios correspondientes a los cerdos criados estabulados tratados con 4 desparasitantes, fueron estadísticamente iguales.

Experimento en bloques al azar

En muchos problemas experimentales es necesario diseñar el experimento de tal manera que la variabilidad debida a fuentes extrañas pueda ser controlada sistemáticamente. El remover la variabilidad de factores extraños nos permite reducir el error experimental. Un diseño que nos permite

142

tal situación es el denominada “diseño en bloques al azar”. Es una técnica de bloqueo de variación en el material experimental, bloqueo que puede ser en el tiempo o en el espacio. El diseño consiste en incluir en el modelo, algunos factores que aunque no son de interés, se reconoce que pueden causar una fuente de variación en las unidades experimentales del experimento. Así un bloque es un grupo de unidades experimentales que son más o menos homogéneas, de modo que la asignación de tratamientos diferentes a dichas unidades produzca en las observaciones un efecto más fácil de distinguir de otros factores aleatorios.

La estructura de los datos de este diseño es como sigue:BLOQUE 1 BLOQUE 2 BLOQUE b

El modelo estadístico para este diseño es:Yij = +I +βj + εij

i= 1,2,...,t; j= 1,2,...,b;

El procedimiento para un análisis de varianza para este modelo es el siguiente:

F.V G.L SC CM F0

TRATAMIENTOS t-1 SCTr CMTr=SCTr/(t-1) CMTr/CME

BLOQUES b-1 SCBlo CMBlo = SCBLo/b-1

ERROR (t-1)(b-1) SCE CME= SCE/(t-1)(b-1)

TOTAL tb-1 SCT


SCT =

SCTr =

SCBlo=

SCE = SCT – SCTr – SCBlo

143

Y11

Y21

Y31

.

.

.

Yt1

Y12

Y22

Y32

.

.

.

Yt2

Y1b

Y2b

Y3b

.

.

.

Ytb

Experimento factorial

Muchos experimentos requieren del estudio de los efectos de dos o más factores, los experimentos factoriales son los diseños más eficientes para este tipo de análisis. Se entiende por experimento factorial aquel donde en cada ensayo o repetición completa del experimento se investigan todas las posibles combinaciones de los niveles de los factores considerados. Por ejemplo, si se tienen 2 niveles del factor 1 y 3del factor 2, entonces cada repetición o ensayo contiene todas las 2x3 =6 combinaciones.

En algunos tratamientos puede encontrarse que las diferencias en respuesta entre los niveles de un factor no es la misma en todos los niveles de otros. Cuando esto ocurre entonces existe una interacción entre los factores. Por ejemplo, considérese un factor a y un factor b como se muestra en el siguiente cuadro:

b0 b1

a0 a0b0 = 20 a0b1 = 40

a1 a1b0 = 50 a1b1 = 12

Al primer nivel del factor b, el efecto simple del factor a es A= (a1b0)-(a0b0) = 50-20 = 30 y el efecto simple del factor a al segundo nivel del factor b es A = (a1b1)-(a0b1) = 12-40= -28. Entonces el efecto de a depende del nivel seleccionado para el factor b , entonces se dice que existe interacción entre los factores a y b. Lo anterior se ilustra gráficamente como sigue:

Figura. Experimento factorial sin interacción (A) y experimento factorial con interacción (B)

Graficas de este tipo son útiles en la interpretación de las interacciones significativas y en los informes de resultados para personas con poco o ningún entrenamiento estadístico, pero no pueden usarse como única técnica de análisis.

El procedimiento para el análisis de varianza de este experimento se resume en el siguiente cuadro.

F.V G.L SC CM F0

TRATAMIENTO (A) a-1 SCA CMA=SCA/(a-1) CMA/CME

TRATAMIENTO (B) b-1 SCB CMB = SCB/(b-1) CMB/CME144

INTERACCIÓN (AB) (a-1)(b-1) SCAB CMAB = SCAB/(a-1)(b-1) CMAB/CME

ERROR ab.(n-1) SCE CME= SCE/(t-1)(abn-1)

TOTAL abn-1 SCT


SCT =

SCA=

SCB=

SCAB = SC (Subtotales) – SCA- SCB

SC =

SCE = SCT – SCA – SCB - SCAB

145

Práctica 8 Análisis de varianza (ANOVA)

1. Determinar si el color del envase de un producto influye en las ventas del artículo. Se estableció un diseño experimental donde se evalúo el envase en tres colores: Rojo, Azul y Amarillo, y observaron las ventas en cada presentación. Obteniéndose los siguientes resultados.

Color Ventas $AzulAzulAzulAzulAzulRojoRojoRojoRojoRojoAmarillo Amarillo Amarillo Amarillo Amarillo

400250550600550300200450500 500480 220 360 400 650

2. En un sistema Regional de Control de Calidad, con 15 laboratorios afiliados se quiere investigar las fluctuaciones entre 3 diferentes maneras de medir RGR (Recuento de Glóbulos Rojos). La primera forma es usando equipos automatizados de recuento, o contadores hematológicos, tales como el Technicon H301 y similares. De entre todos los afiliados que usen ese método se eligen cinco de ellos al azar para conformar el Grupo 1. La segunda manera es usando el método microhematocrito y para ello, se eligen al azar, otros cinco afiliados que usan tal método para conformar el Grupo 2. Finalmente, el Grupo 3 se conforma con otros cinco laboratorios seleccionados al azar, de entre los que usan otros métodos, como por ejemplo el macrohematocrito, recuento en cámara, etc. Los 15 laboratorios siguen un programa de Control de Calidad interno y se suponen calibrados. Se envía a cada laboratorio una muestra ciega, con una sangre calibrada en el laboratorio de referencia de: (2,9467 0,0004).106 gl/ml.

Valores de RGR expresados en 106 gl/ml

146

3. Para controlar la influencia del factor humano en las mediciones clínicas se debe hacer medir lo mismo a varios operadores diferentes. Así, se pueden comparar los valores medidos por cada uno, entre sí, con un modelo de Anova. En el ejercicio siguiente se usa un modelo de un factor para ilustrar el método, sin embargo, cuanto más factores se tomen en cuenta, mejor será la sensibilidad del modelo estadístico para detectar las diferencias.

Registro 1.

Registro 2.

Registro 3.

147

CAPITULO 7

REGRESIÓN LINEAL

INTRODUCCIÓN

Una respuesta a la pregunta típica que hace cualquier estudiante que se enfrenta a las dificultades del razonamiento matemático, ¿ para que me sirven las matemáticas?, se plantea aquí como una muestra de la matemática aplicada en aspectos tangibles y cotidianos como la estadística y la matemática financiera.

Pero también en aspectos no tan tangibles como lo son los temas de potenciación, radiación, fracciones y ecuaciones trigonométricas que sirven de apoyo para otros temas como el cálculo diferencial e integral, el cual tiene una aplicación más directa., con estos elementos el estudiante de la Carrera de Procesos Agroindustriales se beneficia porque complementa su formación básica en matemáticas.


1. Analizar la importancia de los usos de la regresión lineal simple.1.1. Describir e ilustrar con ejemplos las aplicaciones practicas de la regresión lineal simple en el ámbito profesional.

149149


1.1.1. Practicar y utilizar la regresión lineal simple en el ámbito profesional.

OBJETIVO Y CRITERIOS DE APRENDIZAJE2. Expresar las ecuaciones para estimar los parámetros de regresión lineal, definiendo el coeficiente de correlación R2 y relacionarlo con la precisión de la recta estimada.2.1. Practicar e ilustrar las ecuaciones de mínimos cuadrados en la estimación de la recta e interpretar los parámetros de la regresión y el coeficiente de correlación R2.

161

161


2.1.1. Emplear las ecuaciones de mínimos cuadrados en la estimación de la recta e interpretar los parámetros de la regresión y el coeficiente de correlación R2.

DEMOSTRACIÓN DE HABILIDADES FINALESPa.9 Regresión lineal 175

148

TEMA 1

Objetivo de aprendizaje.1. Analizar la importancia de los usos de la regresión lineal simple.

Criterio de Aprendizaje.1.1. Describir e ilustrar con ejemplos las aplicaciones practicas de la regresión lineal simple en el ámbito profesional.


Modelo regresión lineal

Con este tipo de regresiones nos conformamos con encontrar relaciones funcionales de tipo lineal, es decir, buscamos cantidades a y b tales que se pueda escribir

Con el menor error posible entre e Y, o bien

De forma que sea una variable que toma valores próximos a cero.

Obsérvese que la relación explica cosas como que si X varía en 1 unidad, varía la cantidad b. Por tanto: Si b>0, las dos variables aumentan o disminuyen a la vez; Si b<0, cuando una variable aumenta, la otra disminuye. Por tanto, en el caso de las variables peso y altura lo lógico será encontrar que b>0. El problema que se plantea es entonces el de cómo calcular las cantidades a y b a partir de un conjunto de n observaciones

De forma que se minimice el error. Las etapas en que se divide el proceso que vamos a desarrollar son de forma esquemática, las que siguen:

1. Dadas dos variables X, Y, sobre las que definimos

Medimos el error que se comete al aproximar Y mediante calculando la suma de las diferencias entre los valores reales y los aproximados al cuadrado (para que sean positivas y no se compensen los errores):

149

2. Una aproximación de Y, se define a partir de dos cantidades a y b. Vamos a calcular aquellas que minimizan la función

3. Posteriormente encontraremos fórmulas para el cálculo directo de a y b que sirvan para cualquier problema.

Regresión de Y sobre X

Para calcular la recta de regresión de Y sobre X nos basamos en la figura.

Figura: Los errores a minimizar son las cantidades

Una vez que tenemos definido el error de aproximación mediante la relación las cantidades que lo minimizan se calculan derivando con respecto a ambas e igualando a cero (procedimiento de los mínimos cuadrados):

150

La relación no es más que otra manera de escribir la relación, que se denomina ecuaciones normales. La primera de se escribe como

Sustituyendo se tiene que

Lo que nos da las relaciones buscadas:

La cantidad b se denomina coeficiente de regresión de Y sobre X.

Regresión de X sobre Y

Las mismas conclusiones se sacan cuando intentamos hacer la regresión de X sobre Y. Para calcular la recta de regresión de X sobre Y es totalmente incorrecto despejar de

151

Pues esto nos da la regresión de X sobre , que no es lo que buscamos. La regresión de X sobre Y se hace aproximando X por , del modo

Donde

Pues de este modo se minimiza, en el sentido de los mínimos cuadrados, los errores entre las cantidades

xi y las

Figura: Los errores a minimizar son las cantidades

Ejemplo

En una muestra de 1.500 individuos se recogen datos sobre dos medidas antropométricas X y Y. Los resultados se muestran resumidos en los siguientes estadísticos:

Obtener el modelo de regresión lineal que mejor aproxima Y en función de X. Utilizando este modelo, calcular de modo aproximado la cantidad Y esperada cuando X=15.

Solución:

152

Lo que se busca es la recta, que mejor aproxima los valores de Y (según el criterio de los mínimos cuadrados) en la nube de puntos que resulta de representar en un plano (X,Y) las 1.500 observaciones. Los coeficientes de esta recta son:

Así, el modelo lineal consiste en:

Por tanto, si x=15, el modelo lineal predice un valor de Y de:

En este punto hay que preguntarse si realmente esta predicción puede considerarse fiable. Para dar una respuesta, es necesario estudiar propiedades de la regresión lineal que están a continuación.

Propiedades de la regresión lineal

Una vez que ya tenemos perfectamente definida , (o bien ) nos preguntamos las relaciones que hay entre la media y la varianza de esta y la de Y (o la de X). La respuesta nos la ofrece la siguiente proposición:

En los ajustes lineales se conservan las medias, es decir

En cuanto a la varianza, no necesariamente son las mismas para los verdaderos valores de las variables X y Y, y sus aproximaciones y , pues sólo se mantienen en un factor de r2, es decir,

Basta probar nuestra afirmación para la variable Y, ya que para X es totalmente análogo:

153

Donde se ha utilizado la magnitud que denominamos coeficiente de correlación, r, y que ya definimos anteriormente como

Como consecuencia de este resultado, puede decirse que la proporción de varianza explicada por la

regresión lineal es del .

Nos gustaría tener que r=1, pues en ese caso ambas variables tendrían la misma varianza, pero esto no es cierto en general. Todo lo que se puede afirmar, como sabemos, es que

Y por tanto

La cantidad que le falta a la varianza de regresión, , para llegar hasta la varianza total de Y, ,

es lo que se denomina varianza residual, que no es más que la varianza de , ya que

El tercer sumando se anula según las ecuaciones normales expresadas en la relación:

154

Por ello

Obsérvese que entonces la bondad del ajuste es

Para el ajuste contrario se define el error como , y su varianza residual es también proporcional a 1-r2:

Y el coeficiente de determinación (que sirve para determinar la bondad del ajuste de X en función de Y) vale:

Para los ajustes de tipo lineal se tiene que los dos coeficientes de determinación son iguales a r2, y por tanto representan además la proporción de varianza explicada por la regresión lineal:

Por ello:

Si el ajuste es bueno (Y se puede calcular de modo bastante aproximado a partir de X y viceversa).

Si las variables X e Y no están relacionadas (linealmente al menos), por tanto no tiene sentido hacer un ajuste lineal. Sin embargo no es seguro que las dos variables no posean ninguna relación en el caso r=0, ya que si bien el ajuste lineal puede no ser procendente, tal vez otro tipo de ajuste sí lo sea.

Ejemplo 1

155

De una muestra de ocho observaciones conjuntas de valores de dos variables X e Y, se obtiene la siguiente información:

Calcule: 1. La recta de regresión de Y sobre X. Explique el significado de los parámetros. 2. El coeficiente de determinación. Comente el resultado e indique el tanto por ciento de la variación de Y que no está explicada por el modelo lineal de regresión.

3. Si el modelo es adecuado, ¿cuál es la predicción para x=4.

Solución:

1. En primer lugar calculamos las medias y las covarianza entre ambas variables:

Con estas cantidades podemos determinar los parámetros a y b de la recta. La pendiente de la misma es b, y mide la variación de Y cuando X aumenta en una unidad:

Al ser esta cantidad negativa, tenemos que la pendiente de la recta es negativa, es decir, a medida que X aumenta, la tendencia es a la disminución de Y. En cuanto al valor de la ordenada en el origen, a, tenemos:

Así, la recta de regresión de Y como función de X es:

2. El grado de bondad del ajuste lo obtenemos a partir del coeficiente de determinación:

156

Es decir, el modelo de regresión lineal explica el de la variabilidad de Y en función de la de X. Por

tanto queda un de variabilidad no explicada.

3. La predicción que realiza el modelo lineal de regresión para x=4 es:

Lo cual hay que considerar con ciertas reservas, pues como hemos visto en el apartado anterior, hay una razonable cantidad de variabilidad que no es explicada por el modelo.

Ejemplo 2Se realizan 8 mediciones de textura y grado de madurez a 10 manzanas golden, obteniéndose los siguientes resultados:

Resultado de las mediciones

textura 12 8 10 11 7 7 10 14

grado de madurez 58 42 51 54 40 39 49 56

¿Existe una relación lineal importante entre ambas variables? Calcular la recta de regresión de la textura en función del grado de madurez y la del grado de madurez en función de la textura. Calcular la bondad del ajuste ¿En qué medida, por término medio, varía el grado de madurez?

Solución:

Para saber si existe una relación lineal entre ambas variables se calcula el coeficiente de correlación lineal, que vale:

Ya que

157

Por tanto el ajuste lineal es muy bueno. Se puede decir que el ángulo entre el vector formado por las desviaciones del grado de madurez con respecto a su valor medio y el de la textura con respecto a su valor medio, , es:

Es decir, entre esos vectores hay un buen grado de paralelismo (sólo unos 19 grados de desviación). La recta de regresión del grado de madurez en función de la textura es:

La recta de regresión de la edad como función del peso es

Que como se puede comprobar, no resulta de despejar en la recta de regresión de Y sobre X. La bondad del ajuste es

Por tanto podemos decir que el de la variabilidad del grado de madurez en función de la textura es explicada mediante la recta de regresión correspondiente. Lo mismo podemos decir en

158

cuanto a la variabilidad de la textura en función del grado de madurez. Del mismo modo puede decirse

que hay un de varianza que no es explicada por las rectas de regresión. Por tanto la varianza residual de la regresión del grado de madurez en función de la textura es:

Y la de la textura en función del peso:

Análisis de varianza del modelo lineal

Regresión Lineal

Un problema clásico en estadística es tratar de determinar la relación entre dos variables aleatorias X y Y. Por ejemplo, podríamos considerar el alto y ancho de una muestra de adultos.

La regresión lineal trata de explicar esta relación con una línea recta que trata de acercarse lo mas posible a todos los puntos de la muestra.

La regresión lineal postula que Y= a+bX+e

Donde el "residual" e es una variable aleatoria de media cero. El coeficiente a y b son escogidos de forma tal que la suma de los cuadrados de los residuales sea lo mas cercano a cero posible.

En multitud de ocasiones, son varias las variables que se observan en la realización de un muestreo, existiendo entre ellas dependencias estadísticas. En tales situaciones puede plantearse el problema de hasta qué punto el conocimiento de unas variables, llamadas explicativas, aportan información suficiente para predecir los valores de otras denominadas de respuesta.

Dependiendo de los contextos, de las hipótesis que se consideren válidas, de la naturaleza de las variables y del número de éstas, se utilizarían los diferentes métodos de regresión.

Regresión Simple (Recta de Regresión)

Los datos y el modelo

El problema de la regresión lineal simple entre dos variables X y Y se reduce a calcular la recta de regresión que mejor represente su distribución conjunta. Los datos se presentan como una matriz de dos columnas:

159

Siendo (xi, yi), con i= 1, 2, ..., n, el i-ésimo par observado.

Se pretende ajustar un modelo de la forma yi=a xi+b+ei

Bajo las siguientes hipótesis:

1. La variable respuesta yi depende de la variable explicativa xi de forma lineal (con pendiente a y ordenada en origen b), más un factor residual aleatorio ei. 2. Los residuos tienen distribución normal de media 0 y varianza desconocida. 3. Estos factores aleatorios son independientes entre sí.

Nota: en el Anexo se pueden encontrar más ejercicios, además de las tablas de: Z, Ji2,

160

TEMA 2

Objetivo de aprendizaje.2. Expresar las ecuaciones para estimar los parámetros de regresión lineal, definiendo el coeficiente de correlación R2 y relacionarlo con la precisión de la recta estimada.

Criterio de Aprendizaje.2.1. Practicar e ilustrar las ecuaciones de mínimos cuadrados en la estimación de la recta e interpretar los parámetros de la regresión y el coeficiente de correlación R2.

Didáctica de enseñanza.Pa.9 Regresión Lineal

Estimación de parámetros

Los parámetros de la recta de regresión, a y b, se calculan siguiendo el criterio de los mínimos cuadrados, lo que lleva a los siguientes resultados:

Siendo

Y

Las medias de ambas variables estadísticas.

La varianza residual es desconocida, siendo su estimador insesgado

El coeficiente de correlación

Definiendo el coeficiente de correlación como

,

Que sólo toma valores en el intervalo [-1, 1], nos da una idea de hasta qué punto el ajuste lineal es razonable:

161

Si r es próximo a -1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi) alrededor de una recta de pendiente negativa. Si r es próximo a 0: el ajuste no es aceptable, indicando que no existe relación lineal entre las variables. Si r es próximo a +1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi) alrededor de una recta de pendiente positiva.

Contraste de independencia

El contraste de independencia entre las variables es más objetivo que la simple observación del coeficiente de correlación r. Así se plantea comprobar si los datos observados corroboran o no la hipótesis nula:

H0: "la variable explicativa X no influye en la respuesta Y". Frente a la alternativa:

H1: "la variable explicativa X influye linealmente en la respuesta Y". Mediante el estadístico de contraste

Que se distribuye como una tn-2 de Student, se puede contrastar la hipótesis nula H0 al nivel de significación del 5%.

Caso

Se dispone de los datos de ocho anestesias de diferente duración, efectuadas con un anestésico volátil y del tiempo en que se restablece la conciencia suficiente como para contar hacia atrás desde un número determinado sin error:

Duraciónanestesia (min)

Duracióndespertar (min)

150 13127 16160 21210 20250 16130 1360 1255 14

Se intenta probar la hipótesis de que la duración del despertar no está influida por la de la anestesia. El coeficiente de correlación para esta muestra es de 0.562231, a medio camino entre el 0 y el 1, no permitiendo dar una respuesta segura sobre el contraste; en cambio, el estadístico A toma un valor de 1.66531, del que se puede deducir que la hipótesis no puede rechazarse al nivel del 5%; en conclusión, no hay indicios de que la duración del despertar esté linealmente relacionada con el tiempo de duración

162

de la anestesia. Si se hubiese rechazado la hipótesis de independencia, se podrían ajustar los datos a la recta de ecuación

y = 0.03 x + 11.62, siendo x la duración de la anestesia e y la del despertar.

Regresión Lineal Múltiple

Los datos y el modelo

Se trata de predecir el valor de una variable respuesta (y) como función lineal de una familia de m variables explicativas (x1, x2, ..., xm), a partir de una muestra de tamaño n cuyas observaciones se ordenan matricialmente:

Siendo yi la i-ésima variable respuesta y xi,j la j-ésima variable explicativa asociada a la observación i. Así las cosas, se trata de ajustar los datos a un modelo de la forma

Bajo las siguientes hipótesis:

1. Los residuos ei son normales de media 0 y varianza común desconocida ; además, estos residuos son independientes. 2. El número de variables explicativas (m) es menor que el de observaciones (n); esta hipótesis se conoce con el nombre de rango completo. 3. No existen relaciones lineales exactas entre las variables explicativas.

Estimación de los parámetros de regresión

El estimador del vector paramétrico es

Siendo

163

Habiéndose indicado la transposición matricial mediante el superíndice T.

Estimación de la varianza

El estimador insesgado de la varianza , conocido con el nombre de varianza residual, tiene por expresión

Coeficiente de determinación corregido

El coeficiente de determinación corregido, definido como

Siendo

Mide el ajuste del modelo, se interpreta como el porcentaje de variación de la variable respuesta explicada por el modelo; así, cuanto más se acerque R2 a 100, con más confianza se podrá considerar el modelo lineal como válido.

Contraste de regresión

El contraste de regresión es imperativo a la hora de diagnosticar y validar el modelo que se está ajustando; consiste en decidir si realmente la variable respuesta y es función lineal de las explicativas x1, x2, ..., xm. Formalmente, el contraste se plantea en los siguientes términos:

H0: "no existe dependencia lineal: " Frente a la alternativa:

H1: "sí existe alguna dependencia lineal: ". El estadístico de contraste es

Que se distribuye como una Fm,n-m-1 de Snedecor. El contraste se realiza con un nivel de significación del 5%.

Caso

164

En una muestra de 25 hospitales, el analista ha recogido los siguientes datos sobre el costo anual en 1988 (variable respuesta), así como sobre el personal sanitario y el número de camas durante el mismo año.

Costehospitalario

Personalsanitario

Númerode camas

1000 100 300750 50 150500 25 100350 15 70400 20 80750 30 100850 70 200450 30 90450 35 100350 25 75800 39 125950 70 260900 60 215500 25 951000 65 300365 20 75400 45 94525 50 108400 46 93400 46 93350 20 76500 36 129600 50 183550 50 145750 65 250800 70 275

Se quiere ajustar un modelo lineal que devuelva el coste de mantenimiento hospitalario en función del personal sanitario y del número de camas.

En primer lugar observamos que el número de variables explicativas es 2, por lo que se necesitan estimar tres parámetros de regresión: 222.28 para el término independiente, 1.28 para la variable personal sanitario y 2.24 para el número de camas. La desviación típica residual y el coeficiente de determinación corregido toman los valores 107.80 y 76.49%, respectivamente. Finalmente, el contraste de regresión rechaza la hipótesis de independencia al nivel del 5%, dando a entender que no hay indicios de que el modelo lineal

y = 222.28 + 1.28 x1 + 2.24 x2

Deba ser rechazado. Sin embargo, un análisis más detallado muestra que la inclusión de la variable personal sanitario no aporta información relevante, de modo que al eliminarla se obtiene el modelo y = 232.34 + 2.55 x2,

165

Con una desviación típica residual de 106.08 y un coeficiente de determinación de 77.23%, parámetros de diagnóstico ligeramente mejores que los anteriores. Para comprobar estos resultados, eliminar en el panel superior de entrada los datos centrales (100, 50, 25, 15, etc.) y volver a pulsar la barra central.

Método de mínimos cuadrados

La formula de regresión de la muestra que represéntale modelo de regresión en línea recta sería:

Ŷі =bo + b1Xі

Donde Ŷі es el valor del predicho de Y para la observación і y Xі

Estimación por mínimos cuadrados generalizados.

En un modelo de regresión lineal se supone que la matriz de varianzas-covarianzas de los errores es de la forma

Siendo In la matriz identidad de orden n. Si no se verifica la hipótesis de homocedasticidad, o la de independencia, o ambas, entonces la matriz de varianzas-covarianzas tiene la forma general

Siendo una matriz simétrica, definida positiva de orden n × n. En este caso, se puede calcular el estimador de por el método de mínimos cuadrados generalizados. Este método se desarrolla en dos etapas: en una primera etapa se transforma el modelo de regresión original

Para ello y por ser una matriz simétrica, definida positiva, existe una matriz cuadrada P tal que

Esta matriz no tiene porque ser única, pero si existe. Multiplicando por P la ecuación de regresión se obtiene

(10.3)

Denominando * = P , X* = PX y * = P , se obtiene la ecuación de regresión

Y los errores del modelo verifican

166

Por tanto los errores son incorrelados y homocedásticos. Ahora se puede aplicar el método de mínimos

cuadrados ordinarios a estos datos transformados para obtener el estimador

Por el Teorema de Gauss-Markov, este estimador G es el mejor estimador lineal insesgado. En la

práctica, la matriz P, aunque existe, es desconocida y es necesario estimarla a partir de las observaciones, obteniendo el estimador

A continuación se exponen dos situaciones comunes en las que se puede aplicar este método de estimación.

Heterocedasticidad.

Si las observaciones son independientes pero heterocedásticas entonces la matriz de varianzas-covarianzas viene dada por

Y la matriz P

En este caso los datos transformados son

167

Esto equivale a trabajar con el modelo transformado

Sobre este modelo se aplica ahora el método de mínimos cuadrados ordinarios. En particular, si se trabaja con el modelo de regresión lineal se obtiene el siguiente estimador del coeficiente de regresión

Este estimador se denomina estimador por mínimos cuadrados ponderados y es un caso particular del estimador por mínimos cuadrados generalizados. En la práctica, para utilizar este estimador hay que calcular estimadores de los parámetros 1

2,..., n2 , lo que puede hacerse por uno de los siguientes

métodos:

* Suponer que la varianza se ajusta a una función

Y estimar la función g.

* Hacer grupos en las observaciones (en el orden en que se han recogido) normalmente del mismo tamaño k y suponer que en cada grupo la varianza es constante. Entonces se estima la varianza en cada grupo a partir de las observaciones del grupo. Una forma de conseguir esto es ajustar el modelo de regresión por mínimos cuadrados ordinarios a las observaciones originales y a partir de los residuos de este modelo obtener los estimadores de la varianza en cada grupo.

Observaciones dependientes.

Si las observaciones son homocedásticas pero dependientes entonces la matriz de varianzas-covarianzas es de la forma general

168

En la mayoría de las situaciones la estructura de dependencia de los errores puede ajustarse a un modelo paramétrico. Un modelo sencillo y muy utilizado es el modelo AR , (modelo autorregresivo de orden uno). En este caso se verifica que los errores siguen la ecuación

siendo la autocorrelación de orden 1 del proceso t, por tanto, < 1, y at es una sucesión de variables aleatorias independientes e igualmente distribuídas.

En este caso, la matriz de varianzas-covarianzas es

La matriz P de transformación es

Y la matriz -1 es

Utilizando esta matriz se obtiene el estimador por mínimos cuadrados generalizados

169

Nuevamente, en la práctica, -1 es desconocido y se tiene que estimar. Por la forma de la matriz -1, es suficiente con estimar el parámetro y sustituir en la matriz. Para estimar , puede utilizarse el siguiente procedimiento: ajustar a los datos el modelo de regresión lineal por mínimos cuadrados ordinarios y calcular los residuos mínimo cuadráticos

A partir de estos residuos se obtiene el siguiente estimador de ,

sustituyendo por en la matriz -1 se obtiene la matriz estimada -1, a partir de la cual se obtiene el estimador

Siguiendo este procedimiento se puede obtener el siguiente estimador iterativo:

Paso 1. Se utiliza el estimador F para obtener nuevos residuos ei'.

Paso 2. De estos residuos se obtiene un nuevo estimador '. Paso 3. Utilizando ' se calcula un nuevo estimador F

'.

Se continúa el proceso de forma iterativa (volver al Paso 1) hasta obtener la convergencia del estimador F (estimador iterativo de Cochran y Orcutt (1949)).

En este problema también se pueden considerar otros estimadores del parámetro o modelos de dependencia más complejos que dependen de un número mayor de parámetros.

Ejemplo “Se desea ajustar un modelo de regresión lineal simple de diseño fijo a cien observaciones, donde los valores de la variable explicativa son xi = i/n, i = 1,...,100 (diseño fijo equiespaciado) y los valores de la variable respuesta vienen dados en la tabla adjunta (leídos por columnas). Analizar la hipótesis de independencia de los residuos”.

2'41

1'43

2'34

2'11

2'91

4'52

3'55

3'63

2'32

2'59

3'10

1'49

2'56

2'13

2'64

4'14

3'04

3'64

2'46

3'15

2'61

1'85

2'55

1'85

2'53

4'17

3'34

3'40

2'31

3'29

1'8 1'6 2'9 2'2 2'7 3'6 3'2 3'1 2'4 3'2170

7 9 5 5 5 6 1 7 1 3

1'471'01

2'282'42

2'722'84

2'152'80

2'292'81

2'702'56

3'312'76

3'163'47

2'693'24

2'702'08

1'48

1'91

2'08

3'14

3'19

2'30

3'39

3'52

2'80

2'57

1'47

2'73

2'10

3'03

3'43

3'10

3'84

3'53

3'29

3'17

1'85

1'93

2'03

3'05

3'22

3'89

4'07

3'22

3'14

2'80

1'91

1'93

1'70

3'31

4'24

3'60

3'45

2'52

2'78

2'38

Ajustando la recta de regresión por mínimos cuadrados se obtiene

Las observaciones muestrales y la recta ajustada se representan en la Figura.

Figura. Datos y recta ajustada por MCO.

Los residuos de este modelo presentan una clara dependencia positiva. Esto se observa en el gráfico de residuos frente al índice

171

Figura Residuos MCO según índice.

En la Figura 10.3. Se representa el correlograma (f.a.s.) de los residuos del modelo y se observa que las primeras autocorrelaciones de los residuos son muy altas. En particular, r1 = 0'758, con desviación típica = 0'099. Utilizando el contraste de independencia de Ljung-Box (Sección 4.7.2.) se obtiene para m = 5 (número de retardos) que

Figura. F.a.s. de los residuos MCO.

172

En la Figura se representa el gráfico de autocorrelaciones parciales (f.a.p.) de los residuos y se observa que la fap de orden uno es muy grande. De todo se concluye que no se acepta la hipótesis de independencia.

Figura. F.a.p. de los residuos MCO.

De los gráficos representados en las Figuras 10.3 y 10.4 se deduce que la sucesión de errores del modelo de regresión sigue una estructura de dependencia del tipo AR (1) con = 0'758. En base a ello se estima la recta de regresión por mínimos cuadrados generalizados utilizando la matriz de transformación dada anteriormente. Se obtiene el siguiente modelo de regresión

Las dos rectas de regresión obtenidas por mínimos cuadrados y por mínimos cuadrados generalizados se representan en la Figura siguiente. En este ejemplo la diferencia entre las dos rectas estimadas es pequeña.

173

Figura. Las dos rectas ajustadas.

174

Práctica 9Regresión lineal


1. Sea la matriz de covarianzas entre X y Y: > var(datos) X YX 1.866667 1.100Y 1.100000 1.175Halla la correlación lineal entre ambas (rXY).

2. Sea la variable dependiente Z predicha a través de la expresión lineal aY+b, donde Y es una variable regresora. Deduce la expresión de los estimadores de a y b por mínimos cuadrados.

3. Sean las variables X = "número de hijos" y Y = "gastos navideños". La siguiente tabla recoge las frecuencias observadas en cierta encuesta:

Y \X 0 1 2 5 3 3 2 10 8 9 3 15 5 9 7 20 0 1 2

Da las medias y desviaciones típicas de cada variable, así como el coeficiente de correlación lineal entre las dos.

4. Considera una regresión Y=a+bX. Se pretende predecir el comportamiento de Y para X=X0. Explica las diferencias entre un intervalo de confianza para el valor esperado de Y y un intervalo de predicción para Y.

5. Se quiere predecir la variable Z a partir de alguna (y sólo una) de las variables X, Y y V. ¿Cómo decidirías cuál de las tres escoger? 6. ¿Cómo se expresa la calidad de un análisis de regresión?

7. En un proceso agroindustrial, se han considerado el factor A = "intensidad media" y B = "cantidad de proyección". Se han observado treinta valores (ai,bi) (i=1..30). Representados gráficamente, parece que adoptan una forma hiperbólica. Por ello, se pretende ajustar la curva AB=x+yA, siendo x y y parámetros de la curva. ¿Cómo llevarías a cabo el análisis?

8. La siguiente tabla presenta una muestra experimental relacionada con un estudio sobre la influencia del tiempo trascurrido desde el despertar (T) en el rendimiento en una prueba sicotécnica (R): 9.

T 2'5 2'8 3'1 3'3 3'9 4'0 4'5 R 9'6 9'9 9'8 9'9 9'2 9'1 7'8

Los puntos adoptan una disposición claramente parabólica. Describe un modelo matemático y un método de análisis adecuados.

175

10. Un fabricante de motos pretende determinar qué factores influyen en la velocidad máxima que pueden alcanzar sus modelos. Efectúa mediciones de la velocidad máxima que alcanzan ochenta motos, para las cuales registra los valores de cuarenta variables continuas que piensa pueden tener relación con aquélla: potencia, cilindrada, dimensiones, aerodinámica, etc. Propón un método para llevar a cabo el estudio, detallando los pasos principales.

11. Da una interpretación del coeficiente de determinación.

12. En un estudio llevado a cabo en ocho ciudades de México, se obtuvo el número de autos y celulares por cada mil habitantes:

Provincia Xicotepec Zacatlán Huahuchinango Teziutlán Acatlán Tehuacán Amozoc Zaragoza Autos 58 84 78 81 82 102 85 102Móviles 64 78 83 88 89 99 101 102

Discute qué proporción de la variación de la tasa de celulares por mil habitantes puede explicarse a partir de la tasa de autos. Dato: la recta de mínimos cuadrados de "móviles" sobre "autos" es 19'83+0'81×autos, con r=0'87.

13. Relaciona el coeficiente de determinación con el contraste de regresión

176

V REFERENCIAS

Rendón, S. Gilberto. 1997. “Muestreo, aplicación en la estimación simultánea de varios parámetros”. Universidad Autónoma Chapingo, México.

Rendón, S. Gilberto. 1998. “Métodos estadísticos, muestreo, diseños experimentales, estadística no paramétrica”. Universidad Autónoma Chapingo, México.

Tamayo, T. Mario. 1998. “El proceso de la investigación científica”

Levin, I. Richard; Rubin S. David. 1996. “Estadística para Administradores”, Ed. Prentice Hall, Sexta Edición

Menderihall, William; Wackerly, Demis; . “Estadística Matemáticas”

León T., Aurelio et al. “Antología de Matemáticas IV”, Colegio de Bachilleres del Estado de Puebla.

Sitios de internet visitados:

www.//ftp.metprev.uma.es

http://ftp.medprev.uma.es/libro/html.htm

http://www.hrc.es/bioest/Anova_1.html

http://www.itson.mx/un/posgrado/Estadistica/Descriptiva%20,%20teoria,%20ejercicios.doc

http://highered.mcgraw-hill.com/sites/9701033612/information_center_view0/ tabla_de_contenido.html

http://www.seh-lelha.org/ancova.htm

http://www.sportsci.org/resource/stats/ancova.html

http://trochim.human.cornell.edu/kb/expcov.htm

http://www.angelfire.com/emo/tomaustin/Met/guiaseismuestra.htm

http://www.uv.es/~meliajl/Research/LibroBMDP/BMBPinde.html

http://www3.uji.es/~mateu/ejer-tema5-d37.doc

http://www.hrc.es/bioest/Ejemplos_histo.html

http://www.gesell.com.ar/geselinos/egb/problema.htm

VI GLOSARIO

177

http://www.hrc.es/bioest/Ejemplos_histo.html

http://www.hrc.es/bioest/Anova_1.html

http://ftp.medprev.uma.es/libro/html.htm

http://www.//ftp.metprev.uma.es

VII ANEXOS

Ejercicios y ejemplos

Concepto de variable aleatoria.Se llama variable aleatoria a toda aplicación que asocia a cada elemento del espacio muestral de un experimento, un número real.

Ejemplo: Sea el experimento que consiste en lanzar tres monedas al aire. El espacio muestral será:

Si a cada elemento de E le hacemos corresponder, por ejemplo, el número de caras, hemos definido una variable aleatoria.

Se utilizan letras mayúsculas para designar las v.a. y sus respectivas letras minúsculas para los valores concretos de las mismas.

Variable aleatoria discreta.Es la que solo puede tomar determinados valores.La variable aleatoria número de caras en el lanzamiento de tres monedas sólo puede tomar los valores 0, 1, 2 y 3. (Es discreta).La variable aleatoria suma de las caras superiores en el lanzamiento de dos dados puede tomar solamente los valores 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 y 12. (Es también discreta)

Función de probabilidad de una v.a. discreta.Es la aplicación que asocia a cada valor x de la v.a. X su probabilidad p.Los valores que toma una v.a. discreta X y sus correspondientes probabilidades suelen disponerse en una tabla con dos filas o dos columnas llamada tabla de distribución de probabilidad:

En toda función de probabilidad se verifica que

Ejemplo: La v.a. “número de caras en el lanzamiento de tres monedas” tiene la siguiente función de probabilidad:

Nº de caras 0 1 2 3f(x)=

Función de distribución de una v.a. discreta.Sea X una v.a. cuyos valores suponemos ordenados de menor a mayor.Se llama función de distribución de la variable X a la función que asocia a cada valor de la v.a. la probabilidad acumulada hasta ese valor, es decir,

Media, varianza y desviación típica de una variable aleatoria discreta.Se llama de una v.a. discreta X, que toma los valores con probabilidades

al valor de la siguiente expresión: La varianza viene dada por la siguiente fórmula:

, bien

La desviación típica es la raiz cuadrada de la varianza.

178

Ejercicio.La distribución de probabilidad de una v.a. X viene dada por la siguiente tabla:

xi pi 0,1 0,3 0,2 0,3

¿Cuánto vale p(X=3)Calcula la media y la varianza.

Solución:La suma de todas las probabilidades es 1, por tanto,

luego p(X=3)=0,1

Formamos la siguiente tabla:

12345

0,10,30,10,20,3

0,10,60,30,81,5

0,11,20,93,27,5

Experimento de BernoulliEs un experimento que tiene las siguientes características:1. En cada prueba del experimento sólo son posibles dos resultados: el suceso ha llamado A llamado éxito y el suceso

llamado fracaso.

2. El resultado obtenido en cada prueba es independiente de los resultados anteriores.

3. La probabilidad del suceso A es constante y no varía de unas pruebas a otras.

La distribución de probabilidad de este experimento recibe el nombre de distribución binomial de parámetros n y p

n es el número de pruebas del experimento y p es la probabilidad del éxito.

Si representamos por X la variable aleatoria binomial que representa el número de éxitos obtenidos en las n del experimento, podemos escribir:

p(obtener r éxitos )=p(X=r)=

Esta expresión recibe el nombre de función de probabilidad de una distribución binomial o de Bernoulli.

Dado que en este tipo de experiencias los cálculos pueden ser laboriosos, se han construido unas tablas que nos proporcionan la probabilidad de que la variable X tome distintos valores, según los distintos valores de n y r.

Media y varianza de una distribución binomial. Media:

Varianza:

Desviación típica:

179

Ejercicios resueltos.

1.- Calcula la probabilidad de que una familia que tiene 4 hijos, 3 de ellos sean varones.

Solución: Se trata de un experimento de Bernoulli donde n=4 y p=1/2

p(obtener 3 varones)=P(X=3)=

Recuerda:

es un número combinatorio cuyo valor se obtiene así:

En general

2.- Se tiene una moneda trucada de modo que la probabilidad de sacar cara es cuatro veces la de sacar cruz. Se lanza 6 veces la moneda. Calcula las siguientes probabilidades: Obtener dos veces cruz. Obtener a lo sumo dos veces cruz.

Solución:Calculamos en primer lugar la probabilidad de cara y de cruz:p(cara)+p(cruz)=1. Si llamamos x a la probabilidad de sacar cruz, podemos escribir:4x+x=1; 5x=1; x=0,2Así resulta: p(cruz)=0,2 y p(cara)=0,8Es una distribución binomial de parámetros n=6 y p=0,2

Probabilidad de obtener dos veces cruz:

Probabilidad de obtener a lo sumo dos veces cruz:

=

3.- La probabilidad de que un alumno de 1º de Bachillerato repita curso es de 0,3. Elegimos 20 alumnos al azar. ¿Cuál es la probabilidad de que haya exactamente 4 alumnos repetidores?

Solución:Se trata de una binomial de parámetros 20 y 0,3, es decir, B(20; 0,3)Si X es el número de alumnos que repiten,

4.- Calcula la esperanza matemática, la varianza y la desviación típica de la variable aleatoria X, cuya función de probabilidad viene dada por la siguiente tabla:

xi -4 -1 2 50,1 0,5 0,3 0,1

Solución:180

La esperanza matemática es la media:

5.- Sea la siguiente función de probabilidad:

xi1 3 5 7 9

pi 0,2 0,2 0,4 0,1 0,1

Escribe la función de distribución y calcula: y

Solución:xi

1 3 5 7 9

F(x)=P(X ≤ xi) 0,2 0,4 0,8 0,9 1

;

181

Ejercicios propuestos.

1.- La probabilidad de que un reloj salga de fábrica defectuoso es del 4 %. Halla:a) El número de relojes defectuosos esperados en un lote de 1000b) La varianza y la desviación típica.

( Solución: 40 y 6,19)

2.- Una determinada raza de perros tiene 4 cachorros en cada camada. Si la probabilidad de que un cachorro sea macho es de 0,55, se pide:a) La probabilidad de que en una camada dos exactamente sean hembrasb) Probabilidad de que en una camada al menos dos sean hembras.

(Solución: 0,3675; 0,609 )

3.- Considera una variable aleatoria discreta X cuya distribución de probabilidad es la siguiente:xi 1 2 3

P(X = xi) k 0,45 k a) Calcula el valor de kb) Halla la función de probabilidad c) Halla la función de distribución F.

Solución k = 0,275. Función de probabilidad:

xi 1 2 3f(x)=P(X = xi) 0,275 0,45 0,275

Función de distribución:

xi 1 2 3F(x)=P(X ≤ xi) 0,275 0,725 1

4.- Considera una variable aleatoria X cuya función de probabilidad viene dada por la siguiente tabla:x -25 -10 0 5

f(x) a 2a 3a 4a

a) Deduce el valor de a.b) Halla la función de distribución Fc) Calcula la esperanza, la varianza y la desviación típica.

Solución: a) 0,1; c) –2,5; 86,25; 9,29

5.- La probabilidad de que un estudiante obtenga el título de arquitecto es 0,3. Calcula la probabilidad de que un grupo de 7 estudiantes matriculados en primer curso:a) Ninguno de los 7 finalice la carrera.b) Finalicen los 7.c) Al menos 2 acaben la carrera.d) Sólo finalice uno la carrera.

Solución: 0,082; 0,00021; 0,671; 0,2471

6.- El 20 % de los tornillos de un gran lote so defectuosos. Se cogen tres tornillos al azar y se pide calcular razonadamente:a) La probabilidad de que los tres sean defectuosos.b) La probabilidad de que ninguno sea defectuoso.

182

c) La probabilidad de que solamente uno sea defectuoso.

(Propuesto en Selectividad, Alicante, septiembre de 2001)

Variable aleatoria continua.Distribución normal.

Conocimientos previos

CONCEPTO DE INTEGRAL DEFINIDA.

Para hallar el área del recinto limitado por la curva f(x), el eje de abscisas y las rectas x=a y x=b, se utiliza la siguiente fórmula:

que recibe el nombre de integral definida de f entre los límites a y by se lee “integral entre a y b de f(x)”.La integración es la operación inversa de la derivación.Por ejemplo, si , la fórmula anterior se resuelve de la siguiente forma:

Primero se sustituye la x por b y al resultado obtenido le llamaremos F(b).Después se sustituye la x por a y al resultado obtenido le llamaremos F(a)Finalmente restamos los resultados, es decir,

Ejercicio:

Resuelve la siguiente integral definida:

Solución:

luego

183

Cuando se calculan áreas los resultados se toman en valor absoluto.

Variable aleatoria continua.Es aquella que puede tomar infinitos valores dentro de un intervalo de la recta real. Por ejemplo, la duración de las bombillas de una determinada marca y modelo.En el caso de variables aleatorias continuas no tiene sentido plantearse probabilidades de resultados aislados, por ejemplo, probabilidad de que una bombilla dure 100 horas, 22 minutos y 16 segundos. La probabilidad sería 0.El interés de estas probabilidades está en conocer la probabilidad correspondiente a un intervalo. Dicha probabilidad se conoce mediante una curva llamada función de densidad y suponiendo que bajo dicha curva hay un área de una unidad.Conociendo esta curva, basta calcular el área correspondiente para conocer la probabilidad de un intervalo cualquiera.

La función de densidad de una v.a. continua cumple las siguientes condiciones: Sólo puede tomar valores comprendidos entre 0 y 1:

El área encerrada bajo la curva es igual a la unidad: .

Ejercicio:

Sea . Comprueba que es una función de densidad y calcula

Solución:

Para que sea función de densidad tiene que valer 1. Veamos:

Función de distribución.Como en el caso de la v.a. discreta, la función de distribución proporciona la probabilidad acumulada hasta un determinado valor de la variable, es decir, .Cumple las siguientes condiciones:

Su valor es cero para todos los puntos situados a la izquierda del menor valor de la variable. Su valor es 1 para todos los puntos situados a la derecha del mayor valor de la variable.

Media y varianza de una v.a. continua.Existe cierta correspondencia entre la variable aleatoria discreta y la continua:

Variable aleatoria discreta Variable aleatoria continua

Lo que es pasa a ser y lo que es pasa a ser

184

Ejercicio 1.La función de densidad de una v.a. continua viene definida por :

a) Halla la función de distribución.b) Calcula la media y la varianza.

Solución:a) La función de distribución se obtiene integrando la función de densidad, es decir,

A la izquierda de 0, su valor 0.A la derecha de 1, su valor es 1

Entre 0 y 1:

es decir,

b) Cálculo de la media:

Cálculo de la varianza:

Ejercicio 2.Calcula la media, la varianza y la desviación típica de una v.a. que tiene como función de densidad:

Solución:

Media:

Varianza:

.

Desviación típica:

Ejercicio 3.

Sea , una función de densidad.

a) Calcula su función de distribución.b) Calcula .

Solución:

a)

Su valor es cero para todos los puntos situados a la izquierda de 2 Su valor es 1 para todos los puntos situados a la derecha de 5

185

b)

Distribución normal.Hay muchas v.a. continuas cuya función de densidad tiene forma de campana. Ejemplos:- La variable peso en una población de personas de la misma edad y sexo.- La variable altura de la población citada.- etc.Se dice que estas variables tienen una distribución normal y la función de densidad recibe el nombre de curva normal o campana de Gauss.Para expresar que una v.a. continua X, tiene una distribución normal de media y desviación típica , escribimos

.

Distribución normal estándar.De las infinitas distribuciones , tiene especial interés la de media 0 y desviación típica 1, es decir, . Esta distribución recibe el nombre de estandar o reducida

Existen unas tablas que permiten calcular probabilidades en distribuciones normales reducidas. Por ello es aconsejable transformar cualquier v.a. X que sigue que sigue una distribución en otra variable Z que siga una distribución N(0,1).El cambio de variable que es necesario hacer es el siguiente:

Cálculo de probabilidades en distribuciones normales reducidas.Sea Z una variable que sigue una distribución normal N(0,1).Vamos algunos ejemplos que nos permiten calcular determinadas probabilidades en las tablas:

a) La probabilidad pedida se encuentra directamente en las tablas. Basta buscar 1,2 en la columna y 0,03 en la fila. Su intersección nos da la probabilidad.

b)

186

Representación gráfica de la función de densidad de una distribución normal.

En este caso la probabilidad pedida no está en las tablas. Sin embargo, si tenemos en cuenta que el área total bajo la gráfica ha de ser 1, deducimos de la figura que:

.

c)Como la gráfica es simétrica respecto al eje de ordenadas, y ya estamos en el caso anterior. Comprueba que el resultado final es 0,2358.

d)

Observando la figura se deduce que

Ejercicio 4El peso de los individuos de una población se distribuye normalmente con media de 70 Kg. y desviación típica 6 Kg. De una población de 2000 personas, calcula cuántas tendrán un peso comprendido entre 64 y 76 Kg.

Solución:Se trata de una distribución N(70,6)

(directamente en las tablas).

Por tanto, Esto significa que el 68,25 % de las personas pesan entre 64 y 76 Kg..Como hay 2000 personas, calculamos el 68,25% de 2000 y obtenemos 1365 personas.

Ejercicio 5.

187

La duración media de un lavavajillas es de 15 años y su desviación típica 0,5. Sabiendo que su vida útil se distribuye normalmente, halla la probabilidad de que al adquirir un lavavajillas dure más de 15 años.

Solución:Es una distribución normal de media 15 y desviación típica 0,5, es decir, N(15; 0,5).

Ejercicio 6.La nota media de las pruebas de acceso correspondientes a los estudiantes que querían ingresar en una facultad era 5,8 y la desviación típica 1,75. Fueron admitidos los de nota superior a 6.a) ¿Cuál fue el porcentaje de admitidos si la distribución es normal?b) ¿Con qué probabilidad exactamente cuatro de diez estudiantes son admitidos?

Solución:Apartado a):

Apartado b):Es una distribución binomial de parámetros n=10 y p=0,4562

p(obtener r éxitos )=p(X = r)=

= =

Aproximación de la distribución binomial mediante la normal. (Corrección de Yates)

Cuando n es grande y p está próximo a 0,5 el comportamiento de una distribución binomial B(n, p) es aproximadamente igual a una distribución normal, Esto permite sustituir el estudio de una por el de una .Suele considerarse que la aproximación es buena cuando np>5 y nq>5Dado que por mucho que se parezca nunca es igual una binomial que una normal, es necesario aplicar en el cálculo de probabilidades un ajuste que recibe el nombre de corrección de Yates.

Si X es la binomial y X’ la normal, la corrección consiste en lo siguiente:

(Se asocia un intervalo unidad centrado en el punto)

(se alarga el intervalo ½ por la izquierda y ½ por la derecha.)

Para valores de n mayores de 1.000 se puede suprimir la corrección.

Ejercicio 7. Se lanza una moneda correcta al aire 400 veces. Calcula la probabilidad de obtener un número de caras comprendido entre 180 y 210, ambos inclusive.

188

Solución:Calculamos la media y la desviación típica de la distribución binomial:

; . Por tanto,

pero y

luego

Ejercicio 8.Un tirador acierta en el blanco en el 70% de los tiros. Si el tirador participa en una competición y tira 25 veces, ¿cuál es la probabilidad de que acierte más de 10 tiros?

Solución:Es una distribución B(25; 0,7) que podemos aproximar a través de la normal:

La aproximación será buena.

189

Ejercicios propuestos.

1.- Un profesor de matemáticas ha observado que las notas obtenidas por sus alumnos en los exámenes de Estadística siguen una distribución N(6; 2,5).Se han presentado al último examen 32 alumnos, ¿cuántos sacaron al menos un 7?.

( Sol. 11 )

2.- Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por la experiencia de pruebas anteriores, se sabe que las puntuaciones siguen una distribución normal de media 80 y desviación típica 25.¿Qué porcentaje de candidatos obtendrá entre 75 y 100 puntos?

(Sol. 36,74% )

3- Calcula el valor de k para que la función si sea función de densidad.

Obtenido el valor de k, calcula la media y la desviación típica de la distribución.

( Sol. k = 1/50 ; media = 3,33; desviación típica = 2,36 )

4.- El peso de los toros de una determinada ganadería se distribuye normalmente con una media de 500 Kg. y 45 Kg. de desviación típica. Si la ganadería tiene 2000 toros,a) Cuántos pesarán más de 540 Kg.?b) Cuántos pesarán menos de 480 Kg.?c) Cuántos pesarán entre 490 y 510 Kg.?

( Sol. 373; 660; 348 )

5.- Una de las pruebas de acceso a la Universidad para mayores de 25 años consiste en un test con 100 preguntas, cada una de las cuales tiene 4 posibles respuestas y sólo una correcta. Para superar esta prueba deben obtenerse, al menos, 30 respuestas correctas.Si una persona contesta al azar, ¿cuál es el número esperado de respuestas correctas?.¿Qué probabilidad tendrá de superar la prueba?

(Sol. 25; Utilizando la aproximación a través de la normal: p= 0,1492)

6.- Después de realizar varios sondeos sobre una población con escasa cultura, se ha conseguido averiguar que únicamente el 15 % de la misma es favorable a los tratamientos de psicoterapia. Elegida al azar una muestra de 50 personas de dicha población, se desea saber:a) La probabilidad de que haya más de 5 personas favorables a dichos tratamientos.b) La probabilidad de que a lo sumo haya 6 personas favorables.

(Sol. 0,7852; 0,3446 )

190

nombre de la norma - utselvautselva.edu.mx/pai/1/2009/55.3 guia del profesor para... · web viewsi...

Documents