comodin maestria 09

75
TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles ESTADISTICA DEFINICIÓN. Estadística es el arte o ciencia de coleccionar reunir y analizar información procedente de una población para inferir a partir de ella en una serie de conclusiones, las cuales son válidas para la población de la cual se extrajo la información.. Para su estudio la Estadística se divide en dos áreas: ESTADÍSTICA DESCRIPTIVA. ESTADÍSTICA INFERENCIAL. ESTADÍSTICA DESCRIPTIVA: Tiene como objetivo, el procesamiento de información obtenida de una muestra o de toda una población con el objeto de definir características de los valores analizados (parámetros poblacionales o muestrales), o representar la información contenida en esos datos a través de gráficos. Para facilitar el procesamiento de la información contenida en un conjunto de datos es común agruparlos en lo que se denomina Distribución de Frecuencias. DISTRIBUCIÓN DE FRECUENCIAS. Es una disposición de los datos que muestra cuántos elementos o que parte de los datos entran en diferentes intervalos o categorías en los cuales son agrupados los datos. Construcción: 1. La elección del número de clases o intervalos. 2. La identificación o ubicación del número de datos en cada clase o intervalo. 3. Cuantificar el número de datos en cada clase o intervalo. 4. La presentación de la información en una tabla o diagrama. Reglas: 1. El número de intervalos en los que se dividen los datos, entonces es función del número de datos que se van a agrupar. _____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag. MAESTRIA EN INGENIERIA ADMINISTRATIVA 1

Upload: fernandez1234

Post on 15-Jun-2015

170 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

ESTADISTICA

DEFINICIÓN.

Estadística es el arte o ciencia de coleccionar reunir y analizar información procedente de una

población para inferir a partir de ella en una serie de conclusiones, las cuales son válidas para la

población de la cual se extrajo la información..

Para su estudio la Estadística se divide en dos áreas:

ESTADÍSTICA DESCRIPTIVA.

ESTADÍSTICA INFERENCIAL.

ESTADÍSTICA DESCRIPTIVA:Tiene como objetivo, el procesamiento de información obtenida de una muestra o de toda una

población con el objeto de definir características de los valores analizados (parámetros poblacionales

o muestrales), o representar la información contenida en esos datos a través de gráficos.

Para facilitar el procesamiento de la información contenida en un conjunto de datos es común

agruparlos en lo que se denomina Distribución de Frecuencias.

DISTRIBUCIÓN DE FRECUENCIAS. Es una disposición de los datos que muestra cuántos elementos o que parte de los datos

entran en diferentes intervalos o categorías en los cuales son agrupados los datos.

Construcción:

1. La elección del número de clases o intervalos.

2. La identificación o ubicación del número de datos en cada clase o intervalo.

3. Cuantificar el número de datos en cada clase o intervalo.

4. La presentación de la información en una tabla o diagrama.

Reglas:

1. El número de intervalos en los que se dividen los datos, entonces es función del número de

datos que se van a agrupar.

2. Cada elemento (registro u observación) debe quedar en una y sola una clase.

3. Con el objeto de facilitar su posterior procesamiento es conveniente es necesario que las

clases cubran escalas o intervalos iguales de valores.

PROCESAMIENTO DE DATOSRango = valor máximo - valor mínimo.

Intervalos de clase: Consiste en agrupar los datos en rangos con un límite

inferior y un límite superior cada intervalo o clase.

Marca de clase ( mi ): Valor representativo de cada clase ó intervalo resulta

del promedio entre el límite inferior y superior de cada intervalo o clase.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

1

Page 2: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

Tamaño de clase ( W ): Diferencia entre el límite superior e inferior de cada

clase o intervalo.

Cálculo del número de intervalos.

REGLA DE STURGES:

Si k es el número de intervalos en los que se dividen los datos, entonces k es función de n el número

de intervalos:

Teniendo k una magnitud: ………….. 5 k 15.

Cumpliendo siguiente relación:

donde:x1: es la potencia a la cual elevado el # 2 se acerca en su mínima diferencia pero sin sobrepasar el valor de n.

x2: es la potencia a la cual elevado el # 2 sobrepasa en su mínima diferencia al valor de n.

Estando entre x1 y x2 el número optimo de intervalos a formar con el conjunto de datos escogiendo el que mejor se ajuste al número de datos.

Problema 1.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

2

Page 3: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

El registro de la estatura expresada en metros de una muestra seleccionada aleatoriamente

de 154 estudiantes de una Institución Educativa se presenta en la siguiente tabla:

1 2 3 4 5 6 7 8 9 10

1 1.62 1.75 1.54 1.71 1.71 1.70 1.67 1.57 1.61 1.81

2 1.76 1.64 1.62 1.66 1.73 1.75 1.65 1.69 1.68 1.64

3 1.75 1.70 1.72 1.76 1.85 1.79 1.80 1.84 1.57 1.64

4 1.66 1.71 1.72 1.60 1.65 1.69 1.59 1.60 1.70 1.56

5 1.75 1.65 1.69 1.68 1.59 1.58 1.68 1.73 1.62 1.76

6 1.70 1.69 1.72 1.68 1.62 1.57 1.59 1.60 1.73 1.75

7 1.55 1.63 1.70 1.64 1.57 1.65 1.72 1.85 1.70 1.75

8 1.74 1.75 1.62 1.71 1.71 1.78 1.56 1.57 1.65 1.82

9 1.67 1.71 1.72 1.61 1.58 1.68 1.73 1.60 1.70 1.58

10 1.54 1.70 1.75 1.64 1.59 1.67 1.69 1.66 1.70 1.85

11 1.62 1.63 1.72 1.81 1.85 1.77 1.80 1.84 1.57 1.58

12 1.76 1.79 1.62 1.71 1.76 1.72 1.68 1.63 1.69 1.80

13 1.72 1.68 1.63 1.57 1.77 1.82 1.69 1.79 1.74 1.84

14 1.70 1.69 1.72 1.68 1.58 1.66 1.72 1.60 1.73 1.75

15 1.74 1.80 1.84 1.67 1.63 1.79 1.80 1.84 1.57 1.58

16 1.69 1.76 1.80 1.77

Basados en estos datos, determine e interprete con respecto a la estatura de los

alumnos de esta Institución Educativa:

1. El cuadro de frecuencias

2. La media, mediana y moda (ó modo).

3. La varianza y desviación estándar.

4. Los fractiles: Q3, D4, P20 .

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

3

Page 4: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

Problema 2.

Los datos presentados en la tabla, relacionan una muestra seleccionada

aleatoriamente del registro de ventas diarias expresadas en miles de litros de

gasolina en una estación de servicio ubicada en la ciudad de Orizaba, Veracruz:

Determine:

1. Cuadro de frecuencias,

2. La media, mediana y moda ( ó modo).

3. La varianza y desviación estándar.

4. Calcule e interprete los siguientes Fractiles:

Q3, D3, P60 .

Problema 3. Con el objeto de estimar la capacidad de producción de una empresa textil fue

seleccionada aleatoriamente una muestra de los registros de producción por turno.

Los datos presentados en la tabla, relacionan el total de metros de tela producidos por

un turno de 8 horas.

Determine:

1. La media, mediana y moda ( ó modo).

2. La varianza y desviación estándar.

3. Calcule e interprete los siguientes Fractiles: Q1,

D7, P40 .

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

Ventas de Gasolina( miles de litros )

Número de días

1.235 - 25

1.265 - 43

1.295 - 55

1.325 - 63

1.355 - 41

1.385 - 20

1.415 - 15

1.445 - 8

Producción(miles de metros)

Número de turnos

1.61 - 53

1.64 - 58

1.67 - 80

1.70 - 42

1.73 - 34

1.76 - 23

1.79 - 7

1.82 - 3

4

Page 5: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

Introducción.

Si la Estadística solo tuviera como objetivo la determinación y la representación gráfica de las

características de un conjunto de datos (describirlos); tal vez no tendría el carácter de ciencia. Este

hecho requiere; de la persona que realiza este análisis un mínimo nivel de conocimientos.

El principal objetivo de la Estadística con lo cual actualmente toma una importancia relevante,

es el de hacer inferencias acerca de una población a partir de una muestra; es decir hacer válido el

resultado del análisis de un conjunto de elementos extraídos de una población (denominado muestra)

para la población de la cual se obtuvo.

Entendiendo por población a la colección de toda la posible información que caracteriza un

fenómeno. Concibiendo por población, un concepto mucho más general del que tiene el significado

común esta palabra, no necesariamente implica que está constituida por personas. En este sentido

una población es cualquier colección ya sea de un número finito de mediciones o una colección

grande, virtualmente infinita de datos acerca de algo de interés.

Estadísticamente hablando de una población interesa conocer determinadas características de

ella, las cuales se presentan en diferentes magnitudes en forma de valores; dichas características

denominadas parámetros se pueden describir matemáticamente. Para llegar a conocer su valor, se

puede proceder de dos formas. Mediante: El Censo y El Muestreo.

CENSO. Consiste en analizar el 100% de los elementos que constituyen la población.

MUESTREO. Hace referencia al análisis de solo una parte representativa de los elementos que tiene

la población. Una buena muestra es aquella que refleja las características esenciales de la población

de la cual se obtuvo.

En problemas cotidianos y reales se puede considerar que presenta mayores ventajas el

muestreo con respecto al censo. Algunas de las ventajas y desventajas del muestreo se comentan a

continuación.

Ventajas del muestreo

Más económico que el censo.

Reduce considerablemente el tiempo de aplicación.

Proporciona resultados más oportunos, dado que permite la obtención rápida de información

sobre un proceso variable y de alguna forma la determinación de su estado en un tiempo fijo.

Más adecuado cuando los datos se obtienen de la destrucción de los elementos en estudio.

Cuando la población es dinámica y no puede mantenerse el tiempo suficiente para su estudio.

Desventajas del muestreo

Los resultados no son tan exactos como con el censo.

Requiere de una preparación o capacitación de la persona que lo aplica.

Validez, certeza o confiabilidad

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

5

Page 6: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

Pero respecto al muestreo. ¿Qué tan valida sería el resultado o la conclusión a la cual se llegara;

si la muestra en la cual se tomara la decisión estuviera basada en un segmento de la población que

no fuera representativo de la misma.

Ejemplos……..

¿ Que tanta validez, confiabilidad o certeza, se tendría ………… ?

Si para obtener el grado de contaminación de un río, la muestra se obtuviera de las aguas del

nacimiento del mismo.

Si para obtener el índice de personas analfabetas en el país la muestra se obtuviera de la

población que vive en las zonas urbanas.

Si para definir al candidato ganador en unas elecciones para ocupar un puesto a nivel nacional, la

muestra se obtuviera de una determinada ciudad o estado del país.

Si para obtener el índice de desempleo en un estado, la muestra se obtuviera de la población de

una ciudad industrial del mismo.

Por último, si para aceptar o rechazar el embarque relacionado con un pedido de 200 rollos de tela

de 150 mts. c/u. El encargado o responsable tomará la decisión del resultado de la inspección

efectuada a los rollos de tela seleccionados de aquellos de más fácil accesibilidad.

La respuesta a cada uno de los ejemplos sería la misma:

¡ Ninguna validez…. Ninguna confianza ….. Ninguna certeza !

Pero, la pregunta o preguntas ahora serían………

¿Cuándo es o no válida una muestra?

¿Cuándo es o no confiable una muestra?

¿Cuándo es o no certera una muestra?

De igual manera, podría existir una sola respuesta a cualquiera de estos tres

cuestionamientos:

Tiene validez, es confiable o certero el resultado, cuando la muestra esta compuesta por

elementos que representen las características de la población.

TIPOS DE MUESTREO

Hay dos maneras de seleccionar elementos de una población para conformar una muestra:

Muestreo no aleatorio o a juicio.

Muestreo aleatorio o probabilístico.

MUESTREO NO ALEATORIO O A JUICIO.

Está basado en el siguiente criterio:

“No todas las muestras tienen un interés de generalización, pudiendo tener un interés de tipo

analítico"

Debido a ello, las muestras son seleccionadas de manera tal que contengan el tipo de

elementos sobre los cuales hacen referencia las proposiciones de la hipótesis que está siendo

sometida a prueba. El muestreo a juicio, también llamado no probabilístico o no aleatorio, se _____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

6

Page 7: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

realiza, teniendo conocimiento de las características de los elementos de la población; situación que

se toma en cuenta al momento de seleccionar los elementos que pasarán a formar parte de la

muestra en la realización del estudio. Ejemplo.

Una ama de casa que acude al súper a comprar manzanas; seleccionará para compra solo aquellas

manzanas que cubren las características para el fin que persigue en su utilización; aquellas que son

las “mejores”. Y puede ser, que para una ama de casa diferente, seleccionará manzanas con otras

características, pero para ella serán las “mejores”.

El entrenador de la selección nacional de fútbol, seleccionará solo los “mejores” jugadores. Que

serán aquellos jugadores que piense les serán aptos para el sistema que desea implantar.

Por lo expuesto anteriormente, la selección de los elementos que constituyen la muestra se realiza

en base al criterio o juicio del investigador. Estos no se seleccionan por procedimientos al azar sino en

base al conocimiento o interés que el investigador muestre sobre un determinado elemento, lo que

genera que no todos los elementos que forman parte de la población que se está analizando tienen

probabilidad de ser seleccionados. En lo general estos métodos no probabilísticos carecen de validez

científica, además que no tienen una base teórica para calcular la escala de error ni la

representatividad de la muestra, dado que los elementos seleccionados solo representan las

características de la persona que los elige.

De lo visto, puede decirse que son dos las principales características de los elementos

seleccionados de esta manera.

1. Los elementos de la muestra obtenida no representan las características de los elementos

que componen la población.

2. No todos los elementos que componen la población tienen la misma oportunidad de ser

elegidos.

Los principales métodos de muestreo no probabilístico son:

MUESTREO DECISIONAL.

Se presenta cuando los entrevistadores o investigadores de campo utilizan su criterio para

elegir a los elementos con los cuales formarán la muestra. En este tipo de muestreo, el elemento

seleccionado cubre determinadas características las cuales son definidas a juicio del entrevistador.

Este tipo de muestreo es empleado en las llamadas " encuestas de opinión ", donde las

personas que se toman en cuenta para la muestra deben de cubrir determinadas características con el

tema tratado.

MUESTREO DE CUOTA.

Se realiza una clasificación de la población en estudio en función al objetivo del estudio y se

utilizan estas categorías previamente fijadas para obtener un número predeterminado de elementos

de cada categoría. Son muestras casi estratificadas y so utilizadas por las agencias de investigación

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

7

Page 8: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

de mercados. El procedimiento de esta técnica consiste en fijar un número de individuos por

entrevistar y dejar totalmente al entrevistador ( profesional o no ), su localización. El sesgo que

introduce el entrevistador, al seleccionar únicamente elementos que de acuerdo a su interés o

facilidad determine que serán parte de la muestra. Es una de las desventajas más importantes que

tiene este tipo de muestreo.

MUESTREO BASADO EN EXPERTOS.

Los elementos se eligen con base en la opinión de personas con autoridad y suficientemente

informadas acerca de la población bajo estudio. Los elementos que formarán la muestra serán

resultado de la de la experiencia o conocimiento del comportamiento de la población analizada.

Por ejemplo en una investigación sobre la problemática de la educación en el bachillerato. Al

entrevistar a los directores de escuelas de este nivel; la muestra estará formada por aquellos

dirigentes de las instituciones que se consideren más apropiadas al problema planteado.

MUESTRAS CASUALES.

Este método consiste en investigar a cualquier grupo de personas que son de fácil acceso o

que acuden a un lugar determinado. Son las muestras más utilizadas por los reporteros de los medios

de comunicación ( prensa, radio, televisión ), así como de algunas agencias que realizan estudios de

mercadeo de opinión. La técnica consiste en entrevistar a los individuos en forma casual, por ejemplo

a uno de cada cinco individuos que pasen por la calle.

MUESTREO ALEATORIO O PROBABILÍSTICO

Tiene como objetivo obtener muestras representativas de la población que se analiza basado

en la aleatoriedad en la selección de los elementos que formarán la muestra.

Puede decirse que son dos las principales características de los elementos seleccionados de esta

manera.

1. Los elementos de la muestra obtenida representan las características de los elementos que

componen la población.

2. Todos los elementos que componen la población tienen la misma oportunidad de ser

elegidos.

En lo general estos métodos tienen una base teórica para calcular la escala de error y la

representatividad de la muestra. Los principales métodos de muestreo aleatorio o probabilístico son:

MUESTREO ALEATORIO SIMPLE.

Procedimiento:

1. Asignar un número a cada uno de los elementos que constituyen la población.

2. Utilizando la tabla de números aleatorios (también llamada de dígitos aleatorios) ó bien,

introduciendo en un recipiente tantos papelitos numerados como elementos tiene la población y

una vez revueltos estos, extraer del recipiente tantos papeles como elementos formen la muestra.

Tabla de número aleatorios. _____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

8

Page 9: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

Está formada por filas (→) y columnas (↓). Dependiendo del autor, cada columna está

formada de diferente número de dígitos ( 2, 5, 10, … ). Los dígitos que forman las filas y columnas se

han generado por un proceso completamente aleatorio. La probabilidad que aparezca cualquier dígito

entre cero y nueve es la misma y la probabilidad que ocurra una secuencia de dígitos es la misma que

para cualquier otra secuencia.

Ventajas del muestreo aleatorio simple.

a. De fácil aplicación.

b. Muy utilizado cuando la población de la cual se extraerán las muestras es finita.

c. Es el indicado cuando no se pueden formar grupos (estratos o conglomerados) con los elementos

de la población.

Desventajas del muestreo aleatorio simple.

a. Es difícil aplicarlo para poblaciones muy grandes.

b. Se requiere tener una lista completa de los elementos de la población.

MUESTREO ESTRATIFICADO.

Es empleado este tipo de muestreo cuando la naturaleza de la población y el objetivo del

estudio lo permiten. Consiste en formar grupos (estratos) con elementos que presentan pequeñas

diferencias entre sí; pero una diferencia significativa entre grupos o estratos.

Procedimiento

1. Definir de una manera clara y detallada la manera en que se formarán los estratos (elementos

con similares características ). Asociando a cada elemento con uno y solo un estrato.

2. Una vez especificados los estratos, se selecciona aleatoriamente de cada uno de ellos el número

de elementos que participarán en la muestra.

Ventajas del muestreo estratificado

a. Frecuentemente el costo de la recolección de los datos en el muestreo estratificado se reduce al

estratificar en grupos cuyos elementos tienen características similares pero que difieren de un

grupo a otro.

b. Garantiza que en la muestra estén participando elementos de los diferentes grupos que

constituyen la población, los cuales representan las diferentes características que están

contenidas en la misma, generando con ello mayor representatividad de la muestra.

c. Ofrece la oportunidad de comparación entre los diferentes estratos, sin tener que otra muestras e

incurrir en más gastos y / o mayor tiempo en la realización del estudio.

Desventajas del muestreo estratificado.

a. La principal y posiblemente la única, es que no siempre es posible conformar grupos o estratos

con elementos que presenten similitud en cuanto a las características del objetivo del estudio y

ello debido a que la naturaleza de la población no lo permite.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

9

Page 10: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

MUESTREO POR CONGLOMERADOS.

Se emplea el muestreo por conglomerados cuando por la naturaleza de la población y el

objetivo del estudio es posible formar grupos (llamados conglomerados), con elementos que

presentan significativas variaciones entre sí, pero existe similitud en cuanto a su conformación entre

grupos o conglomerados.

Procedimiento.

1. Se divide la población en grupos con elementos heterogéneos en cuanto a las características;

objeto del estudio.

2. Definidos estos se seleccionan aleatoriamente uno a uno los conglomerados hasta completar el

tamaño de la muestra.

3. Se efectúa un censo en los conglomerados seleccionados.

Ventajas del muestreo por conglomerados.

a. No se requiere tener una lista completa de los elementos de la población.

b. Para poblaciones grandes, muy extensas o dispersas reduce significativamente los costos con su

aplicación.

Desventajas del muestreo por conglomerados.

Si al conformar los conglomerados no se tiene el cuidado de que estos queden integrados con

elementos que difieren en sus características, en caso de ser estos seleccionados; desplazarán a

otros conglomerados más representativos de la población dado que si cubren condiciones de

heterogeneidad, provocando con ello que la muestra no represente adecuadamente a la población al

quedar excluidos por haberse completado el tamaño la muestra

Una manera de reducir el error de muestreo, es disminuir el número de elementos que

integran los conglomerados, lo que incrementará el número de conglomerados.

MUESTREO SISTEMATICO.

En el muestreo sistemático, los elementos se seleccionan de la población a un intervalo

uniforme que es medido en tiempo, orden o espacio.

Procedimiento

1. Se define la magnitud "k de elementos" del intervalo, la cual se obtiene al dividir el total de

elementos de la población entre el número de elementos que constituirán la muestra.

2. Se elige aleatoriamente un elemento dentro de los primeros "k" elementos que constituyen el

primer intervalo formado dentro del marco muestral y posteriormente se selecciona en forma

sucesiva el "k-ésimo " elemento que sigue al último que se obtuvo.

Ventajas del muestreo sistemático.

Es especialmente útil en auditorias, cuando la información relevante se registra en forma

ordenada; por ejemplo en computadora o en un archivo de tarjetas. La selección de cuentas de

crédito, registro de mantenimiento de equipo o datos de ventas de los registros de la compañía.

Desventajas del muestreo sistemático. _____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

10

Page 11: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

Hay situaciones en las que no debe emplearse. Por ejemplo, cuando existe una periodicidad

en el comportamiento de la población; en este caso el muestreo sistemático puede causar un sesgo,

al introducir el error de muestreo que resulta de la influencia periódica.

Frecuentemente los registros de ventas y los datos financieros que se observan en el tiempo,

tienen un comportamiento cíclico: las ventas en los restaurantes son mayores durante el fin de

semana que durante el resto de los días, los niveles de dinero en efectivo son más altos alrededor de

los días 15 y 30 de cada mes, los prestamos personales son más frecuentes en los meses de invierno.

Problema 1.La siguiente es una muestra del salario mensual obtenido por el personal de una empresa ubicada en el norte del país. El monto del salario esta en función al puesto y funciones que tiene el personal. Los valores están expresados en miles de pesos. Estime el salario promedio de todo el personal. Seleccionando una muestra aleatoria de 20 elementos; aplicando el muestreo:

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

11

Page 12: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

1. ALEATORIO SIMPLE. 2. POR CONGLOMERADOS.

3. ESTRATIFICADO. 4. SISTEMATICO

1 2 3 4 5 6 7 8 9 10NIVEL: GERENTES

1 32.6 31.8 29.7 26.8 26.9 32.8 31.9 29.5 29.5 33.12 33.0 31.7 33.5 28.5 29.8 29.9 27.8 32.6 31.6 29.7

NIVEL: JEFES DE DEPARTAMENTO

3 19.7 16.8 16.9 12.8 11.9 11.6 19.8 12.1 19.5 18.74 18.3 15.5 18.8 17.9 17.8 16.4 19.3 18.0 17.9 15.55 16.9 17.7 19.9 20.0 15.9 18.6 19.9 13.0 15.7 17.6

NIVEL: PERSONAL DE OFICINAS

6 1.3 1.5 1.9 2.0 1.9 1.8 1.4 1.8 1.4 2.07 1.8 1.9 2.0 1.9 2.0 2.3 2.5 1.9 2.0 1.98 1.6 1.9 2.0 1.9 1.8 2.4 1.9 2.0 2.3 2.5

NIVEL: SUPERVISORES

9 7.3 7.5 7.9 7.0 7.9 7.8 7.4 7.8 7.4 7.510 7.8 7.9 7.6 7.9 7.5 7.3 7.5 7.9 7.3 7.911 7.6 7.9 7.3 7.9 7.8 7.4 7.9 7.4 7.8 7.512 7.9 7.8 7.4 7.8 7.9 7.6 7.9 7.5 7.9 7.3

NIVEL: PERSONAL SINDICALIZADO

13 5.9 4.5 6.7 4.8 6.3 4.1 4.9 5.5 5.5 6.714 4.5 6.3 6.3 5.4 6.4 6.9 5.6 7.3 6.9 4.015 5.3 5.9 4.5 6.7 4.8 4.1 4.9 5.5 4.9 7.016 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.117 5.3 5.9 4.5 6.7 4.8 4.1 4.9 6.3 5.4 6.418 4.5 6.7 4.8 4.1 4.9 5.9 4.5 6.7 4.8 4.119 5.3 5.9 4.5 6.7 4.8 6.3 6.3 5.4 6.4 6.920 5.9 4.5 6.7 4.8 4.1 4.9 5.5 5.5 6.7 4.821 5.3 5.9 4.5 4.1 4.9 5.9 4.5 6.7 4.8 4.522 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.123 5.3 5.9 4.5 4.1 4.9 4.5 6.3 6.7 4.8 4.124 4.5 6.3 6.3 5.4 4.8 4.1 4.9 5.9 6.7 4.825 4.6 6.6 6.2 5.8 6.2 6.5 5.4 4.5 6.3 6.726 4.5 6.3 6.3 5.4 4.8 4.1 4.9 5.9 6.7 4.827 5.8 6.2 6.5 5.4 6.2 5.8 6.2 6.5 5.4 7.628 6.6 6.2 5.8 6.2 6.5 4.8 4.1 4.9 5.5 5.529 5.4 6.4 6.9 5.6 7.3 6.2 6.5 5.4 7.6 6.030 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.131 5.8 5.5 4.5 6.7 4.8 4.1 4.9 6.3 5.4 6.432 5.5 5.9 4.8 6.2 4.1 4.4 4.2 5.3 5.0 6.133 4.5 6.7 4.5 6.7 4.8 4.1 4.9 5.4 6.4 6.934 4.5 6.3 6.3 6.9 5.5

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA ADMINISTRATIVA

12

Page 13: COMODIN MAESTRIA 09

TEMA: MUESTREO ________________________________________Catedrático: Fernando Fernández Rodiles

ALEATORIO SIMPLE ESTRATIFICADO CONGLOMERADOS SISTEMATICO

PASOS A SEGUIR.1. Se asigna un número a ca-da uno de los elementos de la población.

2. Utilizando la tabla de núme- ros aleatorios o escribiendo en un papel todos los números que conforman la población se introducen en un recipiente y después de revolverlos se ex trae al azar la muestra.

VENTAJAS..a. Selecciona a la muestra por métodos que le permiten a ca- da elemento tener la misma probabilidad de formar parte de la muestra.

b. Para poblaciones finitas no muy extensas es el método más rápido y menos costoso.

DESVENTAJASa. El azar en la selección, en ocasiones no garantiza la repre- sentatividad de la muestra esto ocasiona la necesidad de incre- mentar el número de muestras.

PASOS A SEGUIR..1. Formar grupos con elemen- tos que tengan aproximadamen te las mismas características respecto al objetivo del estudio.2. De cada grupo o estrato for- mado, seleccionar el número de elementos que participaran en la muestra.

VENTAJAS.a. El costo de la recolección y análisis de los datos se redu- ce al estratificar en grupos cu-yos elementos tienen caracte- rísticas similares pero que difie- ren de un grupo a otro.b. Garantiza que en la muestra estén participando elementos con diferentes las característi- cas que componen la poblaciónc. Permite analizar diferencias entre los estratos sin necesidad de mayor trabajo.

DESVENTAJASa. Por la naturaleza de la pobla- ción en ocasiones no es senci- llo formar estratos

PASOS A SEGUIR..1. Formar grupos con elemen- tos que tengan diferencias signi ficativas respecto a las caracte- rísticas del estudio.2. Se selecciona uno a uno de los grupos hasta completar el tamaño se la muestra.3. Se realiza un censo en los conglomerados seleccionados.

VENTAJAS.a. No se necesita una lista de los elementos de la población. b. Para grandes poblaciones es más económico que otros.

DESVENTAJAS.a. Si al formar un conglomera- do no se cumple con la hetero- geneidad de sus elementos en caso de salir este seleccionado desplazará a otros conglomera- dos más representativos al que- dar excluidos por haberse com- pletado la muestra. b. Se contrarresta lo anterior reduciendo el número de ele-mentos en los conglomerados.

PASOS A SEGUIR.1. Se define un intervalo uniforme, medido en tiempo, orden o espacio ( k = N / n )

2. Se elige aleatoriamente un elemento del primer intervalo.

3. La posición que guarda el elemento seleccionado en el primer intervalo marca la posición de los demás elementos en los siguientes intervalos.

VENTAJAS.a. Útil cuando la información se tiene adecuadamente ordena- da, por ejemplo en computadora o en archivo de tarjetas ( auditorias, cuentas de crédito, da- tos de ventas, etc. ) DESVENTAJASa. Se corre el riesgo de que la muestra no sea representativa cuando los datos presentan tendencia cíclica, al seleccionar elementos que solo se presentan sistemáticamente.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag. MAESTRIA EN INGENIERIA ADMINISTRATIVA

13

Page 14: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

CUESTIONARIO

1. ¿ Cual es el objetivo del muestreo ?.2. ¿ Cual es la relación del muestreo con la Estadística ?3. ¿Cuándo es más conveniente el muestreo con respecto al censo ?4. ¿ Que significado tiene denominar a una muestra como muestra aleatoria ?5. ¿ Cuales de los siguientes ejemplos están relacionados con muestras aleatorias y cuales no ?.

Explique en cada caso.a. Preguntas que de parte de la Gerencia de una tienda se aplican a cada décimo cliente respecto a

las ofertas que se realizan.b. Selección de árboles de un aserradero para ser convertidos en madera.c. Selección de “n” alumnos por el Director de una Escuela, para representar en un concurso de

conocimientos.d. Integrar a la Selección de fútbol para representar a México en la próxima Copa del Mundo 2006 a

celebrarse en Alemania.e. Control del contenido en peso de las cajas de una fabrica de galletas.

COMENTARIOS REFERENTES A LA APLICACIÓN DE MUESTREOEs necesario antes de definir el tipo de muestro a utilizar para la conformación de la muestra es

necesario identificar y delimitar los factores que afectan o modifican el resultado del análisis, que se pretende realizar.

En los ejemplos siguientes se enumeran algunos factores que pueden estar presentes en el estudio a realizar. Sin embargo, una vez identificados es necesario definir ¿Cuáles de ellos van a ser tomados en cuenta para la realización del estudio.

Ejemplos:Objetivo: Estimar el tiempo promedio en realizar el maquinado de una pieza.FACTORES.

1. El número de operarios que realiza esta operación.2. Las máquinas utilizadas para la realización de esta operación.3. Los tipos de herramienta de corte empleados para el maquinado de esta pieza.4. Las jornadas de trabajo.5. El tiempo durante la jornada en que serán tomadas las lecturas.

Objetivo: Estimar la preferencia por el consumo de una determinada marca de refresco.FACTORES.

1. Las edades de los consumidores.2. Las condiciones climatológicas.3. Como bebida sola o acompañado. 4. Los puntos de venta del producto.

Objetivo: Estimar el tiempo promedio en realizar el recorrido de una distancia..FACTORES.

1. Tipo de vehiculo.2. Analizar condiciones durante el traslado: hora en realizarlo día de la semana, temporada.3. Operario.4. Alternativas de rutas.

Objetivo: Estimar la preferencia por el voto de un candidato a un puesto público. FACTORES.

1. Las edades de los votantes.2. El nivel económico de las personas.3. El grado académico de las personas. 4. La región geográfica (norte, centro, sur). 5. Zona geográfica (urbana, rural)

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

14

Page 15: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

DISTRIBUCIÓN NORMAL

Es la distribución de probabilidad más importante en Estadística. Denominada también Distribución

Gaussiana, en honor de Karl Friedrich Gauss quién derivó su ecuación. Su gráfica que es una curva en

forma de campana se, le denomina curva normal.

Su ecuación viene dada por:

Para - < x <

Características:

1. La curva es simétrica con respecto a su eje vertical el cual incide en la parte central.

2. La Media, Mediana y Moda inciden en un mismo punto. En la parte central de la curva donde

presenta su altura máxima.

3. La curva normal se acerca asintóticamente a su eje horizontal en ambos extremos a partir de la

media.

4. El área que se genera bajo la curva y sobre el eje horizontal es igual a 1.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

15

MediaMediana

Moda

0.5 0.5

Page 16: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Ejercicio I.

Utilizando las tablas de la distribución normal y mediante un bosquejo de un gráfico de la curva

normal, determine el valor del área involucrada en cada ejercicio.

1. p ( z < 1.01 ) 6. p ( -1.04 < z < 0.09) 11. p ( - 0.50 > z > 0.50 )

2. p ( z > -1.23 ) 7. p (-0.82 < z < 1.87) 12. p ( - 1.66 > z > -0.05 )

3. p ( z > -2.10 ) 8. p (-2.19 < z < -0.07) 13. p ( - 0.30 > z > 0.30 )

4. p ( z < - 1.32 ) 9. p (- 1.45 < z < 1.05 ) 14. p ( 1. 00 > z > 1.00 )

5. p ( z > -3.59 ) 10. p (- 3.59 < z < 3.59) 15. p ( - 5.25 > z > 4.75 )

Ejercicio II.

Encuentre el valor de z si el área bajo la curva normal estándar:

1.A la derecha de z es de 75% 6. A la derecha de z es de 0.1018

2.A la izquierda de z es de 0.4013 7. A la izquierda de z es del 84.85%

3.A la derecha de z es del 81% 8. A la derecha de z es de 0.1469

4.A la izquierda de z es de 0.3500 9. A la derecha de z es del 60.10%

5.A la derecha de z es del 61.15% 10. A la izquierda de z es de 0.1762

Ejercicio III.

Encuentre el valor de z si el área bajo la curva normal estándar:

1. Entre 0 y z con z positivo es de 43.7% 6. Entre 0 y z con z negativo es de 0.4525

2. Entre 0 y z con z positivo es de 0.3708 7. Entre 0 y z con z negativo es de 42.36%

3. Entre 0 y z con z positivo es de 2.79% 8. Entre 0 y z con z negativo es de 0.2852

4. Entre 0 y z con z positivo es de 0.4948 9. Entre 0 y z con z negativo es de 31.33%

5. Entre 0 y z con z positivo es de 0.0259 10. Entre 0 y z con z negativo es de 49.01%

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

16

Page 17: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

CARACTERÍSTICAS DE LAS POBLACIONES

C O N D I C I O N E S

NO ESTANDARIZADAS ESTANDARIZADAS

≠ 0 MEDIA = 0

≠ 1 DESV. EST. = 1

X VARIABLE ZC O N V E R S I Ó N D E V A L O R E S

Valores X a Valores Z

Valores Z Valores X

X = + Z

TEOREMA DE CHEYBSHEV

Proporciona la estimación de la probabilidad de que una variable aleatoria asuma un valor dentro

de k desviaciones estándar de su media para cualquier valor de k.

La probabilidad de que una variable aleatoria que cuyo valor se distribuye normalmente, asuma

un valor dentro de k desviaciones estándar de la media es al menos de: 1 – 1 / k2. Esto es:

P ( - k < X < + k ) 1 - 1 / k2

Ejemplos: Si k = 2 Entonces: P ( - 2 < X < + 2 ) 0.75 % de los valores de XSi k = 3 Entonces: P ( - 3 < X < + 3 ) 0.89 % de los valores de X

Problema 1.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

17

Z1 Z2X1 X2

Page 18: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

El tiempo utilizado en el ensamble de un dispositivo en una empresa electrónica se distribuye normalmente con una media de 30.5 minutos y una desviación estándar de 9.3 minutos.

Tomando como referencia estos datos determine la probabilidad que el ensamble de un dispositivo se realice en:

1. Al menos 28 minutos.2. Máximo 35 minutos.3. Entre 25 y 35 minutos.4. Al menos 25 pero cuando más 33 minutos.

5. Mínimo 38 pero máximo 37.5 minutos.6. Cuando más 32.5 pero al menos 35.3 minutos.

7. No más de 38.5 minutos pero al menos 40.5 minutos.8. ¿ En mínimo que tiempo se ensamblará el 70% de los dispositivos ?.9. ¿ En máximo que tiempo se ensamblará el 85% de los dispositivos ?.10. Para determinar la capacidad de producción de la línea el tiempo estimado tomado en cuenta

para el ensamble del dispositivo es de 42 minutos. ¿ Que porcentaje de dispositivos ensamblados quedará fuera de este tiempo ?.

11. De 500 dispositivos ensamblados ¿ Cuántos de ellos se ensamblarán en al menos 25.5 pero cuando más 35.5 minutos ?.

Problema 2. Uno de los controles realizados al final de la línea de envasado, de una fábrica embotelladora de

refresco está relacionado con su llenado. Un volumen de refresco que supere el límite superior del rango establecido para las condiciones de operación de la máquina ( ± 10 mililitros ) representa perdidas para la empresa, así mismo un volumen de refresco abajo del límite inferior podría propiciar multas a la compañía. Si la máquina está regulada para verter un volumen de refresco que se distribuye normalmente con una media de 250 mililitros y una desviación estándar de 11 mililitros. Determine:1. El porcentaje de botellas con un contenido mínimo de 248 mililitros.2. Que porcentaje de botellas serán llenadas con menor contenido al establecido por las condiciones de

operación de la máquina.3. La fracción de botellas con un contenido máximo de 252 mililitros.4. El porcentaje de botellas con un contenido máximo de 245 pero de al menos 265 mils.5. Que cantidad de refresco tendrán como mínimo el 75% de las botellas ?.6. Que cantidad de refresco tendrán cuando mas el 85% de las botellas ?.7. Que porcentaje de botellas queda fuera del margen establecido ?.8. De cada 1000 botellas llenadas, cuantas de ellas serán llenadas con mayor contenido al establecido

por las condiciones de operación de la máquina.9. De cada 1500 botellas llenadas, cuantas de ellas serán llenadas dentro del rango establecido para

las condiciones de operación de la máquina.10. La fracción de botellas con un contenido mínimo de 245 mililitros pero máximo de 260 mililitros de

refresco.

Problema 3.

El consumo promedio diario de combustible utilizado en una caldera que suministra vapor al Departamento de Engomado de una empresa textil es de 1 975 lts. diarios con una desviación estándar de 325 lts. En función a esta información determine. El porcentaje de días en que se

consumen:

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

18

Page 19: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

1. Un mínimo de 1 500 lts. 2. Cunado más 1 650 lts.3. Entre 1 800 y 2 000 lts diarios.4. No más de 1550 pero al menos 1 850 lts.5. Máximo 1 750 lts. pero mínimo 1 900 lts.6. ¿ Cual será el consumo mínimo de combustible en el 65 % de los días ?.7. ¿ Cando menos cuanto se consumirá en el 25% de los días ?.8. ¿ Cual será el consumo máximo en el 80 % de los días ?.9. ¿ No mas de cuanto combustible se consumirá en el 35% de los días ?.10. Si al inicio de una jornada se cuenta con 1 700 lts. y el tanque de almacenamiento no es

abastecido hasta el día siguiente. ¿ Cual será la probabilidad que se quede sin vapor el Dpto. de engomado ?.

Problema 4. El fabricante de baterías (acumuladores) para automóvil marca “AMERICA” afirma que estos tienen

una vida útil que se distribuye normalmente con una media de 5.5 años y una desviación estándar de 1.15 años. Basados en estos datos determine:1. ¿ Cuantos de los próximos 500 acumuladores fabricados tendrán una duración entre 5 y 6 años ?.

2. Máximo cuanto durarán el 35 % de los acumuladores de esta marca.3. ¿ Cuantos de los próximos 450 fabricados tendrán una duración de cuando menos 3.5 pero a lo más

5.5 años ?. 4. Mínimo que duración tendrán el 35 % de los acumuladores de esta marca.5. ¿ Cuantos de los próximos 300 acumuladores fabricados tendrán una duración entre 7 y 8 años ?. 6. ¿ Cuantos de los próximos 250 acumuladores fabricados tendrán una duración de no más de 5

años ?. 7. Una compañía de taxis con el objeto de evitar contratiempos al ofrecer servicio por política ha

definido que la probabilidad de que el acumulador le falle no debe sobrepasar el 15%. En que tiempo deberá cambiar el acumulador de sus vehículos.

8. Al menos ¿Qué duración tendrán el 40 % de los acumuladores de esta marca ?9. A lo sumo ¿Cuál será la duración del 90% de estos acumuladores?10. El fabricante repone por un acumulador nuevo, cualquier acumulador defectuoso en su periodo de

garantía. ¿Qué garantía debe ofrecer el fabricante en tiempo si no quiere reponer más del 15% de los acumuladores vendidos ?.

TEOREMA DEL LÍMITE CENTRAL

- Los valores de las medias obtenidas de muestras de magnitud n ( n > 30) seleccionadas de una

población con media y desviación estándar tendrán aproximadamente una distribución normal.

- Los valores de las medias obtenidas de muestras seleccionadas de poblaciones que se distribuyen

normalmente tendrán una distribución normal sin importar la magnitud de n.De donde se tiene que:

La media o promedio de todas las medias de las muestras extraídas de la población es igual

a la media de toda la población

=

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

19

Page 20: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

La desviación estándar de las muestras:

Para poblaciones grandes ( 20 n < N )

Para poblaciones pequeñas ( 20 n ≥ N )

Estandarización de los valores de ( pasar de a z ) :

Desestandarización de los valores de z ( pasar de z a )

Problema 1.La máquina empleada para el llenado de sacos de azúcar en un Ingenio Azucarero, está regulada

para efectuar dicha operación, despachando en promedio 50 Kgs. con una desviación estándar de 2.5 kgs. El control del peso vertido se verifica tomando periódicamente una muestra de 15 sacos, calculando el contenido promedio. Si el valor promedio de estas muestras se distribuye normalmente. Determine la probabilidad que el peso promedio de cualquiera de estas muestras sea de:1. Al menos 49.5 kgs.2. Máximo 51.5 kgs.3. No menos de 49 pero a lo más 51 kgs.4. Mínimo 47 pero máximo 50 kgs.5. Más de 50.5 kgs. pero a lo sumo 53 kgs.6. No más de 48 kgs. pero como mínimo 49.5 kgs.7. Cuando más ¿Cuál será el valor del 83 % de las muestras de esta magnitud ?. 8. Cuando menos ¿Cuál será el valor del 60 % de las muestras de esta magnitud ?.9. ¿ No mayor de que valor tendrá el 83 % de las muestras de esta magnitud ?. 10. Cuando menos ¿Cuál será el valor del 60 % de las muestras de esta magnitud ?.

Problema 2.La máquina empleada para el llenado de las cajas de galletas de una determinada marca, está

regulada para efectuar dicha operación, despachando en promedio 1 000 grs. con una desviación estándar de 95 grs. En base a esta información, determine la probabilidad que muestras seleccionadas aleatoriamente de 65 cajas contengan en promedio:1. ¿ Al menos 985 grs. ?2. Un mínimo de 975 grs. pero no más de 1 025 grs.

3. ¿ A lo más 985 grs. ?4. La fracción de muestras de esta magnitud que pesen en promedio un máximo 980 grs. pero no

menos de 1 020 grs.5. ¿Que proporción de muestras de esta magnitud pesaran en promedio al menos 975 grs. pero cuando

más 1 kg.?6. ¿ Cuántas de 500 muestras de 25 cajas cada una; pesarán en promedio al menos 990 kg. pero

cuando más 1 025 grs. ?. 7. Al menos cuanto pesarán en promedio el 60% de las muestras.8. Cuando más cuanto pesarán en promedio el 35% de las muestras. 9. Para verificar si se esta cumpliendo con el peso etiquetado en una inspección la PROFECO

selecciona aleatoriamente 20 cajas y aplica una sanción en caso que el peso promedio obtenido en la muestra no contenga al menos el 95% del peso etiquetado. ¿Habría probabilidad de que esto sucediera?.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

20

Page 21: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

10. Por otra parte la empresa para controlar contenido en peso de las cajas, selecciona aleatoriamente 15 cajas; y para el proceso para corregirlo, si el peso de la muestra no esta entre un 5% del peso etiquetado. ¿En que porcentaje de las muestras el peso promedio se sale de este rango?.

Problema 3.

El consumo promedio diario de combustible utilizado en una caldera que suministra vapor al Departamento de Engomado de una empresa textil es de 1 850 lts. diarios con una desviación estándar de 325 lts. En función a esta información determine la probabilidad que el consumo

promedio de una muestra seleccionada aleatoriamente de 15 días en esta caldera sea de:

11. Al menos 1 700 lts. 12. Mínimo 1 900 lts. Pero máximo 2000 lts.13. No más de 1 950 lts.

14. Entre 1 750 y 1 950 lts diarios.15. No más de 1600 pero al menos 1 750 lts.16. Mínimo 1 650 lts. pero máximo 1 750 lts.

17. ¿ Cual será el consumo promedio mínimo del 65 % de las muestras con esta cantidad de días ?.18. Cuando menos, ¿Cual será el consumo promedio del 25 % de las muestras con esta cantidad de

días ?.19. ¿ Cual será el consumo promedio máximo en el 80 % de las muestras conteniendo 20 días

seleccionados al azahar ?.20. ¿ No mas de cuanto se consumirá en promedio en el 35% de las muestras conteniendo 25 días

seleccionados al azahar ?

DISTRIBUCION t de StudentSi el valor de la variable aleatoria continua t se distribuye como una distribución t de Student. I. Determinar la:

a. p ( t < 2.201 = 11 ) f. p ( -0.879 < t > <.228 =

10 )

b. p ( t > 1.943 = 6 ) g. p ( -0.863 < t < 1.740 = 17 )

c. p ( t > -2.080 = 21 ) h. p ( 2.042 > t > -2.750 = 30 )

d. p ( t < -0.856 = 25 ) i. p ( -0.860 < t < 1.725 = 20 )

e. p ( t > -2.947 = 15 ) j. p ( -1.061 > t > 1.717 = 22 )

II. Determinar el valor de to cuando:

a. p ( t > to = 15 ) = 0.25 f. p ( t < to = 5 ) = 0.85

b. p ( t < to = 23 ) = 0.75 g. p ( t > to = 30 ) = 0.80

c. p ( t > to = 19 ) = 0.025 h. p ( t < to = 11 ) = 0.25

d. p ( t < to = 12 ) = 0.975 i. p ( t > to = 33 ) = 0.25

e. p ( t > to = 20 ) = 0.99 j. p ( t < to = 20 ) = 0.025

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

21

Page 22: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

III. Casos especiales:Determinar el valor de to cuando

a. p ( t > to = 51 ) = 0.75 f. p ( t < to = 11 ) = 0.93

b. p ( t < to = 36 ) = 0.25 g. p ( t > to = 29 ) = 0.17

c. p ( t > to = 45 ) = 0.025 h. p ( t < to = 18 ) = 0.13

d. p ( t < to = 54 ) = 0.975 i. p ( t > to = 23 ) = 0.83

e. p ( t > to = 33 ) = 0.99 j. p ( t < to = 30 ) = 0.18

IV. Otros casos:Determinar el valor de to cuando

a. p ( t < to = 42 ) = 0.92 c. p ( t > to = 69 ) = 0.17

b. p ( t > to = 54 ) = 0.012 d. p ( t < to = 58 ) = 0.87

DISTRIBUCION Chi-Cuadrada

Si el valor de la variable aleatoria continua se distribuye como una distribución

Chi-Cuadrada.

Determine la:

1. p ( < 5.58 = 11 ) 2. p ( 3.94 > > 15.99 = 10 )

3. p ( > 21.3 = 22 ) 4. p ( 9.39 > > 26.00 = 18 )

5. p ( > 14.26 = 29 ) 6. p ( 11.81 > > 21.7 = 27 )

II. Determinar el valor de cuando:

1. p ( > = 23 ) = 0.05 2. p ( < = 23 ) = 0.75

3. p ( > = 30 ) = 0.50 4. p ( > = 20 ) = 0.35

5. p ( < = 18 ) = 0.10 6. p ( < = 3 ) = 0.75

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

22

Page 23: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

III. Casos especiales

Determinar el valor de cuando:

1. p ( > = 43 ) = 0.50 2. p ( > = 25 ) = 0.43

3. p ( < = 57 ) = 0.10 4. p ( < = 33 ) = 0.65

5. p ( > = 65 ) = 0.25 6. p ( > = 13 ) = 0.60

IV. Otros casos especiales

Determinar el valor de cuando:

1. p ( > = 48 ) = 0.30 2. p ( < = 53 ) = 0.72

DEFINICIÓN. Estadística es el arte o ciencia de coleccionar reunir y analizar información procedente de una

población para inferir a partir de ella en una serie de conclusiones, las cuales son válidas para la población de la cual se extrajo la información..

Para su estudio la Estadística se divide en dos áreas:

ESTADÍSTICA DESCRIPTIVA.

ESTADÍSTICA INFERENCIAL.

ESTADÍSTICA DESCRIPTIVA:Tiene como objetivo el procesamiento de información obtenida de una muestra o toda una población

con el objeto de definir valores o representarlos a través de gráficos de toda la información analizada.

ESTADÍSTICA INFERENCIAL: Consiste en analizar el resultado del análisis hecho a una muestra seleccionada aleatoriamente de

una población, haciendo válido dicho resultado para toda la población de la cual se extrajo la muestra. Se pueden hacer inferencias acerca de los parámetros de una población de dos formas:

I. ESTIMACIÓN DE PARÁMETROS. Estimar el valor del parámetro de una población

II. PRUEBA O VERIFICACION DE HIPÓTESIS. Verificar el verdadero valor del parámetro

de una población.

En ambos casos se toma como base el resultado obtenido al analizar una muestra obtenida de la población que interesa y hacer valido el resultado para toda la población de la cual se extrajo la muestra.

ESTIMACIÓN DE PARÁMETROS

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

23

Page 24: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Estimar del valor del parámetro de una población, es definir a través de un proceso estadístico, el valor aproximado del verdadero valor que tiene el parámetro de una población a partir del análisis de una muestra de elementos extraídos de la población de la cual se extrajo. La estimación del parámetro de una población puede realizarse de dos maneras:

a. Estimación puntualConsistente en definir un único valor del parámetro que se está estimando.

Ejemplos:1. “Se estima que el porcentaje de piezas defectuosas al final de una línea de producción

es del 8%“

2. . “ El volumen promedio de gasolina vendida por día en una estación de serviciose estima en 3500 lts”.

3. “Se estima que la varianza con respecto al promedio de duración de una bombilla eléctrica de la marca OSRAM en 800 horas ”.

b. Estimación por intervalo.Consistente en definir un rango de valores ( con un límite inferior y otro superior) dentro del cual

puede caer el verdadero valor del parámetro que se está estimando.

Ejemplos:1. “ Se estima que el porcentaje de piezas defectuosas al final de una línea de producción está

entre el 7 y el 9% “

2. “ El volumen promedio de gasolina vendida por día en una estación de serviciose estima entre 3200 y 3800 lts”.

3. “La desviación estándar con respecto al promedio de la duración de una bombilla eléctrica de la marca OSRAM se estima entre 750 y 850 horas”.

Nivel de Confianza en la estimación del parámetro:

Mide que tan probable es que el valor estimado del parámetro se encuentra dentro del rango de

valores definidos en la estimación.

Esta Confianza o Probabilidad es expresada en porcentaje (%), en un rango de valores que

comúnmente se establece entre el 90 y 99 %.

MAGNITUD DE LAS MUESTRAS NECESARIAS EN LA ESTIMACIÓN DE PARÁMETROS

El número de muestras necesarias para la estimación del parámetro de una población depende de tres

factores:

a. Del grado de confianza con que se pretende estimar el parámetro. Ha mayor confianza deseada

mayor deberá ser el número de elementos que compondrán la muestra Este grado de confianza

se ve reflejado en el valor del estadístico z en la curva normal.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

24

Page 25: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

b. De la heterogeneidad de los valores analizados en la muestra. Ha mayor diferencia o dispersión

de estos mayor será el número de elementos que compondrán la muestra. Esto se refleja en el

valor de la desviación estándar de la muestra ()

c. De la exactitud con la que se desee estimar el parámetro (E).

FORMULA EMPLEADA PARA OBTENER EL NÚMERO DE

MUESTRAS NECESARIAS PARA ESTIMAR:

LA MEDIA DE UNA POBLACIÓN

LA MEDIA DE UNA POBLACIÓN

Problema 1

En las auditorias efectuadas a las empresas (específicamente en las denominadas grandes), al intentar evaluar los procedimientos de control interno mediante un análisis de los libros de contabilidad; resulta excesivo considerar todas las transacciones efectuadas en un año ó en un periodo de tiempo determinado. Para tal fin generalmente se selecciona aleatoriamente una muestra de las transacciones efectuadas en el intervalo de tiempo que se analiza. De una de estas empresas fueron seleccionadas muestras de transacciones efectuadas en los dos tipos que la empresa contempla: A crédito y en efectivo obteniéndose los siguientes resultados:

D E S C R I P C I Ó N CREDITO EFECTIVO

No. de transacciones analizadas 61 71

Valor promedio $ 15 865.00 $ 10 560.00

Desviación estándar $850.00 $ 650.00

Número de transacciones en la muestra con un monto mayor a los $7000.00

35 23

En base a estos resultado. Estime un intervalo de confianza del: 1. 95 %, para el monto promedio por transacción efectuada a CREDITO.2. 90 %, para el monto promedio por transacción efectuada en EFECTIVO.3. 99 %, para la diferencia en el monto promedio de los tipos de transacción manejadas en esta

empresa. 4. 90 %, para la varianza y desviación estándar con respecto al monto promedio por transacción

efectuada a CREDITO.5. 90 %, para la varianza y desviación estándar con respecto al monto promedio por transacción

efectuada en EFECTIVO. _____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

25

Page 26: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

6. 95 % para el porcentaje de transacciones efectuadas a CREDITO en esta empresa con un valor superior a los $ 7 000.00.

7. 98 % para el porcentaje de transacciones efectuadas en EFECTIVO en esta empresa con un valor superior a los $ 7 000.00.

8. 95 %, para el porcentaje de transacciones efectuadas a CREDITO en esta empresa con un valor inferior a los $ 7 000.00.

9. 98 %, para el porcentaje de transacciones efectuadas en EFECTIVO en esta empresa con un valor inferior a los $ 7 000.00

10. ¿Fue suficiente el número de muestras para estimar el monto promedio de las transacciones de los incisos 1 y 2. Si el error que se está dispuesto aceptar en la estimación del valor en las mismas, no debe ser mayor de: a. $500.00; b. $300.00; c. $100.00 y d. si no se acepta ningún error en la estimación del valor ?.

11. ¿Fue suficiente el número de operaciones en la muestra (transacciones) para estimar el porcentaje de transacciones con un valor superior a $7 000.00 los incisos 6, 7, 8 y 9 ?. Si el error que se está dispuesto aceptar en la estimación del porcentaje no debe ser mayor del: a. 5%; b. 7%; c. 10% y d. si no se acepta ningún error en la estimación del porcentaje.

Problema 2.

Un procedimiento que ha resultado efectivo para medir el grado de aceptación de un producto y el cual ha disminuido la inversión realizada en la promoción y mercadotecnia de nuevos productos, consiste en la introducción del producto al mercado; en zonas de ventas representativas. Este procedimiento por una parte proporciona el número de ventas y por otra parte define las zonas donde se tendrá mayor o menor demanda del producto.

Con el objeto de ejemplificar lo anterior, se considera el caso de una empresa fabricante de implementos agrícolas, al cual esta interesada en introducir al mercado un nuevo “equipo para riego”.

Para probar su aceptación, se seleccionó utilizando para ello el muestreo aleatorio estratificado con afijación proporcional una muestra de 45 tiendas distribuidoras, localizadas en tres zonas agrícolas y se observó el número de equipos vendidos durante un periodo de un año. Los resultados se presentan en la siguiente tabla:

DESCRIPCIONZONAS

A B Cnúmero de tiendas 16 10 19

# de equipos vendidos en promedio

31 28 47

varianza 30.5 15.3 47.9

En base a los resultados observados en la tabla. Y suponiendo que las ventas se distribuyen normalmente en cada zona. Determine un intervalo de confianza del:1. 95% para el número promedio de equipos vendidos en cada una de las tres zonas (A,

B y C). 2. 90% para la diferencia en el promedio de equipos vendidos entre las zonas (A y B), (A y C), (B y C).3. 95% para la varianza y desviación estándar con respecto al numero promedio de equipos vendidos

en cada una de las tres zonas.

Suponiendo que la proporción de ventas se distribuyen normalmente en cada zona

4. Determine un Intervalo de confianza del 95% para el Porcentaje de ventas de equipos de riego en cada una de las zonas con respecto al total de equipos vendidos en las 45 tiendas.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

26

Page 27: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Problema 3.Las mazas para molino azucarero (2.00 mts de largo por 1.75 mts. de diámetro) empleadas

para la extracción de las mieles contenidas en la caña de azúcar, son cilindros de hierro colado que

después de ser fundidas y ensambladas en su flecha de acero, son sometidas al maquinado con el

objeto de proporcionarles el diámetro y características requeridas para la función que desempeñarán

ya colocadas en el molino para su operación.

Con el objeto de mejorar el tiempo de maquinado, fueron propuestas por diferentes

proveedores tres herramientas de corte y utilizadas en operaciones seleccionadas aleatoriamente. Los

tiempos realizados expresados en minutos se presentan en la siguiente tabla:

HERRAMIENTA 1 2 3 4 5 6 7 8 9 10 11 12

A 243 255 239 248 245 241 249 247 240 242 244

B 231 230 229 232 230 235 236 235 233 234 231 229

C 254 250 259 263 250 257 259 260 269 267

DATOS ANTES DESPUES

Numero de operaciones

tiempo promedio (en minutos)

varianza con respecto a la tiempo promedio

desviación estándar con respecto a la tiempo promedio

Suponiendo que los tiempos empleados en el maquinado se distribuyen normalmente con cada una

de las tres herramientas y en base a esta información estime un intervalo de confianza del:

1. 90% para el tiempo promedio empleado por cada una de las herramientas propuestas.

2. 95% para la diferencia entre el tiempo promedio de corte entre las herramientas propuestas (A con B,

A con C y B con C).

3. 95% para la Varianza y Desviación Estándar con respecto al tiempo promedio empleado por cada

una de las herramientas propuestas.

Problema 4.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

27

Page 28: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Teniendo como objetivo "mejora en el servicio", como una dentro de varias de las estrategias de mercadotecnia para el incremento en sus ventas. Una gran cadena de supermercados muestreó las opiniones de sus clientes respecto al servicio ofrecido antes y después que el personal asistiera a cursos de capacitación que tenían como objeto mejorar la atención a los clientes. Se pidió a cada una de las personas encuestadas que asignaran una calificación que reflejara la calidad del servicio del personal en una

escala de 0 ( malo) a 10 ( excelente ). Los resultados obtenidos en cada una de estas etapas son presentados en la siguiente tabla:

DATOS ANTES DESPUES

# de clientes encuestados 71 81

calificación promedio 6.85 8.66

desviación estándar con respecto a la calificación promedio

0.95 0.46

# de clientes que dieron una calificación inferior a 5

47 28

En base a la información de la tabla. Estime un intervalo de confianza del:

1. 90% para la calificación promedio obtenida por el personal antes de la realización del curso.2. 93% para la calificación promedio obtenida por el personal después del curso.3. 98% para la proporción de clientes que calificó el servicio del personal antes de la realización del

curso, con una calificación inferior a 5 puntos.4. 98% para la proporción de clientes que calificó el servicio del personal después de la realización del

curso, con una calificación inferior a 5 puntos.5. 98% para la proporción de clientes que calificó el servicio del personal antes de la realización del

curso, con una calificación superior a 5 puntos.6. 98% para la proporción de clientes que calificó el servicio del personal después de la realización del

curso, con una calificación superior a 5 puntos.7. 95% para el incremento en la calificación promedio, respecto al servicio ofrecido por el personal,

otorgada por los clientes antes y después del curso.8. 93% para la Varianza y Desviación Estándar con respecto a la calificación promedio del personal,

antes de la realización del curso.9. 93% para la Varianza y Desviación Estándar con respecto a la calificación promedio del personal,

después de la realización del curso.10. ¿Fue suficiente el número de clientes encuestados (muestra) para estimar la calificación promedio en

los incisos 1 y 2. ?. Si el error que se está dispuesto aceptar en la estimación de la calificación otorgada por los clientes no debe ser mayor de: a. 0.05; b. 0.10; c. 0.20 y d. si no se acepta ningún error en la estimación de la calificación.

11. ¿Fue suficiente el número de clientes encuestados (muestra) para estimar el porcentaje de clientes que asignaron una calificación inferior a 5 puntos en los incisos 3, 4, 5, y 6 ?. Si el error que se está dispuesto aceptar en la estimación del porcentaje no debe ser mayor del: a. 5%; b. 7%; c. 10% y d. si no se acepta ningún error en la estimación del porcentaje.

PRUEBA O VERIFICACIÓN DE HIPÓTESISEs la segunda parte en la cual la Estadística en su área Inferencial se divide para su estudio.

PROBAR O VERIFICAR UNA HIPÓTESIS. Es tomar una decisión respecto al valor que tiene el parámetro; o bien. Es comprobar a través de un proceso estadístico si el valor que se supone tiene el parámetro de una población es cierto o es falso.

PROCEDIMIENTO.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

28

Page 29: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Para comprobar si el valor del parámetro sometido a prueba es cierto o es falso, es extraída y procesada una muestra de la población que se estudia. El resultado obtenido se compara con el valor sometido a prueba (valor hipotético). De esta comparación se generan dos alternativas:1. Si no existe una diferencia “significativa “ entre estos dos valores; el valor que se supone tiene el

parámetro de la población ( valor hipotético ), se ACEPTA como cierto.2. Si existe una diferencia “significativa” entre el valor del parámetro obtenido en la muestra y el valor

hipotético sometido a prueba, el valor que se supone tiene el parámetro de la población ( valor hipotético ), se RECHAZA como falso .

REGIONES DE ACEPTACION Y DE RECHAZO.Ejemplo: Yo supongo que esta moneda es “ legal ”, entendiendo como tal; que la moneda no está cargada en ninguno de sus lados, o bien, que existe la misma probabilidad que al lanzarla caiga “cara” o “cruz”. ( Es decir que al ser lanzada un número de veces el 50 % de los resultados serían cara y el otro 50 % sería cruz ). Para probar esto, una alternativa sería lanzarla un número determinado de veces y observar: ¿Cuántas caras y cuantas cruces que se presentan ?.

Basados en esto; por ejemplo en n = 100 lanzamientos de la moneda esperaríamos obtener: 50 caras y 50 cruces.Pero una vez realizado el experimento

¿A que conclusión llegaríamos sobre el resultado obtenido ?. Veamos algunas alternativas analizadas por el lado de las caras:a. Resultado: 50 caras Con este resultado se comprobaría que la moneda es legal. Pero con……..

b. Resultado: 51 caras.c. Resultado: 53 caras. d. Resultado: 55 caras. e. Resultado: 60 caras. f. Resultado: 65 caras. ¿ Y con estos ?g. Resultado: 70 caras

O bien:

a. Resultado: 49 carasb. Resultado: 47 carasc. Resultado: 45 caras

d. Resultado: 40 caras e. Resultado: 35 caras f. Resultado: 30 caras

Aquí, la clave estaría; en establecer …..“ un rango de aceptación, es decir, el mínimo y el máximo número de caras, dentro del cual consideraría que la moneda es legal ”.Es decir un intervalo de resultados en el cual se consideraría que no existe una diferencia significativa entre lo que nos esperábamos encontrar y el resultado. Por ejemplo:

3940 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61

REGION REGION DE DE RECHAZO ( RR ) REGION DE ACEPTACION ( RA ) RECHAZO ( RR )

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

29

¿ Con estos resultados consideraría Ud. que la moneda no es legal ?

¿ Con estos resultados

consideraría Ud. que la moneda no es

¿ Y con estos ?

Page 30: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

En prueba de hipótesis el principal objetivo es “Establecer el o los límites de aceptación hasta el cual se consideraría que lo que se esta comprobando es cierto ó es falso”.

REGION DE ACEPTACION (RA): Zona de resultados en la cual se considera que no existe una diferencia significativa entre el valor hipotético sometido a prueba y el valor del parámetro muestral.

REGIÓN DE RECHAZO (RR): Zona de resultados en la cual se considera que existe una diferencia significativa entre el valor hipotético sometido a prueba y el valor del parámetro muestral.

TIPOS DE HIPOTESISEl primer paso a dar al realizar una prueba de hipótesis es el de hacer el planteamiento de dos proposiciones que están relacionadas con el valor supuesto del parámetro que se intenta someter a prueba. Dichas proposiciones son denominadas: HIPOTESIS NULA e HIPOTESIS ALTERNATIVA.

HIPOTESIS NULA : ( Ho )La proposición planteada en esta hipótesis deberá colocar a la persona que realiza la prueba en una posición imparcial a lo que intenta probar. El objetivo final de toda prueba de hipótesis es el de aceptar o rechazar la proposición planteada en la hipótesis nula; por esta razón algunos autores la denominan hipótesis de trabajo.

HIPOTESIS ALTERNATIVA: ( H1 )La proposición en esta hipótesis generalmente se plantea en función a lo que se intenta probar. Los autores la denominan hipótesis de investigación. Esta hipótesis es aceptada cuando el resultado del proceso estadístico no sostiene lo planteado en la hipótesis nula.

TIPOS DE PRUEBAS ( UNA Y DOS COLAS )

En función a lo que se intenta probar respecto al valor del parámetro. Las pruebas de hipótesis se clasifican en dos tipos:

Sean: PRUEBAS DE TIPO I: PRUEBAS DE UN EXTREMO ( UNA COLA )

a. EXTREMO IZQUIERDO O COLA IZQUIERDA: Se genera cuando interesa que el valor del parámetro sometido a prueba alcance un mínimo valor para aceptar lo planteado en la hipótesis nula.

b. EXTREMO DERECHO O COLA DERECHA: Se genera cuando interesa que el valor del parámetro muestral sometido a prueba no sobrepase un mínimo valor para aceptar lo planteado en la hipótesis nula.

PRUEBAS DE TIPO II: DOS EXTREMOS ( DOS COLAS )

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

30

HO : θ = θ0

H1 : θ < θ0

RR RA

HO : θ = θ0

H1 : θ > θ0

RA RR

Page 31: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Se genera cuando interesa por una parte que el valor del parámetro sometido a prueba alcance un mínimo; pero por otra, que no sobrepase un máximo para aceptar lo planteado en la hipótesis nula.

NIVEL DE SIGNIFICANCIA ( ) .Es aquel que establece los valores en el límite de aceptación o rechazo de la proposición planteada en la hipótesis nula ( el límite inferior y/o superior de aceptación ). El nivel de sigificancia generalmente se establece en términos de porcentaje, el cual generalmente oscila entre un 1 y 10 %, aún cuando pueden aplicarse niveles de significancia de otras magnitudes. Pudiéndose establecer que la probabilidad de rechazar Ho cuando esta es cierta es directamente proporcional a la magnitud de dicho nivel de significancia.No hay un estándar o un nivel universal de significancia para probar una hipótesis. Es posible probar una hipótesis a cualquier nivel de significancia.

ERRORES TIPO I y TIPO II ( y )Al tomar la decisión de aceptar o rechazar la hipótesis nula, existe la posibilidad de caer en alguno de dos errores posibles:

ERRORES TIPO I ( )En una prueba estadística, es el error que se comete al tomar la decisión de rechazar la hipótesis nula cuando ésta es cierta.

ERRORES TIPO II ( )En una prueba estadística, es el error que se comete al tomar la decisión de no rechazar la hipótesis nula cuando ésta es falsa.

Ejemplo:Imagine las situaciones posibles que se pueden llegar a establecer en un juicio respecto a la decisión que toma un juez al emitir su veredicto en relación al acusado.

VEREDICTO DEL JUEZ

INOCENTE CULPABLE

SITUACION DEL ACUSADO

INOCENTE ACIERTO ERROR I I

CULPABLE ERROR I ACIERTO

Planteamiento de las hipótesis:Ho: El acusado es inocenteH1: El acusado es culpable

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

31

HO : θ = θ0

H1 : θ ≠ θ0

RR RA RR

Page 32: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

El error TIPO I ( ) ocurriría cuando siendo inocente el acusado se le declara culpable (se rechaza Ho ) El error TIPO II ( ) Ocurriría cuando siendo culpable el acusado se le declara inocente ( se acepta Ho).

Para un problema en general, el cuadro anterior podría quedar de la siguiente manera:

ERRORES TIPO I y TIPO II ( y )

DECISIONHIPOTESIS NULA

CIERTA FALSA

ACEPTAR HoDECISION

CORRECTA

ERRORTIPO II

( )

RECHAZAR HoERRORTIPO I( )

DECISIONCORRECTA

Notas:1. Toda prueba o verificación de hipótesis tiene como objetivo aceptar o rechazar lo planteado en la

hipótesis nula Ho. Por ello, a esta hipótesis se le denomina Hipótesis de trabajo2. La proposición planteada en Ho, deberá colocar a la persona que realiza la prueba en una posición

imparcial a lo que se trata de probar con respecto al valor del parámetro.3. El planteamiento hecho con respecto al valor del parámetro sometido a prueba en la hipótesis nula H1

( < , ≠ , > ), será el que define el tipo de prueba:

Sea : cualquier parámetro ( , , P, x - y , Px - Py , x2 / y

2 ) poblacional sometido

aprueba y o el valor supuesto del parámetro sometido a prueba (valor hipotético de prueba), entonces se podría probar que

< o menor con respecto a un valor. ( extremo izquierdo ó cola izquierda ).

≠ o diferente con respecto a un valor ( dos extremos o dos colas ).

> o mayor con respecto a un valor ( extremo derecho o cola derecha ).

INSTRUCCIONES: Los siguientes problemas tienen como objetivo que el alumno:

I. Identifique el parámetro ó parámetros que se someterán a prueba.

II. Exprese con palabras el planteamiento de las hipótesis: NULA ( Ho ) y

ALTERNATIVA ( H1 ).

III. El planteamiento hecho con palabras lo traduzca a expresiones algebraicas.

EJERCICIO 1. En los años 90, el porcentaje de alumnos de nuevo ingreso en una institución de educación superior que abandonaban sus estudios durante el primer semestre debido a que la carrera que habían elegido no cubría sus expectativas, era del 25 %. Para los periodos transcurridos en este nuevo siglo fue analizada _____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

32

Page 33: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

una muestra de alumnos que abandonaron sus estudios por diferentes causas. En base al análisis de los resultados obtenidos:

1. Se quiere probar si el porcentaje de deserción por esta causa es el mismo, es decir; si puede considerarse que el porcentaje de deserción sigue siendo del 25 %.

2. Se quiere probar si se ha incrementado el porcentaje de deserción por esta causa, es decir; si puede considerarse que actualmente es mayor del 25 %.

3. Se quiere probar si ha disminuido el porcentaje de deserción, es decir; si puede considerarse que actualmente es menor al 25 %.

EJERCICIO 2. El contenido en impreso en la etiqueta de una determinada marca de refresco es de 225 mililitros. Para comprobar dicho contenido se seleccionaron aleatoriamente botellas conteniendo dicho refresco y el volumen promedio obtenido fue utilizado para comprobación. En base al análisis de los resultados obtenidos:

1. Se quiere comprobar si el contenido es el mismo que el que dice la etiqueta.2. Se quiere probar si dicho volumen es de al menos 225 mililitros.3. Se quiere probar si dicho volumen supera los 225 mililitros.4. Se quiere probar si dicho volumen no supera los 225 mililitros5. Se quiere probar si el volumen es inferior al impreso en la etiqueta.

EJERCICIO 3. Se trata de probar si el procedimiento propuesto para disminuir el tiempo empleado en la realización de una operación, es mejor que el procedimiento actual. Para compararlos, se aplicó un procedimiento específico a cada uno de dos grupos seleccionado aleatoriamente de alumnos y se compararon los resultados obtenidos con uno y otro método. Basados en estos resultados, se quiere probar:1. La calificación promedio obtenida por los alumnos con el método TRADICIONAL es mínimo 75.2. La calificación promedio obtenida por los alumnos con el método basado en el APRENDIZAJE

SIGNIFICATIVO supera los 90 puntos.3. Si no existe una diferencia en el nivel de aprovechamiento entre uno y otro método.4. Si el método basado en el APRENDIZAJE SIGNIFICATIVO actual es mejor que el basado en el

método TRADICIONAL.5. Si el método basado en el MÉTODO TRADICIONAL es mejor que el basado en el APRENDIZAJE

SIGNIFICATIVO.6. Si la calificación promedio alcanzada con el método de APRENDIZAJE SIGNIFICATIVO supera en al

menos 5 puntos a la calificación promedio alcanzada con el método de MÉTODO TRADICIONAL. 7. Si el Porcentaje de alumnos reprobados empleando el MÉTODO TRADICIONAL es de cuando más

el 25%.8. Si el Porcentaje de alumnos reprobados empleando el APRENDIZAJE SIGNIFICATIVO es máximo

del 15%.9. Si es mayor el porcentaje de alumnos reprobados con el MÉTODO TRADICIONAL que empleando el

método de APRENDIZAJE SIGNIFICATIVO.

EJERCICIO 4.

Los folletos de publicidad de un automóvil compacto de conocida marca, manejan que el

promedio de rendimiento del mismo, en condiciones normales de operación es de 17.4

kilómetros / litro. Para someter a prueba esta afirmación se realizan pruebas en diferentes

autos de dicha marca.

1. Se quiere probar si el rendimiento difiere con lo que dice la publicidad.

2. Se quiere probar si dicho rendimiento es superior a lo que afirma la publicidad.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

33

Page 34: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

3. Se quiere probar si el rendimiento es inferior a lo que los folletos publicitarios afirman.

EJERCICIO 5.

El gerente de una línea de autobuses realiza la programación de sus corridas con base en que un

autobús requiere en promedio, un tiempo de cuando más 40 minutos en recorrer la distancia

Orizaba-Córdoba, Para corroborar esto fueron cronometradas una muestra seleccionada

aleatoriamente de corridas. Desarrolle el planteamiento de las hipótesis Nula y Alternativa

( expresando con palabras y posteriormente a través de símbolos ).

EJERCICIO 6.

El promotor de una dieta para reducir peso afirma que en promedio, la persona que se someta a ella

siguiendo las indicaciones, reducirá al menos 2 kgs. en una semana. Para probar esta afirmación fue

seleccionada aleatoriamente una muestra de personas sometidas a tal régimen.

Desarrolle el planteamiento de las hipótesis Nula y Alternativa

EJERCICIO 7. Un estudio relacionado con el nivel de consumo diario y la preferencia de dos de las principales marcas de refresco de cola ( marcas A y B para nuestro ejemplo ) en una amplia región del país, involucró la aplicación de encuestas a una muestra de personas seleccionada aleatoriamente de la región; en base a los resultados del análisis de la muestra. Se desean probar los siguientes supuestos:

I. ¿Cuales serían el o los parámetros que utilizaría para medir? a. La preferencia de cualquiera de las dos marcas:

Nombre ____________ Símbolos ____________

b. El consumo de refresco de cualquiera de las dos marcas: Nombre __________ Símbolos ____________

II. Exprese con palabras y después con expresiones algebraicas el planteamiento de las hipótesis: NULA ( Ho ) y ALTERNATIVA ( H1 ).

1. Si el consumo promedio del refresco de cola para las personas que demandan la marca A es de cuando menos 200 mililitros diarios.

2. Si el consumo promedio del refresco de cola para las personas que demandan la marca A es mayor a 200 mililitros diarios.

3. Si el consumo promedio de refresco de cola para las personas que demandan la marca B es de cuando más 200 mililitros al día.

4. Si el consumo promedio de refresco de cola para las personas que demandan la marca B es menor a 200 mililitros al día

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

34

Page 35: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

5. Si se puede considerar que al menos el 60% de las personas que consumen refresco de cola, prefieren la marca A.

6. Si se puede considerar que menos del 60% de las personas que consumen refresco de cola, prefieren la marca A.

7. Si se puede considerar que máximo 35% de las personas que demandan para consumo refresco de cola, prefieren la marca B.

8. Si se puede considerar que el consumo promedio de las personas que prefieren refresco de cola es el mismo en las dos marcas.

9. Si es significativamente menor el consumo promedio de las personas que prefieren la marca B que aquellos que se inclinan por la marca A.

10. Si los que prefieren la marca A consumen en promedio al menos 50 mlls. más de refresco al día que los que prefieren la marca B.

11. Si es significativamente mayor la preferencia por parte de los consumidores de refresco de cola por la marca A que por la marca B.

12. Si difiere significativamente la preferencia por parte de los consumidores de refresco de cola por la marca A que por la marca B.

13. Si la varianza con respecto a las ventas promedio de la marca A es la misma que la varianza con respecto a las ventas promedio de la marca B.

14. Si la varianza con respecto a las ventas promedio de la marca A es la mayor que la varianza con respecto a las ventas promedio de la marca B.

Problema 1.

“La estabilidad de las mediciones de las características de un producto manufacturado es importante para mantener su calidad. En realidad, es mejor tener, a veces una pequeña variación en el valor medido de alguna de sus características importantes y tener una media del proceso dentro del “rango de acepta-ción”, que tener una amplia variación con una media que supuestamente se ajusta a las necesidades,

dado que puede producir un porcentaje de productos defectuosos mayor que en el primer caso”.

Ofrecer Un producto homogéneo en cuanto a su comportamiento ha sido una de las principales preocupaciones de una empresa fabricante de bombillas eléctricas

para lograr un control adecuado, somete periódicamente a pruebas de operación en condiciones normales de servicio. De una de estas pruebas realizadas se obtuvo la

información correspondiente a dos líneas de producción y que se presenta en la siguiente tabla:

D E S C R I P C I Ó NL I N E A S

A B# de muestras. 86 91

promedio de duración 1 190 hrs. 1 062 hrs.

desviación estándar 303 hrs. 162 hrs.# de lámparas que dilataron

menos de 1 200 hrs 3420

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

35

Page 36: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Puede considerarse a un nivel de significancia del:1. 5%, que el tiempo promedio de duración de los focos producidos por la LINEA A es de al

menos 1 200 horas.2. 8%, que el tiempo promedio de duración de los focos producidos por la LINEA B no supera

las 1 000 horas. 3. 10%, que es significativamente mayor la duración de los focos producidos por la LINEA A

que los focos producidos por la LINEA B. 4. 6%, que la diferencia en el tiempo promedio de duración entre esta clase de focos es mayor

a las 120 horas.5. 5%, que la desviación estándar con respecto al tiempo promedio de duración de los focos

producidos en la LINEA A supera significativamente el valor de 290.6. 10%, que la desviación estándar con respecto al tiempo promedio de duración de los focos

producidos en la LINEA B es de cuando más 150. 7. 5% Si el porcentaje de focos con una duración menor a las 1 200 horas producidos por la

LINEA A es superior al 35%.8. El porcentaje de focos con una duración menor a las 1 200 horas producidos por la LINEA

B es inferior al 25 %.9. 8% Si la diferencia en el porcentaje de focos producidos por las dos clases de líneas con

una duración inferior a las 1 200 horas es de al menos el 15 %.

Problema 2.

El tiempo de secado de un tipo de pintura

anticorrosiva depende de la cantidad de solvente

“X” con lo cual se prepara la misma. Con el objeto

de determinar en que grado afecta la cantidad de

este solvente en el tiempo de secado, fue realizado

un experimento utilizando diferentes cantidades.

Para el estudio se determinó que las cantidades de

interés eran de 15 grs/lt. y 30 grs/lt. de solvente,

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

36

Page 37: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

añadido en la mezcla con la cual se preparó. Los

datos obtenidos aparecen en la tabla.

DESCRIPCIÓNCANTIDAD DE

SOLVENTE

15 grs/lt 30 grs/ltnúmero de pruebas realizadas 21 20

tiempo promedio de secado (min.) 48 37varianza 2.3 1.8

desviación estándar 1.52 1.67

Suponiendo que los tiempos de secado de la pintura anticorrosiva se distribuyen normal-mente. En base a estos resultados ¿Se puede considerar a un nivel de significancia del:

1. 5% que el tiempo promedio de secado de la pintura con 15 grs. de solvente es de cuando más 45 minutos.

2. 10% que el tiempo promedio de secado de la pintura con 30 grs. de solvente es de al menos 35 minutos.

3. 5% que el tiempo promedio de secado de la pintura con 15 grs. de solvente es significativamente mayor que el tiempo promedio de secado de la pintura con 30 grs/lt. .

4. 5% que el tiempo promedio de secado de la pintura con 15 grs. de solvente es mayor en al menos 5 minutos más que el tiempo promedio de secado de la pintura con 30 grs/lt.

5. 5% que la varianza con respecto al tiempo el tiempo promedio de secado de la pintura con 15 grs. de solvente es de cuando más 2 grs/lt.

6. 5% que la varianza con respecto al tiempo el tiempo promedio de secado de la pintura con 30 grs. de solvente es de cuando menos 2.0 grs/lt.

Problema 3.

Con el objeto de estar en un nivel competitivo, se genera la necesidad en los productores de diseñar procesos más eficientes sin descuidar la calidad de los productos elaborados. Por tal motivo fue sometido a prueba un nuevo método en el ensamble de un dispositivo electrónico. Para tal fin fueron ensamblados dispositivos empleando el método actual y el propuesto obteniendo los siguientes resultados:

DATOSMETODO

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

37

Page 38: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

En base a los resultados presentado en la tabla. Pruebe a un nivel de significancia del:1. 5% si el tiempo promedio en realizar el ensamble del dispositivo empleando el método

ACTUAL es de cuando mas 35 minutos.2. 10% si el tiempo promedio en realizar el ensamble del dispositivo empleando el método

PROPUESTO es inferior a los 25 minutos.3. 8% si el tiempo promedio en realizar el ensamble del dispositivo empleando el método

ACTUAL significativamente diferente al del método PROPUESTO.4. 10% si el porcentaje de piezas defectuosas con el método PROPUESTO es mayor al 17%.5. 10% Si es significativamente mayor el porcentaje de piezas defectuosas al emplear el

método PROPUESTO que al emplear el método ACTUAL6. 5% si el ahorro en tiempo es significativo al emplear el método PROPUESTO con respecto

al método ACTUAL. 7. 10% si hay un ahorro de tiempo de cuando mas 10 minutos al emplear el método

PROPUESTO con respecto al método ACTUAL, al ensamblar el dispositivo.8. 10% si es superior a 60 la varianza con respecto al tiempo al emplear el método ACTUAL.

Problema 4.

Teniendo como objetivo "mejora en el servicio", como una de las estrategias de mercadotecnia para el incremento en sus ventas. Una gran cadena de supermercados muestreó las opiniones de sus clientes respecto al servicio ofrecido antes y después que el personal asistiera a cursos de capacitación que tenían como objeto mejorar la atención a los clientes. Se pidió a cada una de las personas encuestadas que asignaran una calificación que reflejara la calidad del servicio del personal en una escala de 0 ( malo) a 10 ( excelente ). Los resultados obtenidos en cada una de estas etapas son

presentados en la siguiente tabla:

DATOS ANTES DESPUES

# de clientes encuestados 60 75

calificación promedio 6.35 8.76

desviación estándar con respecto a la calificación promedio 0.95 0.46

# de clientes que dieron una calificación inferior a 5 47 28

En base a los resultados presentados en la tabla. ¿Puede considerarse a un nivel de significancia del:

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

38

Page 39: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

1. 10% que el promedio en la calificación obtenida por el personal; antes de la capacitación no superaba los 6.75 puntos?

2. 5% que la calificación promedio obtenida por el personal; después de la capacitación supera los 8.5 puntos ?.

3. 6% que más del 70% del personal en esta empresa obtuvo una calificación menor a 5 puntos antes del curso de capacitación ?.

4. 5% que cuando más el 30% del personal en esta empresa obtuvo una calificación menor a 5 puntos después del curso de capacitación ?.

5. 6% que el promedio en la calificación obtenida por el personal antes de la capacitación es significativamente diferente a la obtenida después del curso ?.

6. 6% que el promedio en la calificación obtenida por el personal antes de la capacitación es significativamente diferente a la obtenida después del curso ?.

7. 5% que el resultado del curso mejoró significativamente la calificación ?.8. 5% que el promedio en la calificación obtenida por el personal después de la capacitación

supera en al menos 1.5 puntos a la obtenida antes del curso ? 9. 10 % que la varianza con respecto a la calificación obtenida por el personal; antes de la

capacitación es superior a 0.8 .10. 10 % que la varianza con respecto a la calificación obtenida por el personal; después de la

capacitación es inferior a 0.25 .

Problema: Fue propuesto al gerente de producción de la empresa fabricante de ropa de mezclilla para caballero un nuevo hilo de algodón para ser empleado en la confección de las prendas, con una mayor resistencia que el que actualmente se esta usando. Para tomar una decisión, el hilo propuesto fue sometido a pruebas de

tensión, comparándolo con el que actualmente se está utilizando. Los resultados se presentan en la siguiente tabla:

D A T O S ACTUAL PROPUESTO

Pruebas realizadas 45 50

Resistencia media 2.1 kg. 3.8 kg.

Desv. Estándar. 1.0 kg. 1.5 kg.

Probar a un nivel de significancia del 5 %, si puede considerarse que:1. La resistencia promedio a la tensión del hilo PROPUESTO es superior a 3.5 kg. 2. El hilo PROPUESTO supera la resistencia promedio en al menos 2 kgs. A la del

hilo ACTUAL.3. La varianza con respecto a su resistencia del hilo ACTUAL es de cuando más 0.8

kgs.4.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

39

Page 40: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

5. Es significativamente mayor la varianza con respecto a la resistencia promedio del hilo PROPUESTO al compararla con hilo que se está empleando ACTUALMENTE.

Problema 1. El proceso de aseguramiento de la calidad en una empresa de la Industria Metal-Mecánica, ha

tenido avances significativos. Uno de los procesos que ha mejorado no tan solo en la calidad del producto sino en la reducido de sus tiempos de operación; ha sido en el del maquinado del embrague para freno

de auto. Para tal fin fueron diseñados nuevos aditamentos y se emplearon nuevas herramientas de corte, propuestas por los proveedores.

Con el objeto de evaluar los resultados obtenidos fueron comparados los tiempos realizados ANTES Y DESPUES de la aplicación de las mejoras. La tabla siguiente presenta los resultados del análisis de muestras seleccionadas aleatoriamente respecto al tiempo realizado al inicio del programa y los que actualmente se presentan:

DESCRIPCIÓNPROCESO

INICIAL MEJORADOtamaño de la muestra 29 27

tiempo promedio (minutos) 79.8 57.3desviación estándar 29.24 15.76

Suponiendo que los tiempos en realizar el maquinado de los embragues con cualquiera de los dos procesos, se distribuye normalmente. En base a estos resultados ¿Se puede considerar a un nivel de significancia del:

1. 5% que el tiempo promedio realizado en el maquinado del embrague ANTES de la implementación de las mejoras era superior los 73 minutos.

2. 10% que el tiempo promedio realizado en el maquinado del embrague DESPUES de la implementación de las mejoras es inferior a los 60 minutos.

3. 5% que el tiempo promedio realizado en el maquinado del embrague disminuyó significativamente DESPUES de la implementación de las mejoras con relación al tiempo realizado en esta operación ANTES de aplicarlas?.

4. 8% que el tiempo promedio realizado en el maquinado del embrague disminuyó significativamente DESPUES de la implementación de las mejoras, en al menos 25 minutos, con relación al tiempo realizado en esta operación ANTES de su aplicación?.

5. 5% si la desviación estándar con respecto al tiempo promedio realizado en el maquinado del embrague ANTES de la implementación de las mejoras era superior 25 minutpos

6. 10% si la desviación estándar con respecto al tiempo promedio realizado en el maquinado del embrague DESPUES de la implementación de las mejoras es inferior a los 20 minutos?.

7. 5% si la varianza con respecto al tiempo promedio realizado en el maquinado del embrague ANTES de la implementación de las mejoras era superior a la de DESPUES de su aplicación?.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

40

Page 41: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

PRUEBA DE BONDAD DE AJUSTE

Prueba realizada para determinar si una población tiene una distribución teórica especificada. Está

basada en el grado de ajuste que existe entre la frecuencia de ocurrencias de las observaciones en una

muestra observada y las frecuencias esperadas que se obtienen de una distribución hipotética. Dichas

diferencias pueden ser debidas entre otras causas a:

a. Fluctuaciones propias de los elementos que participan en la muestra.

b. Que el fenómeno observado realmente no presenta el comportamiento que se trata de probar.

El planteamiento de las hipótesis sería:

Ho: Presenta comportamiento …………………………..

H1: No presenta comportamiento………………………

Ho se rechaza si: >

Donde: =

Con: = número de celdas - 1

Donde:

: es un valor de la variable aleatoria cuya distribución muestral se asemeja

a la distribución Chi-Cuadrada.

: es el valor de la variable aleatoria obtenido en tablas

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

41

Page 42: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

fo : frecuencias observadas en la i - ésima celda.

fe : frecuencias esperadas en la i - ésima celda.

Celda: Es cada resultado posible del experimento

Nota.

Entre mayor sea la diferencia entre las frecuencias observadas y las esperadas, mayor será el valor de

y por lo tanto mayor será la probabilidad de rechazar la hipótesis nula Ho. Este criterio de decisión no

debe usarse si las frecuencias observadas son menores a cinco.

Problema 1.

El registro de la estatura expresada en metros de una muestra seleccionada aleatoriamente de 154 estudiantes de una Institución Educativa se presenta en la siguiente tabla.

Probar la hipótesis que de que la estatura de estos alumnos se distribuye normalmente. (Utilice un nivel de significancia del 10 %).

ESTATURA(metros)

# alumnos

1.54 – 1.57 131.58 – 1.61 161.62 – 1.65 231.66 – 1.69 251.70 – 1.73 321.74 – 1.77 21

1.78 – 1.81 131.82 – 1.85 11

LIMITES REALES mi fi mi fi fi (mi – x-)2 Z 1 Z 2 AREA f o

1.535 – 1.575 1.555 13 20.215 0.2369 -2.08 - 1.55

1.575 – 1.615 1.595 16 25.520 0.1444 - 1.55 - 1.01

1.615 - 1.655 1.635 23 37.605 0.0696 - 1.01 - 0.48

1.655 - 1.695 1.675 25 41.875 0.0056 - 0.48 - 0.05

1.695 - 1.735 1.715 32 54.880 0.0200 - 0.05 0.59

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

42

Page 43: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

1.735 - 1.775 1.755 21 36.855 0.0131 0.59 1.12

1.775 - 1.815 1.795 13 23.335 0.1433 1.12 1.65

1.815 – 1.855 1.835 11 20.185 0.2313 1.65 2.19

260.47 0.8642

X = 1.691

S2= 0.00565

S = 0.075

LIMITES REALESFRECUENCIAS OBSERVADAS

f o

AREA O PROBABILIDAD

FRECUENCIASESPERADAS

f e

( fe- fo ) 2

1.535 – 1.575 13

1.575 – 1.615 16

1.615 - 1.655 23

1.655 - 1.695 25

1.695 - 1.735 32

1.735 - 1.775 21

1.775 - 1.815 13

1.815 – 1.855 11

Problema 2.

En base a las estadísticas de periodos anteriores de la Secretaría del Trabajo los accidentes de tipo laboral, en la Industria Metal-Mecánica: el 45% de los mismos son debidos a la falta de capacitación del trabajador, el 25% su origen se debe a equipo de protección inadecuado para la labor que realizan, el 20% a la falta de concentración o descuido del trabajador en la función realizada, y el 10% al cansancio o fatiga del trabajador. Para este periodo; de los 225 accidentes que ocurrieron en empresas de este giro, el origen de los accidentes fueron debidos a:

O R I G E N D E L O S A C C I D E N T E S

falta de capacitación

equipo de protección

falta de concentración

o descuido

cansancio o fatiga

110 52 49 14

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

43

Page 44: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

En base a estos resultados, ¿Se puede considerar que el origen de los accidentes fue diferente al de periodos anteriores?. (Utilice un nivel de significancia del 10 %).

Problema 3.

En un proceso de producción se toma una muestra aleatoria de 150 artículos cada uno de los 5 días laborables de la semana y estos son inspeccionados para encontrar los artículos defectuosos. Para una semana determinada el total de artículos defectuosos fueron 60, los cuales se presentaron de la siguiente manera:

DÍA LUNES MARTES MIERC. JUEVES VIERNES TOTAL

# de piezas defectuosas

13 12 9 14 12 60

En base a estos resultados, ¿Se puede considerar que existe una diferencia significativa en el porcentaje diario de artículos defectuosos? (Utilice un nivel de significancia del 8 %).

Problema 5.

En el lanzamiento de 120 veces un dado, se obtuvieron los resultados que se presentan en la tabla:

C A R A S

1 2 3 4 5 6

# DE VECES 18 24 23 19 15 21

En base a estos resultados ¿Se puede considerar que el dado está balanceado ?. Utilice un nivel de significancia del 10 %.

Problema 6.

El sexo registrado en 1000 nacimientos es el que se presenta en la siguiente tabla:

S E X O

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

44

Page 45: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

masculino femenino

número 440 560

Estos datos apoyan la hipótesis que la proporción de hombres y mujeres es la misma. Utilice un nivel de significancia del 10 %.Realice las siguientes pruebas:

1. Bondad de ajuste.2. De hipótesis para una proporción.3. De una diferencia de proporciones

PRUEBA DE INDEPENDENCIAPrueba realizada para determinar si existe o no relación entre dos variables.

Conceptos:Tabla de contingencia: Formada por filas y columnas. Y esta formada de tal manera que clasifica y relaciona la información que se presenta entre filas columnas.

Dimensiones de una tabla de contingencia: Una tabla de contingencia se describe nombrando primero el numero de filas y después el número de columnas ( # de filas x # de columnas), sin tomar en cuenta la fila ni la columna de los totales.Ejemplo: La información presentada en la tabla hace referencia al número de piezas vendidas de tres diferentes prendas de vestir en los últimos años:

ARTICULOnumero de artículos vendidos

TOTAL1 995 1 996 1 997 1 998

PANTALONES 3 545 3 890 4 087 4 235 15 757

CAMISAS 1 156 1 546 2 345 2 567 7 614ZAPATOS 567 678 989 1 025 3 259

TOTAL 5 268 6 114 7 421 7 827 26 630

Dimensiones de la tabla: Es una tabla de contingencia de 3 x 4 .

El planteamiento de las hipótesis sería:

Ho: las variables analizadas son independientes H1: El valor que toma una variable depende del valor que toma la otra.

Ho se rechaza si: >

Donde: =

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

45

Page 46: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Con = ( número de filas - 1 ) ( número de columnas - 1 )

Donde:

: es un valor de la variable aleatoria cuya distribución muestral se aproxima

a la distribución Chi-Cuadrada.

: es el valor de la variable aleatoria obtenido en tablas

fo : frecuencias observadas en la i - ésima celda.fe : frecuencias esperadas en la i - ésima celda.

Nota: Entre mayor sea la diferencia entre las frecuencias observadas y las esperadas, mayor será el

valor de y por lo tanto mayor será la probabilidad de rechazar la hipótesis nula Ho. Este criterio de

decisión no debe usarse si las frecuencias observadas no son de al menos cinco.Problema 1.

En una investigación socioeconómica efectuada en una población con el objeto determinar la relación existente entre el número de hijos por familia y el grado académico máximo alcanzado por el padre fueron seleccionadas aleatoriamente 200 familias para encuestarlas, obteniéndose la información que se presenta en la siguiente tabla:

MÁXIMO GRADO ESCOLARALCANZADO POR LOS

PADRES

NÚMERO DE HIJOSTOTAL

O - 1 2 - 3+

de 3

PRIMARIA 14 37 32 83

SECUNDARIA 19 42 17 78BACHILLERATO 12 17 10 39

total 45 96 59 200

En base a estos resultados, se puede considerar que el número de hijos que tiene una familia depende del nivel escolar alcanzado por el padre. Utilice un nivel de significancia del 10%.

Problema 2.

Al preparar una campaña promocional a nivel nacional para un producto alimenticio, una oficina publicitaria desea determinar si la edad es un factor para la aceptación del producto. Por tanto la firma ha encuestado cuatro grupos distintos de edad obteniéndose la siguiente información.

CALIFICACIONGRUPO DE EDAD (años)

TOTAL10 - 19 20 - 29 30-49 50 ó +

EXCELENTE 25 40 47 46 158

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

46

Page 47: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

BUENO 69 51 74 57 251REGULAR 36 29 19 37 121

MALO 25 24 30 21 100TOTAL 155 144 170 161 630

En base a estos resultados, se puede considerar el grado de aceptación del producto depende de la edad de la persona. Utilice un nivel de significancia del 10 %.

Al preparar una campaña promocional a nivel regional una empresa refresquera desea determinar ¿Qué tanto influye en la demanda el punto o lugar de venta del producto?. Para determinarlo, la firma ha colocado su producto en cuatro grupos distintos de edad obteniéndose la

siguiente información.

CALIFICACIONGRUPO DE EDAD (años)

TOTAL10 - 19 20 - 29 30-49 50 ó +

EXCELENTE 25 40 47 46 158

BUENO 69 51 74 57 251REGULAR 36 29 19 37 121

MALO 25 24 30 21 100TOTAL 155 144 170 161 630

En base a estos resultados, se puede considerar el grado de aceptación del producto depende de la edad de la persona. Utilice un nivel de significancia del 10 %.

Problema 3.

La gerencia de la Cia. "X" con el objeto de estimular a sus vendedores ha propuesto un nuevo método de pago el cual consiste en comisiones sobre ventas realizadas en contra del actual; salario fijo más bono de compensación al finalizar el año. Para ello puso a consideración su plan, muestreando aleatoriamente a una muestra de vendedores en cada una de las zonas que tiene; obteniéndose los siguientes resultados:

número de vendedores que

prefieren

Z O N A

NOROESTE SURESTE CENTRO COSTA TOTAL

METODO ACTUAL

32 31 49 55 167

METODO PROPUESTO

24 33 63 26 146

TOTAL 56 64 112 81 313

En base a estos resultados, se puede considerar el grado de aceptación del método de pago propuesto es el mismo en cada una de las zonas consideradas. Utilice un nivel de significancia del 10 %.

Problema 4.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

47

Page 48: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Las compañías aseguradoras están revisando su política de cobrar primas reducidas para los seguros de automóviles pequeños, debido a que la proporción de accidentes fatales en este tipo de transporte es

mayor al compararlo con los autos grandes. Para investigar este problema se realizó un análisis sobre la distribución de accidentes en los que al menos un pasajero resultó gravemente herido o

falleció. Los datos de 322 accidentes se muestran en la tabla.

DESCRIPCIÓN DELACCIDENTE

TAMAÑO DEL AUTOMOVILTOTAL

PEQUEÑO COMPACTO GRANDECon heridas fatales o

graves71 29 21 121

Sin heridas fatales o graves

133 19 49 201

TOTAL 204 48 70 322

¿ Indican los datos que la frecuencia de accidentes con heridos fatales o graves dependen del tamaño del automóvil ?. Utilice un nivel de significancia del 10 %.

Problema 3.

Durante el proceso de control de la calidad en la producción de un artículo fabricado en 4 líneas diferentes de una empresa. Se toma una muestra aleatoria de 120 artículos en cada una de y estos son inspeccionados para encontrar los artículos defectuosos. Efectuada la inspección el total de artículos defectuosos fueron 60, los cuales se

presentaron de la siguiente manera:

L I N E A

DÍA I II III IV

# de piezas defectuosas

En base a estos resultados, ¿Se puede considerar que existe una diferencia significativa en el porcentaje de artículos defectuosos en las diferentes líneas?

( Utilice un nivel de significancia del 8 % ).

CONCEPTOSCONCEPTOS

ANÁLISIS DE REGRESIÓN.Análisis que tiene por objetivo estimar el valor de una variable a través de otra, mediante métodos estadísticos, utilizando datos observados de eventos similares ya ocurridos.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

48

Page 49: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

El término regresión lineal implica que el valor medio que toma Y variable dependiente dado un valor x variable independiente ( y/x ), está linealmente relacionado por la ecuación de regresión lineal poblacional:

y/x= + xdonde los coeficientes de regresión y son parámetros que deben estimarse a partir de los datos muestrales. Si a y b representan estas estimaciones respectivamente, se puede entonces estimar y/x por

de la regresión muestral o de la línea de regresión ajustada.

= a + b x

donde: a: el valor de la ordenada al origen. b: el valor de la pendiente de la recta

ANÁLISIS DE CORRELACION.Técnica que determina la fuerza con que las variables están relacionadas.COEFICIENTE DE CORRELACION.Determina el porcentaje de valores que toma la variable dependiente ( y ), que son explicados por la línea estimada de regresión.ECUACIÓN DE ESTIMACIÓN.Formula matemática que relaciona la variable desconocida con la (s) variable (s) conocida (s) en el análisis de regresión.ERROR ESTÁNDAR DE LA ESTIMACIÓN Medida de la confiabilidad de la ecuación de estimación, que indica la variabilidad de los puntos observados alrededor de la línea de regresión, esto es; hasta que punto los valores observados difieren de sus valores estimados obtenidos con la ecuación establecida.LÍNEA DE REGRESIÓNLínea ajustada a un grupo de puntos para estimar la relación entre dos variables.MÉTODO DE MÍNIMOS CUADRADOSTécnica para ajustar una línea recta a través de un conjunto de puntos, de tal manera que la suma entre la diferencia de las distancias del valor observado y el valor estimado, elevadas al cuadrado, sea el mínimo. PENDIENTE Constante ( b ) para cualquier línea recta dada, cuyo valor representa: Que tanto, el cambio del valor de la variable independiente ( X ), modifica el valor de la variable dependiente ( Y ).VARIABLE DEPENDIENTELa variable ( Y ) que se intenta predecir en el análisis de regresión.

VARIABLE INDEPENDIENTEVariable ( s ) conocida ( s ) en el análisis de regresión ( x1 , x2, .... ( xi ).

RELACIÓN LINEAL Tipo particular de asociación entre dos variables que puede describirse matemáticamente mediante una línea recta.

RELACION DIRECTARelación entre dos variables en las que al incrementarse el valor de la variable independiente, se incrementa el valor de la variable dependiente.

RELACIÓN INVERSARelación entre dos variables en las que al incrementarse el valor de la variable independiente, decrece el valor de la variable dependiente.

DIAGRAMA DE DISPERSIONGráfico que se construye a partir de los valores observados de dos variables una denominada variable independiente ( X ) y la otra variable dependiente ( Y ). Que tiene como función:

1. Conocer de forma gráfica si existe o no relación entre las dos variables.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

49

Page 50: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

2. Definir que tipo de relación se presenta en caso de existir.

DIAGRAMAS DE DISPERSION

TIPOS DE RELACIONES ENTRE VARIABLES

y y

LINEAL DIRECTA L LINEAL INVERSA

y y

x x ESTACIONARIA NO EXISTE RELACION

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

50

x x

Page 51: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Problema 1.

Con el objeto de establecer una ecuación que establezca los costos de producción (directos e indirectos), basándose en el nivel de producción, una empresa recabó información sobre los gastos generales expresados en miles de pesos y las unidades producidas, en diferentes plantas con las que cuenta la Compañía, la cual se muestra en la siguiente tabla.

#Gastos generales(miles de pesos)

Unidades producidas

1 184 38

2 163 40

3 265 51

4 148 33

5 273 54

6 166 37

7 227 46

8 109 30

9 146 35

10 167 39

11 173 43

12 158 39

Con base en esta información:

1. Desarrolle la ecuación de estimación que mejor describa estos datos.

2. Empleando la ecuación desarrollada en el punto anterior, determine un intervalo de confianza del

96% para la estimación de los gastos generales que se generan al producir:

a. 45 unidades.

b. 50 unidades.

3. Determine los coeficientes de correlación y determinación.

Problema 3.

Con el objeto de determinar el presupuesto de operación para el próximo año, se intenta definir una ecuación para estimar los gastos de reparación de los camiones de una empresa, de auto transporte de

carga; con base en su antigüedad. Para ello se toma como base las erogaciones hechas por este _____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

51

Page 52: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

concepto en el último año en los diferentes camiones con que la empresa cuenta., lo cual se muestra en la siguiente tabla:

Camión Edad del

camión en años

Miles de pesos gastados

mantenimiento

1 6 16.5

2 5 13.0

3 5 13.6

4 3 13.2

5 3 12.8

6 1 10.8

7 1 11.0

8 6 15.8

Con base en esta información:

1. Determine la ecuación que mejor se ajuste a este conjunto de datos.

2. Empleando la ecuación desarrollada en el punto 2, determine un intervalo del 95% para la

estimación del gasto en mantenimiento para camiones con: 2 y 4 años de uso respectivamente.

3. Determine los coeficientes de correlación y determinación.

Problema 2:Si bien, no es la publicidad de un artículo ofertado el único factor que influye en su demanda, es

un hecho que a mayor y mejor publicidad, las ventas de un producto se incrementan. El gerente de ventas de una empresa que confecciona ropa para dama está interesado en establecer una relación del comportamiento de estas dos variables: (inversión en miles de pesos y monto de las ventas que se observaron), para ello tomó los registros de ventas de los últimos diez años en los cuales fue

promocionada una línea de ropa en sus diferentes modelos. La siguiente tabla presenta los resultados observados en los mismos:

AñoGastos de Publicidad

( miles de pesos )Ventas anuales

( millones de pesos )

1 997 34 1.09

1 998 48 1.16

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

52

Page 53: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

1 999 39 1.26

2 000 51 1.49

2 001 44 1.34

2 002 41 1.23

2 003 50 1.32

2 004 56 1.42

2 005 61 1.48

2 006 54 1.24

2 007 58 1.39

2 008 49 1.35

Con base en esta información: 1. Determine la ecuación que mejor se ajuste a este conjunto de datos.2. Empleando la ecuación desarrollada en el punto anterior, estime un intervalo de confianza del 90%

para las ventas anuales para una inversión en publicidad de: a. $ 53 000.00 b. $ 38 000.00

3. Determine los coeficientes de Correlación y Determinación

Problema 3.

Con el objeto de estimar sus costos de producción para elaborar su Programa Operativo Mensual el Gerente de Producción desea establecer la relación existente entre el número de piezas producidas y el costo. Para ello tomó de los registros de producción de los últimos doce meses el comportamiento de estas dos variables.

La siguiente tabla presenta los resultados observados:

AñoNúmero de

piezas producidasCosto

(miles de pesos)

Diciembre 131 25.1

Enero 117 24.3

Febrero 149 25.3

Marzo 149 25.4

Abril 122 24.4

Mayo 145 25.7

Junio 154 30.1

Julio 153 30.0

Agosto 112 24.1

Septiembre 142 25.5

Octubre 128 24.7

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

53

Page 54: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

Noviembre 163 33.1

Con base en esta información:

1. Determine la ecuación que mejor se ajuste a este conjunto de datos.

2. Empleando la ecuación desarrollada en el punto anterior, estime un intervalo de confianza del 90%

para el costo estimado en producir 120 piezas

3. Determine los coeficientes de Correlación y Determinación.

Ejercicio 1.

Dado el siguiente conjunto de datos

i 1 2 3 4 5 6 7 8 9 10 11 12x i 8 4 15 10 12 7 18 5 13 10 25 22

Y i25 15 37 29 23 23 45 16 35 30 72 62

Con base en esta información:

1. Desarrolle la ecuación de estimación que mejor describa el comportamiento de estos datos.

2. Empleando la ecuación desarrollada en el punto anterior, determine un intervalo de confianza del

90% para la estimación del número de unidades producidas cuando la variable

a. x i toma el valor de 16. b. x i toma el valor de 24

3. Determine los coeficientes de correlación y determinación.

Ejercicio 2.

Dado el siguiente conjunto de datos

i 1 2 3 4 5 6 7 8 9

x i 66 75 41 54 25 49 46 30 34

Y i15 11 8 10 5 10 9 7 6

Con base en esta información:

1. Desarrolle la ecuación de estimación que mejor describa el comportamiento de estos datos.

2. Empleando la ecuación desarrollada en el punto anterior, determine un intervalo de confianza del

90% para la estimación del número de unidades producidas cuando la variable x i toma el valor

de 26 .

3. Determine los coeficientes de correlación y determinación.

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

54

Page 55: COMODIN MAESTRIA 09

TEMA: ANALISIS DE REGRESIÓN LINEAL_______________________________________Fernando Fernández Rodiles

_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ Pag.

MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN

55