resumen estadistica ii (segunda parte)

9
Unidad n° 4: regresión y correlación Análisis de Regresión - Procedimiento, herramienta o técnica estadística de predicción o pronóstico que permite, a través de una variable conocida, pronosticar el comportamiento de una variable desconocida. - La Variable Independiente (x) pronostica el valor de la Variable Dependiente (y). La variable (x) es conocida o hipotética y es de carácter explicativo; (y) se denomina la variable de respuesta. - Este análisis se basa en encontrar la ecuación de “mejor ajuste” a los valores de las variables, es decir, que mejor se ajuste al dispersograma o nube de puntos. Dispersograma: diagrama de dispersión bidimensional que muestra la relación entre las variables (se dice que es un grafico dinámico) Cada punto es un par ordenado de valores de (x) e (y). Regresión simple: se basa en una muestra. Interviene una sola variable independiente (x) para el pronóstico de la variable dependiente (y). (Población) (Muestra) Regresión múltiple: muchas variables independientes (x) intervienen en el pronóstico de la variable dependiente (y). (Población) (Muestra) Supuestos: - Distribución Normal: con una media en la línea de regresión de µxy= Bo + B1.Xi - Homocedasticidad: desviaciones estándar iguales a lo largo de la línea de regresión. y= Bo + B1.Xi + ei y= Bo + B1.X1 + B2.X2…… ŷ= bo + b1.x ŷ= bo + b1.x1 + b2.x2……

Upload: annie-moleker

Post on 08-Feb-2016

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Resumen Estadistica II (Segunda Parte)

Unidad n° 4: regresión y correlación

Análisis de Regresión

- Procedimiento, herramienta o técnica estadística de predicción o pronóstico que permite, a través de una variable conocida, pronosticar el comportamiento de una variable desconocida.

- La Variable Independiente (x) pronostica el valor de la Variable Dependiente (y). La variable (x) es conocida o hipotética y es de carácter explicativo; (y) se denomina la variable de respuesta.

- Este análisis se basa en encontrar la ecuación de “mejor ajuste” a los valores de las variables, es decir, que mejor se ajuste al dispersograma o nube de puntos.

Dispersograma: diagrama de dispersión bidimensional que muestra la relación entre las variables (se dice que es un grafico dinámico) Cada punto es un par ordenado de valores de (x) e (y).

Regresión simple: se basa en una muestra. Interviene una sola variable independiente (x) para el pronóstico de la variable dependiente (y).

(Población)

(Muestra)

Regresión múltiple: muchas variables independientes (x) intervienen en el pronóstico de la variable dependiente (y).

(Población)

(Muestra)

Supuestos:

- Distribución Normal: con una media en la línea de regresión de µxy= Bo + B1.Xi

- Homocedasticidad: desviaciones estándar iguales a lo largo de la línea de regresión.

- Valores de (y) estadísticamente independientes entre sí.

Criterio de Mínimos Cuadrados

- Sirve para encontrar los coeficientes de la recta (bo y b1)

- Es la sumatoria de todos los desvíos, errores o residuos (diferencia entre valor observado y esperado o estimado). Sirve para minimizar el número de desviaciones.

Estimación Puntual: se sustituye el valor conocido o supuesto de (x) en la ecuación y se calcula el valor estimado de (ŷ)

y= Bo + B1.Xi + ei

y= Bo + B1.X1 + B2.X2…… + ei

ŷ= bo + b1.x

ŷ= bo + b1.x1 + b2.x2…… + bnxn

Page 2: Resumen Estadistica II (Segunda Parte)

Estimación por Intervalo: utilizando el error estándar o típico de la regresión podemos averiguar los límites superior e inferior dentro de los cuales es probable que caiga el valor del pronóstico.

- Intervalo de confianza para (ȳ) dado un valor específico de (x), cuando (y) es desconocida. Intervalo promedio

- Intervalo de predicción, observamos individualmente a (y). Mientras más grande sea (x), mayor será el intervalo y más específico será.

Error estándar o típico de estimación: describe la dispersión de puntos de los datos que se encuentran por encima y por debajo de la línea de regresión. Establece la variabilidad esperada con respecto al pronóstico de la regresión. Similar a la desviación estándar en las medidas descriptivas. Mientras mayor sea el valor del error estándar, mayor será la magnitud de dispersión de los datos.

Análisis de Correlación

- Determina si dos variables cuantitativas están relacionadas, la dirección que ambas tienen y la fuerza de dicha relación lineal entre ellas.

- Permite, luego del pronóstico, cambiar las variables por otras más convenientes o mejores.

Coeficiente de Correlación

- Es múltiple o simple dependiendo del tipo de regresión.

- (r) es el rango de correlación muestral e indica la dirección y la fuerza de la relación. Pronostica al parámetro poblacional (P) de Pearson.

- Cuanto más grande sea el (r), más fuerte será la relación entre las variables.

Coeficiente de Determinación

- (r²) indica la proporción de variabilidad de la variable independiente con respecto a la variabilidad de la variable dependiente.

- Mientras más cerca de 1 esté la proporción, más aporta al modelo.

- Si tuviera que elegir entre dos coeficientes de determinación, elijo el de mayor valor porque es el que mejor se ajusta al dispersograma.

Unidad n°5: Series de Tiempo

Serie de tiempo

Page 3: Resumen Estadistica II (Segunda Parte)

- Conjunto de información cuantitativa relevada a través del tiempo de manera sistemática. Son datos numéricos que se obtienen en periodos regulares a través del tiempo.

- La suposición básica en el análisis de series de tiempo es que los factores que ocasionan los patrones de actividad en el pasado, continúan haciéndolo en el presente y seguirán más o menos de la misma forma en el futuro.

El principal objetivo del análisis de la serie de tiempo consiste en identificar y aislar los factores, elementos o componentes de influencia con el propósito de hacer predicciones para efectuar una planeación y control administrativos. Encuentra la línea de tendencia a través de la regresión, con el “tiempo” como variable independiente.

Modelo Multiplicativo para datos anuales o mensuales

- T (Tendencia): dirección o movimiento a largo plazo (se puede dar por cambios demográficos, tecnológicos, etc.)

- C (Ciclo): oscilación o movimientos altos y bajos que se dan a lo largo de la serie, son curvas por encima y debajo de la línea de la línea de tendencia. Duran de 3 a 10 años aprox., tiene una duración irregular (se puede dar por los ciclos económicos)

- S (Estacionalidad): se tiene en cuenta cuando los datos se registran mensual, trimestral o semestralmente (etc.), es un patrón que se repite año tras año y puede estar influido por el clima o las estaciones del año.

- I (Movimiento Irregular): dato observado que no sigue la tendencia modificada por el componente cíclico. No se puede pronosticar.

Índice: mide la variación de un concepto (precio, cantidad, valor, etc.) como porcentaje de ese concepto con respecto de ese mismo concepto en un año o período base.

Paasché:

Laspeyre:

Técnicas de suavizamiento de las series temporales: trata de amortiguar la fluctuación del movimiento irregular y cíclico, hasta llegar a observar de mejor manera la curva o línea de tendencia.

- Promedios móviles :

Y = T . C . S . I

I= ∑ P1.Q1∑ Po.Q1

I= ∑ P1.Q1∑ Po.Q1

Page 4: Resumen Estadistica II (Segunda Parte)

- Elimina los componentes C, I y S (dependiendo de la base)

- Busca puntos medios o medias aritméticas de variación para una secuencia de valores observados, por ejemplo: entre dos o más años. Dependiendo de los años o meses que se quieran tomar serán también los valores a tomarse.

- Cálculo del índice estacional: el estudio y aislamiento de los movimientos estacionales de una serie de tiempo mensual porque, al conocer el valor del componente estacional para un mes determinado, podemos ajustar y mejorar las proyecciones de tendencia para pronósticos o predicciones; y también sirve para descomponer las series de tiempo y eliminar sus influencias, considerando mayormente su tendencia y fluctuaciones cíclicas.

- Suavización exponencial:

- Se realiza entre el valor real y el valor suavizado anterior; mientras mayor sea el valor de α, mayor importancia se le da al valor original del período (Yt), y la suavización será cada vez menor; mientras menor sea el α, mayor será la suavización.

Unidad n°6: Control de Calidad

Control estadístico de de la actividad y productividad:

- La administración de calidad total surge en Japón, después de la Segunda Guerra Mundial (alrededor de 1950), cuando a Unión Japonesa de Científicos e Ingenieros invitó al Dr. Deming a formar a ingenieros, directivos y estudiantes en cuanto al tema del Control Estadístico de Procesos y los conceptos de Calidad.

- Deming realizó esto en oposición al pensamiento en EE.UU. de que el control de calidad se realizara después del proceso productivo, y no durante (como proponía Deming)

Calidad: conjunto de atributos de un producto, a los cuales un cliente define como calidad

- Ocho aspectos de la calidad :

- Desempeño: que cumpla con la finalidad

- Características: distintas cualidades que hacen atractivo al producto (funcionamiento)

- Confiabilidad: probabilidad de que el producto funcione como dice que funciona

- Ajuste: que la unidad funcione de acuerdo al requerimiento

- Durabilidad: cantidad de tiempo que requiere para que se reponga la unidad

- Condiciones de Servicio: mantenimiento del producto (post venta)

Page 5: Resumen Estadistica II (Segunda Parte)

- Estética: atributos atractivos en cuanto a la percepción humana

- Calidad percibida: parámetros de los clientes para definir la calidad

- Inspección de calidad: controlar la calidad de los proveedores (determina la capacidad del proceso)

Los 14 puntos de Deming

1. Crear constancia en la mejora de productos y servicios.2. Adoptar una nueva filosofía de cooperación.3. Desistir de la dependencia en la inspección en masa para lograr calidad. Mejorar el

proceso e incluir calidad en el producto desde el comienzo.4. Terminar con la práctica de comprar a los más bajos precios. Minimizar el costo total en el

largo plazo. 5. Mejorar constantemente y por siempre los sistemas de producción, servicio y

planeamiento de cualquier actividad. Esto va a mejorar la calidad y la productividad, bajando los costos constantemente.

6. Establecer entrenamiento dentro del trabajo (capacitación).7. Establecer líderes para ayudar a la gente, máquinas y dispositivos a realizar su trabajo.8. Eliminar el miedo y construir confianza, para trabajar más eficientemente.9. Terminar con la competición y construir un sistema de cooperación basado en el mutuo

beneficio que abarque toda la organización.10. Eliminar eslóganes, exhortaciones y metas pidiendo cero defectos o nuevos niveles de

productividad. 11. Eliminar cuotas numéricas y la gestión por objetivos.12. Eliminar las evaluaciones anuales o el sistema de méritos que da rangos a la gente y crean

competición y conflictos.13. Instituir un programa vigoroso de educación y auto mejora.14. Poner a todos en la compañía a trabajar para llevar a cabo la transformación.

Control Estadístico de Procesos:

- Proceso: Combinación global de personas, equipo, materiales utilizados, métodos y medio ambiente, que colaboran en la producción.

- Control de Procesos: es una herramienta estadística que se utiliza en el puesto de trabajo para conseguir el producto adecuado y de primera. Los gráficos de control constituyen el procedimiento básico del control estadístico de procesos.

El control de procesos tiene 3 objetivos:

- Seguimiento y vigilancia del proceso

- Reducción de la variación aleatoria y eliminación de la variación asignable

Page 6: Resumen Estadistica II (Segunda Parte)

- Menor costo por unidad

- Variaciones del control de procesos: se refleja en el producto

- Variación aleatoria o común : está permanentemente presente en cualquier proceso como consecuencia de su diseño y de sus condiciones de funcionamiento, generando un patrón homogéneo de variabilidad que puede predecirse y, por tanto, controlarse.

- Variación asignable : de carácter esporádico y puntual provoca anomalías y defectos en la fabricación, en cuanto se conoce la causa que origina ese tipo de defecto y por tanto se puede eliminar el mismo corrigiendo la causa que lo genera.

- El objetivo principal del control estadístico de procesos es detectar las causas asignables de variabilidad de manera que la única fuente de variabilidad del proceso sea debido a causas comunes o no asignables, es decir, puramente aleatorias.

El Kaizen:

- Mejora continua hasta la calidad total; una estrategia o metodología de calidad en la empresa y en el trabajo, tanto individual como colectivo.

- Su metodología trae consigo resultados concretos, tanto cualitativos como cuantitativos, en un lapso relativamente corto y a un bajo costo (por lo tanto, aumenta el beneficio) apoyado en la sinergia que genera el trabajo en equipo de la estructura formada para alcanzar las metas establecidas por la dirección de la compañía.

Recursos estadísticos para la calidad

- Gráfico causa efecto: esqueleto de pez; trata de encontrar la causa u origen de un efecto defectuoso.

- Diagrama de Pareto: regla 80/20; el 80% de la actividad depende del 20% de los factores. Si nos concentramos en el 20% de los factores, solucionamos el 80% de las actividades defectuosas. El 80% de los resultados totales se originan en el 20% de los elementos.

- Hoja de comprobación: sirve para examinar artículos defectuosos, analizar la localización de defectos, verificar las causas de los defectos, y la verificación y análisis de operaciones.

- Diagrama de flujo de procesos: Permiten identificar los problemas y las oportunidades de mejora del proceso. Se identifican los pasos, los flujos de los re-procesos, los conflictos de autoridad, las responsabilidades, los cuellos de botella, y los puntos de decisión.

Page 7: Resumen Estadistica II (Segunda Parte)

- Método Taguchi: filosofía del control de calidad fuera de línea, el diseño de productos y procesos basado en parámetros de diseño que determinan el buen funcionamiento del equipo

- Gráfico de Control: indica cuando un proceso está bajo control o fuera de control. Puede decirse que es análogo a una prueba de hipótesis. El gráfico va a variar dependiendo de si es para variables (media o rango) y para atributos (proporción o cantidad de defectos).

Benchmarking: conjunto de actividades que debe realizarse de forma continua y aplicando una metodología estructurada para asegurar unas mejoras "que se mantengan" a través de la comparaci6n permanente con las mejores prácticas existentes en cada momento. Es una comparación con el líder mundial y aprender de otros.

Fabricación “Just in Time”

- Alineamiento cliente - proveedor automático e inteligente teniendo los procedimientos en el producto pre programados.

- La idea básica del Just in Time es producir un artículo justo a tiempo para que este sea vendido o utilizado por la siguiente estación de trabajo en un proceso de manufacturas.

- Debido a que el inventario (stock) es considerado la raíz de muchos problemas en las operaciones, este debe ser eliminado o reducido al mínimo