1 introducción a la estadística licenciatura en administración y dirección de empresas (lade)...
TRANSCRIPT
1
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
1. Análisis de datos.2. Análisis de datos bivariantes.3. Correlación y regresión.4. Series temporales y números índice.5. Probabilidad.6. Variables aleatorias.7. Modelos discretos.8. Modelos continuos.9. Variables aleatorias multidimensionales: la distribución normal bivariante.
Programa de la asignatura
Organización de la asignaturaClases teóricas y clases prácticas de ordenador. Se valorará positivamente la asistencia a las clases prácticas. Las prácticas se realizarán en aulas informáticas en horarios preestablecidos. Se utilizará el programa STATGRAPHICS.
Profesora: Mónica Catalán ReyesProfesora: Mónica Catalán Reyes
2
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Organización de las prácticas
Evaluación de la asignaturaLa evaluación de la asignatura será el examen final. Se contara positivamente la entrega de un trabajo y ejercicios, estas dos tareas sumarán como máximo 0,5 puntos a la nota del examen.
El trabajo consistirá en analizar una base de datos con dos variables cuantitativas. Realizar el análisis por separado de las variables (univariante) y el conjunto (bivariante) hasta el ajuste de un modelo de regresión.
- Análisis de datos Univariante- Análisis de datos Bivariante- Regresión- Distribuciones (generación de datos por simulación)- Series temporales.
Las prácticas de la asignatura serán realizadas con el paquete estadístico Statgraphics. En la biblioteca se puede conseguir un CD con una versión para estudiantes. El mínimo de prácticas en ordenador son 5:
Profesora: Mónica Catalán ReyesProfesora: Mónica Catalán Reyes
3
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Bibliografía
Bibliografía Complementaria
- PEÑA, D. y ROMO, J.: Introducción a la Estadística para las Ciencias Sociales. McGraw Hill, New York, 1997.
- PEÑA, D.: Estadística. Modelos y Métodos, segunda edición, Alianza Universidad Textos, Madrid, 2001.
- MOORE, D. S.: The Basic Practice of Statistics, segunda edición, Freeman and Co., 2000.
- NEWBOLD, P.: Statistics for business and economics, cuarta edición, Prentice Hall, Englewood Cliffs, 1996.
Profesora: Mónica Catalán ReyesProfesora: Mónica Catalán Reyes
4
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
IntroducciónEl objetivo del curso es la Introducción a los conceptos fundamentales del Análisis de Datos y de la Probabilidad.
¿Qué es la estadística?Es una poderosa herramienta para generar conocimiento que ha experimentado un gran desarrollo a lo largo del tiempo.
¿En qué áreas se aplica la estadística?Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras.
Ejemplos de su aplicación son:
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.
5
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Introducción
Ejemplos de su aplicación son:
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población.
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas.
6
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
IntroducciónEtapas de un estudio estadístico
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población.
2) Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación.
3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio.
4) Inferencia estadística: consiste en suponer un modelo para la población e interpretación de los datos a la luz del modelo para obtener conclusiones generales.
5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población
7
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007Introducción
Esquema de las etapas de un estudio estadístico
AREA DE INTERES DATOSDATOS
Tema de InvestigaciónTema de Investigación
-Antecedentes Previos Antecedentes Previos
-ObjetivosObjetivos
-Preguntas de InvestigaciónPreguntas de Investigación
-Posibles HipótesisPosibles Hipótesis
-Unidad de AnálisisUnidad de Análisis
-PoblaciónPoblación
-VariablesVariables
ORGANIZAR Y RESUMIRORGANIZAR Y RESUMIR
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.)
INTERPRETACIÓN
INFERENCIA ESTADÍSTICAINFERENCIA ESTADÍSTICA
¿Población o Muestra?¿Población o Muestra?
CONCLUSIONES
Población Población
MuestraMuestra
ProbabilidadProbabilidadINFORMACIÓN
8
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007Introducción
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada.
2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades.
3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda.
4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país.
6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.
7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.
9
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007Introducción
1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada.
2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades.
3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda.
4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país.
6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.
7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.
Ejemplos de algunos problemas a estudiar
10
Mónica Catalán Reyes-2007Mónica Catalán Reyes-2007
• VARIABLE: VARIABLE: es lo que se va a medir y representa una característica de la es lo que se va a medir y representa una característica de la UNIDAD DE UNIDAD DE ANÁLISISANÁLISIS..
• ¿QUIÉNES VAN A SER MEDIDOS?: ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Los sujetos u objetos o Unidades de Análisis de una Población o una MuestraPoblación o una Muestra• POBLACIÓN :POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. Es el total de unidades de análisis que son tema de estudio.
Muestra: 60 trabajadores de empresas de comunicación
Unidad de análisis: Trabajador de empresa de comunicación
Variables: sexo, edad, salario, Nº de horas de trabajo, etc.
Población: Población:
““Las personas que Las personas que
trabajantrabajan en empresas de en empresas de
comunicacióncomunicación” ”
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
• MUESTRA: MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.Es un conjunto de unidades de análisis provenientes de una población.
MuestraMuestra
Resumen de algunos conceptos planteados en la Introducción
11
Problema de Problema de InvestigaciónInvestigación
- Antecedentes Previos Antecedentes Previos
- ObjetivoObjetivo
- Preguntas de Preguntas de InvestigaciónInvestigación
- Posibles HipótesisPosibles Hipótesis
- Unidad de AnálisisUnidad de Análisis
- Población Población
- VariablesVariables
Herramientas Herramientas EstadísticasEstadísticas
Respuesta al Respuesta al problema de problema de investigacióinvestigació
nn
INFORMACIÓNINFORMACIÓN
Mónica Catalán Reyes-2007Mónica Catalán Reyes-2007
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007Resumen de algunos conceptos planteados en la Introducción
12
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007ACTIVIDAD 1
Formulario para el registro de datos de los alumnos de LADE-2007 1) Registro Nº 2) Hombre Mujer 3) Edad 4) Número de hermanos(as): 5) ¿Vive con sus padres?: Si No 6) ¿En que comunidad autónoma nació?: 7) ¿Paga alquiler?: Si No 8) ¿Cuánto paga de alquiler al mes?: 9) ¿En que Sector vive actualmente?: 10) ¿Que medio de transporte utiliza generalmente para venir a la Universidad? 11) ¿Desayuna de lunes a viernes?: Siempre Casi Siempre A veces Nunca 12) ¿Fuma?: Si No 13) ¿Cuántos cigarrillos fuma al día?: 14) ¿Tiene teléfono móvil?: Si No 15) ¿Cuanto gasta en teléfono móvil mensualmente?:
Observación: por favor responda a cada una de las preguntas
Vamos a trabajar en los siguientes problemas de investigación: 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad; y 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.
Definir: Población bajo estudio, unidad de análisis, variables de interés.
13
Mónica Catalán Reyes-2004Mónica Catalán Reyes-2004
MUESTRAMUESTRA La muestra se genera a La muestra se genera a través de algún tipo de través de algún tipo de
muestreomuestreo
PROBABILISTICOPROBABILISTICO NO PROBABILISTICONO PROBABILISTICO
El total de elementos de la población serán El total de elementos de la población serán NN y los de la muestra y los de la muestra nn
- - Todas las unidades de la población tienen Todas las unidades de la población tienen alguna probabilidad de ser seleccionadas.alguna probabilidad de ser seleccionadas.
- Para obtener la muestra se requiere tener - Para obtener la muestra se requiere tener identificados los elementos de la población.identificados los elementos de la población.
- Los elementos de la población se identifican a - Los elementos de la población se identifican a través de un listado de elementos, denominado través de un listado de elementos, denominado marco muestralmarco muestral..
-- Para obtener una muestra se requiere de datos Para obtener una muestra se requiere de datos previos acerca de la población.previos acerca de la población.
- Una de sus ventajas es que puede medirse el - Una de sus ventajas es que puede medirse el tamaño del error en las predicciones.tamaño del error en las predicciones.
Muestreo aleatorio simpleMuestreo aleatorio simple
Muestreo sistemáticoMuestreo sistemático
Muestreo estratificadoMuestreo estratificado
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
14
MUESTRAMUESTRA La muestra se genera a La muestra se genera a través de algún tipo de través de algún tipo de
muestreomuestreo
PROBABILISTICOPROBABILISTICO NO PROBABILISTICONO PROBABILISTICO
El total de elementos de la población serán El total de elementos de la población serán NN y los de la muestra y los de la muestra nn
- - Este tipo de muestra también se denomina muestra dirigida.Este tipo de muestra también se denomina muestra dirigida.
- Suponen un procedimiento de selección informal y un poco Suponen un procedimiento de selección informal y un poco arbitrario.arbitrario.
- La elección de los elementos no depende de la probabilidad, sino de La elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador.causas relacionadas con las características del investigador.
- Son utilizadas en algunas investigaciones y a partir de ellas se hacen Son utilizadas en algunas investigaciones y a partir de ellas se hacen inferencias hacia la población.inferencias hacia la población.
-La muestra dirigida selecciona sujetos típicos, con la esperanza de La muestra dirigida selecciona sujetos típicos, con la esperanza de que serán casos representativos de una población determinada. que serán casos representativos de una población determinada.
Muestra de sujetos voluntariosMuestra de sujetos voluntarios
Muestra de expertosMuestra de expertos
Muestra de sujetos-tipoMuestra de sujetos-tipo
Muestra por cuotasMuestra por cuotas
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
15
TIPOS DE VARIABLESTIPOS DE VARIABLESVariables CuantitativasVariables Cuantitativas
VariableVariable: : corresponde a la característica de la Unidad de Análisiscorresponde a la característica de la Unidad de Análisis
Tipos de escalaTipos de escala IntervaloIntervalo o o RazónRazón
DISCRETADISCRETA
Variables Variables CualitativasCualitativas
CONTINUACONTINUA
Toma valores enteros Toma valores enteros
EjemplosEjemplos: : Número de HijosNúmero de Hijos, , Número de Número de empleados de una empresaempleados de una empresa, , Número de Número de
asignaturas aprobadas en un semestreasignaturas aprobadas en un semestre , etc., etc.
Toma cualquier valor dentro de un intervalo Toma cualquier valor dentro de un intervalo
EjemplosEjemplos: : Peso (escala de Razón); Estatura (escala de Peso (escala de Razón); Estatura (escala de Razón); Temperatura (Escala de Intervalo), etc.Razón); Temperatura (Escala de Intervalo), etc.
Escala de RazónEscala de Razón: Tiene un cero absoluto, el cambio de unidad de medida no : Tiene un cero absoluto, el cambio de unidad de medida no afecta la descripción de la variable. afecta la descripción de la variable. Escala IntervaloEscala Intervalo:: Tiene un cero arbitrario y Tiene un cero arbitrario y
al cambiar de unidad de medida cambia la descripción de la variable.al cambiar de unidad de medida cambia la descripción de la variable.
Unidad de MedidaUnidad de Medida: : GramosGramos o o KilosKilos para la variable Peso; Grados para la variable Peso; Grados CC o o F F para Temperatura para Temperatura
ORDINALORDINALNOMINALNOMINAL
Característica o cualidad Característica o cualidad cuyas categorías no tienen cuyas categorías no tienen un orden preestablecido. un orden preestablecido.
EjemplosEjemplos: : Sexo, Deporte Sexo, Deporte FavoritoFavorito, etc., etc.
Característica o cualidad cuyas Característica o cualidad cuyas categorías tienen un orden categorías tienen un orden
preestablecido. preestablecido.
EjemplosEjemplos: Calificación (S, N, A); : Calificación (S, N, A); Grado de Interés por un tema, etc.Grado de Interés por un tema, etc.
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
16
FrecuenciaFrecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se : desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica.presenta una característica.
DISCRETADISCRETA
CONTINUACONTINUA
ORDINALORDINAL
NOMINALNOMINAL
TIPO FRECUENCIATIPO FRECUENCIAFrecuencia AbsolutaFrecuencia Absoluta
(F)(F)Frecuencia RelativaFrecuencia Relativa
(f)(f)
Frecuencia Absoluta Frecuencia Absoluta Acumulada (FAA)Acumulada (FAA)
Frecuencia Relativa Frecuencia Relativa Acumulada (fra)Acumulada (fra)
DISCRETADISCRETA
CONTINUACONTINUANOMINALNOMINAL
ORDINALORDINAL
Variable Variable CuantitativaCuantitativa
Variable Variable CualitativaCualitativa
Variable Variable CuantitativaCuantitativa
Variable Variable CualitativaCualitativa
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
17
VariablesVariables- Tipo de Industria- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (: se clasifica en industria tipo A, B, C o D. (cualitativa nominalcualitativa nominal))- - Nº de EmpleadosNº de Empleados: se refiere al número de empleados en las líneas de producción. (: se refiere al número de empleados en las líneas de producción. (cuantitativa cuantitativa
discretadiscreta))- - SuperficieSuperficie: se refiere a los : se refiere a los metros cuadradosmetros cuadrados ( (unidad de medidaunidad de medida) disponibles para las áreas de ) disponibles para las áreas de
producción. (producción. (cuantitativa continuacuantitativa continua))- - CalificaciónCalificación: calificación realizada por una institución pública sobre cumplimiento de ciertos : calificación realizada por una institución pública sobre cumplimiento de ciertos
estándares (Muy Bien, Bien, Regular, Mal). (estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinalcualitativa ordinal))
Industria nº Tipo Nº Empleados Superficie Calificación
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. de conserva en función de algunas características.
Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva
PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país
DatosDatos
EJEMPLOEJEMPLO
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
18
EJEMPLOEJEMPLO
TABLAS DE TABLAS DE FRECUENCIAFRECUENCIA
Tipo deIndustria
FrecuenciaAbsoluta (Fj)
FrecuenciaRelativa (fj)
Porcentaje(%)
A
B
C
D
Total 300 1 100
CalificaciónFrec.
Absoluta (Fj)Frec.Relativa
(fj) o %Frec. Absol.
Acum. (FAAj)Frec. Relat.
Acum. (fraj) o %
Muy Bien
Bien
Regular
Mal 300 1 (o 100)
Total 300 1 (o 100)
Numero deEmpleados
Frec.Absoluta (Fj)
Frec.Relativa(fj) o %
Frec. Absol.Acum. (FAAj)
Frec. Relat.Acum. (fraj) o %
<100
[100-150[
.
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)Superficie
(mt2)Frec.
Absoluta (Fj)Frec.Relativa
(fj) o %Frec. Absol.
Acum. (FAAj)Frec. Relat.
Acum. (fraj) o %
<200
[200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%)
(1)(1)(2)(2)
(3)(3)
(4)(4)
Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias de conserva en : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. función de algunas características.
Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva
PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
19
EJEMPLOEJEMPLO
Elementos que Elementos que observamos en las observamos en las
TABLASTABLAS
1) Titulo General1) Titulo General
2) Titulo por columna/fila2) Titulo por columna/fila
4) Fuente4) Fuente
3) Frecuencias3) Frecuencias
desde tabla de frecuencias desde tabla de frecuencias (1)(1)
Auto-explicativaAuto-explicativa
Tipo deIndustria
Nº Proporción Porcentaje
A 30 0,10 10 %
B
C
D
Total 300 1 100 %
Tabla 1: Distribución de las Industrias de Conservas Tabla 1: Distribución de las Industrias de Conservas de acuerdo a Tipo de Industriade acuerdo a Tipo de Industria
Fuente: Informe 2006, Ministerio de Industria y EnergíaFuente: Informe 2006, Ministerio de Industria y Energía
Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias de conserva : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. en función de algunas características.
Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva
PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
20
1) Determinar el número de clases o intervalos (k) 1) Determinar el número de clases o intervalos (k) (C(C11, C, C22, ..., C, ..., Ckk): ):
- Total de unidades de análisis (n)
- Regla de Sturges: k =1 + 3,3 logn
2) Determinar amplitud del intervalo2) Determinar amplitud del intervalo- Valor mínimo que toma la variable en el grupo, min(xi) i=1, 2,...,n.
- Valor máximo que toma la variable en el grupo, max(xi) i=1, 2,...,n.
- Rango= max(xi)-min(xi) = R
- Amplitud =(R+1)/k = a
3) Construir los intervalos3) Construir los intervalos: Límite inferior y Limite superior de cada intervalo: Límite inferior y Limite superior de cada intervalo
- LIj =Límite inferior de la clase j, j=1, 2,...,k
- LSj =Límite superior de la clase j, j=1, 2,...,k
- LI1 = min(xi)-(1/2)
- LS1 = LI1 + a
- LI2 = LS1
- LS2 = LI2+ a
-.....
Pregunta: ¿Cómo se construye una tabla cuando la variable es Pregunta: ¿Cómo se construye una tabla cuando la variable es Cuantitativa (x)?Cuantitativa (x)?
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
21
Elementos de una tabla de frecuencia cuando la variable es continua (x)Elementos de una tabla de frecuencia cuando la variable es continua (x)
Respuesta: Confeccionar la tabla aplicando el procedimiento anteriorRespuesta: Confeccionar la tabla aplicando el procedimiento anterior
Intervalo Centro de clase Amplitud F f FAA fra
I1 c1 a1
I2 c2 a2 . .
Ik ck ak n 1
Total n 1
[LI1 ; LS1 [
[LI2 ; LS2 [
[LIk ; LSk]
aj = (LSj – LIj))cj = (LIj) + LSj )/2
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
22
Mónica Catalán Reyes-2004Mónica Catalán Reyes-2004
Ejercicio: confección de una tabla de frecuencia para una variable Ejercicio: confección de una tabla de frecuencia para una variable continuacontinua
10,5 10,7 9,5 10,5 11,8 11,2
12,0 10,3 13,5 12,3 10,6 9,8
10,7 11,5 11,1 10,6 9,3 12,9
10,4 7,5 10,2 8,7 10,9 9,9
11,7 10,3 10,6 10,5 11,9 11,0
13,9 10,6 10,0 10,8 10,6 -
7,3 8,0 8,5 12,5 9,7 -
Los datos corresponden a la edad de Los datos corresponden a la edad de los hijos de los trabajadores de una los hijos de los trabajadores de una
empresa empresa
7,3 9,7 10,4 10,6 11,1 12,3
7,5 9,8 10,5 10,6 11,2 12,5
8,0 9,9 10,5 10,7 11,5 12,9
8,5 10,0 10,5 10,7 11,7 13,5
8,7 10,2 10,6 10,8 11,8 13,9
9,3 10,3 10,6 10,9 11,9 -
9,5 10,3 10,6 11,0 12,0 -
Datos ordenados de menor a mayorDatos ordenados de menor a mayor
1)1) Construya un Diagrama de Tallo y HojaConstruya un Diagrama de Tallo y Hoja
2)2) ¿Cuál es la variable?; ¿Cuál es la Unidad de ¿Cuál es la variable?; ¿Cuál es la Unidad de análisis?; ¿Cuánto vale n?; ¿Cuál es el rango análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la variable?. de la variable?.
3)3) Sobre una Tabla de frecuenciaSobre una Tabla de frecuencia: ¿Cuántos : ¿Cuántos intervalos podría construir?; ¿Cuál es la intervalos podría construir?; ¿Cuál es la amplitud de cada intervalo?; ¿Cuántas amplitud de cada intervalo?; ¿Cuántas medidas de frecuencia puede obtener para medidas de frecuencia puede obtener para cada intervalo?.cada intervalo?.
4)4) Construir tabla de frecuenciaConstruir tabla de frecuencia para la para la variablevariable: Intervalos, centro de clase, : Intervalos, centro de clase, amplitud, frecuencias.amplitud, frecuencias.
Realice la siguiente actividadRealice la siguiente actividad
Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos.
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
23
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
1. Gráfico de Sectores Circulares (de 1. Gráfico de Sectores Circulares (de Torta)Torta)
Distribución de las unidades de análisis de acuerdo a variable 1
A20%
D10%
C40%
B30%
Distribución de las unidades de análisis de acuerdo a variable 1
B30%
C40%
D10% A
20%
Distribución de las unidades de análisis de acuerdo a variable 1
B30%
C40%
D10%
A20%
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
24
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
2. Gráfico de Barras2. Gráfico de Barras
Numero de unidades de análisis de acuerdo a variable 1
0
100
200
300
400
500
A B C D
variable 1
Nº
Porcentaje de unidad de análisis de acuerdo a variable 1
0 20 40 60 80 100
A
B
C
D
varia
ble
1
% unidad de análisis
-Este tipo de gráfico se utiliza generalmente para Este tipo de gráfico se utiliza generalmente para representar la frecuenciarepresentar la frecuencia de las categorías de una de las categorías de una variable cualitativavariable cualitativa. .
-Cuando una variable es cuantitativa se puede utilizar Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha este tipo de gráfico sólo si la variable se ha transformada en categorías.transformada en categorías.
-Hay distintas versiones de estos gráficos (por ejemplo Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos describir el comportamiento de una variable en distintos grupos.grupos.
Proporción de unidad de análisis de acuerdo a variable 1
0 0,2 0,4 0,6 0,8 1
A
B
C
D
varia
ble
1
Proporción de unidad de análisis
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
25
HistogramaHistograma
- Permite la representación de - Permite la representación de la la frecuenciafrecuencia de una de una variable variable CuantitativaCuantitativa..
- El El ejeeje xx se refiere a la se refiere a la variable.variable.
- El El ejeeje yy se refiere a la se refiere a la frecuencia (Nº , %).frecuencia (Nº , %).
- Cada Cada barrabarra representa la representa la frecuencia de la variable en la frecuencia de la variable en la población en estudio (o la población en estudio (o la muestra). muestra).
-El histograma se puede El histograma se puede construir desde los datos de la construir desde los datos de la tabla de frecuencia de la tabla de frecuencia de la variable en estudio.variable en estudio.
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
3. Histograma3. Histograma
1413121110987
15
10
5
0
edad
Fre
cuen
cia
Nº
Nº
edadedad
HistogramaHistograma
Distribución de los hijos de trabajadores Distribución de los hijos de trabajadores de la empresa de acuerdo a edadde la empresa de acuerdo a edad
EjemploEjemplo
En el gráfico se puede observar el En el gráfico se puede observar el número de número de hijoshijos de menor edad (7-8 años), las de mayor de menor edad (7-8 años), las de mayor
edad (13-14 años); y además que la mayoría de edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 hijos de los trabajadores están entre los 10 y 12
años.años.
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
26
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
5. Polígono de Frecuencia5. Polígono de Frecuencia
edadedad
1413121110987
15
10
5
0
edad
Fre
cuen
cia
Nº
Nº
Distribución de los hijos de trabajadores Distribución de los hijos de trabajadores
de la empresade la empresa de acuerdo a edadde acuerdo a edad -Esta representación se basa en Esta representación se basa en el Histograma.el Histograma.
-Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..
-El El eje xeje x se refiere a la se refiere a la variable.variable.
- El El ejeeje yy se refiere a la se refiere a la frecuencia (Nº , %). frecuencia (Nº , %).
-Los puntos que permiten la Los puntos que permiten la unión de las líneas representa unión de las líneas representa el el centro de clase centro de clase (o marca de (o marca de clase)clase)..
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
27
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
5. Diagrama de Caja5. Diagrama de Caja
- Permite identificar gráficamente la Permite identificar gráficamente la media, los percentiles 25 y 75, media, los percentiles 25 y 75, mínimo y máximo de una variable. mínimo y máximo de una variable.
- Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..
-El El eje xeje x permite identificar la permite identificar la poblacion en estudio.poblacion en estudio.
- El El ejeeje yy representa los valores de la representa los valores de la variable en estudio. variable en estudio.
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
1473584N =
HombresMujeres
Eda
d
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaron Edad de las personas que se realizaron angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000
28
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
5. Diagrama de Caja5. Diagrama de Caja
- Permite identificar gráficamente la Permite identificar gráficamente la mediamedia, los , los percentiles 25 y 75percentiles 25 y 75, , mínimomínimo y y máximomáximo de una variable. de una variable.
- Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..
-El El eje xeje x permite identificar la permite identificar la poblacion en estudio.poblacion en estudio.
- El El ejeeje yy representa los valores de la representa los valores de la variable en estudio. variable en estudio.
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
1473584N =
HombresMujeres
Eda
d
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaron Edad de las personas que se realizaron angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000
mediamedia
Percentiles 75Percentiles 75
máximomáximo
Percentil 25Percentil 25
mínimo mínimo
mediamedia
29
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
5. Diagrama de Caja5. Diagrama de Caja
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
1473584N =
HombresMujeres
Eda
d
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaron Edad de las personas que se realizaron angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000
mediamedia
Percentiles 75Percentiles 75
máximomáximo
Percentil 25Percentil 25
mínimo mínimo
mediamedia
Medidas Descriptivas Mujeres Hombres
N 584 1473
Media (o promedio) 63,3 59,2
Varianza 109,6 111,9
Desv.Típica (o Desv. Estándar) 10,5 10,6
Coeficiente Variación 0,2 0,2
Mínimo 25 23
Percentil 25 57 52
mediana 64 59
Percentil 75 70 67
Máximo 93 92
Moda 66 56
30
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
6. Otros6. Otros
Número de alumnos matriculados en la Carrera A según año de ingreso
0
2040
6080
100
1998 1999 2000 2001 2002 2003
año de ingreso
Nº
de
alu
mn
os
Número de alumnos matriculados en la Carrera B según año de ingreso
020406080
100
1998 1999 2000 2001 2002 2003
año de ingreso
Nº
de
alu
mn
os
Número de alumnos matriculados en las Carreras según año de ingreso
0
50
100
150
200
1998 1999 2000 2001 2002 2003
año ingreso
Nº
de
alu
mno
s
Carrera B
Carrera A
año de ingreso Carrera A Carrera B1998 60 801999 55 702000 80 502001 40 602002 68 502003 70 75
Nº de alumnos
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
31
OBSERVACIONESOBSERVACIONES
* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.
* El Gráfico debe contener un Título General y la identificación de cada eje * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia).(variable en estudio y frecuencia).
* En ocasiones resulta más ilustrativo un gráfico que una tabla de * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia.frecuencia.
* Al igual que las tablas, los gráficos deben ser auto-explicativos.* Al igual que las tablas, los gráficos deben ser auto-explicativos.
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
32
OBSERVACIONESOBSERVACIONES
* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.
* El Gráfico debe contener un Título General y la identificación de cada eje * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia).(variable en estudio y frecuencia).
* En ocasiones resulta más ilustrativo un gráfico que una tabla de * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia.frecuencia.
* Al igual que las tablas, los gráficos deben ser auto-explicativos.* Al igual que las tablas, los gráficos deben ser auto-explicativos.
Variables Cuantitativas
variablex i individuo elen variablela devalor ixni ,...,1
nccccn
i
1
n
iin
n
ii xccxcxcx
11
1
bxabaxbaxbaxn
iin
n
ii
11
1
)()()(
221
1
2n
n
ii xxx
21
2
1
)()( n
n
ii xxx
)()()( 111
nn
n
iii yxyxyx
)()()( 111
nn
n
iii yxyxyx
variabley i individuo elen variablela devalor iy
NOTACIONNOTACION
constantes:,, cba
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
33
MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL
-Media Aritmética (Promedio)Media Aritmética (Promedio)
-MedianaMediana
-ModaModa
n
xx
n
ii
1
Media Aritmética o PromedioMedia Aritmética o Promedio
MedianaMediana
)(EM kx
2M )1()(
E
kk xx
x
1x
2x
nx
Datos CuantitativosDatos Cuantitativos
x
)1(x
)2(x
)(nx
Datos Cuantitativos ordenados de menor a mayorDatos Cuantitativos ordenados de menor a mayor
Si Si nn es par es par
Si Si n n es impares impar
centro del dato)( kx
repite" se más que dato el"M o ModaModaDatos Datos
Cualitativos y CuantitativosCualitativos y Cuantitativos
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
34
Percentiles, Deciles o CuartilesPercentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)Decil (ejemplo: 4, 5, 8)
-Cualtil (ejemplo: 1, 2, 3)Cualtil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10El Decil va de 1 a 10
El Decil 4 (4/10)El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos: es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando losPercentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los nn datos están ordenados de datos están ordenados de MenorMenor a a MayorMayor
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
El Percentil va de 1 a 100El Percentil va de 1 a 100
El percentil 25 (25/100)El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos: es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Cuartil va de 1 a 4El Cuartil va de 1 a 4
El Cuartil 3 (3/4)El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos: es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
35
MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN
-RangoRango
-VarianzaVarianza
-Desviación EstándarDesviación Estándar
RangoRango
VarianzaVarianzax
1x
2x
nx
Datos CuantitativosDatos Cuantitativos
Coeficiente de VariaciónCoeficiente de VariaciónComparación entre VariablesComparación entre Variables
Se refiere al comportamiento de las variables cuantitativas en Se refiere al comportamiento de las variables cuantitativas en un grupo. un grupo. Por ejemplo: Si se tiene un conjunto de personas a las Por ejemplo: Si se tiene un conjunto de personas a las que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál
presenta mayor variación? presenta mayor variación?
)min()max( ii xxR
Desviación EstándarDesviación Estándar
)1(
)(1
)1(
)(1 1
22
1
2
2
n
xn
x
n
xxs
n
i
n
iii
n
ii
2ss
x
scv
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
36
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis.
Coeficiente de Asimetría 3
1
3)(
sn
xx
CA
n
ii
Si CA=0 si la distribución es simétrica alrededor de la media.Si CA<0 si la distribución es asimétrica a la izquierdaSi CA>0 si la distribución es asimétrica a la derecha
Coeficiente de Apuntamiento 4
1
4)(
sn
xx
CAp
n
ii
- Si CAp=3 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.- Si CAp>3, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media).- Si CAp<3 la distribución es más plana y se llama platicúrtica.
37
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Ejemplos
V2
7,06,05,04,03,02,01,0
14
12
10
8
6
4
2
0
Desv. típ. = 1,67
Media = 3,9
N = 30,00
V4
2,01,00,0-1,0
30
20
10
0
Desv. típ. = ,64
Media = 0,0
N = 30,00
V5
9,08,07,06,05,04,03,02,01,0
6
5
4
3
2
1
0
Desv. típ. = 2,42
Media = 5,2
N = 28,00
38
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Ejemplos
Media 3,9
Error típico 0,30
Mediana 4
Moda 4
Desviación estándar 1,67
Varianza de la muestra 2,78
kurtosis -0,43
Coeficiente de asimetría -0,02
Rango 6
Mínimo 1
Máximo 7
Cuenta 30V1
9,08,07,06,05,04,03,02,01,0
16
14
12
10
8
6
4
2
0
Desv. típ. = 1,77
Media = 5,4
N = 66,00
1 4 4
1 4 4
1 4 5
2 4 5
2 4 6
2 4 6
2 4 6
3 4 6
3 4 7
4 4 7
Datos Histograma Medidas descriptivas
39
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Rango IntercuatilicoRango Intercuatilico (RI): es la diferencia entre el tercer y el primer cuartil RI=C (RI): es la diferencia entre el tercer y el primer cuartil RI=C33-C-C11
Del ejemplo anterior se tiene que QDel ejemplo anterior se tiene que Q11=C=C11=3 y Q=3 y Q33=C=C33=5 por lo tanto RI= 5-3=2 =5 por lo tanto RI= 5-3=2
Comparación de la Media y la Mediana: Robustez
•Los datos atípicos son datos extremos o lejanos de la mayoría de las observaciones.
•La media y la mediana tienen un comportamiento diferente frente a los datos atípicos
•La media en su calculo considera todos los datos, incluyendo los datos atípicos.
•La mediana es una medida que se ve poco afectada por los datos atípicos, no los considera en su calculo dado que separa los datos.
• Sobre la base de lo anterior, la mediana es una medida robusta en comparación con la media.
40
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias)para datos Agrupados (tabla de frecuencias)
Intervalo Centro de clase Amplitud F f FAA fra
I1 c1 a1
I2 c2 a2 . .
Ik ck ak n 1
Total n 1
f1
f2
fk
n1
n2
nk
Tabla de frecuencia (para variable cuantitativa)Tabla de frecuencia (para variable cuantitativa)
1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma:
k
jjjcc fcxMedia
1
Sea cj la marca de clase (o centro de clase) y fj la frecuencia relativa de la clase j, donde j=1, 2,…, k.
2) La La Desviación típicaDesviación típica para datos para datos agrupados esta dada por:agrupados esta dada por:
k
jjcjc fxcs
1
2)(
3) El El Coeficiente de AsimetríaCoeficiente de Asimetría para para datos agrupados esta dado por:datos agrupados esta dado por:
3
1
3)(
c
k
jjcj
cs
fxc
CA
4) El El Coeficiente de apuntamientoCoeficiente de apuntamiento para para datos agrupados esta dada por:datos agrupados esta dada por:
4
1
4)(
c
k
jjcj
cs
fxc
CAp
41
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias)para datos Agrupados (tabla de frecuencias)
Intervalo Centro de clase Amplitud F f FAA fra
I1 c1 a1
I2 c2 a2 . .
Ik ck ak n 1
Total n 1
f1
f2
fk
n1
n2
nk
Tabla de frecuencia (para variable cuantitativa)Tabla de frecuencia (para variable cuantitativa)
5) La Mediana para datos agrupados es igual a la clase o intervalo que concentra al menos el 50% de los datos. Para esto se observan las frecuencias relativas acumuladas
Sea cj la marca de clase (o centro de clase), fj la frecuencia relativa de la clase j, donde j=1, 2,…, k.
Sea Faj la frecuencia absoluta acumulada de la clase j y faj la frecuencia relativa acumulada de la clase j, donde j=1, 2,…, k.
fa1
fa2
FA1
FA2
6) El cuartil 1 (Q1 o C1) para datos agrupados es igual a la clase o intervalo que concentra al menos el 25% de los datos. Observar las frecuencias relativas acumuladas.
6) El cuartil 3 (Q3 o C3) para datos agrupados es igual a la clase o intervalo que concentra al menos el 75% de los datos. Observar las frecuencias relativas acumuladas.
Se pueden obtener percentiles y deciles
42
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Tabla 1 Actividad
Transporte Estudia Pensionado Trabaja
Autobus 5 7 0
Bicicleta 3 3 2
Caminar 2 5 2
Coche 5 4 5
Metro 6 7 4
Transporte Nº %
Autobus 12 20,0
Bicicleta 8 13,3
Caminar 9 15,0
Coche 14 23,3
Metro 17 28,3
TOTAL 60 100
Actividad Nº %
Estudia 21 35,0
Pensionado 26 43,3
Trabaja 13 21,7
TOTAL 60 100
ProblemaInteresa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial.
Para esto se consultó a cada Para esto se consultó a cada persona sobre la actividad a persona sobre la actividad a la que se dedicaba y el medio la que se dedicaba y el medio de transporte preferido.de transporte preferido.
43
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personasNº de personas
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
Tabla 2 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60
44
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personas y % respecto de tipo de Transporte Nº de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100
45
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personas y % respecto de tipo de ActividadNº de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100
46
Resumen: análisis de frecuencia de 2 variables cualitativasResumen: análisis de frecuencia de 2 variables cualitativas
• Si tenemos dos variables cualitativas podemos construir una tabla de doble entrada con las Si tenemos dos variables cualitativas podemos construir una tabla de doble entrada con las frecuencias absolutasfrecuencias absolutas F Fijij, , dondedonde i=1, 2,…, m i=1, 2,…, m yy j=1, 2,…, k. j=1, 2,…, k.
• La La frecuencia relativafrecuencia relativa conjunta se obtiene dividiendo cada conjunta se obtiene dividiendo cada F Fij ij por n y se escribepor n y se escribe f fijij..
• La La distribución marginaldistribución marginal de la 1ª variable se obtiene calculando de la 1ª variable se obtiene calculando
i=1,2,…,mi=1,2,…,m
• La La distribución marginaldistribución marginal de la 2ª variable se obtiene calculando de la 2ª variable se obtiene calculando
j=1,2,…,kj=1,2,…,k
•La La distribución condicionadadistribución condicionada se refiere a estudiar la distribución de una variable dado un nivel o se refiere a estudiar la distribución de una variable dado un nivel o categoría de la otra variable.categoría de la otra variable.
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
k
jiji ff
1.
m
iijj ff
1.
mi(d
dcdc
j
jiji ,...,2,1 donde
) marginal relativa Frec.
),( conjunta relativa Frec.)/( relativa Frecuancia
47
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cuantitativas Descripción de 2 variables cuantitativas
Distribución conjuntaDistribución conjuntaProblemaInteresa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro Para esto se tiene el registro de una partida de 104 de una partida de 104 máquinas que presentaron máquinas que presentaron fallas en una región.fallas en una región.
Nº piezas
Nº máquinas
0 11
1 16
2 16
3 20
4 41
Total 104
Nº fallas
Nº maquinas
1 16
2 43
3 45
Total 104
Nº fallos
Nº piezas 1 2 3 Total
0 4 5 2 11
1 2 8 6 16
2 3 9 4 16
3 2 6 12 20
4 5 15 21 41
Total 16 43 45 104
Calcular lo siguiente1) Distribución relativa conjunta2)2) Distribución del número de fallos Distribución del número de fallos
condicionada a 3 piezas.condicionada a 3 piezas.3)3) La media del numero de fallosLa media del numero de fallos4)4) La media del numero de piezasLa media del numero de piezas5)5) La media del numero de fallos La media del numero de fallos
condicionada a las 2 piezascondicionada a las 2 piezas
48
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
Descripción de 2 variables cuantitativas Descripción de 2 variables cuantitativas
Distribución relativa conjuntaDistribución relativa conjuntaProblemaInteresa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro de Para esto se tiene el registro de una partida de 104 máquinas que una partida de 104 máquinas que presentaron fallas en una región.presentaron fallas en una región.
Calcular lo siguiente1) Distribución relativa conjunta2)2) Distribución del número de fallos Distribución del número de fallos
condicionada a 3 piezas.condicionada a 3 piezas.3)3) La media del numero de fallosLa media del numero de fallos4)4) La media del numero de piezasLa media del numero de piezas5)5) La media del numero de fallos La media del numero de fallos
condicionada a las 2 piezascondicionada a las 2 piezas
x y Nº fallos
Nº piezas 1 2 3 Total
0 0,038 0,048 0,019 0,106
1 0,019 0,077 0,058 0,154
2 0,029 0,087 0,038 0,154
3 0,019 0,058 0,115 0,192
4 0,048 0,144 0,202 0,394
Total 0,154 0,413 0,433 1
distribución del numero de fallas condicionada a 3 piezas
Nº fallos
Nº piezas 1 2 3 Total
x=3 0,1 0,3 0,6 1
la media de fallos condicionada a 3 piezas es: 2,50
Nº piezas 1 2 3 Total
x=2 0,1875 0,5625 0,25 1
la media de fallos condicionada a 2 piezas es: 2,06
Media de fallos=2,28
Media Nº de piezas=2,62
SoluciónSolución
Cov(x,y)= (0. 1 .0,038+ 0. 2 .0,048+…+ 4. 3 .0,202)- 2,62.2,28 =6,19-5,96 = 0,23
49
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007Descripción de 2 variables cuantitativas Descripción de 2 variables cuantitativas
Distribución conjuntaDistribución conjunta
Si se tienen 2 variables cuantitativas discretas que se miden a un conjunto de unidades se puede construir:
1) Tablas de doble entrada de frecuencias a absolutas y de frecuencias relativas.2) Distribución marginal de cada variable.3) Distribución de una variable condicionada a una categoría de la otra.
Medidas que se pueden calcular
y
x y1 y2 … yJ total
x1 F11 F12 … F1J F1.
x2 F21 F22 … F2J F2.
… xI FI1 FI2 … FIJ FI.
total F.1 F.2 … F.J N
Frecuencia AbsolutasFrecuencia Absolutas Frecuencia RelativasFrecuencia Relativas
y
x y1 y2 … yj total
x1 f11 f12 … f1j f1.
x2 f21 f22 … f2j f2.
… xI fi1 fi2 … fij fi.
total f.1 f.2 … f.j 1
I
iii fxx
1.
J
jjj fyy
1.
yxyxfyxI
i
J
Jjiij
1 1),cov(
I
iiix fxxs
1.
2)(
Media o promedio de x y de y
Desviación típica de x y de y
Covarianza de x con y
J
jjjy fyys
1.
2)(
yxss)y,xcov(
r Correlación de x con y
50
Ejemplo 1Ejemplo 1
Sobre los datos que se tienen para el cursoSobre los datos que se tienen para el curso
Aplicar todo lo visto hasta ahora sobre estadística descriptiva, no olvide identificar el problema, la unidad de análisis, las variables en estudio (definición de cada una de ellas donde se identifique la unidad de medida para las variables cuantitativas y las categorías de las variables cualitativas).
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
51
MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL- Covarianza Covarianza
- CorrelaciónCorrelación
x
1x
2x
nx
DatosDatos
CuantitativosCuantitativos
Covarianza: Covarianza:
Recordemos que:Recordemos que: Hasta ahora hemos estudiado las Hasta ahora hemos estudiado las medidas tendencia medidas tendencia central central (Media, Mediana, Moda) (Media, Mediana, Moda) y dispersióny dispersión (Varianza y Desviación Estándar) para (Varianza y Desviación Estándar) para unauna Variable Cuantitativa Variable Cuantitativa (x).(x).
Es una medida de Variabilidad Conjunta entre Es una medida de Variabilidad Conjunta entre dosdos variables ( variables (xx11 ,, x x22) o bien () o bien (xx , , yy))
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Si Cov(x,y) es positivaSi Cov(x,y) es positiva: : la asociación entre la asociación entre x x e e yy es directamente proporcional, es es directamente proporcional, es decir que cuando decir que cuando x x aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa.
Si Cov(x,y) es negativaSi Cov(x,y) es negativa: : la asociación entre la asociación entre x x e e y y es inversamente proporcional, es es inversamente proporcional, es decir que cuando decir que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa.
Si Cov(x,y) es ceroSi Cov(x,y) es cero: : no existe asociación entreno existe asociación entre x x e e yy..
n
iii )yy)(xx(
n)y,xcov(
1
1
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
52
MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL- Covarianza Covarianza
- CorrelaciónCorrelación
DatosDatos
CuantitativosCuantitativos
Coeficiente de Correlación de Pearson (Coeficiente de Correlación de Pearson (rr): ): Mide el grado de Asociación Lineal Mide el grado de Asociación Lineal entre dos variables Cuantitativasentre dos variables Cuantitativas
Se refiere al grado de asociación entre Se refiere al grado de asociación entre dosdos variables ( variables (xx11 ,, x x22) o bien () o bien (xx , , yy))
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Si Si rr es positivo es positivo: : la asociación entre la asociación entre x x e e yy es directamente proporcional, es decir que es directamente proporcional, es decir que cuando cuando x x aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa. Si Si rr=1=1: : la asociación lineal es la asociación lineal es perfecta.perfecta.
Si Si rr es negativo es negativo: : la asociación entre la asociación entre x x e e y y es inversamente proporcional, es decir es inversamente proporcional, es decir que cuando que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa. Si Si rr=-1=-1: : la asociación lineal es la asociación lineal es perfecta.perfecta.
Si Si rr es cero es cero: : no existe asociación entreno existe asociación entre x x e e yy..
CorrelaciónCorrelación: :
11 ryxss
)y,xcov(r
yx
n
iii
ss)n(
yxnyx
r1
1
Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)
UC3M-2007
53
r=1 r=-1
EJEMPLO : Representación gráfica de las variables x e yEJEMPLO : Representación gráfica de las variables x e y
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
54
Objetivo 2Estudiar si los valores de una
variable pueden ser utilizados para predecir el valor de la otra
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
Datos CuantitativosDatos Cuantitativos
Determinar si existe relación entre las variables x e y:
Coeficiente de Correlación
Objetivo 1Determinar si dos variables están Determinar si dos variables están asociadas y en qué sentido se da asociadas y en qué sentido se da
la asociaciónla asociación..
Estudiar la dependencia de una variable respecto de la otra:
Modelo de RegresiónModelo de Regresión
TérminosVariable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)Error (residuo)
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
55
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
Datos CuantitativosDatos Cuantitativos
NotaciónVariable Respuesta: y
Variable Explicativa: x
Modelo de Regresión Lineal Simple: yi=+xi+ei
Intercepto: Pendiente:
Error: e
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Modelo Estimado(recta de regresión)
bxay ˆ
xbya
2
11
2
111
n
ii
n
i
n
ii
n
ii
n
i
xxn
yxxynb
Método de Estimación: Mínimos CuadradosMínimos Cuadrados
iii yye ˆResiduos o Errores
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
2
),cov(
xs
yxb
x
y
s
srb
56
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
DATOSDATOS
MODELO DE REGRESIÓN LINEAL SIMPLE yi=+xi+ei
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
MODELO ESTIMADO
bxay ˆ
xbya
2
11
2
111
n
ii
n
i
n
ii
n
ii
n
i
xxn
yxxynb
ESTIMADORES
iii yye ˆ
ERRORES
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
2
),cov(
xs
yxb
x
y
s
srb
Desviación típica residual: sr
Representa la variabilidad promedio de los
datos observados con relación a la recta
de regresión.
n
e
n
yys
n
i
n
iii
r
1
2
1
2)ˆ(
57
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
MODELO DE REGRESIÓN LINEAL SIMPLE yi=+xi+ei
MODELO ESTIMADO
bxay ˆ
Una Variable Respuesta (y) una Variable Explicativa (x)
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
xx
yy
iii yye ˆ
Desviación típica residual: sr
Representa la variabilidad promedio de los
datos observados con relación a la recta
de regresión.
n
e
n
yy
s
n
iii
r
21
2)ˆ(
Recta estimada
58
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño edad (meses) talla (cm) i xi yi
1 3 55 2 6 68 3 5 64 4 5 66 5 3 62 6 4 65 7 9 74 8 8 75 9 9 73
10 7 69 11 6 73 12 5 68 13 8 73 14 6 71
y=talla / x=edad / n=14
95614
1
i
iy 3,68y 6,5ys
8414
1
i
ix 6x 2xs
07,9),cov( yx 88,0xyr
586314
1
i
iiyx 55614
1
2 i
ix
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
59
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
M o d e l o E s t i m a d o bxay ˆ
44,2b 64,53a
xy 44,264,53ˆ
Interpretación de los resultados
- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en una unidad la talla se incrementa en 2,44 cm.
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
60
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
De acuerdo al coeficiente de determinación, el modelo ajustado a los datos es adecuado (R2 cercano a 1)
Bondad de Ajuste del Modelo R2 = 0,77
niño edad (meses) talla (cm) Talla estimada error
i xi yi iy ie 1 3 55 61,0 -6,0 2 6 68 68,3 -0,3 3 5 64 65,8 -1,8 4 5 66 65,8 0,2 5 3 62 61,0 1,0 6 4 65 63,4 1,6 7 9 74 75,6 -1,6 8 8 75 73,2 1,8 9 9 73 75,6 -2,6 10 7 69 70,7 -1,7 11 6 73 68,3 4,7 12 5 68 65,8 2,2 13 8 73 73,2 -0,2 14 6 71 68,3 2,7
86,402)(14
1
2 i
ii yy
7,92)ˆ(14
1
214
1
2
i
ii
ii eyy
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
57,214
7,922
n
esr
61
531-1-3-5
5
4
3
2
1
0
e
Fre
cuen
cia
7570656055
5
4
3
2
1
0
y
Fre
cuen
cia
Histograma para la variable Talla (y)Histograma para la variable Talla (y)
Histograma para los errores (e)Histograma para los errores (e)
Algunos Gráficos que se observan en RegresiónAlgunos Gráficos que se observan en Regresión
20100
100
90
80
70
60
50
x
y
Diagrama de Dispersión Edad (x) v/s Talla (y)Diagrama de Dispersión Edad (x) v/s Talla (y)
Recta de regresión estimadaRecta de regresión estimada
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
- La media de los errores o residuos es cero.
- La desviación típica residual, representa la variabilidad promedio de los datos observados con relación a la recta de regresión.
62
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Correlación y causalidad
Si el coeficiente de correlación entre dos variables es alto (cercano a -1 o a 1), indica que estas dos variables toman valores que están relacionados entre si, pero no permite concluir una relación causal entre esas variables.
Ejemplo: se tienen dos variables “el número de matrimonios mensual en una ciudad” y “la temperatura promedio mensual” en un periodo determinado. El coeficiente de correlación entre estas dos variables es igual a 0,70.
- Las dos variables muestran una asociación, pero no podemos pensar que el número de matrimonios aumente con la temperatura, ni que una ola de calor produzca mayor numero de matrimonios.- A este tipo correlación se denomina correlación espuria.
Temperatura promedio
Nº
Mat
rimon
ios
63
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
1. Análisis de datos.2. Análisis de datos bivariantes.3. Correlación y regresión.4. Series temporales y números índice.5. Probabilidad.6. Variables aleatorias.7. Modelos discretos.8. Modelos continuos.9. Variables aleatorias multidimensionales: la distribución normal bivariante.
Programa de la asignatura
64
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 1. Introducción2. Clasificación de las series temporales (serie estacionaria y serie no estacionaria)
3. Descomposición básica de una serie temporal (tendencia, estacionalidad, componente irregular)
4. Análisis de la tendencia (método de la tendencia determinista, método de la tendencia evolutiva y método de diferenciación de la serie)
5. Análisis de la estacionalidad (tabla de doble entrada, coeficiente de estacionalidad y desestacionalización de la serie)
Resumen de conceptos involucrados: Una serie temporal puede ser estacionaria o no estacionaria. Una serie temporal esta compuesta por la tendencia (creciente o decreciente), la estacionalidad y un componente irregular. El análisis de la tendencia se puede realizar a través del método de la tendencia determinista (recta de regresión), método de la tendencia evolutiva (media móvil de orden tres y de orden cinco) y método de diferenciación de la serie. En el análisis de estacionalidad se organizan los datos en una tabla de doble entrada, se calculan coeficientes de estacionalidad y se realiza una desestacionalización de la serie.
65
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 1.- Introducción
Una serie temporal corresponde a una variable registrada a lo largo del tiempo.
La variable será de tipo cuantitativa y la unidad de tiempo estará dado según el registro de esa variable, este puede ser cada hora, diariamente, semanalmente, mensualmente, anualmente, etc.
El análisis de series temporales tiene como fin explicar la evolución de una variable en el tiempo y prever sus valores futuros.
Ejemplos: 1. El ingreso diario de pacientes a la unidad de emergencia de un hospital: la variable es el
número de pacientes que ingresan y la unidad de tiempo es diariamente.
2. En un supermercado se tienen las ventas semanales de un producto determinado: la variable es el número de ventas del producto y la unidad de tiempo es semanalmente.
3. Una empresa estudia la tasa de ausentismo laboral mensual en un periodo de 10 años: La variable es la tasa de ausentismo y la unidad de tiempo es mensualmente.
4. En un país se realiza un estudio sobre la proporción de mujeres que ingresan a la universidad sobre el total de ingresos anuales desde el año 1980 a 2006: la variable es la proporción de mujeres y unidad de tiempo es anualmente.
66
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales
Representación gráfica de una serie temporal
• La representación gráfica principal de una serie de tiempo es por medio de un gráfico temporal.
• El gráfico temporal se construye situando los valores que toma la serie en el eje de las
ordenadas (eje y) y los instantes temporales correspondientes en el eje de las abscisas (eje x).
En el cuadro 1 se puede observar 4 tipos de series para distintas variables medidas en las unidades de tiempo correspondiente.
1. Serie A: Número de reclamaciones semanales presentadas en el servicio de atención al cliente de una empresa de servicios (30 semanas).
2. Serie B: Número de Ventas cuatrimestrales de un nuevo producto (30 cuatrimestres correspondiente a 7 años y medio)
3. Serie C: Número de pasajeros mensuales transportados por avión en vuelos internacionales (144 meses correspondiente a 12 años).
4. Serie D: Precio diario de una acción en dólares (100 días).
67
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales
Cuadro 1: Grafico temporal para la serie A, serie B, serie C y serie D.
Serie A Serie B
Serie C Serie D
18
19
20
21
22
23
24
1 10 19 28
Semana
Nº
rec
lam
ac
ion
es
10
20
30
40
50
1 10 19 28
cuatrimestre
Ven
tas
4,5
5,0
5,5
6,0
6,5
1 45 89 133
mes
Pas
ajer
os
tran
spo
rtad
os
20
25
30
35
40
1 50 99
día
Pre
cio
de
un
a ac
ció
n
68
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales
2.- Clasificación de las series temporales
Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria.
SERIE ESTACIONARIA
• En esta serie la media y la variabilidad son constantes en el tiempo.
• En el gráfico temporal se observa que los valores que toma la serie tienden a oscilar alrededor de una media constante, y la variabilidad de la serie respecto de la media permanece también constante en el tiempo.
• Para este tipo de serie tiene sentido calcular la media y la desviación estándar (o típica) y construir un histograma.
• Un ejemplo se observa en cuadro 2 y cuadro 3.
69
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 2.- Clasificación de las series temporales
Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria.
SERIE ESTACIONARIA
Cuadro 2: Grafico de una serie temporal estacionaria.
18
19
20
21
22
23
24
1 10 19 28
Semana
Nº
recl
amac
ione
s
Media 20,96
Desv. Estándar 1,35
n 30
Serie A
SERIE ESTACIONARIA
Cuadro 3: Histograma de una serie temporal estacionaria.
Histograma Nº de Reclamaciones
Nº Reclamaciones
24232221201918
10
8
6
4
2
0
Desv. típ. = 1,35
Media = 21
N = 30,00
70
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 2.- Clasificación de las series temporales
Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria.
SERIE NO ESTACIONARIA
• En esta serie la media y/o la variabilidad cambian a lo largo del tiempo.
• El cambio de la media se traduce en la presencia de una tendencia a crecer o decrecer, por lo que la serie no tiende a oscilar alrededor de un valor constante o de referencia.
• Este tipo de series son dinámicas o evolutivas.
• Una serie no estacionaria puede ser estacional, es decir, que la serie tiene una pauta de evolución que se repite de un año a otro.
• Es importante destacar que por definición, una serie anual no puede ser nunca estacional, sin embargo las series mensuales o diarias pueden presentar estacionalidad, debida al mes o al día.
Ejemplos de series estacionarias se observan en el cuadro 4.
71
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 2.- Clasificación de las series temporales
Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria.
10
20
30
40
50
1 10 19 28
cuatrimestre
Ven
tas
4,5
5,0
5,5
6,0
6,5
1 45 89 133
mes
Pas
ajer
os
tran
spo
rtad
os
20
25
30
35
40
1 50 99
día
Pre
cio
de
un
a ac
ció
n
Serie B Serie D
SERIES NO ESTACIONARIAS
Serie C
NO
ESTACIONAL
ESTACIONAL
NO
ESTACIONAL
Cuadro 4: Gráfico temporal para la serie B, serie C y serie D.
La serie B y la serie D son no estacionales.
La serie C es estacional: tiene una pauta de evolución que se repite
72
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales
3.- Descomposición básica de una serie temporal
• Los métodos descriptivos clásicos pueden aplicarse a series temporales estacionarias, pero no para las no estacionarias.
• Una serie no estacionaria presenta unas características que permiten descomponerla. En éstas se puede identificar una tendencia constante o no constante y también se puede observar la estacionalidad.
• La descripción de una serie temporal supone que la serie observada es la suma de tres componentes distintos:
1. La tendencia: que se identifica con un movimiento suave de la serie a largo plazo. Es una pauta regular que evoluciona lentamente en el tiempo creciendo o decreciendo, tal como se observa en el cuadro 5.
2. La estacionalidad: que son movimientos de oscilación dentro del año, tal como se observa en el cuadro 6.
3. El irregular: que incluye las variaciones aleatorias alrededor de los componentes anteriores.
73
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales
3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular
1.- La tendencia
2.- La estacionalidad
10
20
30
40
50
1 10 19 28
cuatrimestre
Ven
tas
TendenciaTendencia de series no estacionariasTendencia CrecienteTendencia Creciente
20
25
30
35
40
1 10 19 28
día
Pre
cio
de
un
a ac
ció
n
Tendencia DecrecienteTendencia Decreciente
Cuadro 5: Gráfico temporal para series con tendencia creciente y decreciente.
74
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales
3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular
2.- La estacionalidad
4,5
5,0
5,5
6,0
6,5
1 45 89 133
mes
Pas
ajer
os
tran
spo
rtad
os
Serie C
4,6
4,8
5,0
5,2
5,4
5,6
5,8
6,0
6,2
6,4
6,6
1 2 3 4 5 6 7 8 9 10 11 12
Año
Pas
ajer
os
tran
spo
rtad
os
enero
julio
EstacionalidadEstacionalidad de una serie no estacionaria
Cuadro 6: Gráfico temporal de la serie C que es creciente y presenta estacionalidad (en los meses de enero de cada año hay menor Nº de pasajeros que en julio)
75
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales
3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular
La serie temporal no estacionaria se puede escribir como:
Valor observado= tendencia + estacionalidad + irregular
tttt ISTx
donde Tt es la tendencia, St es la estacionalidad e It el componente irregular.
76
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
• Para analizar la tendencia de una serie partiremos del supuesto que la serie no tiene estacionalidad (la estacionalidad se verá más adelante).
• Es decir, la serie a analizar es no estacionaria, no tiene estacionalidad, puede presentar una tendencia creciente o decreciente y posee un componente aleatorio irregular, esto se representa por el siguiente esquema:
Valor observadoValor observado= = tendenciatendencia + + irregularirregular
ttt ITx Para calcular la tendencia se puede plantear una hipótesis sobre la forma de Tt; tenemos dos casos:
1. Suponer que Tt es una función determinista del tiempo, por ejemplo una línea recta. Bajo este supuesto estudiaremos un método de tendencia determinista.
2. Suponer que Tt es una función no determinista desconocida, pero que evoluciona suavemente a lo largo del tiempo. Bajo este supuesto estudiaremos un método de tendencia evolutiva.
Un método más general consiste en no hacer ninguna hipótesis sobre la forma de la ecuación de la tendencia a corto plazo y suponer que la tendencia evoluciona lentamente en el tiempo, de manera que en el instante t debe ser próxima a la tendencia en el instante t-1. Para esto estudiaremos un método de diferenciación de la serie que elimina la tendencia de la serie.
M1M1
M2M2
M3M3
77
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M1: Método de tendencia determinista
Representamos la tendencia de una serie temporal por una línea recta. La ecuación de la recta se calculará mediante una ecuación de regresión donde la variable dependiente es la serie observada y la variable explicativa es el tiempo.
El objetivo es obtener la tendencia y posteriormente el componente irregular.
La tendencia en t esta dada por la siguiente ecuación de regresión:
Considerando ttt ITx
btaTt
Donde a y b son constantes a determinar y t es la variable tiempo.
N
ttxx
tx
N
iii
1))((
),cov(N
tt
s
N
ii
t
12
)(
Para obtener la pendiente (b) y el intercepto (a) de la recta, se debe calcular lo siguiente:
2
),cov(
ts
txb tbxa
btaTt ttt TxI La tendencia estará dada por: La componente irregular estará dada por:
78
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M1: Método de tendencia determinista
Los datos se organizarán de la siguiente forma:
Datos observados Datos a estimar
t xt Tt It
1 x1 T1 I1
2 x2 T2 I2
3 x3 T3 I3
N xN TN IN
btaTt ttt TxI La tendencia estará dada por: La componente irregular estará dada por:
79
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M1: Método de tendencia determinista
Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia mediante la recta de regresión. Recordar que esta serie no es estacionaria y se analiza bajo el supuesto que no tiene estacionalidad .
- El esquema propuesto es: ttt ITx donde xt = venta, Tt= tendencia e It es el componente irregular o residuo en el tiempo t.
- La tendencia se estima mediante un modelo de regresión: btaTt - La variable tiempo (t ) toma los valores del 1 al 30.
- La media para el tiempo es: 5,15t
- La varianza para el tiempo es: 92,742 ts
- La media de la serie de ventas es: 63,27x
- La covarianza entre la serie de ventas y la variable t es: 11,81),cov( tx
- La pendiente de la recta de regresión es: 08,192,74
11,81b
- El intercepto de la recta de regresión es: 84,105,1508,163,27 a
- La tendencia estimada esta dada por: tTt 08,184,10ˆ
- Los residuos o componente irregular están dados por: ttt TxI ˆˆ
80
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M1: Método de tendencia determinista
Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia mediante la recta de regresión. Recordar que esta serie no es estacionaria y se analiza bajo el supuesto que no tiene estacionalidad.
En el cuadro 7 se puede observar gráficamente el comportamiento de los datos de la serie comparado con la tendencia estimada y los errores o componentes irregulares.
0
10
20
30
40
50
cuatrimestre
ve
nta
s
-10
0
10
20
30
40
50
cuatrimestre
res
idu
os
Recta estimada para Tendencia
Residuos o componente irregular
Recta estimada para Tendencia
Valores reales de la serie (ventas)
(a)(a)
(b)(b)
Cuadro 7: contiene en (a) el gráfico de la recta de tendencia y datos de la serie de ventas y en (b) el grafico de los componentes irregulares (residuos) y la recta de la tendencia.
Observación: Ajustar un línea recta a la tendencia tiene la ventaja de la simplicidad. Puede servir para describir algunas series cuyo gráfico temporal muestra claramente una tendencia lineal, sin embargo no es aplicable a las series donde no se observa un incremento o decremento continuado y constante a lo largo del tiempo.
81
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M2: Método de tendencia evolutiva
Un procedimiento más realista que el del ajuste de la línea recta, es suponer que la tendencia Tt es una función, pero que evoluciona lentamente, y en consecuencia, puede aproximarse en intervalos muy cortos (por ejemplo de 3 o 5 datos) por una función simple del tiempo. En general se supone una recta, pero ahora sus coeficientes van cambiando suavemente en el tiempo.
Para estimar la tendencia Tt tenemos que asumir que en períodos cortos los coeficientes son constantes. En concreto, suponiendo que la representación de la tendencia por una recta es válida para tres períodos consecutivos, t-1, t, t+1, se tendrá:
- - - - - -
ocrecimientTT tt 1
tt TT ocrecimientTT tt 1
En consecuencia, se obtiene la media de tres observaciones consecutivas (t-1, t y t+1):
311
tttt
xxxm A esta operación se le denomina Media Móvil centrada de orden tres.
82
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M2: Método de tendencia evolutiva
Media Móvil centrada de orden tres
Observación: Utilizando la igualdad se obtiene: ttt ITx 3
11 ttt
ttIII
Tm
irregular componente tendencia tm
• Como el componente irregular tiene media cero, la media de tres valores del irregular puede suponerse despreciable frente a la tendencia y mt recoge principalmente en cada instante la tendencia de la serie en dicho momento.
• La Media Móvil centrada de orden tres, proporciona aproximadamente la tendencia en cada punto.
• El calculo de la componente irregular se efectúa después restando a los valores la tendencia, es decir:
ttt TxI
311
tttt
xxxm
83
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M2: Método de tendencia evolutiva
La Media Móvil centrada de orden tres es:
La componente irregular es: ttt TxI
311
tttt
xxxm
Calculando la media móvil de orden tres los datos se organizarán de la siguiente forma:
Datos observados Datos a estimar
t xt mt=Tt It
1 x1 - -
2 x2 m2 I2
3 x3 m3 I3
N-1 xN-1 mN-1 IN-1
N xN - -
84
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M2: Método de tendencia evolutiva
La Media Móvil de orden cinco se calcula con 5 observaciones consecutivas (t-2, t-1, t, t+1 y t+2):
La componente irregular es: ttt TxI
Calculando la media móvil de orden cinco los datos se organizarán de la siguiente forma:
52112
tttttt
xxxxxM
Datos observados Datos a estimar
t xt Mt=Tt It
1 x1 - -
2 x2 - -
3 x3 M3 I3
4 x4 M4 I4
5 x5 M5 I5
N-2 xN-2 MN-2 IN-2
N-1 xN-1 - -
N xN - -
Observación: la tendencia con una media móvil de orden cinco es más suave que con la media móvil de orden tres.
85
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M2: Método de tendencia evolutiva Media Móvil de orden tres y de orden cinco
Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia utilizando la media móvil de orden tres (mt) y la media móvil de orden cinco (Mt). Algunos de los datos de la tendencia (mt y Mt ) obtenidos son los siguientes:
t ventas mt Mt
1 13,16
2 40,07 24,3
3 19,63 23,9 21,3
4 11,89 17,7 21,6
5 21,61 16,1 17,9
6 14,85 19,3 18,6
7 21,54 19,9 20,3
8 23,28 21,7 20,8
9 20,30 22,6 22,4
De las 30 observaciones, calculando la Media Móvil de orden tres se obtienen 28 observaciones de tendencia; y calculando la Media Móvil de orden cinco se obtienen 26 observaciones de tendencia.
86
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M2: Método de tendencia evolutiva Media móvil de orden tres y de orden cincoEjemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia utilizando la media móvil de orden tres (mt) y la media móvil de orden cinco (Mt). Algunos de los datos de la tendencia (mt y Mt ) obtenidos son los siguientes:
0
10
20
30
40
50
2 4 6 8 10 12 14 16 18 20 22 24 26 28
cuatrimestre
ve
nta
0
10
20
30
40
50
3 5 7 9 11 13 15 17 19 21 23 25 27
cuatrimestre
ve
nta
(a) Tendencia de ventas con una media móvil de orden tres
(b) Tendencia de ventas con una media móvil de orden cinco
Cuadro 8: Tendencia de ventas obtenida por la media móvil de orden tres (a) y de orden cinco (b).
Observación: desde el cuadro 8 se puede ver que la tendencia de las ventas con la media móvil de orden cinco es más suave que con la de orden tres.
87
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M3: Método de diferenciación de la serie
Este método más general para calcular la tendencia, consiste en no hacer ninguna hipótesis sobre la forma de la ecuación de la tendencia a corto plazo.
Supone únicamente que la tendencia evoluciona lentamente en el tiempo, de manera que en el instante t debe ser próxima a la tendencia en el instante t-1.
En consecuencia, si se resta a cada valor de la serie el valor anterior, la serie resultante estará aproximadamente libre de la tendencia.
Esta operación se denomina diferenciar la serie y consiste en pasar de la serie xt a una nueva serie yt,
que se construye mediante:
1 ttt xxy
• Este procedimiento equivale a suponer que la tendencia en t es el valor de la serie en t-1. Por lo tanto la serie diferenciada equivale al componente irregular.
• Este método es más general ya que no requiere de ninguna hipótesis sobre la forma de la tendencia.
• Este método es el más utilizado en la actualidad.
88
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M3: Método de diferenciación de la serie
Calculando la serie diferenciada, los datos se organizarán de la siguiente forma:
1 ttt xxy
Datos observados Comp. Irregular t xt yt 1 x1 - 2 x2 y2=x1-x2 3 x3 y3=x2-x3
N-1 xN-1 yN-1=xN-2-xN-1 N xN yN=xN-1-xN
89
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M3: Método de diferenciación de la serie 1 ttt xxy
Ejemplo: Para las series no estacionarias presentadas en el cuadro 4 (Serie B, Serie C y Serie D) se eliminará la tendencia mediante la diferenciación, quedando la componente irregular (It). La siguiente
tabla contiene la diferenciación para seis casos de las series b, c y d; y la representación gráfica de la componente irregular para todos los datos se puede observar en el cuadro 9.
Serie B Serie C Serie D Cuatrim. Nº ventas yt=It mes pasajeros yt=It día precio acción yt=It
1 13,16 1 4,72 1 30,53
2 40,07 26,91 2 4,77 0,05 2 30,34 -0,18
3 19,63 -20,43 3 4,88 0,11 3 30,54 0,20
4 11,89 -7,74 4 4,86 -0,02 4 32,13 1,59
5 21,61 9,72 5 4,80 -0,06 5 32,16 0,03
6 14,85 -6,76 6 4,91 0,11 6 33,05 0,89
90
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia
M3: Método de diferenciación de la serie 1 ttt xxy
Ejemplo: Para las series no estacionarias del cuadro 4 (Serie B, Serie C y Serie D) se eliminó la tendencia mediante la diferenciación, quedando la componente irregular (It).
-4,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
cuatrimestre
com
pone
nte
irreg
ular
-0,3
-0,2
-0,1
0,0
0,1
0,2
0,3
1 12 23 34 45 56 67 78 89 100 111 122 133
cuatrimestre
com
po
ne
nte
irre
gu
lar
-30
-20
-10
0
10
20
30
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
cuatrimestre
com
po
ne
nte
irre
gu
lar
(b) Componente irregular para
Ventas
(c) Componente irregular para Nº pasajeros
(d) Componente irregular para Precio de una
acción
Cuadro 9: Representación gráfica de la diferenciación de las series B,C y D.
91
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 5.- Análisis de Estacionalidad5.- Análisis de Estacionalidad
Siempre que se recogen datos igualmente espaciados es esperable un efecto estacional, por ejemplo cuando se observan datos mensuales o semanales a través del tiempo.
Para analizar la estacionalidad, se requiere disponer los datos en una tabla de doble entrada, donde los valores de la serie se organizan según las opciones de tiempo, tal como se observa en el cuadro 10, donde cada tabla reúne los valores de la serie según (1) mes y año, (2) semana y mes, (3) día y semana.
(1) año (2) mes
mes 1994 1995 1996 1997 Semana enero febrero marzo abril mayo junio julio
enero 1
febrero 2
marzo 3
abril 4
mayo
junio (3) semana
julio Día 1 2 3 4 5 6 7
agosto lunes
septiembre martes
octubre miércoles
noviembre jueves
diciembre viernes
sábado
domingo
Cuadro 10: Tres ejemplos de organización de los valores que toma la serie en una tabla de doble entrada.
92
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 5.- Análisis de Estacionalidad5.- Análisis de Estacionalidad
El análisis de estacionalidad se basa en el cálculo de las medias por filas, por columnas y la media global.
1. Al restar la media global a la media de cada fila se obtienen los coeficientes estacionales.
• Para los ejemplos presentados en el cuadro 10, los coeficientes estacionales representan como se sitúa (1) la media de cada mes respecto de la media global; (2) la media de cada semana respecto de la media global y (3) la media de cada día respecto de la media global.
2. Las medias de las columnas indican la tendencia de la serie. Al restar la media global a la media de
cada columna se obtiene el comportamiento relativo.
• Para los ejemplos presentados en el cuadro 9, se tendría (1) la media de cada año menos la media global; (2) la media de cada mes menos la media global y (3) la media de cada semana respecto de la media global.
3. Se denomina serie desestacionalizada a una serie donde se ha eliminado el efecto estacional. Esta
serie se construye restando a los valores de cada fila el coeficiente estacional correspondiente.
Ejemplo: Para la serie mensual de pasajeros transportados por avión en vuelos internacionales (c), se realiza un análisis de la estacionalidad (ver cuadro 11), es decir se organizan los datos por mes y año, se calcula la media global, las medias por mes (fila ), las medias por año (columna), el coeficiente de estacionalidad por mes; y se construye la serie desestacionalizada.
93
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Series Temporales 5.- Análisis de Estacionalidad 5.- Análisis de Estacionalidad ((Coeficientes Estacionales, Tendencia de la Serie, Serie Desestacionalizada)
Serie: pasajeros por mes y añoaño
mes 1990 1991 1992 1993 1994 1995 medias Coef. Estac.enero 4,7 4,7 5,0 5,1 5,3 5,3 5,0 -0,15febrero 4,8 4,8 5,0 5,2 5,3 5,2 5,1 -0,12marzo 4,9 4,9 5,2 5,3 5,5 5,5 5,2 0,02abril 4,9 4,9 5,1 5,2 5,5 5,4 5,2 -0,02mayo 4,8 4,8 5,1 5,2 5,4 5,5 5,1 -0,03junio 4,9 5,0 5,2 5,4 5,5 5,6 5,3 0,08julio 5,0 5,1 5,3 5,4 5,6 5,7 5,4 0,18agosto 5,0 5,1 5,3 5,5 5,6 5,7 5,4 0,19septiembre 4,9 5,1 5,2 5,3 5,5 5,6 5,3 0,08octubre 4,8 4,9 5,1 5,3 5,4 5,4 5,1 -0,04noviembre 4,6 4,7 5,0 5,1 5,2 5,3 5,0 -0,17diciembre 4,8 4,9 5,1 5,3 5,3 5,4 5,1 -0,04
Medias 4,8 4,9 5,1 5,3 5,4 5,5Media Global = 5,175
Serie de pasajeros desestacionalizadaaño
mes 1990 1991 1992 1993 1994 1995enero 4,9 4,9 5,1 5,3 5,4 5,5febrero 4,9 5,0 5,1 5,3 5,4 5,4marzo 4,9 4,9 5,2 5,2 5,4 5,4abril 4,9 4,9 5,1 5,2 5,5 5,4mayo 4,8 4,9 5,2 5,2 5,5 5,5junio 4,8 4,9 5,1 5,3 5,4 5,5julio 4,8 5,0 5,1 5,3 5,4 5,5agosto 4,8 4,9 5,1 5,3 5,4 5,5septiembre 4,8 5,0 5,1 5,3 5,4 5,5octubre 4,8 4,9 5,1 5,3 5,4 5,5noviembre 4,8 4,9 5,2 5,3 5,4 5,5diciembre 4,8 5,0 5,1 5,3 5,3 5,5
Media por filas: sumar todos los valores de la fila y dividirlo por el número de años
Media por columnas: sumar todos los valores de la columna y dividirlo por el número de meses
Diferencia entre la media de fila y la media global.
Tabla de doble entrada
Serie desestacionalizada: a cada valor de la fila se le resta el coeficiente de estacionalidad.
= tendencia de la serie
Cuadro 11: Análisis de estacionalidad para la serie mensual de pasajeros transportados por avión en vuelos internacionales.
94
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del
tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.
1) Número índice para un producto (veremos 3) : - Para calcular este índice hay que identificar el producto a evaluar y el valor que toma éste en una unidad de tiempo, por ejemplo año.- Hay que determinar un año base, al que se le denomina período base del índice. - La Elección del año base es arbitraria y representa el momento temporal de referencia para las comparaciones.
a) Índice de precio (It) =
- Permite comparar la evolución de productos distintos.- Si se comparan tres productos hay que seleccionar el mismo año base para construir el índice, esto permite hacer la comparación de la variación del precio de los productos.
100base añoen precio
tañoen precio
año 1 litro leche 100 grs azafran 1 kg carne
1990 70 10000 1200
1991 75 12000 1250
1992 77 16000 1280
1993 77 20000 1300
1994 85 25000 1375
1995 90 22000 1450
año Índice leche Índice azafran Índice carne
1990 100 100 100
1991 107,1 120 104,2
1992 110 160 106,7
1993 110 200 108,3
1994 121,4 250 114,6
1995 128,6 220 120,8
Precios a) Índice de
precio(It)
95
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del
tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.
1) Número índice para un producto:
b) Índice de precio relativo respecto al año base=
- Proporciona de manera directa los crecimientos relativos respecto del año base.- Por ejemplo: para la leche índice de precio relativo respecto del año base, representa el incremento (en este caso) porcentual respeto del año base.- Es decir, en el año 1991 la leche incrementó su precio en un 7,1% respecto del año 1990; y un 10% en el año 1992 (también respecto del año base 1990)
año 1 litro leche 100 grs azafran 1 kg carne
1990 70 10000 1200
1991 75 12000 1250
1992 77 16000 1280
1993 77 20000 1300
1994 85 25000 1375
1995 90 22000 1450
Precios
b) Índice de precio relativo al año base
100base año precio
base año precio taño precio
año Índice leche Índice azafrán Índice carne
1990 0 0 0
1991 7,1 20 4,2
1992 10 60 6,7
1993 10 100 8,3
1994 21,4 150 14,6
1995 28,6 120 20,8
96
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del
tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.
1) Número índice para un producto:
c) Índice de precio relativo respecto del año anterior =
(donde P0 es el precio en el año base)
=
Proporciona los crecimientos relativos con relación a cualquier otro período.
c) Índice de precio relativo al año anterior
1001)/P- taño (precio
1)/P- taño precio( t)/Paño (precio
0
00
10011
t
t
I
I
año Índice leche Índice azafran Índice carne
1990 100 100 100
1991 107,1 120 104,2
1992 110 160 106,7
1993 110 200 108,3
1994 121,4 250 114,6
1995 128,6 220 120,8
a) Índice de
precio(It)
añoÍndice leche
Índice azafran
Índice carne
1990 - - -
1991 7,1 20 4,2
1992 2,7 33,3 2,4
1993 0 25,0 1,5
1994 10,4 25,0 5,8
1995 5,9 -12 5,4
97
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del
tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.
2) Número índice con agregación simple
a) Índice agregado: Promedio de índices individuales =
- Este índice evita la unidad de medida de los precios de los productos al incorporar en su cálculo los índices de precio, considerando un año base.- Su ventaja es la simplicidad.- El inconveniente es que da el mismo peso a todos los productos.
k
índices de suma 1
k
II
k
ii
g
año 1 litro leche 100 grs azafran 1 kg carne
1990 70 10000 1200
1991 75 12000 1250
1992 77 16000 1280
1993 77 20000 1300
1994 85 25000 1375
1995 90 22000 1450
Precios
año Índice leche Índice azafrán Índice carneÍndice agregado
1990 100 100 100 100
1991 107,1 120 104,2 110,4
1992 110 160 106,7 125,6
1993 110 200 108,3 139,4
1994 121,4 250 114,6 162,0
1995 128,6 220 120,8 156,5
Índice agregado
98
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del
tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.
3) Número índice con agregación ponderada a) Índice agregado ponderado: Índice A P=
- Considera las ponderaciones de los precios sobre un año base- Necesitamos conocer la cantidad de producto consumida en el año base. - No da el mismo peso a todos los productos.
Índice agregado ponderado
Año 1990: una familia consume 270 litro leche, 100 grs. Azafrán y 150 Kg de carne
Año 1990 leche azafrán carne
Consumo 270 1 150
Precio 18900 10000 180000 208900
Ponderación 0,0905 0,0479 0,8617 1
k
iiigp pII
1
año Índice leche Índice azufran Índice carne Índice AP
1990 100 100 100 100
1991 107,1 120 104,2 105,2
1992 110 160 106,7 109,6
1993 110 200 108,3 112,8
1994 121,4 250 114,6 121,7
1995 128,6 220 120,8 126,3
99
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del
tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.
3) Número índice con agregación ponderada b) Índice agregado ponderado: Índice de Laspeyres=
Ci año Base: es la cantidad de producto i en el año base.Precioi año t: es el precio del producto i en el año t.Precioi año Base: es el precio del producto i en el año año base.
- Este índice tiene en cuenta la importancia relativa de los producto en el consumo.- Necesitamos conocer la cantidad de producto consumida en el año base. - No da el mismo peso a todos los productos.- Los resultados son iguales al índice AP
Índice Laspeyres
100
Pr
Pr
1base año base año
1 taño base año
k
iii
k
iii
Laspeyres
ecioC
ecioC
I
Año 1990: una familia consume 270 litro leche, 100 grs. Azafrán y 150 Kg de carne
año 1 litro leche 100 grs azafran 1 kg carne Índice Laspeyres
1990 70 10000 1200 100
1991 75 12000 1250 105,2
1992 77 16000 1280 109,5
1993 77 20000 1300 112,9
1994 85 25000 1375 121,7
1995 90 22000 1450 126,3
Según se observa el índice AP (a) posee una formula distinta que el índice de Laspeyres (b), pero generan los mismos resultados.
100
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean : permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean
en economía y casi todos los campos de las ciencias sociales.en economía y casi todos los campos de las ciencias sociales.
4) Índice de precios al consumo (IPC)
- El IPC se calcula mensualmente por el Instituto Nacional de Estadísticas (INE).
- Refleja la evolución de los precios para la familia media Española
- Es un índice de Laspeyres que compara el valor cada mes de un conjunto de artículos con su valor en el período de referencia; éste se denomina Laspeyres encadenado
- El período de referencia se modifica aproximadamente cada 10 años, para tener en cuenta los cambios en la estructura del consumo de la población española.
- La distribución de los gastos de las familias (o ponderaciones) se estima realizando una encuesta que se conoce como Encuesta de presupuestos Familiares (EPF)
- Describe la evolución de los precios de consumo en un país a lo largo del tiempo.
- El porcentaje de variación o de crecimiento del IPC se puede calcular para cada año, mes, etc, utilizando el índice de precio relativo:
10011
t
t
I
I
101
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean : permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean
en economía y casi todos los campos de las ciencias sociales.en economía y casi todos los campos de las ciencias sociales.
4) Índice de precios al consumo (IPC)
GruposAño 2006, IPC base 2001
Año 2007, IPC base 2006
Alimentos y bebidas no alcohólicas 22,28 22,06
Bebidas alcohólicas y tabaco 3,07 2,82
Vestido y calzado 9,25 9,03
Vivienda 10,71 10,36
Menaje 6,17 6,15
Medicina 2,72 2,83
Transporte 14,91 14,89
Comunicaciones 3,28 3,58
Ocio y cultura 6,78 7,11
Enseñanza 1,68 1,6
Hoteles, cafés y restaurantes 11,45 11,55
Otros bienes y servicios 7,72 8,02
General 100 100
IPC, base 2006. Ponderaciones (Fuente INE)
102
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean : permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean
en economía y casi todos los campos de las ciencias sociales.en economía y casi todos los campos de las ciencias sociales.
4) Índice de precios al consumo (IPC)
Ejemplo del calculo del porcentaje de variación (o crecimiento)
año IPC % variación
1987 74,9 -
1988 78,5 4,8
1989 83,9 6,9
1990 89,5 6,7
1991 94,8 5,9
1992 100 5,5
1993 105 5,0
1994 110 4,8
1995 115,1 4,6
8,410019,74
5,781001
1
t
t
I
I
103
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Probabilidades
Contenidos:Contenidos:
- Conceptos básicos de experimento aleatorio, espacio muestral, suceso, Conceptos básicos de experimento aleatorio, espacio muestral, suceso, probabilidad, etc.probabilidad, etc.
- Calculo de probabilidades: reglas básicas, Probabilidad condicionada, Calculo de probabilidades: reglas básicas, Probabilidad condicionada, regla de Bayes, Independenciaregla de Bayes, Independencia
- Concepto de variable aleatoria.Concepto de variable aleatoria.- Modelos probabilísticos para variables discretas.Modelos probabilísticos para variables discretas.- Modelos probabilísticos para variables continuas.Modelos probabilísticos para variables continuas.
104
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
EExperimentoxperimento Aleatorio (E) Aleatorio (E)
Es cualquier proceso en el cual se recoge información de un fenómeno que presenta variación en sus resultados.
Ejemplos:E1: Medir la concentración de gases contaminantes en los tubos de escape de un conjunto de vehículos.
E2: Lanzar un dado y observar el Nº sobre la cara superior.
E3: Damos una dosis de vitaminas a un niño y observamos el peso y la estatura del niño después de 12 semanas.
Espacio Muestral (EM)Espacio Muestral (EM)
Es el conjunto de todos los posibles resultados de un Experimento.
Ejemplos:
EM1: Si x=% de gases contaminantes, los posibles resultados en E1 son
EM2: Si x=Nº en la cara superior, los posibles resultados en E2 son
EM3: Si x = peso ganado, y =estatura ganada; los posibles resultados en E3 son
6 5, 4, 3, 2, 1,x / x
0y ;x- / y) (x;
100x0x /
- Experimento Aleatorio- Espacio Muestral- Evento o Suceso
PROBABILIDADPROBABILIDAD
Principales Conceptos
105
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
- Experimento Aleatorio- Espacio Muestral- Evento o Suceso
PROBABILIDADPROBABILIDAD
Principales Conceptos
Evento o SucesoEvento o SucesoSea un Experimento (E) y su Espacio Muestral (EM): “un Evento o Suceso es cualquier subconjunto del EM”. A cada uno de los resultados en el EM se le llama Evento Simple o Suceso Elemental.
del ejemplo anterior
En EM1 algunos eventos son ,
En EM2 algunos eventos son A=“Nº par”, B=“Nº impar”, C=“Nº 4”.
En EM3 algunos eventos son
donde B es un evento Simple (suceso elemental)
6 5, 4, 3, 2, 1,x / x
0y ;x- / y) (x;
100x0x / 5x0x / A 02x10x / B
0y ;03 / xy) (x; A 3) ;00(-1B
106
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
Sean A y B dos sucesos cualquiera:Sean A y B dos sucesos cualquiera:Se escribe (AB) si ocurre A o si ocurre B o ambos
Se escribe (AB) si ocurre A y BAC representa el complemento de A, cuando no ocurre A ocurre AC.
Definición 1: Si A y B son eventos, se dice que A y B son excluyentes o mutuamente excluyentes si no pueden ocurrir simultáneamente, es decir, (AB) =.
E: Lanzar un dado y observar el número en la cara superior.
EM= {1, 2, 3, 4, 5, 6}
A={4}, B=Nº impar={1, 3, 5}
(AB) = (A y B son excluyentes)
Ejemplos: E: Determinar si una persona porta o no un arma blanca.
EM= {si, no}
A={si}, B={no}
(AB) = (A y B son excluyentes)
- Experimento Aleatorio- Espacio Muestral- Evento o Suceso
PROBABILIDADPROBABILIDAD Propiedades
107
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
- Experimento Aleatorio- Espacio Muestral- Evento o Suceso
PROBABILIDADPROBABILIDAD Propiedades
Sean A y B dos sucesos cualquiera:Sean A y B dos sucesos cualquiera:Se escribe (AB) si ocurre A o si ocurre B o ambos
Se escribe (AB) si ocurre A y BAC representa el complemento de A, cuando no ocurre A ocurre AC.
Definición 2: Sea E un experimento y EM el espacio muestral, con cada suceso A se asocia un número que medirá la probabilidad de que A ocurra, donde P(A) será la probabilidad de A. Si EM={A1, A2,...,Ar} con s=1, 2,..., r.
1) 0P(Ai)1 2) P(EM)=13) Si A1,A2,...,Ar son sucesos mutuamente excluyentes, es decir (AiAj) =; la probabilidad de la
unión de todos los sucesos es:
P(A1)+ P(A2)+... +P(Ar)=
r
1ss
r
1ss )P(A)AP(AA11 AA22 AA33
AA44 AA55
EM
108
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDADPROBABILIDAD Propiedades
1.- Si es un conjunto vacío (suceso imposible) la probabilidad es cero: - P( )=0- (A ) =A P(A ) = P(A) + P()= P(A) - (A ) = , A y son sucesos excluyentes
2.- Si A un suceso cualquiera y AC un suceso complementario, EM={A,AC }: - P(A) + P(AC) =1- P(A) =1- P(AC) - P(AC) =1- P(A) - P(EM)=P(A AC)= P(A) + P(AC)
3.- Sean A y B sucesos cualquiera:- P(A B)= P(A) + P(B)- P(A B)
- Si A y B son sucesos independientes: P(A B)=P(A ) P(B) - Si A y B son sucesos excluyentes: P(A B)=
4.- Sean A y B sucesos tales que BA: P(B)P(A)
5.- Sean A, B y C sucesos cualquiera: - P(AB C)= P(A) + P(B)+ P(C)- P(AB)- P(A C)- P(B C) + P(A BC)
A AC
EM
A B
EM
A
BEM
109
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDADPROBABILIDAD
Definición 3: Sea E un experimento y EM el espacio muestral, A es el suceso de interés, entonces P(A)= (Nº de elementos de A) / (Nº de elementos en EM)
Observación: la dificultad en el calculo de la probabilidad está en determinar el Nº de elementos en el espacio muestral.
E: se lanzan 2 dados y se observan los números en las caras superiores.
EM= {(1,1) (1,2) (1,3).....(6,6)}
A= La suma de los números de las caras superiores es 4. A ={(1,3) (3,1) (2,2)}
Ejemplo:
ProblemaProblema: Determinar probabilidad de ANº de elementos en EM= 36
Nº de elementos en A= 3P(A)=3/36=0,083 (8,3%)
1 2 3 4 5 61 11 12 13 14 15 162 21 22 23 24 25 263 31 32 33 34 35 364 41 42 43 44 45 465 51 52 53 54 55 566 61 62 63 64 65 66
Ejercicio:
Experimento: lanzar una moneda; Suceso A: que salga cara; calcular P(A).
Obtener la frecuencia relativa del suceso A: cuando el experimento se repite 30 veces, 50 veces y 100 veces.
110
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
1) Una persona tiene 20 lápices en su bolso, 4 de los cuales no funcionan, si tiene que firmar una carta y saca al azar un lápiz del bolso, ¿cuál es la probabilidad de que saque un lápiz bueno?.
E: Sacar un lápiz del bolso.
EM= {L1, L2, L3, L4, L5, L6, L7, L8, L9, L10, L11, L12, L13, L14, L15, L16, L17, L18, L19, L20}
A= Sacar un lápiz bueno.
Nº de elementos en EM= 20; Nº de elementos en A= 16; P(A)=16/20= 0,8 (80%)
PROBABILIDAD PROBABILIDAD EjemplosEjemplos
2) Una bolsa de caramelos de 3 sabores (Sandía, Naranja y Limón) contiene 20 unidades de las cuales el 50% es de Limón, el 25% de Sandía y el otro 25% de Naranja.Si un niño saca al azar un caramelo:a) ¿Cuál el la probabilidad que saque uno de limón?b) ¿Cuál es la probabilidad que saque uno de sandia?c) ¿Cuál es la probabilidad que saque uno de naranja?Si el niño saca al azar dos caramelos: a) ¿Cuál es la probabilidad que los dos sean de limón?b) ¿Cuál es la probabilidad que los dos sean de naranja?c) ¿Cuál es la probabilidad que uno sea de sandía y otro de naranja?
En este ejemplo determine: Experimento, Espacio
Muestral, Suceso y probabilidad del Suceso
111
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
“ “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”
PROBABILIDAD PROBABILIDAD Técnicas de ConteoTécnicas de Conteo- Principio Multiplicativo- Permutaciones- Combinaciones
1.- PRINCIPIO MULTIPLICATIVO
- Suponemos un Experimento que consiste en k etapas o procedimientos, donde la etapa ei puede tener ni posibles resultados, i=1,...k.
- En el experimento, cada una de las formas de efectuar e1 puede ser seguida por cualquiera de los resultados de e2 y así sucesivamente por cualquiera hasta concretar la última etapa del experimento, que es ek.
- Por lo tanto el experimento puede tener (n1 x n2 x … x nk) posibles resultados.
Ejemplo:
1) Sea E= se lanza un dado 2 veces: e1= lanzar el dado por primera vez y e2= lanzar el dado por segunda vez. Los posibles resultados en cada etapa del experimento son: n1=6 y n2= 6. El número posible de resultados es: n1n2= 6 6=36.
112
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDAD PROBABILIDAD Técnicas de ConteoTécnicas de Conteo- Principio Multiplicativo- Permutaciones- Combinaciones
1.- PRINCIPIO MULTIPLICATIVO
Ejemplo
2) ¿De cuantas formas se puede vestir una persona que tiene 3 pantalones diferentes, 2 camisas distintas y 2 pares de zapatos?.
E= la persona se viste: e1= se pone pantalón, e2= se pone camisa y e3= se pone zapatos . Los posibles resultados en cada etapa del experimento son: n1=3, n2= 2 y n3= 2. El número posible de formas de vestirse es: n1n2 n3 = 3 *2* 2=12.
“ “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”
113
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDAD PROBABILIDAD Técnicas de ConteoTécnicas de Conteo- Principio Multiplicativo- Permutaciones- Combinaciones
2.- PERMUTACIONES y 3) COMBINACIONES
PERMUTACIÓN: Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.
El Nº de posibles resultados en un experimento es
COMBINACIÓN: Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.
El Nº de posibles resultados en un experimento es
donde n!=1x 2 x 3 x … x (n-1) x n por ejemplo 3!= 1x 2 x 3 = 6
)!(
!
rn
nP
)!(!
!
rnr
nC
“ “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”
114
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDAD PROBABILIDAD Técnicas de ConteoTécnicas de Conteo- Principio Multiplicativo- Permutaciones- Combinaciones
2.- PERMUTACIONES y 3) COMBINACIONES
PERMUTACIÓN: COMBINACIÓN:
Ejemplo: Se tienen 4 banderas (Roja, Amarilla, Verde Blanca) ¿Cuántas señales se pueden tener mezclando 2
banderas?
Rpta.:
E= de 4 banderas sacar dos banderas y formar señales
EM={RA, AR, RV, VR, RB, BR, AV, VA, AB, BA, VB, BV}
A= la señal tiene una bandera Roja
P(A)= 6/12=0,5
)!(
!
rn
nP
)!(!
!
rnr
nC
1221
4321
)!24(
!4
P
Ejemplo: Hay cuatro personas (Ana, Rosa, Miguel Claudia) ¿Cuántos grupos se pueden tener mezclando 2
personas?
Rpta.:
E= de 4 personas formar grupos de 2
EM={AR, AM, AC, RM, RC, MC}
A= el grupo esta formado sólo por mujeres
P(A)= 3/6=0,5
B= el grupo es mixto
P(B)=3/6=0,5
62
12
)21()21(
4321
)!24(!2
!4
C
“ “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”
115
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDAD PROBABILIDAD PROBABILIDAD CONDICIONADAPROBABILIDAD CONDICIONADA
-La idea de probabilidad condicionada permite incorporar información relevante para hallar la probabilidad de un suceso.
- La expresión de la probabilidad condicionada es la siguiente:
sabiendo que
es decir, los dos sucesos ocurren al mismo tiempo
Ejemplo: En una población de N mujeres y hombres, donde NM son mujeres y NH son hombres, se sabe que Nc
consumen cierto producto, de los cuales NcM mujeres consumen ese producto.
Experimento: se elige al azar una persona y se le pregunta si consume el producto.
A: la persona consume el producto.
Si sabemos que la persona seleccionada es mujer, la probabilidad de que consuma el producto condicionada a que es mujer se obtiene como sigue:
A: la persona consume el producto; B: la persona es mujer.
Esquemáticamente: Esquemáticamente:
N
NAP c)(
)(
)() ()/(
BP
BAP
P(B)
ByAPBAP
)() ( BAPByAP
)()/()( BPBAPBAP
EE
BBAA )(
)()/(
BP
BAP
N
NN
N
N
NBAP
M
cM
M
cM
)( BA
116
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDAD PROBABILIDAD REGLA DE BAYESREGLA DE BAYES
- En algunos casos, el espacio muestral de un Experimento se puede partir en varios sucesos, los llamaremos B1, B2, …, Br, incompatibles entre si o excluyentes (no hay intersección), tal como se presenta en el esquema:
- En ese mismo experimento existe un suceso A cualquiera de nuestro interés, representado en el siguiente esquema:
-La probabilidad del suceso A puede calcularse a partir de las probabilidades de A condicionado por los diferentes sucesos B1, B2, …, Br, utilizando la formula de probabilidad total:
-Sobre la base de la formula anterior, se puede calcular la probabilidad de que ocurra el suceso B i (i=1,2,
…,r) dado el suceso A mediante la formula:
BB11 BB22 BB33
BB44BB55
EE
BB66
BB11 BB22 BB33
BB44BB55
EE
BB66
AA
r
iii BPBAPAP
1)()/()(
)(
)( )/(
)(
) (
)(
)y ()/(
AP
BPBAP
AP
ABP
AP
ABPABP iiii
i
117
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDAD PROBABILIDAD REGLA DE BAYESREGLA DE BAYES
-La probabilidad del suceso A:
-La Prob. que ocurra el sucesoBi (i=1,2,…,r) dado el suceso A:
-EjemploEjemplo: Estudio de la situación laboral de los trabajadores en 4 sectores de la economía, denotados por B1, B2, B3 y B4. a) Interesa determinar la probabilidad que una persona este en paro y b) de que una persona que esta sin trabajo pertenezca al segundo sector
Sea el suceso A: estar sin trabajo (estar en paro)
- La probabilidad de que una persona este sin trabajo en el sector B1 es P(A/B1)=0,05
- La probabilidad de que una persona este sin trabajo en el sector B2 es P(A/B2)=0,01
- La probabilidad de que una persona este sin trabajo en el sector B3 es P(A/B3)=0,02
-La probabilidad de que una persona este sin trabajo en el sector B4 es P(A/B4)=0,1
Se sabe que la mitad de las personas pertenecen al primer sector y y el resto se divide en partes iguales entre los otros 3, por lo tanto:
- La probabilidad de que una persona proceda del sector B1 es P(B1)=0,5
- La probabilidad de que una persona proceda de los sectores B2, B3 y B4 es P(B2) = P(B3) = P(B4) = 0,16
a) La probabilidad que una persona este en paro es:
b) La probabilidad que una persona que está sin trabajo pertenezca al sector 2 (B2) es:
r
iii BPBAPAP
1)()/()(
0458,016,01,05,005,0)/()/()( 41 BAPBAPAP
03,00458,0
16,001,0
)(
)()/()/( 22
2
AP
BPBAPABP
)(
)( )/(
)(
) (
)(
)y ()/(
AP
BPBAP
AP
ABP
AP
ABPABP iiii
i
118
Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
PROBABILIDAD PROBABILIDAD INDEPENDENCIAINDEPENDENCIA- Dos sucesos son independientes cuando la aparición de uno de ellos no modifica la probabilidad de que ocurra el otro. Por lo tanto, dos sucesos A y B son independientesindependientes si:
Si A y B son independientes, entonces:
Ejemplo a: no hay independencia entre los sucesos A y B
Experimento: se lanza dos veces un dado equilibrado.
El suceso A: en el segundo lanzamiento sale un Nº par. El suceso B: La suma de los resultados es al menos 9
-Los elementos de A son {12, 22, 32, 42, 52, 62,14, 24, 34, 44, 54, 64, 16, 26, 36, 46, 56, 66}
-Los elementos de B son { 63, 36, 54, 45, 64, 46, 56, 65, 66, 55}
-Los elementos de A y B son {54, 64, 36, 46, 56, 66}
Por lo tanto: , y Por lo tanto: , y
Ejemplo b: hay independencia entre los sucesos A y B
Experimento: se lanza dos veces una moneda equilibrada donde {CC, CX, XC, XX}
El suceso A: en primer lanzamiento sale cara A={CC, CX}. El suceso B en el segundo sale cara, B={XC,CC}. Que resulte A y B es {CC}.
La P(A)=2/4=0,5 y P(B)=2/4=0,5 y P(AyB)=1/4=0,25 por lo tanto P(AyB)=P(A)xP(B)=0,5 x 0,5 = 0,25
)()/( APBAP
)()()()/()()y ( BPAPBPBAPBAPBAP
36/6)()y ( BAPBAP5,036/12)( AP 36/10)( BP
119