1 introducción a la estadística licenciatura en administración y dirección de empresas (lade)...

119
1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes. 3. Correlación y regresión. 4. Series temporales y números índice. 5. Probabilidad. 6. Variables aleatorias. 7. Modelos discretos. 8. Modelos continuos. 9. Variables aleatorias multidimensionales: la distribución normal bivariante. Programa de la asignatura Organización de la asignatura Clases teóricas y clases prácticas de ordenador. Se valorará positivamente la asistencia a las clases prácticas. Las prácticas se realizarán en aulas informáticas en horarios preestablecidos. Se utilizará el programa STATGRAPHICS. Profesora: Mónica Catalán Profesora: Mónica Catalán Reyes Reyes

Upload: cristobal-rojo-gutierrez

Post on 02-Feb-2016

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

1

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

1. Análisis de datos.2. Análisis de datos bivariantes.3. Correlación y regresión.4. Series temporales y números índice.5. Probabilidad.6. Variables aleatorias.7. Modelos discretos.8. Modelos continuos.9. Variables aleatorias multidimensionales: la distribución normal bivariante.

Programa de la asignatura

Organización de la asignaturaClases teóricas y clases prácticas de ordenador. Se valorará positivamente la asistencia a las clases prácticas. Las prácticas se realizarán en aulas informáticas en horarios preestablecidos. Se utilizará el programa STATGRAPHICS.

Profesora: Mónica Catalán ReyesProfesora: Mónica Catalán Reyes

Page 2: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

2

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Organización de las prácticas

Evaluación de la asignaturaLa evaluación de la asignatura será el examen final. Se contara positivamente la entrega de un trabajo y ejercicios, estas dos tareas sumarán como máximo 0,5 puntos a la nota del examen.

El trabajo consistirá en analizar una base de datos con dos variables cuantitativas. Realizar el análisis por separado de las variables (univariante) y el conjunto (bivariante) hasta el ajuste de un modelo de regresión.

- Análisis de datos Univariante- Análisis de datos Bivariante- Regresión- Distribuciones (generación de datos por simulación)- Series temporales.

Las prácticas de la asignatura serán realizadas con el paquete estadístico Statgraphics. En la biblioteca se puede conseguir un CD con una versión para estudiantes. El mínimo de prácticas en ordenador son 5:

Profesora: Mónica Catalán ReyesProfesora: Mónica Catalán Reyes

Page 3: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

3

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Bibliografía

Bibliografía Complementaria

- PEÑA, D. y ROMO, J.: Introducción a la Estadística para las Ciencias Sociales. McGraw Hill, New York, 1997.

- PEÑA, D.: Estadística. Modelos y Métodos, segunda edición, Alianza Universidad Textos, Madrid, 2001.

- MOORE, D. S.: The Basic Practice of Statistics, segunda edición, Freeman and Co., 2000.

- NEWBOLD, P.: Statistics for business and economics, cuarta edición, Prentice Hall, Englewood Cliffs, 1996.

Profesora: Mónica Catalán ReyesProfesora: Mónica Catalán Reyes

Page 4: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

4

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

IntroducciónEl objetivo del curso es la Introducción a los conceptos fundamentales del Análisis de Datos y de la Probabilidad.

¿Qué es la estadística?Es una poderosa herramienta para generar conocimiento que ha experimentado un gran desarrollo a lo largo del tiempo.

¿En qué áreas se aplica la estadística?Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras.

Ejemplos de su aplicación son:

1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo.

2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.

Page 5: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

5

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Introducción

Ejemplos de su aplicación son:

3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos.

4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad.

5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa).

6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población.

En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas.

Page 6: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

6

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

IntroducciónEtapas de un estudio estadístico

Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son:

1) Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población.

2) Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación.

3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio.

4) Inferencia estadística: consiste en suponer un modelo para la población e interpretación de los datos a la luz del modelo para obtener conclusiones generales.

5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población

Page 7: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

7

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007Introducción

Esquema de las etapas de un estudio estadístico

AREA DE INTERES DATOSDATOS

Tema de InvestigaciónTema de Investigación

-Antecedentes Previos Antecedentes Previos

-ObjetivosObjetivos

-Preguntas de InvestigaciónPreguntas de Investigación

-Posibles HipótesisPosibles Hipótesis

-Unidad de AnálisisUnidad de Análisis

-PoblaciónPoblación

-VariablesVariables

ORGANIZAR Y RESUMIRORGANIZAR Y RESUMIR

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.)

INTERPRETACIÓN

INFERENCIA ESTADÍSTICAINFERENCIA ESTADÍSTICA

¿Población o Muestra?¿Población o Muestra?

CONCLUSIONES

Población Población

MuestraMuestra

ProbabilidadProbabilidadINFORMACIÓN

Page 8: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

8

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007Introducción

Ejemplos de algunos problemas a estudiar

1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada.

2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades.

3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda.

4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.

5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país.

6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.

7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.

Page 9: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

9

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007Introducción

1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada.

2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades.

3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda.

4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.

5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país.

6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.

7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.

Ejemplos de algunos problemas a estudiar

Page 10: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

10

Mónica Catalán Reyes-2007Mónica Catalán Reyes-2007

• VARIABLE: VARIABLE: es lo que se va a medir y representa una característica de la es lo que se va a medir y representa una característica de la UNIDAD DE UNIDAD DE ANÁLISISANÁLISIS..

• ¿QUIÉNES VAN A SER MEDIDOS?: ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Los sujetos u objetos o Unidades de Análisis de una Población o una MuestraPoblación o una Muestra• POBLACIÓN :POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. Es el total de unidades de análisis que son tema de estudio.

Muestra: 60 trabajadores de empresas de comunicación

Unidad de análisis: Trabajador de empresa de comunicación

Variables: sexo, edad, salario, Nº de horas de trabajo, etc.

Población: Población:

““Las personas que Las personas que

trabajantrabajan en empresas de en empresas de

comunicacióncomunicación” ”

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

• MUESTRA: MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.Es un conjunto de unidades de análisis provenientes de una población.

MuestraMuestra

Resumen de algunos conceptos planteados en la Introducción

Page 11: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

11

Problema de Problema de InvestigaciónInvestigación

- Antecedentes Previos Antecedentes Previos

- ObjetivoObjetivo

- Preguntas de Preguntas de InvestigaciónInvestigación

- Posibles HipótesisPosibles Hipótesis

- Unidad de AnálisisUnidad de Análisis

- Población Población

- VariablesVariables

Herramientas Herramientas EstadísticasEstadísticas

Respuesta al Respuesta al problema de problema de investigacióinvestigació

nn

INFORMACIÓNINFORMACIÓN

Mónica Catalán Reyes-2007Mónica Catalán Reyes-2007

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007Resumen de algunos conceptos planteados en la Introducción

Page 12: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

12

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007ACTIVIDAD 1

Formulario para el registro de datos de los alumnos de LADE-2007 1) Registro Nº 2) Hombre Mujer 3) Edad 4) Número de hermanos(as): 5) ¿Vive con sus padres?: Si No 6) ¿En que comunidad autónoma nació?: 7) ¿Paga alquiler?: Si No 8) ¿Cuánto paga de alquiler al mes?: 9) ¿En que Sector vive actualmente?: 10) ¿Que medio de transporte utiliza generalmente para venir a la Universidad? 11) ¿Desayuna de lunes a viernes?: Siempre Casi Siempre A veces Nunca 12) ¿Fuma?: Si No 13) ¿Cuántos cigarrillos fuma al día?: 14) ¿Tiene teléfono móvil?: Si No 15) ¿Cuanto gasta en teléfono móvil mensualmente?:

Observación: por favor responda a cada una de las preguntas

Vamos a trabajar en los siguientes problemas de investigación: 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad; y 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.

Definir: Población bajo estudio, unidad de análisis, variables de interés.

Page 13: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

13

Mónica Catalán Reyes-2004Mónica Catalán Reyes-2004

MUESTRAMUESTRA La muestra se genera a La muestra se genera a través de algún tipo de través de algún tipo de

muestreomuestreo

PROBABILISTICOPROBABILISTICO NO PROBABILISTICONO PROBABILISTICO

El total de elementos de la población serán El total de elementos de la población serán NN y los de la muestra y los de la muestra nn

- - Todas las unidades de la población tienen Todas las unidades de la población tienen alguna probabilidad de ser seleccionadas.alguna probabilidad de ser seleccionadas.

- Para obtener la muestra se requiere tener - Para obtener la muestra se requiere tener identificados los elementos de la población.identificados los elementos de la población.

-  Los elementos de la población se identifican a -  Los elementos de la población se identifican a través de un listado de elementos, denominado través de un listado de elementos, denominado marco muestralmarco muestral..

-- Para obtener una muestra se requiere de datos Para obtener una muestra se requiere de datos previos acerca de la población.previos acerca de la población.

- Una de sus ventajas es que puede medirse el - Una de sus ventajas es que puede medirse el tamaño del error en las predicciones.tamaño del error en las predicciones.

Muestreo aleatorio simpleMuestreo aleatorio simple

Muestreo sistemáticoMuestreo sistemático

Muestreo estratificadoMuestreo estratificado

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 14: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

14

MUESTRAMUESTRA La muestra se genera a La muestra se genera a través de algún tipo de través de algún tipo de

muestreomuestreo

PROBABILISTICOPROBABILISTICO NO PROBABILISTICONO PROBABILISTICO

El total de elementos de la población serán El total de elementos de la población serán NN y los de la muestra y los de la muestra nn

- - Este tipo de muestra también se denomina muestra dirigida.Este tipo de muestra también se denomina muestra dirigida.

- Suponen un procedimiento de selección informal y un poco Suponen un procedimiento de selección informal y un poco arbitrario.arbitrario.

- La elección de los elementos no depende de la probabilidad, sino de La elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador.causas relacionadas con las características del investigador.

- Son utilizadas en algunas investigaciones y a partir de ellas se hacen Son utilizadas en algunas investigaciones y a partir de ellas se hacen inferencias hacia la población.inferencias hacia la población.

-La muestra dirigida selecciona sujetos típicos, con la esperanza de La muestra dirigida selecciona sujetos típicos, con la esperanza de que serán casos representativos de una población determinada. que serán casos representativos de una población determinada.

Muestra de sujetos voluntariosMuestra de sujetos voluntarios

Muestra de expertosMuestra de expertos

Muestra de sujetos-tipoMuestra de sujetos-tipo

Muestra por cuotasMuestra por cuotas

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 15: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

15

TIPOS DE VARIABLESTIPOS DE VARIABLESVariables CuantitativasVariables Cuantitativas

VariableVariable: : corresponde a la característica de la Unidad de Análisiscorresponde a la característica de la Unidad de Análisis

Tipos de escalaTipos de escala IntervaloIntervalo o o RazónRazón

DISCRETADISCRETA

Variables Variables CualitativasCualitativas

CONTINUACONTINUA

Toma valores enteros Toma valores enteros

EjemplosEjemplos: : Número de HijosNúmero de Hijos, , Número de Número de empleados de una empresaempleados de una empresa, , Número de Número de

asignaturas aprobadas en un semestreasignaturas aprobadas en un semestre , etc., etc.

Toma cualquier valor dentro de un intervalo Toma cualquier valor dentro de un intervalo

EjemplosEjemplos: : Peso (escala de Razón); Estatura (escala de Peso (escala de Razón); Estatura (escala de Razón); Temperatura (Escala de Intervalo), etc.Razón); Temperatura (Escala de Intervalo), etc.

Escala de RazónEscala de Razón: Tiene un cero absoluto, el cambio de unidad de medida no : Tiene un cero absoluto, el cambio de unidad de medida no afecta la descripción de la variable. afecta la descripción de la variable. Escala IntervaloEscala Intervalo:: Tiene un cero arbitrario y Tiene un cero arbitrario y

al cambiar de unidad de medida cambia la descripción de la variable.al cambiar de unidad de medida cambia la descripción de la variable.

Unidad de MedidaUnidad de Medida: : GramosGramos o o KilosKilos para la variable Peso; Grados para la variable Peso; Grados CC o o F F para Temperatura para Temperatura

ORDINALORDINALNOMINALNOMINAL

Característica o cualidad Característica o cualidad cuyas categorías no tienen cuyas categorías no tienen un orden preestablecido. un orden preestablecido.

EjemplosEjemplos: : Sexo, Deporte Sexo, Deporte FavoritoFavorito, etc., etc.

Característica o cualidad cuyas Característica o cualidad cuyas categorías tienen un orden categorías tienen un orden

preestablecido. preestablecido.

EjemplosEjemplos: Calificación (S, N, A); : Calificación (S, N, A); Grado de Interés por un tema, etc.Grado de Interés por un tema, etc.

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 16: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

16

FrecuenciaFrecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se : desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica.presenta una característica.

DISCRETADISCRETA

CONTINUACONTINUA

ORDINALORDINAL

NOMINALNOMINAL

TIPO FRECUENCIATIPO FRECUENCIAFrecuencia AbsolutaFrecuencia Absoluta

(F)(F)Frecuencia RelativaFrecuencia Relativa

(f)(f)

Frecuencia Absoluta Frecuencia Absoluta Acumulada (FAA)Acumulada (FAA)

Frecuencia Relativa Frecuencia Relativa Acumulada (fra)Acumulada (fra)

DISCRETADISCRETA

CONTINUACONTINUANOMINALNOMINAL

ORDINALORDINAL

Variable Variable CuantitativaCuantitativa

Variable Variable CualitativaCualitativa

Variable Variable CuantitativaCuantitativa

Variable Variable CualitativaCualitativa

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 17: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

17

VariablesVariables- Tipo de Industria- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (: se clasifica en industria tipo A, B, C o D. (cualitativa nominalcualitativa nominal))- - Nº de EmpleadosNº de Empleados: se refiere al número de empleados en las líneas de producción. (: se refiere al número de empleados en las líneas de producción. (cuantitativa cuantitativa

discretadiscreta))- - SuperficieSuperficie: se refiere a los : se refiere a los metros cuadradosmetros cuadrados ( (unidad de medidaunidad de medida) disponibles para las áreas de ) disponibles para las áreas de

producción. (producción. (cuantitativa continuacuantitativa continua))- - CalificaciónCalificación: calificación realizada por una institución pública sobre cumplimiento de ciertos : calificación realizada por una institución pública sobre cumplimiento de ciertos

estándares (Muy Bien, Bien, Regular, Mal). (estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinalcualitativa ordinal))

Industria nº Tipo Nº Empleados Superficie Calificación

1 A 100 1000,6 Muy Bien

2 B 150 1200,4 Bien

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

299 D 250 800,3 Mal

300 C 300 4000,2 Regular

Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. de conserva en función de algunas características.

Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva

PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país

DatosDatos

EJEMPLOEJEMPLO

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 18: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

18

EJEMPLOEJEMPLO

TABLAS DE TABLAS DE FRECUENCIAFRECUENCIA

Tipo deIndustria

FrecuenciaAbsoluta (Fj)

FrecuenciaRelativa (fj)

Porcentaje(%)

A

B

C

D

Total 300 1 100

CalificaciónFrec.

Absoluta (Fj)Frec.Relativa

(fj) o %Frec. Absol.

Acum. (FAAj)Frec. Relat.

Acum. (fraj) o %

Muy Bien

Bien

Regular

Mal 300 1 (o 100)

Total 300 1 (o 100)

Numero deEmpleados

Frec.Absoluta (Fj)

Frec.Relativa(fj) o %

Frec. Absol.Acum. (FAAj)

Frec. Relat.Acum. (fraj) o %

<100

[100-150[

.

.

[950-1000] 300 1 (o 100%)

Total 300 1 (o 100%)Superficie

(mt2)Frec.

Absoluta (Fj)Frec.Relativa

(fj) o %Frec. Absol.

Acum. (FAAj)Frec. Relat.

Acum. (fraj) o %

<200

[200-400[

.

.

[50000-5200] 300 1 (o 100%)

Total 300 1 (o 100%)

(1)(1)(2)(2)

(3)(3)

(4)(4)

Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias de conserva en : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. función de algunas características.

Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva

PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 19: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

19

EJEMPLOEJEMPLO

Elementos que Elementos que observamos en las observamos en las

TABLASTABLAS

1) Titulo General1) Titulo General

2) Titulo por columna/fila2) Titulo por columna/fila

4) Fuente4) Fuente

3) Frecuencias3) Frecuencias

desde tabla de frecuencias desde tabla de frecuencias (1)(1)

Auto-explicativaAuto-explicativa

Tipo deIndustria

Nº Proporción Porcentaje

A 30 0,10 10 %

B

C

D

Total 300 1 100 %

Tabla 1: Distribución de las Industrias de Conservas Tabla 1: Distribución de las Industrias de Conservas de acuerdo a Tipo de Industriade acuerdo a Tipo de Industria

Fuente: Informe 2006, Ministerio de Industria y EnergíaFuente: Informe 2006, Ministerio de Industria y Energía

Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias de conserva : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. en función de algunas características.

Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva

PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 20: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

20

1) Determinar el número de clases o intervalos (k) 1) Determinar el número de clases o intervalos (k) (C(C11, C, C22, ..., C, ..., Ckk): ):

- Total de unidades de análisis (n)

- Regla de Sturges: k =1 + 3,3 logn

2) Determinar amplitud del intervalo2) Determinar amplitud del intervalo- Valor mínimo que toma la variable en el grupo, min(xi) i=1, 2,...,n.

- Valor máximo que toma la variable en el grupo, max(xi) i=1, 2,...,n.

- Rango= max(xi)-min(xi) = R

- Amplitud =(R+1)/k = a

3) Construir los intervalos3) Construir los intervalos: Límite inferior y Limite superior de cada intervalo: Límite inferior y Limite superior de cada intervalo

- LIj =Límite inferior de la clase j, j=1, 2,...,k

- LSj =Límite superior de la clase j, j=1, 2,...,k

- LI1 = min(xi)-(1/2)

- LS1 = LI1 + a

- LI2 = LS1

- LS2 = LI2+ a

-.....

Pregunta: ¿Cómo se construye una tabla cuando la variable es Pregunta: ¿Cómo se construye una tabla cuando la variable es Cuantitativa (x)?Cuantitativa (x)?

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 21: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

21

Elementos de una tabla de frecuencia cuando la variable es continua (x)Elementos de una tabla de frecuencia cuando la variable es continua (x)

Respuesta: Confeccionar la tabla aplicando el procedimiento anteriorRespuesta: Confeccionar la tabla aplicando el procedimiento anterior

Intervalo Centro de clase Amplitud F f FAA fra

I1 c1 a1

I2 c2 a2 . .

Ik ck ak n 1

Total n 1

[LI1 ; LS1 [

[LI2 ; LS2 [

[LIk ; LSk]

aj = (LSj – LIj))cj = (LIj) + LSj )/2

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 22: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

22

Mónica Catalán Reyes-2004Mónica Catalán Reyes-2004

Ejercicio: confección de una tabla de frecuencia para una variable Ejercicio: confección de una tabla de frecuencia para una variable continuacontinua

10,5 10,7 9,5 10,5 11,8 11,2

12,0 10,3 13,5 12,3 10,6 9,8

10,7 11,5 11,1 10,6 9,3 12,9

10,4 7,5 10,2 8,7 10,9 9,9

11,7 10,3 10,6 10,5 11,9 11,0

13,9 10,6 10,0 10,8 10,6 -

7,3 8,0 8,5 12,5 9,7 -

Los datos corresponden a la edad de Los datos corresponden a la edad de los hijos de los trabajadores de una los hijos de los trabajadores de una

empresa empresa

7,3 9,7 10,4 10,6 11,1 12,3

7,5 9,8 10,5 10,6 11,2 12,5

8,0 9,9 10,5 10,7 11,5 12,9

8,5 10,0 10,5 10,7 11,7 13,5

8,7 10,2 10,6 10,8 11,8 13,9

9,3 10,3 10,6 10,9 11,9 -

9,5 10,3 10,6 11,0 12,0 -

Datos ordenados de menor a mayorDatos ordenados de menor a mayor

1)1) Construya un Diagrama de Tallo y HojaConstruya un Diagrama de Tallo y Hoja

2)2) ¿Cuál es la variable?; ¿Cuál es la Unidad de ¿Cuál es la variable?; ¿Cuál es la Unidad de análisis?; ¿Cuánto vale n?; ¿Cuál es el rango análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la variable?. de la variable?.

3)3) Sobre una Tabla de frecuenciaSobre una Tabla de frecuencia: ¿Cuántos : ¿Cuántos intervalos podría construir?; ¿Cuál es la intervalos podría construir?; ¿Cuál es la amplitud de cada intervalo?; ¿Cuántas amplitud de cada intervalo?; ¿Cuántas medidas de frecuencia puede obtener para medidas de frecuencia puede obtener para cada intervalo?.cada intervalo?.

4)4) Construir tabla de frecuenciaConstruir tabla de frecuencia para la para la variablevariable: Intervalos, centro de clase, : Intervalos, centro de clase, amplitud, frecuencias.amplitud, frecuencias.

Realice la siguiente actividadRealice la siguiente actividad

Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos.

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 23: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

23

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

1. Gráfico de Sectores Circulares (de 1. Gráfico de Sectores Circulares (de Torta)Torta)

Distribución de las unidades de análisis de acuerdo a variable 1

A20%

D10%

C40%

B30%

Distribución de las unidades de análisis de acuerdo a variable 1

B30%

C40%

D10% A

20%

Distribución de las unidades de análisis de acuerdo a variable 1

B30%

C40%

D10%

A20%

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 24: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

24

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

2. Gráfico de Barras2. Gráfico de Barras

Numero de unidades de análisis de acuerdo a variable 1

0

100

200

300

400

500

A B C D

variable 1

Porcentaje de unidad de análisis de acuerdo a variable 1

0 20 40 60 80 100

A

B

C

D

varia

ble

1

% unidad de análisis

-Este tipo de gráfico se utiliza generalmente para Este tipo de gráfico se utiliza generalmente para representar la frecuenciarepresentar la frecuencia de las categorías de una de las categorías de una variable cualitativavariable cualitativa. .

-Cuando una variable es cuantitativa se puede utilizar Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha este tipo de gráfico sólo si la variable se ha transformada en categorías.transformada en categorías.

-Hay distintas versiones de estos gráficos (por ejemplo Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos describir el comportamiento de una variable en distintos grupos.grupos.

Proporción de unidad de análisis de acuerdo a variable 1

0 0,2 0,4 0,6 0,8 1

A

B

C

D

varia

ble

1

Proporción de unidad de análisis

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 25: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

25

HistogramaHistograma

- Permite la representación de - Permite la representación de la la frecuenciafrecuencia de una de una variable variable CuantitativaCuantitativa..

- El El ejeeje xx se refiere a la se refiere a la variable.variable.

- El El ejeeje yy se refiere a la se refiere a la frecuencia (Nº , %).frecuencia (Nº , %).

- Cada Cada barrabarra representa la representa la frecuencia de la variable en la frecuencia de la variable en la población en estudio (o la población en estudio (o la muestra). muestra).

-El histograma se puede El histograma se puede construir desde los datos de la construir desde los datos de la tabla de frecuencia de la tabla de frecuencia de la variable en estudio.variable en estudio.

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

3. Histograma3. Histograma

1413121110987

15

10

5

0

edad

Fre

cuen

cia

edadedad

HistogramaHistograma

Distribución de los hijos de trabajadores Distribución de los hijos de trabajadores de la empresa de acuerdo a edadde la empresa de acuerdo a edad

EjemploEjemplo

En el gráfico se puede observar el En el gráfico se puede observar el número de número de hijoshijos de menor edad (7-8 años), las de mayor de menor edad (7-8 años), las de mayor

edad (13-14 años); y además que la mayoría de edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 hijos de los trabajadores están entre los 10 y 12

años.años.

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 26: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

26

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

5. Polígono de Frecuencia5. Polígono de Frecuencia

edadedad

1413121110987

15

10

5

0

edad

Fre

cuen

cia

Distribución de los hijos de trabajadores Distribución de los hijos de trabajadores

de la empresade la empresa de acuerdo a edadde acuerdo a edad -Esta representación se basa en Esta representación se basa en el Histograma.el Histograma.

-Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..

-El El eje xeje x se refiere a la se refiere a la variable.variable.

- El El ejeeje yy se refiere a la se refiere a la frecuencia (Nº , %). frecuencia (Nº , %).

-Los puntos que permiten la Los puntos que permiten la unión de las líneas representa unión de las líneas representa el el centro de clase centro de clase (o marca de (o marca de clase)clase)..

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 27: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

27

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

5. Diagrama de Caja5. Diagrama de Caja

- Permite identificar gráficamente la Permite identificar gráficamente la media, los percentiles 25 y 75, media, los percentiles 25 y 75, mínimo y máximo de una variable. mínimo y máximo de una variable.

- Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..

-El El eje xeje x permite identificar la permite identificar la poblacion en estudio.poblacion en estudio.

- El El ejeeje yy representa los valores de la representa los valores de la variable en estudio. variable en estudio.

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

1473584N =

HombresMujeres

Eda

d

100

90

80

70

60

50

40

30

20

10

0

Edad de las personas que se realizaron Edad de las personas que se realizaron angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000

Page 28: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

28

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

5. Diagrama de Caja5. Diagrama de Caja

- Permite identificar gráficamente la Permite identificar gráficamente la mediamedia, los , los percentiles 25 y 75percentiles 25 y 75, , mínimomínimo y y máximomáximo de una variable. de una variable.

- Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..

-El El eje xeje x permite identificar la permite identificar la poblacion en estudio.poblacion en estudio.

- El El ejeeje yy representa los valores de la representa los valores de la variable en estudio. variable en estudio.

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

1473584N =

HombresMujeres

Eda

d

100

90

80

70

60

50

40

30

20

10

0

Edad de las personas que se realizaron Edad de las personas que se realizaron angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000

mediamedia

Percentiles 75Percentiles 75

máximomáximo

Percentil 25Percentil 25

mínimo mínimo

mediamedia

Page 29: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

29

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

5. Diagrama de Caja5. Diagrama de Caja

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

1473584N =

HombresMujeres

Eda

d

100

90

80

70

60

50

40

30

20

10

0

Edad de las personas que se realizaron Edad de las personas que se realizaron angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000

mediamedia

Percentiles 75Percentiles 75

máximomáximo

Percentil 25Percentil 25

mínimo mínimo

mediamedia

 Medidas Descriptivas Mujeres Hombres

N 584 1473

Media (o promedio) 63,3 59,2

Varianza 109,6 111,9

Desv.Típica (o Desv. Estándar) 10,5 10,6

Coeficiente Variación 0,2 0,2

Mínimo 25 23

Percentil 25 57 52

mediana 64 59

Percentil 75 70 67

Máximo 93 92

Moda 66 56

Page 30: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

30

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

6. Otros6. Otros

Número de alumnos matriculados en la Carrera A según año de ingreso

0

2040

6080

100

1998 1999 2000 2001 2002 2003

año de ingreso

de

alu

mn

os

Número de alumnos matriculados en la Carrera B según año de ingreso

020406080

100

1998 1999 2000 2001 2002 2003

año de ingreso

de

alu

mn

os

Número de alumnos matriculados en las Carreras según año de ingreso

0

50

100

150

200

1998 1999 2000 2001 2002 2003

año ingreso

de

alu

mno

s

Carrera B

Carrera A

año de ingreso Carrera A Carrera B1998 60 801999 55 702000 80 502001 40 602002 68 502003 70 75

Nº de alumnos

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 31: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

31

OBSERVACIONESOBSERVACIONES

* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.

* El Gráfico debe contener un Título General y la identificación de cada eje * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia).(variable en estudio y frecuencia).

* En ocasiones resulta más ilustrativo un gráfico que una tabla de * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia.frecuencia.

* Al igual que las tablas, los gráficos deben ser auto-explicativos.* Al igual que las tablas, los gráficos deben ser auto-explicativos.

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 32: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

32

OBSERVACIONESOBSERVACIONES

* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.

* El Gráfico debe contener un Título General y la identificación de cada eje * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia).(variable en estudio y frecuencia).

* En ocasiones resulta más ilustrativo un gráfico que una tabla de * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia.frecuencia.

* Al igual que las tablas, los gráficos deben ser auto-explicativos.* Al igual que las tablas, los gráficos deben ser auto-explicativos.

Variables Cuantitativas

variablex i individuo elen variablela devalor ixni ,...,1

nccccn

i

1

n

iin

n

ii xccxcxcx

11

1

bxabaxbaxbaxn

iin

n

ii

11

1

)()()(

221

1

2n

n

ii xxx

21

2

1

)()( n

n

ii xxx

)()()( 111

nn

n

iii yxyxyx

)()()( 111

nn

n

iii yxyxyx

variabley i individuo elen variablela devalor iy

NOTACIONNOTACION

constantes:,, cba

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 33: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

33

MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL

-Media Aritmética (Promedio)Media Aritmética (Promedio)

-MedianaMediana

-ModaModa

n

xx

n

ii

1

Media Aritmética o PromedioMedia Aritmética o Promedio

MedianaMediana

)(EM kx

2M )1()(

E

kk xx

x

1x

2x

nx

Datos CuantitativosDatos Cuantitativos

x

)1(x

)2(x

)(nx

Datos Cuantitativos ordenados de menor a mayorDatos Cuantitativos ordenados de menor a mayor

Si Si nn es par es par

Si Si n n es impares impar

centro del dato)( kx

repite" se más que dato el"M o ModaModaDatos Datos

Cualitativos y CuantitativosCualitativos y Cuantitativos

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 34: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

34

Percentiles, Deciles o CuartilesPercentiles, Deciles o Cuartiles

-Percentil (ejemplo: 25, 50, 75)Percentil (ejemplo: 25, 50, 75)

-Decil (ejemplo: 4, 5, 8)Decil (ejemplo: 4, 5, 8)

-Cualtil (ejemplo: 1, 2, 3)Cualtil (ejemplo: 1, 2, 3)

El Decil va de 1 a 10El Decil va de 1 a 10

El Decil 4 (4/10)El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos: es el valor de la variable que reúne al menos el 40% de los datos

Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.

Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando losPercentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los nn datos están ordenados de datos están ordenados de MenorMenor a a MayorMayor

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

El Percentil va de 1 a 100El Percentil va de 1 a 100

El percentil 25 (25/100)El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos: es el valor de la variable que reúne al menos el 25% de los datos

Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.

Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.

El Cuartil va de 1 a 4El Cuartil va de 1 a 4

El Cuartil 3 (3/4)El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos: es el valor de la variable que reúne al menos el 75% de los datos

Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.

Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.

Page 35: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

35

MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN

-RangoRango

-VarianzaVarianza

-Desviación EstándarDesviación Estándar

RangoRango

VarianzaVarianzax

1x

2x

nx

Datos CuantitativosDatos Cuantitativos

Coeficiente de VariaciónCoeficiente de VariaciónComparación entre VariablesComparación entre Variables

Se refiere al comportamiento de las variables cuantitativas en Se refiere al comportamiento de las variables cuantitativas en un grupo. un grupo. Por ejemplo: Si se tiene un conjunto de personas a las Por ejemplo: Si se tiene un conjunto de personas a las que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál

presenta mayor variación? presenta mayor variación?

)min()max( ii xxR

Desviación EstándarDesviación Estándar

)1(

)(1

)1(

)(1 1

22

1

2

2

n

xn

x

n

xxs

n

i

n

iii

n

ii

2ss

x

scv

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 36: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

36

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría

-Kurtosis o ApuntamientoKurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis.

Coeficiente de Asimetría 3

1

3)(

sn

xx

CA

n

ii

Si CA=0 si la distribución es simétrica alrededor de la media.Si CA<0 si la distribución es asimétrica a la izquierdaSi CA>0 si la distribución es asimétrica a la derecha

Coeficiente de Apuntamiento 4

1

4)(

sn

xx

CAp

n

ii

- Si CAp=3 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.- Si CAp>3, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media).- Si CAp<3 la distribución es más plana y se llama platicúrtica.

Page 37: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

37

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría

-Kurtosis o ApuntamientoKurtosis o Apuntamiento

Ejemplos

V2

7,06,05,04,03,02,01,0

14

12

10

8

6

4

2

0

Desv. típ. = 1,67

Media = 3,9

N = 30,00

V4

2,01,00,0-1,0

30

20

10

0

Desv. típ. = ,64

Media = 0,0

N = 30,00

V5

9,08,07,06,05,04,03,02,01,0

6

5

4

3

2

1

0

Desv. típ. = 2,42

Media = 5,2

N = 28,00

Page 38: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

38

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría

-Kurtosis o ApuntamientoKurtosis o Apuntamiento

Ejemplos

Media 3,9

Error típico 0,30

Mediana 4

Moda 4

Desviación estándar 1,67

Varianza de la muestra 2,78

kurtosis -0,43

Coeficiente de asimetría -0,02

Rango 6

Mínimo 1

Máximo 7

Cuenta 30V1

9,08,07,06,05,04,03,02,01,0

16

14

12

10

8

6

4

2

0

Desv. típ. = 1,77

Media = 5,4

N = 66,00

1 4 4

1 4 4

1 4 5

2 4 5

2 4 6

2 4 6

2 4 6

3 4 6

3 4 7

4 4 7

Datos Histograma Medidas descriptivas

Page 39: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

39

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Rango IntercuatilicoRango Intercuatilico (RI): es la diferencia entre el tercer y el primer cuartil RI=C (RI): es la diferencia entre el tercer y el primer cuartil RI=C33-C-C11

Del ejemplo anterior se tiene que QDel ejemplo anterior se tiene que Q11=C=C11=3 y Q=3 y Q33=C=C33=5 por lo tanto RI= 5-3=2 =5 por lo tanto RI= 5-3=2

Comparación de la Media y la Mediana: Robustez

•Los datos atípicos son datos extremos o lejanos de la mayoría de las observaciones.

•La media y la mediana tienen un comportamiento diferente frente a los datos atípicos

•La media en su calculo considera todos los datos, incluyendo los datos atípicos.

•La mediana es una medida que se ve poco afectada por los datos atípicos, no los considera en su calculo dado que separa los datos.

• Sobre la base de lo anterior, la mediana es una medida robusta en comparación con la media.

Page 40: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

40

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias)para datos Agrupados (tabla de frecuencias)

Intervalo Centro de clase Amplitud F f FAA fra

I1 c1 a1

I2 c2 a2 . .

Ik ck ak n 1

Total n 1

f1

f2

fk

n1

n2

nk

Tabla de frecuencia (para variable cuantitativa)Tabla de frecuencia (para variable cuantitativa)

1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma:

k

jjjcc fcxMedia

1

Sea cj la marca de clase (o centro de clase) y fj la frecuencia relativa de la clase j, donde j=1, 2,…, k.

2) La La Desviación típicaDesviación típica para datos para datos agrupados esta dada por:agrupados esta dada por:

k

jjcjc fxcs

1

2)(

3) El El Coeficiente de AsimetríaCoeficiente de Asimetría para para datos agrupados esta dado por:datos agrupados esta dado por:

3

1

3)(

c

k

jjcj

cs

fxc

CA

4) El El Coeficiente de apuntamientoCoeficiente de apuntamiento para para datos agrupados esta dada por:datos agrupados esta dada por:

4

1

4)(

c

k

jjcj

cs

fxc

CAp

Page 41: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

41

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias)para datos Agrupados (tabla de frecuencias)

Intervalo Centro de clase Amplitud F f FAA fra

I1 c1 a1

I2 c2 a2 . .

Ik ck ak n 1

Total n 1

f1

f2

fk

n1

n2

nk

Tabla de frecuencia (para variable cuantitativa)Tabla de frecuencia (para variable cuantitativa)

5) La Mediana para datos agrupados es igual a la clase o intervalo que concentra al menos el 50% de los datos. Para esto se observan las frecuencias relativas acumuladas

Sea cj la marca de clase (o centro de clase), fj la frecuencia relativa de la clase j, donde j=1, 2,…, k.

Sea Faj la frecuencia absoluta acumulada de la clase j y faj la frecuencia relativa acumulada de la clase j, donde j=1, 2,…, k.

fa1

fa2

FA1

FA2

6) El cuartil 1 (Q1 o C1) para datos agrupados es igual a la clase o intervalo que concentra al menos el 25% de los datos. Observar las frecuencias relativas acumuladas.

6) El cuartil 3 (Q3 o C3) para datos agrupados es igual a la clase o intervalo que concentra al menos el 75% de los datos. Observar las frecuencias relativas acumuladas.

Se pueden obtener percentiles y deciles

Page 42: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

42

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas

Distribución conjuntaDistribución conjunta

Tabla 1   Actividad  

Transporte Estudia Pensionado Trabaja

Autobus 5 7 0

Bicicleta 3 3 2

Caminar 2 5 2

Coche 5 4 5

Metro 6 7 4

Transporte Nº %

Autobus 12 20,0

Bicicleta 8 13,3

Caminar 9 15,0

Coche 14 23,3

Metro 17 28,3

TOTAL 60 100

Actividad Nº %

Estudia 21 35,0

Pensionado 26 43,3

Trabaja 13 21,7

TOTAL 60 100

ProblemaInteresa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial.

Para esto se consultó a cada Para esto se consultó a cada persona sobre la actividad a persona sobre la actividad a la que se dedicaba y el medio la que se dedicaba y el medio de transporte preferido.de transporte preferido.

Page 43: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

43

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas

Distribución conjuntaDistribución conjunta

Nº de personasNº de personas

Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

Tabla 2   Actividad    

Transporte Estudia Pensionado Trabaja TOTAL

Autobus 5 7 0 12

Bicicleta 3 3 2 8

Caminar 2 5 2 9

Coche 5 4 5 14

Metro 6 7 4 17

TOTAL 21 26 13 60

Page 44: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

44

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas

Distribución conjuntaDistribución conjunta

Nº de personas y % respecto de tipo de Transporte Nº de personas y % respecto de tipo de Transporte

Tabla 3   Actividad    

Transporte Estudia Pensionado Trabaja TOTAL

Autobus 5 7 0 12

% 41,7 58,3 0 100

Bicicleta 3 3 2 8

% 37,5 37,5 25 100

Caminar 2 5 2 9

% 22,2 55,6 22,2 100

Coche 5 4 5 14

% 35,7 28,6 35,7 100

Metro 6 7 4 17

% 35,3 41,2 23,5 100

TOTAL 21 26 13 60

% 35 43,3 21,7 100

Page 45: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

45

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas

Distribución conjuntaDistribución conjunta

Nº de personas y % respecto de tipo de ActividadNº de personas y % respecto de tipo de Actividad

Tabla 4   Actividad    

Transporte Estudia Pensionado Trabaja TOTAL

Autobus 5 7 0 12

% 23,8 26,9 0 20

Bicicleta 3 3 2 8

% 14,3 11,5 15,4 13,3

Caminar 2 5 2 9

% 9,5 19,2 15,4 15

Coche 5 4 5 14

% 23,8 15,4 38,5 23,3

Metro 6 7 4 17

% 28,6 26,9 30,8 28,3

TOTAL 21 26 13 60

% 100 100 100 100

Page 46: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

46

Resumen: análisis de frecuencia de 2 variables cualitativasResumen: análisis de frecuencia de 2 variables cualitativas

• Si tenemos dos variables cualitativas podemos construir una tabla de doble entrada con las Si tenemos dos variables cualitativas podemos construir una tabla de doble entrada con las frecuencias absolutasfrecuencias absolutas F Fijij, , dondedonde i=1, 2,…, m i=1, 2,…, m yy j=1, 2,…, k. j=1, 2,…, k.

• La La frecuencia relativafrecuencia relativa conjunta se obtiene dividiendo cada conjunta se obtiene dividiendo cada F Fij ij por n y se escribepor n y se escribe f fijij..

• La La distribución marginaldistribución marginal de la 1ª variable se obtiene calculando de la 1ª variable se obtiene calculando

i=1,2,…,mi=1,2,…,m

• La La distribución marginaldistribución marginal de la 2ª variable se obtiene calculando de la 2ª variable se obtiene calculando

j=1,2,…,kj=1,2,…,k

•La La distribución condicionadadistribución condicionada se refiere a estudiar la distribución de una variable dado un nivel o se refiere a estudiar la distribución de una variable dado un nivel o categoría de la otra variable.categoría de la otra variable.

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

k

jiji ff

1.

m

iijj ff

1.

mi(d

dcdc

j

jiji ,...,2,1 donde

) marginal relativa Frec.

),( conjunta relativa Frec.)/( relativa Frecuancia

Page 47: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

47

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Descripción de 2 variables cuantitativas Descripción de 2 variables cuantitativas

Distribución conjuntaDistribución conjuntaProblemaInteresa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro Para esto se tiene el registro de una partida de 104 de una partida de 104 máquinas que presentaron máquinas que presentaron fallas en una región.fallas en una región.

Nº piezas

Nº máquinas

0 11

1 16

2 16

3 20

4 41

Total 104

Nº fallas

Nº maquinas

1 16

2 43

3 45

Total 104

    Nº fallos    

Nº piezas 1 2 3 Total

0 4 5 2 11

1 2 8 6 16

2 3 9 4 16

3 2 6 12 20

4 5 15 21 41

Total 16 43 45 104

Calcular lo siguiente1) Distribución relativa conjunta2)2) Distribución del número de fallos Distribución del número de fallos

condicionada a 3 piezas.condicionada a 3 piezas.3)3) La media del numero de fallosLa media del numero de fallos4)4) La media del numero de piezasLa media del numero de piezas5)5) La media del numero de fallos La media del numero de fallos

condicionada a las 2 piezascondicionada a las 2 piezas

Page 48: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

48

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Descripción de 2 variables cuantitativas Descripción de 2 variables cuantitativas

Distribución relativa conjuntaDistribución relativa conjuntaProblemaInteresa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro de Para esto se tiene el registro de una partida de 104 máquinas que una partida de 104 máquinas que presentaron fallas en una región.presentaron fallas en una región.

Calcular lo siguiente1) Distribución relativa conjunta2)2) Distribución del número de fallos Distribución del número de fallos

condicionada a 3 piezas.condicionada a 3 piezas.3)3) La media del numero de fallosLa media del numero de fallos4)4) La media del numero de piezasLa media del numero de piezas5)5) La media del numero de fallos La media del numero de fallos

condicionada a las 2 piezascondicionada a las 2 piezas

x   y Nº fallos    

Nº piezas 1 2 3 Total

0 0,038 0,048 0,019 0,106

1 0,019 0,077 0,058 0,154

2 0,029 0,087 0,038 0,154

3 0,019 0,058 0,115 0,192

4 0,048 0,144 0,202 0,394

Total 0,154 0,413 0,433 1

distribución del numero de fallas condicionada a 3 piezas

    Nº fallos    

Nº piezas 1 2 3 Total

x=3 0,1 0,3 0,6 1

la media de fallos condicionada a 3 piezas es: 2,50

Nº piezas 1 2 3 Total

x=2 0,1875 0,5625 0,25 1

la media de fallos condicionada a 2 piezas es: 2,06

Media de fallos=2,28

Media Nº de piezas=2,62

SoluciónSolución

Cov(x,y)= (0. 1 .0,038+ 0. 2 .0,048+…+ 4. 3 .0,202)- 2,62.2,28 =6,19-5,96 = 0,23

Page 49: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

49

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007Descripción de 2 variables cuantitativas Descripción de 2 variables cuantitativas

Distribución conjuntaDistribución conjunta

Si se tienen 2 variables cuantitativas discretas que se miden a un conjunto de unidades se puede construir:

1) Tablas de doble entrada de frecuencias a absolutas y de frecuencias relativas.2) Distribución marginal de cada variable.3) Distribución de una variable condicionada a una categoría de la otra.

Medidas que se pueden calcular

y

x y1 y2 … yJ total

x1 F11 F12 … F1J F1.

x2 F21 F22 … F2J F2.

… xI FI1 FI2 … FIJ FI.

total F.1 F.2 … F.J N

Frecuencia AbsolutasFrecuencia Absolutas Frecuencia RelativasFrecuencia Relativas

y

x y1 y2 … yj total

x1 f11 f12 … f1j f1.

x2 f21 f22 … f2j f2.

… xI fi1 fi2 … fij fi.

total f.1 f.2 … f.j 1

I

iii fxx

1.

J

jjj fyy

1.

yxyxfyxI

i

J

Jjiij

1 1),cov(

I

iiix fxxs

1.

2)(

Media o promedio de x y de y

Desviación típica de x y de y

Covarianza de x con y

J

jjjy fyys

1.

2)(

yxss)y,xcov(

r Correlación de x con y

Page 50: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

50

Ejemplo 1Ejemplo 1

Sobre los datos que se tienen para el cursoSobre los datos que se tienen para el curso

Aplicar todo lo visto hasta ahora sobre estadística descriptiva, no olvide identificar el problema, la unidad de análisis, las variables en estudio (definición de cada una de ellas donde se identifique la unidad de medida para las variables cuantitativas y las categorías de las variables cualitativas).

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 51: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

51

MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL- Covarianza Covarianza

- CorrelaciónCorrelación

x

1x

2x

nx

DatosDatos

CuantitativosCuantitativos

Covarianza: Covarianza:

Recordemos que:Recordemos que: Hasta ahora hemos estudiado las Hasta ahora hemos estudiado las medidas tendencia medidas tendencia central central (Media, Mediana, Moda) (Media, Mediana, Moda) y dispersióny dispersión (Varianza y Desviación Estándar) para (Varianza y Desviación Estándar) para unauna Variable Cuantitativa Variable Cuantitativa (x).(x).

Es una medida de Variabilidad Conjunta entre Es una medida de Variabilidad Conjunta entre dosdos variables ( variables (xx11 ,, x x22) o bien () o bien (xx , , yy))

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

Si Cov(x,y) es positivaSi Cov(x,y) es positiva: : la asociación entre la asociación entre x x e e yy es directamente proporcional, es es directamente proporcional, es decir que cuando decir que cuando x x aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa.

Si Cov(x,y) es negativaSi Cov(x,y) es negativa: : la asociación entre la asociación entre x x e e y y es inversamente proporcional, es es inversamente proporcional, es decir que cuando decir que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa.

Si Cov(x,y) es ceroSi Cov(x,y) es cero: : no existe asociación entreno existe asociación entre x x e e yy..

n

iii )yy)(xx(

n)y,xcov(

1

1

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 52: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

52

MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL- Covarianza Covarianza

- CorrelaciónCorrelación

DatosDatos

CuantitativosCuantitativos

Coeficiente de Correlación de Pearson (Coeficiente de Correlación de Pearson (rr): ): Mide el grado de Asociación Lineal Mide el grado de Asociación Lineal entre dos variables Cuantitativasentre dos variables Cuantitativas

Se refiere al grado de asociación entre Se refiere al grado de asociación entre dosdos variables ( variables (xx11 ,, x x22) o bien () o bien (xx , , yy))

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

Si Si rr es positivo es positivo: : la asociación entre la asociación entre x x e e yy es directamente proporcional, es decir que es directamente proporcional, es decir que cuando cuando x x aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa. Si Si rr=1=1: : la asociación lineal es la asociación lineal es perfecta.perfecta.

Si Si rr es negativo es negativo: : la asociación entre la asociación entre x x e e y y es inversamente proporcional, es decir es inversamente proporcional, es decir que cuando que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa. Si Si rr=-1=-1: : la asociación lineal es la asociación lineal es perfecta.perfecta.

Si Si rr es cero es cero: : no existe asociación entreno existe asociación entre x x e e yy..

CorrelaciónCorrelación: :

11 ryxss

)y,xcov(r

yx

n

iii

ss)n(

yxnyx

r1

1

Introducción a la EstadísticaLicenciatura en administración y dirección de Empresas (LADE)

UC3M-2007

Page 53: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

53

r=1 r=-1

EJEMPLO : Representación gráfica de las variables x e yEJEMPLO : Representación gráfica de las variables x e y

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Page 54: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

54

Objetivo 2Estudiar si los valores de una

variable pueden ser utilizados para predecir el valor de la otra 

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

Datos CuantitativosDatos Cuantitativos

Determinar si existe relación entre las variables x e y:

Coeficiente de Correlación

Objetivo 1Determinar si dos variables están Determinar si dos variables están asociadas y en qué sentido se da asociadas y en qué sentido se da

la asociaciónla asociación..

Estudiar la dependencia de una variable respecto de la otra:

Modelo de RegresiónModelo de Regresión

TérminosVariable Respuesta (=variable dependiente)

Variable Explicativa (=variable Independiente)Relación Lineal (modelo lineal)

Parámetros (intercepto y pendiente)Intercepto (respuesta media)

Pendiente (efecto de la variable explicativa sobre la respuesta)Error (residuo)

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Page 55: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

55

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

Datos CuantitativosDatos Cuantitativos

NotaciónVariable Respuesta: y

Variable Explicativa: x

Modelo de Regresión Lineal Simple: yi=+xi+ei

Intercepto: Pendiente:

Error: e

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

Modelo Estimado(recta de regresión)

bxay ˆ

xbya

2

11

2

111

n

ii

n

i

n

ii

n

ii

n

i

xxn

yxxynb

Método de Estimación: Mínimos CuadradosMínimos Cuadrados

iii yye ˆResiduos o Errores

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

2

),cov(

xs

yxb

x

y

s

srb

Page 56: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

56

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

DATOSDATOS

MODELO DE REGRESIÓN LINEAL SIMPLE yi=+xi+ei

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

MODELO ESTIMADO

bxay ˆ

xbya

2

11

2

111

n

ii

n

i

n

ii

n

ii

n

i

xxn

yxxynb

ESTIMADORES

iii yye ˆ

ERRORES

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

2

),cov(

xs

yxb

x

y

s

srb

Desviación típica residual: sr

Representa la variabilidad promedio de los

datos observados con relación a la recta

de regresión.

n

e

n

yys

n

i

n

iii

r

1

2

1

2)ˆ(

Page 57: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

57

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

MODELO DE REGRESIÓN LINEAL SIMPLE yi=+xi+ei

MODELO ESTIMADO

bxay ˆ

Una Variable Respuesta (y) una Variable Explicativa (x)

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

xx

yy

iii yye ˆ

Desviación típica residual: sr

Representa la variabilidad promedio de los

datos observados con relación a la recta

de regresión.

n

e

n

yy

s

n

iii

r

21

2)ˆ(

Recta estimada

Page 58: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

58

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple

Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

niño edad (meses) talla (cm) i xi yi

1 3 55 2 6 68 3 5 64 4 5 66 5 3 62 6 4 65 7 9 74 8 8 75 9 9 73

10 7 69 11 6 73 12 5 68 13 8 73 14 6 71

y=talla / x=edad / n=14

95614

1

i

iy 3,68y 6,5ys

8414

1

i

ix 6x 2xs

07,9),cov( yx 88,0xyr

586314

1

i

iiyx 55614

1

2 i

ix

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Page 59: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

59

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple

Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

M o d e l o E s t i m a d o bxay ˆ

44,2b 64,53a

xy 44,264,53ˆ

Interpretación de los resultados

- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a medida que la edad aumenta la talla aumenta.

- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en una unidad la talla se incrementa en 2,44 cm.

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Page 60: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

60

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple

Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

De acuerdo al coeficiente de determinación, el modelo ajustado a los datos es adecuado (R2 cercano a 1)

Bondad de Ajuste del Modelo R2 = 0,77

niño edad (meses) talla (cm) Talla estimada error

i xi yi iy ie 1 3 55 61,0 -6,0 2 6 68 68,3 -0,3 3 5 64 65,8 -1,8 4 5 66 65,8 0,2 5 3 62 61,0 1,0 6 4 65 63,4 1,6 7 9 74 75,6 -1,6 8 8 75 73,2 1,8 9 9 73 75,6 -2,6 10 7 69 70,7 -1,7 11 6 73 68,3 4,7 12 5 68 65,8 2,2 13 8 73 73,2 -0,2 14 6 71 68,3 2,7

86,402)(14

1

2 i

ii yy

7,92)ˆ(14

1

214

1

2

i

ii

ii eyy

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

57,214

7,922

n

esr

Page 61: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

61

531-1-3-5

5

4

3

2

1

0

e

Fre

cuen

cia

7570656055

5

4

3

2

1

0

y

Fre

cuen

cia

Histograma para la variable Talla (y)Histograma para la variable Talla (y)

Histograma para los errores (e)Histograma para los errores (e)

Algunos Gráficos que se observan en RegresiónAlgunos Gráficos que se observan en Regresión

20100

100

90

80

70

60

50

x

y

Diagrama de Dispersión Edad (x) v/s Talla (y)Diagrama de Dispersión Edad (x) v/s Talla (y)

Recta de regresión estimadaRecta de regresión estimada

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

- La media de los errores o residuos es cero.

- La desviación típica residual, representa la variabilidad promedio de los datos observados con relación a la recta de regresión.

Page 62: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

62

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Correlación y causalidad

Si el coeficiente de correlación entre dos variables es alto (cercano a -1 o a 1), indica que estas dos variables toman valores que están relacionados entre si, pero no permite concluir una relación causal entre esas variables.

Ejemplo: se tienen dos variables “el número de matrimonios mensual en una ciudad” y “la temperatura promedio mensual” en un periodo determinado. El coeficiente de correlación entre estas dos variables es igual a 0,70.

- Las dos variables muestran una asociación, pero no podemos pensar que el número de matrimonios aumente con la temperatura, ni que una ola de calor produzca mayor numero de matrimonios.- A este tipo correlación se denomina correlación espuria.

Temperatura promedio

Mat

rimon

ios

Page 63: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

63

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

1. Análisis de datos.2. Análisis de datos bivariantes.3. Correlación y regresión.4. Series temporales y números índice.5. Probabilidad.6. Variables aleatorias.7. Modelos discretos.8. Modelos continuos.9. Variables aleatorias multidimensionales: la distribución normal bivariante.

Programa de la asignatura

Page 64: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

64

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 1. Introducción2. Clasificación de las series temporales (serie estacionaria y serie no estacionaria)

3. Descomposición básica de una serie temporal (tendencia, estacionalidad, componente irregular)

4. Análisis de la tendencia (método de la tendencia determinista, método de la tendencia evolutiva y método de diferenciación de la serie)

5. Análisis de la estacionalidad (tabla de doble entrada, coeficiente de estacionalidad y desestacionalización de la serie)

Resumen de conceptos involucrados: Una serie temporal puede ser estacionaria o no estacionaria. Una serie temporal esta compuesta por la tendencia (creciente o decreciente), la estacionalidad y un componente irregular. El análisis de la tendencia se puede realizar a través del método de la tendencia determinista (recta de regresión), método de la tendencia evolutiva (media móvil de orden tres y de orden cinco) y método de diferenciación de la serie. En el análisis de estacionalidad se organizan los datos en una tabla de doble entrada, se calculan coeficientes de estacionalidad y se realiza una desestacionalización de la serie.

Page 65: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

65

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 1.- Introducción

Una serie temporal corresponde a una variable registrada a lo largo del tiempo.

La variable será de tipo cuantitativa y la unidad de tiempo estará dado según el registro de esa variable, este puede ser cada hora, diariamente, semanalmente, mensualmente, anualmente, etc.

El análisis de series temporales tiene como fin explicar la evolución de una variable en el tiempo y prever sus valores futuros.

Ejemplos: 1. El ingreso diario de pacientes a la unidad de emergencia de un hospital: la variable es el

número de pacientes que ingresan y la unidad de tiempo es diariamente.

2. En un supermercado se tienen las ventas semanales de un producto determinado: la variable es el número de ventas del producto y la unidad de tiempo es semanalmente.

3. Una empresa estudia la tasa de ausentismo laboral mensual en un periodo de 10 años: La variable es la tasa de ausentismo y la unidad de tiempo es mensualmente.

4. En un país se realiza un estudio sobre la proporción de mujeres que ingresan a la universidad sobre el total de ingresos anuales desde el año 1980 a 2006: la variable es la proporción de mujeres y unidad de tiempo es anualmente.

Page 66: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

66

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales

Representación gráfica de una serie temporal

• La representación gráfica principal de una serie de tiempo es por medio de un gráfico temporal.

• El gráfico temporal se construye situando los valores que toma la serie en el eje de las

ordenadas (eje y) y los instantes temporales correspondientes en el eje de las abscisas (eje x).

En el cuadro 1 se puede observar 4 tipos de series para distintas variables medidas en las unidades de tiempo correspondiente.

1. Serie A: Número de reclamaciones semanales presentadas en el servicio de atención al cliente de una empresa de servicios (30 semanas).

2. Serie B: Número de Ventas cuatrimestrales de un nuevo producto (30 cuatrimestres correspondiente a 7 años y medio)

3. Serie C: Número de pasajeros mensuales transportados por avión en vuelos internacionales (144 meses correspondiente a 12 años).

4. Serie D: Precio diario de una acción en dólares (100 días).

Page 67: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

67

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales

Cuadro 1: Grafico temporal para la serie A, serie B, serie C y serie D.

Serie A Serie B

Serie C Serie D

18

19

20

21

22

23

24

1 10 19 28

Semana

rec

lam

ac

ion

es

10

20

30

40

50

1 10 19 28

cuatrimestre

Ven

tas

4,5

5,0

5,5

6,0

6,5

1 45 89 133

mes

Pas

ajer

os

tran

spo

rtad

os

20

25

30

35

40

1 50 99

día

Pre

cio

de

un

a ac

ció

n

Page 68: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

68

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales

2.- Clasificación de las series temporales

Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria.

SERIE ESTACIONARIA

• En esta serie la media y la variabilidad son constantes en el tiempo.

• En el gráfico temporal se observa que los valores que toma la serie tienden a oscilar alrededor de una media constante, y la variabilidad de la serie respecto de la media permanece también constante en el tiempo.

• Para este tipo de serie tiene sentido calcular la media y la desviación estándar (o típica) y construir un histograma.

• Un ejemplo se observa en cuadro 2 y cuadro 3.

Page 69: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

69

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 2.- Clasificación de las series temporales

Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria.

SERIE ESTACIONARIA

Cuadro 2: Grafico de una serie temporal estacionaria.

18

19

20

21

22

23

24

1 10 19 28

Semana

recl

amac

ione

s

Media 20,96

Desv. Estándar 1,35

n 30

Serie A

SERIE ESTACIONARIA

Cuadro 3: Histograma de una serie temporal estacionaria.

Histograma Nº de Reclamaciones

Nº Reclamaciones

24232221201918

10

8

6

4

2

0

Desv. típ. = 1,35

Media = 21

N = 30,00

Page 70: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

70

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 2.- Clasificación de las series temporales

Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria.

SERIE NO ESTACIONARIA

• En esta serie la media y/o la variabilidad cambian a lo largo del tiempo.

• El cambio de la media se traduce en la presencia de una tendencia a crecer o decrecer, por lo que la serie no tiende a oscilar alrededor de un valor constante o de referencia.

• Este tipo de series son dinámicas o evolutivas.

• Una serie no estacionaria puede ser estacional, es decir, que la serie tiene una pauta de evolución que se repite de un año a otro.

• Es importante destacar que por definición, una serie anual no puede ser nunca estacional, sin embargo las series mensuales o diarias pueden presentar estacionalidad, debida al mes o al día.

Ejemplos de series estacionarias se observan en el cuadro 4.

Page 71: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

71

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 2.- Clasificación de las series temporales

Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria.

10

20

30

40

50

1 10 19 28

cuatrimestre

Ven

tas

4,5

5,0

5,5

6,0

6,5

1 45 89 133

mes

Pas

ajer

os

tran

spo

rtad

os

20

25

30

35

40

1 50 99

día

Pre

cio

de

un

a ac

ció

n

Serie B Serie D

SERIES NO ESTACIONARIAS

Serie C

NO

ESTACIONAL

ESTACIONAL

NO

ESTACIONAL

Cuadro 4: Gráfico temporal para la serie B, serie C y serie D.

La serie B y la serie D son no estacionales.

La serie C es estacional: tiene una pauta de evolución que se repite

Page 72: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

72

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales

3.- Descomposición básica de una serie temporal

• Los métodos descriptivos clásicos pueden aplicarse a series temporales estacionarias, pero no para las no estacionarias.

• Una serie no estacionaria presenta unas características que permiten descomponerla. En éstas se puede identificar una tendencia constante o no constante y también se puede observar la estacionalidad.

• La descripción de una serie temporal supone que la serie observada es la suma de tres componentes distintos:

1. La tendencia: que se identifica con un movimiento suave de la serie a largo plazo. Es una pauta regular que evoluciona lentamente en el tiempo creciendo o decreciendo, tal como se observa en el cuadro 5.

2. La estacionalidad: que son movimientos de oscilación dentro del año, tal como se observa en el cuadro 6.

3. El irregular: que incluye las variaciones aleatorias alrededor de los componentes anteriores.

Page 73: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

73

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales

3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular

1.- La tendencia

2.- La estacionalidad

10

20

30

40

50

1 10 19 28

cuatrimestre

Ven

tas

TendenciaTendencia de series no estacionariasTendencia CrecienteTendencia Creciente

20

25

30

35

40

1 10 19 28

día

Pre

cio

de

un

a ac

ció

n

Tendencia DecrecienteTendencia Decreciente

Cuadro 5: Gráfico temporal para series con tendencia creciente y decreciente.

Page 74: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

74

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales

3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular

2.- La estacionalidad

4,5

5,0

5,5

6,0

6,5

1 45 89 133

mes

Pas

ajer

os

tran

spo

rtad

os

Serie C

4,6

4,8

5,0

5,2

5,4

5,6

5,8

6,0

6,2

6,4

6,6

1 2 3 4 5 6 7 8 9 10 11 12

Año

Pas

ajer

os

tran

spo

rtad

os

enero

julio

EstacionalidadEstacionalidad de una serie no estacionaria

Cuadro 6: Gráfico temporal de la serie C que es creciente y presenta estacionalidad (en los meses de enero de cada año hay menor Nº de pasajeros que en julio)

Page 75: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

75

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales

3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular

La serie temporal no estacionaria se puede escribir como:

Valor observado= tendencia + estacionalidad + irregular

tttt ISTx

donde Tt es la tendencia, St es la estacionalidad e It el componente irregular.

Page 76: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

76

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

• Para analizar la tendencia de una serie partiremos del supuesto que la serie no tiene estacionalidad (la estacionalidad se verá más adelante).

• Es decir, la serie a analizar es no estacionaria, no tiene estacionalidad, puede presentar una tendencia creciente o decreciente y posee un componente aleatorio irregular, esto se representa por el siguiente esquema:

Valor observadoValor observado= = tendenciatendencia + + irregularirregular

ttt ITx Para calcular la tendencia se puede plantear una hipótesis sobre la forma de Tt; tenemos dos casos:

1. Suponer que Tt es una función determinista del tiempo, por ejemplo una línea recta. Bajo este supuesto estudiaremos un método de tendencia determinista.

2. Suponer que Tt es una función no determinista desconocida, pero que evoluciona suavemente a lo largo del tiempo. Bajo este supuesto estudiaremos un método de tendencia evolutiva.

Un método más general consiste en no hacer ninguna hipótesis sobre la forma de la ecuación de la tendencia a corto plazo y suponer que la tendencia evoluciona lentamente en el tiempo, de manera que en el instante t debe ser próxima a la tendencia en el instante t-1. Para esto estudiaremos un método de diferenciación de la serie que elimina la tendencia de la serie.

M1M1

M2M2

M3M3

Page 77: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

77

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M1: Método de tendencia determinista

Representamos la tendencia de una serie temporal por una línea recta. La ecuación de la recta se calculará mediante una ecuación de regresión donde la variable dependiente es la serie observada y la variable explicativa es el tiempo.

El objetivo es obtener la tendencia y posteriormente el componente irregular.

La tendencia en t esta dada por la siguiente ecuación de regresión:

Considerando ttt ITx

btaTt

Donde a y b son constantes a determinar y t es la variable tiempo.

N

ttxx

tx

N

iii

1))((

),cov(N

tt

s

N

ii

t

12

)(

Para obtener la pendiente (b) y el intercepto (a) de la recta, se debe calcular lo siguiente:

2

),cov(

ts

txb tbxa

btaTt ttt TxI La tendencia estará dada por: La componente irregular estará dada por:

Page 78: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

78

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M1: Método de tendencia determinista

Los datos se organizarán de la siguiente forma:

     

Datos observados Datos a estimar

t xt Tt It

1 x1 T1 I1

2 x2 T2 I2

3 x3 T3 I3

N xN TN IN

btaTt ttt TxI La tendencia estará dada por: La componente irregular estará dada por:

Page 79: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

79

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M1: Método de tendencia determinista

Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia mediante la recta de regresión. Recordar que esta serie no es estacionaria y se analiza bajo el supuesto que no tiene estacionalidad .

     

- El esquema propuesto es: ttt ITx donde xt = venta, Tt= tendencia e It es el componente irregular o residuo en el tiempo t.

- La tendencia se estima mediante un modelo de regresión: btaTt - La variable tiempo (t ) toma los valores del 1 al 30.

- La media para el tiempo es: 5,15t

- La varianza para el tiempo es: 92,742 ts

- La media de la serie de ventas es: 63,27x

- La covarianza entre la serie de ventas y la variable t es: 11,81),cov( tx

- La pendiente de la recta de regresión es: 08,192,74

11,81b

- El intercepto de la recta de regresión es: 84,105,1508,163,27 a

- La tendencia estimada esta dada por: tTt 08,184,10ˆ

- Los residuos o componente irregular están dados por: ttt TxI ˆˆ

Page 80: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

80

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M1: Método de tendencia determinista

Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia mediante la recta de regresión. Recordar que esta serie no es estacionaria y se analiza bajo el supuesto que no tiene estacionalidad.

     

En el cuadro 7 se puede observar gráficamente el comportamiento de los datos de la serie comparado con la tendencia estimada y los errores o componentes irregulares.

0

10

20

30

40

50

cuatrimestre

ve

nta

s

-10

0

10

20

30

40

50

cuatrimestre

res

idu

os

Recta estimada para Tendencia

Residuos o componente irregular

Recta estimada para Tendencia

Valores reales de la serie (ventas)

(a)(a)

(b)(b)

Cuadro 7: contiene en (a) el gráfico de la recta de tendencia y datos de la serie de ventas y en (b) el grafico de los componentes irregulares (residuos) y la recta de la tendencia.

Observación: Ajustar un línea recta a la tendencia tiene la ventaja de la simplicidad. Puede servir para describir algunas series cuyo gráfico temporal muestra claramente una tendencia lineal, sin embargo no es aplicable a las series donde no se observa un incremento o decremento continuado y constante a lo largo del tiempo.

Page 81: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

81

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M2: Método de tendencia evolutiva

Un procedimiento más realista que el del ajuste de la línea recta, es suponer que la tendencia Tt es una función, pero que evoluciona lentamente, y en consecuencia, puede aproximarse en intervalos muy cortos (por ejemplo de 3 o 5 datos) por una función simple del tiempo. En general se supone una recta, pero ahora sus coeficientes van cambiando suavemente en el tiempo.

Para estimar la tendencia Tt tenemos que asumir que en períodos cortos los coeficientes son constantes. En concreto, suponiendo que la representación de la tendencia por una recta es válida para tres períodos consecutivos, t-1, t, t+1, se tendrá:

- - - - - -

ocrecimientTT tt 1

tt TT ocrecimientTT tt 1

En consecuencia, se obtiene la media de tres observaciones consecutivas (t-1, t y t+1):

311

tttt

xxxm A esta operación se le denomina Media Móvil centrada de orden tres.

Page 82: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

82

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M2: Método de tendencia evolutiva

Media Móvil centrada de orden tres

Observación: Utilizando la igualdad se obtiene: ttt ITx 3

11 ttt

ttIII

Tm

irregular componente tendencia tm

• Como el componente irregular tiene media cero, la media de tres valores del irregular puede suponerse despreciable frente a la tendencia y mt recoge principalmente en cada instante la tendencia de la serie en dicho momento.

• La Media Móvil centrada de orden tres, proporciona aproximadamente la tendencia en cada punto.

• El calculo de la componente irregular se efectúa después restando a los valores la tendencia, es decir:

ttt TxI

311

tttt

xxxm

Page 83: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

83

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M2: Método de tendencia evolutiva

La Media Móvil centrada de orden tres es:

La componente irregular es: ttt TxI

311

tttt

xxxm

Calculando la media móvil de orden tres los datos se organizarán de la siguiente forma:

     

Datos observados Datos a estimar

t xt mt=Tt It

1 x1 - -

2 x2 m2 I2

3 x3 m3 I3

N-1 xN-1 mN-1 IN-1

N xN - -

Page 84: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

84

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M2: Método de tendencia evolutiva

La Media Móvil de orden cinco se calcula con 5 observaciones consecutivas (t-2, t-1, t, t+1 y t+2):

La componente irregular es: ttt TxI

Calculando la media móvil de orden cinco los datos se organizarán de la siguiente forma:

52112

tttttt

xxxxxM

Datos observados Datos a estimar

t xt Mt=Tt It

1 x1 - -

2 x2 - -

3 x3 M3 I3

4 x4 M4 I4

5 x5 M5 I5

N-2 xN-2 MN-2 IN-2

N-1 xN-1 - -

N xN - -

Observación: la tendencia con una media móvil de orden cinco es más suave que con la media móvil de orden tres.

Page 85: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

85

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M2: Método de tendencia evolutiva Media Móvil de orden tres y de orden cinco

Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia utilizando la media móvil de orden tres (mt) y la media móvil de orden cinco (Mt). Algunos de los datos de la tendencia (mt y Mt ) obtenidos son los siguientes:

t ventas mt Mt

1 13,16

2 40,07 24,3

3 19,63 23,9 21,3

4 11,89 17,7 21,6

5 21,61 16,1 17,9

6 14,85 19,3 18,6

7 21,54 19,9 20,3

8 23,28 21,7 20,8

9 20,30 22,6 22,4

De las 30 observaciones, calculando la Media Móvil de orden tres se obtienen 28 observaciones de tendencia; y calculando la Media Móvil de orden cinco se obtienen 26 observaciones de tendencia.

Page 86: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

86

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M2: Método de tendencia evolutiva Media móvil de orden tres y de orden cincoEjemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia utilizando la media móvil de orden tres (mt) y la media móvil de orden cinco (Mt). Algunos de los datos de la tendencia (mt y Mt ) obtenidos son los siguientes:

0

10

20

30

40

50

2 4 6 8 10 12 14 16 18 20 22 24 26 28

cuatrimestre

ve

nta

0

10

20

30

40

50

3 5 7 9 11 13 15 17 19 21 23 25 27

cuatrimestre

ve

nta

(a) Tendencia de ventas con una media móvil de orden tres

(b) Tendencia de ventas con una media móvil de orden cinco

Cuadro 8: Tendencia de ventas obtenida por la media móvil de orden tres (a) y de orden cinco (b).

Observación: desde el cuadro 8 se puede ver que la tendencia de las ventas con la media móvil de orden cinco es más suave que con la de orden tres.

Page 87: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

87

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M3: Método de diferenciación de la serie

Este método más general para calcular la tendencia, consiste en no hacer ninguna hipótesis sobre la forma de la ecuación de la tendencia a corto plazo.

Supone únicamente que la tendencia evoluciona lentamente en el tiempo, de manera que en el instante t debe ser próxima a la tendencia en el instante t-1.

En consecuencia, si se resta a cada valor de la serie el valor anterior, la serie resultante estará aproximadamente libre de la tendencia.

Esta operación se denomina diferenciar la serie y consiste en pasar de la serie xt a una nueva serie yt,

que se construye mediante:

1 ttt xxy

• Este procedimiento equivale a suponer que la tendencia en t es el valor de la serie en t-1. Por lo tanto la serie diferenciada equivale al componente irregular.

• Este método es más general ya que no requiere de ninguna hipótesis sobre la forma de la tendencia.

• Este método es el más utilizado en la actualidad.

Page 88: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

88

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M3: Método de diferenciación de la serie

Calculando la serie diferenciada, los datos se organizarán de la siguiente forma:

1 ttt xxy

Datos observados Comp. Irregular t xt yt 1 x1 - 2 x2 y2=x1-x2 3 x3 y3=x2-x3

N-1 xN-1 yN-1=xN-2-xN-1 N xN yN=xN-1-xN

Page 89: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

89

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M3: Método de diferenciación de la serie 1 ttt xxy

Ejemplo: Para las series no estacionarias presentadas en el cuadro 4 (Serie B, Serie C y Serie D) se eliminará la tendencia mediante la diferenciación, quedando la componente irregular (It). La siguiente

tabla contiene la diferenciación para seis casos de las series b, c y d; y la representación gráfica de la componente irregular para todos los datos se puede observar en el cuadro 9.

Serie B Serie C Serie D Cuatrim. Nº ventas yt=It mes pasajeros yt=It día precio acción yt=It

1 13,16 1 4,72 1 30,53

2 40,07 26,91 2 4,77 0,05 2 30,34 -0,18

3 19,63 -20,43 3 4,88 0,11 3 30,54 0,20

4 11,89 -7,74 4 4,86 -0,02 4 32,13 1,59

5 21,61 9,72 5 4,80 -0,06 5 32,16 0,03

6 14,85 -6,76 6 4,91 0,11 6 33,05 0,89

Page 90: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

90

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 4.- Análisis de la tendencia4.- Análisis de la tendencia

M3: Método de diferenciación de la serie 1 ttt xxy

Ejemplo: Para las series no estacionarias del cuadro 4 (Serie B, Serie C y Serie D) se eliminó la tendencia mediante la diferenciación, quedando la componente irregular (It).

-4,0

-3,0

-2,0

-1,0

0,0

1,0

2,0

1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97

cuatrimestre

com

pone

nte

irreg

ular

-0,3

-0,2

-0,1

0,0

0,1

0,2

0,3

1 12 23 34 45 56 67 78 89 100 111 122 133

cuatrimestre

com

po

ne

nte

irre

gu

lar

-30

-20

-10

0

10

20

30

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

cuatrimestre

com

po

ne

nte

irre

gu

lar

(b) Componente irregular para

Ventas

(c) Componente irregular para Nº pasajeros

(d) Componente irregular para Precio de una

acción

Cuadro 9: Representación gráfica de la diferenciación de las series B,C y D.

Page 91: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

91

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 5.- Análisis de Estacionalidad5.- Análisis de Estacionalidad

Siempre que se recogen datos igualmente espaciados es esperable un efecto estacional, por ejemplo cuando se observan datos mensuales o semanales a través del tiempo.

Para analizar la estacionalidad, se requiere disponer los datos en una tabla de doble entrada, donde los valores de la serie se organizan según las opciones de tiempo, tal como se observa en el cuadro 10, donde cada tabla reúne los valores de la serie según (1) mes y año, (2) semana y mes, (3) día y semana.

(1) año (2) mes

mes 1994 1995 1996 1997 Semana enero febrero marzo abril mayo junio julio

enero 1

febrero 2

marzo 3

abril 4

mayo

junio (3) semana

julio Día 1 2 3 4 5 6 7

agosto lunes

septiembre martes

octubre miércoles

noviembre jueves

diciembre viernes

sábado

domingo

Cuadro 10: Tres ejemplos de organización de los valores que toma la serie en una tabla de doble entrada.

Page 92: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

92

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 5.- Análisis de Estacionalidad5.- Análisis de Estacionalidad

El análisis de estacionalidad se basa en el cálculo de las medias por filas, por columnas y la media global.

 1. Al restar la media global a la media de cada fila se obtienen los coeficientes estacionales.

• Para los ejemplos presentados en el cuadro 10, los coeficientes estacionales representan como se sitúa (1) la media de cada mes respecto de la media global; (2) la media de cada semana respecto de la media global y (3) la media de cada día respecto de la media global.

 2. Las medias de las columnas indican la tendencia de la serie. Al restar la media global a la media de

cada columna se obtiene el comportamiento relativo.

• Para los ejemplos presentados en el cuadro 9, se tendría (1) la media de cada año menos la media global; (2) la media de cada mes menos la media global y (3) la media de cada semana respecto de la media global.

 3. Se denomina serie desestacionalizada a una serie donde se ha eliminado el efecto estacional. Esta

serie se construye restando a los valores de cada fila el coeficiente estacional correspondiente.

Ejemplo: Para la serie mensual de pasajeros transportados por avión en vuelos internacionales (c), se realiza un análisis de la estacionalidad (ver cuadro 11), es decir se organizan los datos por mes y año, se calcula la media global, las medias por mes (fila ), las medias por año (columna), el coeficiente de estacionalidad por mes; y se construye la serie desestacionalizada.

Page 93: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

93

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Series Temporales 5.- Análisis de Estacionalidad 5.- Análisis de Estacionalidad ((Coeficientes Estacionales, Tendencia de la Serie, Serie Desestacionalizada)

Serie: pasajeros por mes y añoaño

mes 1990 1991 1992 1993 1994 1995 medias Coef. Estac.enero 4,7 4,7 5,0 5,1 5,3 5,3 5,0 -0,15febrero 4,8 4,8 5,0 5,2 5,3 5,2 5,1 -0,12marzo 4,9 4,9 5,2 5,3 5,5 5,5 5,2 0,02abril 4,9 4,9 5,1 5,2 5,5 5,4 5,2 -0,02mayo 4,8 4,8 5,1 5,2 5,4 5,5 5,1 -0,03junio 4,9 5,0 5,2 5,4 5,5 5,6 5,3 0,08julio 5,0 5,1 5,3 5,4 5,6 5,7 5,4 0,18agosto 5,0 5,1 5,3 5,5 5,6 5,7 5,4 0,19septiembre 4,9 5,1 5,2 5,3 5,5 5,6 5,3 0,08octubre 4,8 4,9 5,1 5,3 5,4 5,4 5,1 -0,04noviembre 4,6 4,7 5,0 5,1 5,2 5,3 5,0 -0,17diciembre 4,8 4,9 5,1 5,3 5,3 5,4 5,1 -0,04

Medias 4,8 4,9 5,1 5,3 5,4 5,5Media Global = 5,175

Serie de pasajeros desestacionalizadaaño

mes 1990 1991 1992 1993 1994 1995enero 4,9 4,9 5,1 5,3 5,4 5,5febrero 4,9 5,0 5,1 5,3 5,4 5,4marzo 4,9 4,9 5,2 5,2 5,4 5,4abril 4,9 4,9 5,1 5,2 5,5 5,4mayo 4,8 4,9 5,2 5,2 5,5 5,5junio 4,8 4,9 5,1 5,3 5,4 5,5julio 4,8 5,0 5,1 5,3 5,4 5,5agosto 4,8 4,9 5,1 5,3 5,4 5,5septiembre 4,8 5,0 5,1 5,3 5,4 5,5octubre 4,8 4,9 5,1 5,3 5,4 5,5noviembre 4,8 4,9 5,2 5,3 5,4 5,5diciembre 4,8 5,0 5,1 5,3 5,3 5,5

Media por filas: sumar todos los valores de la fila y dividirlo por el número de años

Media por columnas: sumar todos los valores de la columna y dividirlo por el número de meses

Diferencia entre la media de fila y la media global.

Tabla de doble entrada

Serie desestacionalizada: a cada valor de la fila se le resta el coeficiente de estacionalidad.

= tendencia de la serie

Cuadro 11: Análisis de estacionalidad para la serie mensual de pasajeros transportados por avión en vuelos internacionales.

Page 94: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

94

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del

tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.

1) Número índice para un producto (veremos 3) : - Para calcular este índice hay que identificar el producto a evaluar y el valor que toma éste en una unidad de tiempo, por ejemplo año.- Hay que determinar un año base, al que se le denomina período base del índice. - La Elección del año base es arbitraria y representa el momento temporal de referencia para las comparaciones.

a) Índice de precio (It) =

- Permite comparar la evolución de productos distintos.- Si se comparan tres productos hay que seleccionar el mismo año base para construir el índice, esto permite hacer la comparación de la variación del precio de los productos.

100base añoen precio

tañoen precio

año 1 litro leche 100 grs azafran 1 kg carne

1990 70 10000 1200

1991 75 12000 1250

1992 77 16000 1280

1993 77 20000 1300

1994 85 25000 1375

1995 90 22000 1450

año Índice leche Índice azafran Índice carne

1990 100 100 100

1991 107,1 120 104,2

1992 110 160 106,7

1993 110 200 108,3

1994 121,4 250 114,6

1995 128,6 220 120,8

Precios a) Índice de

precio(It)

Page 95: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

95

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del

tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.

1) Número índice para un producto:

b) Índice de precio relativo respecto al año base=

- Proporciona de manera directa los crecimientos relativos respecto del año base.- Por ejemplo: para la leche índice de precio relativo respecto del año base, representa el incremento (en este caso) porcentual respeto del año base.- Es decir, en el año 1991 la leche incrementó su precio en un 7,1% respecto del año 1990; y un 10% en el año 1992 (también respecto del año base 1990)

año 1 litro leche 100 grs azafran 1 kg carne

1990 70 10000 1200

1991 75 12000 1250

1992 77 16000 1280

1993 77 20000 1300

1994 85 25000 1375

1995 90 22000 1450

Precios

b) Índice de precio relativo al año base

100base año precio

base año precio taño precio

año Índice leche Índice azafrán Índice carne

1990 0 0 0

1991 7,1 20 4,2

1992 10 60 6,7

1993 10 100 8,3

1994 21,4 150 14,6

1995 28,6 120 20,8

Page 96: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

96

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del

tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.

1) Número índice para un producto:

c) Índice de precio relativo respecto del año anterior =

(donde P0 es el precio en el año base)

=

Proporciona los crecimientos relativos con relación a cualquier otro período.

c) Índice de precio relativo al año anterior

1001)/P- taño (precio

1)/P- taño precio( t)/Paño (precio

0

00

10011

t

t

I

I

año Índice leche Índice azafran Índice carne

1990 100 100 100

1991 107,1 120 104,2

1992 110 160 106,7

1993 110 200 108,3

1994 121,4 250 114,6

1995 128,6 220 120,8

a) Índice de

precio(It)

añoÍndice leche

Índice azafran

Índice carne

1990 - - -

1991 7,1 20 4,2

1992 2,7 33,3 2,4

1993 0 25,0 1,5

1994 10,4 25,0 5,8

1995 5,9 -12 5,4

Page 97: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

97

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del

tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.

2) Número índice con agregación simple

a) Índice agregado: Promedio de índices individuales =

- Este índice evita la unidad de medida de los precios de los productos al incorporar en su cálculo los índices de precio, considerando un año base.- Su ventaja es la simplicidad.- El inconveniente es que da el mismo peso a todos los productos.

k

índices de suma 1

k

II

k

ii

g

año 1 litro leche 100 grs azafran 1 kg carne

1990 70 10000 1200

1991 75 12000 1250

1992 77 16000 1280

1993 77 20000 1300

1994 85 25000 1375

1995 90 22000 1450

Precios

año Índice leche Índice azafrán Índice carneÍndice agregado

1990 100 100 100 100

1991 107,1 120 104,2 110,4

1992 110 160 106,7 125,6

1993 110 200 108,3 139,4

1994 121,4 250 114,6 162,0

1995 128,6 220 120,8 156,5

Índice agregado

Page 98: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

98

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del

tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.

3) Número índice con agregación ponderada a) Índice agregado ponderado: Índice A P=

- Considera las ponderaciones de los precios sobre un año base- Necesitamos conocer la cantidad de producto consumida en el año base. - No da el mismo peso a todos los productos.

Índice agregado ponderado

Año 1990: una familia consume 270 litro leche, 100 grs. Azafrán y 150 Kg de carne

Año 1990 leche azafrán carne

Consumo 270 1 150

Precio 18900 10000 180000 208900

Ponderación 0,0905 0,0479 0,8617 1

k

iiigp pII

1

año Índice leche Índice azufran Índice carne Índice AP

1990 100 100 100 100

1991 107,1 120 104,2 105,2

1992 110 160 106,7 109,6

1993 110 200 108,3 112,8

1994 121,4 250 114,6 121,7

1995 128,6 220 120,8 126,3

Page 99: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

99

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del : permiten describir la evolución de una realidad compleja a lo largo del

tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales.

3) Número índice con agregación ponderada b) Índice agregado ponderado: Índice de Laspeyres=

Ci año Base: es la cantidad de producto i en el año base.Precioi año t: es el precio del producto i en el año t.Precioi año Base: es el precio del producto i en el año año base.

- Este índice tiene en cuenta la importancia relativa de los producto en el consumo.- Necesitamos conocer la cantidad de producto consumida en el año base. - No da el mismo peso a todos los productos.- Los resultados son iguales al índice AP

Índice Laspeyres

100

Pr

Pr

1base año base año

1 taño base año

k

iii

k

iii

Laspeyres

ecioC

ecioC

I

Año 1990: una familia consume 270 litro leche, 100 grs. Azafrán y 150 Kg de carne

año 1 litro leche 100 grs azafran 1 kg carne Índice Laspeyres

1990 70 10000 1200 100

1991 75 12000 1250 105,2

1992 77 16000 1280 109,5

1993 77 20000 1300 112,9

1994 85 25000 1375 121,7

1995 90 22000 1450 126,3

Según se observa el índice AP (a) posee una formula distinta que el índice de Laspeyres (b), pero generan los mismos resultados.

Page 100: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

100

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean : permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean

en economía y casi todos los campos de las ciencias sociales.en economía y casi todos los campos de las ciencias sociales.

4) Índice de precios al consumo (IPC)

- El IPC se calcula mensualmente por el Instituto Nacional de Estadísticas (INE).

- Refleja la evolución de los precios para la familia media Española

- Es un índice de Laspeyres que compara el valor cada mes de un conjunto de artículos con su valor en el período de referencia; éste se denomina Laspeyres encadenado

- El período de referencia se modifica aproximadamente cada 10 años, para tener en cuenta los cambios en la estructura del consumo de la población española.

- La distribución de los gastos de las familias (o ponderaciones) se estima realizando una encuesta que se conoce como Encuesta de presupuestos Familiares (EPF)

- Describe la evolución de los precios de consumo en un país a lo largo del tiempo.

- El porcentaje de variación o de crecimiento del IPC se puede calcular para cada año, mes, etc, utilizando el índice de precio relativo:

10011

t

t

I

I

Page 101: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

101

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean : permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean

en economía y casi todos los campos de las ciencias sociales.en economía y casi todos los campos de las ciencias sociales.

4) Índice de precios al consumo (IPC)

GruposAño 2006, IPC base 2001

Año 2007, IPC base 2006

Alimentos y bebidas no alcohólicas 22,28 22,06

Bebidas alcohólicas y tabaco 3,07 2,82

Vestido y calzado 9,25 9,03

Vivienda 10,71 10,36

Menaje 6,17 6,15

Medicina 2,72 2,83

Transporte 14,91 14,89

Comunicaciones 3,28 3,58

Ocio y cultura 6,78 7,11

Enseñanza 1,68 1,6

Hoteles, cafés y restaurantes 11,45 11,55

Otros bienes y servicios 7,72 8,02

General 100 100

IPC, base 2006. Ponderaciones (Fuente INE)

Page 102: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

102

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Números Índice Números índiceNúmeros índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean : permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean

en economía y casi todos los campos de las ciencias sociales.en economía y casi todos los campos de las ciencias sociales.

4) Índice de precios al consumo (IPC)

Ejemplo del calculo del porcentaje de variación (o crecimiento)

año IPC % variación

1987 74,9 -

1988 78,5 4,8

1989 83,9 6,9

1990 89,5 6,7

1991 94,8 5,9

1992 100 5,5

1993 105 5,0

1994 110 4,8

1995 115,1 4,6

8,410019,74

5,781001

1

t

t

I

I

Page 103: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

103

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Probabilidades

Contenidos:Contenidos:

- Conceptos básicos de experimento aleatorio, espacio muestral, suceso, Conceptos básicos de experimento aleatorio, espacio muestral, suceso, probabilidad, etc.probabilidad, etc.

- Calculo de probabilidades: reglas básicas, Probabilidad condicionada, Calculo de probabilidades: reglas básicas, Probabilidad condicionada, regla de Bayes, Independenciaregla de Bayes, Independencia

- Concepto de variable aleatoria.Concepto de variable aleatoria.- Modelos probabilísticos para variables discretas.Modelos probabilísticos para variables discretas.- Modelos probabilísticos para variables continuas.Modelos probabilísticos para variables continuas.

Page 104: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

104

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

EExperimentoxperimento Aleatorio (E) Aleatorio (E)

Es cualquier proceso en el cual se recoge información de un fenómeno que presenta variación en sus resultados.

Ejemplos:E1: Medir la concentración de gases contaminantes en los tubos de escape de un conjunto de vehículos.

E2: Lanzar un dado y observar el Nº sobre la cara superior.

E3: Damos una dosis de vitaminas a un niño y observamos el peso y la estatura del niño después de 12 semanas.

Espacio Muestral (EM)Espacio Muestral (EM)

Es el conjunto de todos los posibles resultados de un Experimento.

Ejemplos:

EM1: Si x=% de gases contaminantes, los posibles resultados en E1 son

EM2: Si x=Nº en la cara superior, los posibles resultados en E2 son

EM3: Si x = peso ganado, y =estatura ganada; los posibles resultados en E3 son

6 5, 4, 3, 2, 1,x / x

0y ;x- / y) (x;

100x0x /

- Experimento Aleatorio- Espacio Muestral- Evento o Suceso

PROBABILIDADPROBABILIDAD

Principales Conceptos

Page 105: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

105

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

- Experimento Aleatorio- Espacio Muestral- Evento o Suceso

PROBABILIDADPROBABILIDAD

Principales Conceptos

Evento o SucesoEvento o SucesoSea un Experimento (E) y su Espacio Muestral (EM): “un Evento o Suceso es cualquier subconjunto del EM”. A cada uno de los resultados en el EM se le llama Evento Simple o Suceso Elemental.

del ejemplo anterior

En EM1 algunos eventos son ,

En EM2 algunos eventos son A=“Nº par”, B=“Nº impar”, C=“Nº 4”.

En EM3 algunos eventos son

donde B es un evento Simple (suceso elemental)

6 5, 4, 3, 2, 1,x / x

0y ;x- / y) (x;

100x0x / 5x0x / A 02x10x / B

0y ;03 / xy) (x; A 3) ;00(-1B

Page 106: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

106

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

Sean A y B dos sucesos cualquiera:Sean A y B dos sucesos cualquiera:Se escribe (AB) si ocurre A o si ocurre B o ambos

Se escribe (AB) si ocurre A y BAC representa el complemento de A, cuando no ocurre A ocurre AC.

Definición 1: Si A y B son eventos, se dice que A y B son excluyentes o mutuamente excluyentes si no pueden ocurrir simultáneamente, es decir, (AB) =.

E: Lanzar un dado y observar el número en la cara superior.

EM= {1, 2, 3, 4, 5, 6}

A={4}, B=Nº impar={1, 3, 5}

(AB) = (A y B son excluyentes)

Ejemplos: E: Determinar si una persona porta o no un arma blanca.

EM= {si, no}

A={si}, B={no}

(AB) = (A y B son excluyentes)

- Experimento Aleatorio- Espacio Muestral- Evento o Suceso

PROBABILIDADPROBABILIDAD Propiedades

Page 107: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

107

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

- Experimento Aleatorio- Espacio Muestral- Evento o Suceso

PROBABILIDADPROBABILIDAD Propiedades

Sean A y B dos sucesos cualquiera:Sean A y B dos sucesos cualquiera:Se escribe (AB) si ocurre A o si ocurre B o ambos

Se escribe (AB) si ocurre A y BAC representa el complemento de A, cuando no ocurre A ocurre AC.

Definición 2: Sea E un experimento y EM el espacio muestral, con cada suceso A se asocia un número que medirá la probabilidad de que A ocurra, donde P(A) será la probabilidad de A. Si EM={A1, A2,...,Ar} con s=1, 2,..., r.

1) 0P(Ai)1 2) P(EM)=13) Si A1,A2,...,Ar son sucesos mutuamente excluyentes, es decir (AiAj) =; la probabilidad de la

unión de todos los sucesos es:

P(A1)+ P(A2)+... +P(Ar)=

r

1ss

r

1ss )P(A)AP(AA11 AA22 AA33

AA44 AA55

EM

Page 108: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

108

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDADPROBABILIDAD Propiedades

1.- Si es un conjunto vacío (suceso imposible) la probabilidad es cero: - P( )=0- (A ) =A P(A ) = P(A) + P()= P(A) - (A ) = , A y son sucesos excluyentes

2.- Si A un suceso cualquiera y AC un suceso complementario, EM={A,AC }: - P(A) + P(AC) =1- P(A) =1- P(AC) - P(AC) =1- P(A) - P(EM)=P(A AC)= P(A) + P(AC)

3.- Sean A y B sucesos cualquiera:- P(A B)= P(A) + P(B)- P(A B)

- Si A y B son sucesos independientes: P(A B)=P(A ) P(B) - Si A y B son sucesos excluyentes: P(A B)=

4.- Sean A y B sucesos tales que BA: P(B)P(A)

5.- Sean A, B y C sucesos cualquiera: - P(AB C)= P(A) + P(B)+ P(C)- P(AB)- P(A C)- P(B C) + P(A BC)

A AC

EM

A B

EM

A

BEM

Page 109: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

109

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDADPROBABILIDAD

Definición 3: Sea E un experimento y EM el espacio muestral, A es el suceso de interés, entonces P(A)= (Nº de elementos de A) / (Nº de elementos en EM)

Observación: la dificultad en el calculo de la probabilidad está en determinar el Nº de elementos en el espacio muestral.

E: se lanzan 2 dados y se observan los números en las caras superiores.

EM= {(1,1) (1,2) (1,3).....(6,6)}

A= La suma de los números de las caras superiores es 4. A ={(1,3) (3,1) (2,2)}

Ejemplo:

ProblemaProblema: Determinar probabilidad de ANº de elementos en EM= 36

Nº de elementos en A= 3P(A)=3/36=0,083 (8,3%)

1 2 3 4 5 61 11 12 13 14 15 162 21 22 23 24 25 263 31 32 33 34 35 364 41 42 43 44 45 465 51 52 53 54 55 566 61 62 63 64 65 66

Ejercicio:

Experimento: lanzar una moneda; Suceso A: que salga cara; calcular P(A).

Obtener la frecuencia relativa del suceso A: cuando el experimento se repite 30 veces, 50 veces y 100 veces.

Page 110: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

110

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

1) Una persona tiene 20 lápices en su bolso, 4 de los cuales no funcionan, si tiene que firmar una carta y saca al azar un lápiz del bolso, ¿cuál es la probabilidad de que saque un lápiz bueno?.

E: Sacar un lápiz del bolso.

EM= {L1, L2, L3, L4, L5, L6, L7, L8, L9, L10, L11, L12, L13, L14, L15, L16, L17, L18, L19, L20}

A= Sacar un lápiz bueno.

Nº de elementos en EM= 20; Nº de elementos en A= 16; P(A)=16/20= 0,8 (80%)

PROBABILIDAD PROBABILIDAD EjemplosEjemplos

2) Una bolsa de caramelos de 3 sabores (Sandía, Naranja y Limón) contiene 20 unidades de las cuales el 50% es de Limón, el 25% de Sandía y el otro 25% de Naranja.Si un niño saca al azar un caramelo:a) ¿Cuál el la probabilidad que saque uno de limón?b) ¿Cuál es la probabilidad que saque uno de sandia?c) ¿Cuál es la probabilidad que saque uno de naranja?Si el niño saca al azar dos caramelos: a) ¿Cuál es la probabilidad que los dos sean de limón?b) ¿Cuál es la probabilidad que los dos sean de naranja?c) ¿Cuál es la probabilidad que uno sea de sandía y otro de naranja?

En este ejemplo determine: Experimento, Espacio

Muestral, Suceso y probabilidad del Suceso

Page 111: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

111

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

“ “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”

PROBABILIDAD PROBABILIDAD Técnicas de ConteoTécnicas de Conteo- Principio Multiplicativo- Permutaciones- Combinaciones

1.- PRINCIPIO MULTIPLICATIVO

- Suponemos un Experimento que consiste en k etapas o procedimientos, donde la etapa ei puede tener ni posibles resultados, i=1,...k.

- En el experimento, cada una de las formas de efectuar e1 puede ser seguida por cualquiera de los resultados de e2 y así sucesivamente por cualquiera hasta concretar la última etapa del experimento, que es ek.

- Por lo tanto el experimento puede tener (n1 x n2 x … x nk) posibles resultados.

Ejemplo:

1) Sea E= se lanza un dado 2 veces: e1= lanzar el dado por primera vez y e2= lanzar el dado por segunda vez. Los posibles resultados en cada etapa del experimento son: n1=6 y n2= 6. El número posible de resultados es: n1n2= 6 6=36.

Page 112: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

112

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDAD PROBABILIDAD Técnicas de ConteoTécnicas de Conteo- Principio Multiplicativo- Permutaciones- Combinaciones

1.- PRINCIPIO MULTIPLICATIVO

Ejemplo

2) ¿De cuantas formas se puede vestir una persona que tiene 3 pantalones diferentes, 2 camisas distintas y 2 pares de zapatos?.

E= la persona se viste: e1= se pone pantalón, e2= se pone camisa y e3= se pone zapatos . Los posibles resultados en cada etapa del experimento son: n1=3, n2= 2 y n3= 2. El número posible de formas de vestirse es: n1n2 n3 = 3 *2* 2=12.

“ “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”

Page 113: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

113

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDAD PROBABILIDAD Técnicas de ConteoTécnicas de Conteo- Principio Multiplicativo- Permutaciones- Combinaciones

2.- PERMUTACIONES y 3) COMBINACIONES

PERMUTACIÓN: Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.

El Nº de posibles resultados en un experimento es

COMBINACIÓN: Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.

El Nº de posibles resultados en un experimento es

donde n!=1x 2 x 3 x … x (n-1) x n por ejemplo 3!= 1x 2 x 3 = 6

)!(

!

rn

nP

)!(!

!

rnr

nC

“ “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”

Page 114: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

114

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDAD PROBABILIDAD Técnicas de ConteoTécnicas de Conteo- Principio Multiplicativo- Permutaciones- Combinaciones

2.- PERMUTACIONES y 3) COMBINACIONES

PERMUTACIÓN: COMBINACIÓN:

Ejemplo: Se tienen 4 banderas (Roja, Amarilla, Verde Blanca) ¿Cuántas señales se pueden tener mezclando 2

banderas?

Rpta.:

E= de 4 banderas sacar dos banderas y formar señales

EM={RA, AR, RV, VR, RB, BR, AV, VA, AB, BA, VB, BV}

A= la señal tiene una bandera Roja

P(A)= 6/12=0,5

)!(

!

rn

nP

)!(!

!

rnr

nC

1221

4321

)!24(

!4

P

Ejemplo: Hay cuatro personas (Ana, Rosa, Miguel Claudia) ¿Cuántos grupos se pueden tener mezclando 2

personas?

Rpta.:

E= de 4 personas formar grupos de 2

EM={AR, AM, AC, RM, RC, MC}

A= el grupo esta formado sólo por mujeres

P(A)= 3/6=0,5

B= el grupo es mixto

P(B)=3/6=0,5

62

12

)21()21(

4321

)!24(!2

!4

C

“ “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”

Page 115: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

115

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDAD PROBABILIDAD PROBABILIDAD CONDICIONADAPROBABILIDAD CONDICIONADA

-La idea de probabilidad condicionada permite incorporar información relevante para hallar la probabilidad de un suceso.

- La expresión de la probabilidad condicionada es la siguiente:

sabiendo que

es decir, los dos sucesos ocurren al mismo tiempo

Ejemplo: En una población de N mujeres y hombres, donde NM son mujeres y NH son hombres, se sabe que Nc

consumen cierto producto, de los cuales NcM mujeres consumen ese producto.

Experimento: se elige al azar una persona y se le pregunta si consume el producto.

A: la persona consume el producto.

Si sabemos que la persona seleccionada es mujer, la probabilidad de que consuma el producto condicionada a que es mujer se obtiene como sigue:

A: la persona consume el producto; B: la persona es mujer.

Esquemáticamente: Esquemáticamente:

N

NAP c)(

)(

)() ()/(

BP

BAP

P(B)

ByAPBAP

)() ( BAPByAP

)()/()( BPBAPBAP

EE

BBAA )(

)()/(

BP

BAP

N

NN

N

N

NBAP

M

cM

M

cM

)( BA

Page 116: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

116

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDAD PROBABILIDAD REGLA DE BAYESREGLA DE BAYES

- En algunos casos, el espacio muestral de un Experimento se puede partir en varios sucesos, los llamaremos B1, B2, …, Br, incompatibles entre si o excluyentes (no hay intersección), tal como se presenta en el esquema:

- En ese mismo experimento existe un suceso A cualquiera de nuestro interés, representado en el siguiente esquema:

-La probabilidad del suceso A puede calcularse a partir de las probabilidades de A condicionado por los diferentes sucesos B1, B2, …, Br, utilizando la formula de probabilidad total:

-Sobre la base de la formula anterior, se puede calcular la probabilidad de que ocurra el suceso B i (i=1,2,

…,r) dado el suceso A mediante la formula:

BB11 BB22 BB33

BB44BB55

EE

BB66

BB11 BB22 BB33

BB44BB55

EE

BB66

AA

r

iii BPBAPAP

1)()/()(

)(

)( )/(

)(

) (

)(

)y ()/(

AP

BPBAP

AP

ABP

AP

ABPABP iiii

i

Page 117: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

117

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDAD PROBABILIDAD REGLA DE BAYESREGLA DE BAYES

-La probabilidad del suceso A:

-La Prob. que ocurra el sucesoBi (i=1,2,…,r) dado el suceso A:

-EjemploEjemplo: Estudio de la situación laboral de los trabajadores en 4 sectores de la economía, denotados por B1, B2, B3 y B4. a) Interesa determinar la probabilidad que una persona este en paro y b) de que una persona que esta sin trabajo pertenezca al segundo sector

Sea el suceso A: estar sin trabajo (estar en paro)

- La probabilidad de que una persona este sin trabajo en el sector B1 es P(A/B1)=0,05

- La probabilidad de que una persona este sin trabajo en el sector B2 es P(A/B2)=0,01

- La probabilidad de que una persona este sin trabajo en el sector B3 es P(A/B3)=0,02

-La probabilidad de que una persona este sin trabajo en el sector B4 es P(A/B4)=0,1

Se sabe que la mitad de las personas pertenecen al primer sector y y el resto se divide en partes iguales entre los otros 3, por lo tanto:

- La probabilidad de que una persona proceda del sector B1 es P(B1)=0,5

- La probabilidad de que una persona proceda de los sectores B2, B3 y B4 es P(B2) = P(B3) = P(B4) = 0,16

a) La probabilidad que una persona este en paro es:

b) La probabilidad que una persona que está sin trabajo pertenezca al sector 2 (B2) es:

r

iii BPBAPAP

1)()/()(

0458,016,01,05,005,0)/()/()( 41 BAPBAPAP

03,00458,0

16,001,0

)(

)()/()/( 22

2

AP

BPBAPABP

)(

)( )/(

)(

) (

)(

)y ()/(

AP

BPBAP

AP

ABP

AP

ABPABP iiii

i

Page 118: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

118

Introducción a la Estadística

Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

PROBABILIDAD PROBABILIDAD INDEPENDENCIAINDEPENDENCIA- Dos sucesos son independientes cuando la aparición de uno de ellos no modifica la probabilidad de que ocurra el otro. Por lo tanto, dos sucesos A y B son independientesindependientes si:

Si A y B son independientes, entonces:

Ejemplo a: no hay independencia entre los sucesos A y B

Experimento: se lanza dos veces un dado equilibrado.

El suceso A: en el segundo lanzamiento sale un Nº par. El suceso B: La suma de los resultados es al menos 9

-Los elementos de A son {12, 22, 32, 42, 52, 62,14, 24, 34, 44, 54, 64, 16, 26, 36, 46, 56, 66}

-Los elementos de B son { 63, 36, 54, 45, 64, 46, 56, 65, 66, 55}

-Los elementos de A y B son {54, 64, 36, 46, 56, 66}

Por lo tanto: , y Por lo tanto: , y

Ejemplo b: hay independencia entre los sucesos A y B

Experimento: se lanza dos veces una moneda equilibrada donde {CC, CX, XC, XX}

El suceso A: en primer lanzamiento sale cara A={CC, CX}. El suceso B en el segundo sale cara, B={XC,CC}. Que resulte A y B es {CC}.

La P(A)=2/4=0,5 y P(B)=2/4=0,5 y P(AyB)=1/4=0,25 por lo tanto P(AyB)=P(A)xP(B)=0,5 x 0,5 = 0,25

)()/( APBAP

)()()()/()()y ( BPAPBPBAPBAPBAP

36/6)()y ( BAPBAP5,036/12)( AP 36/10)( BP

Page 119: 1 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes

119