la estadística inferencial en el proceso investigativo henry gallardo pérez la ufps soy yo, eres...

141
La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Upload: gustavo-suarez-soto

Post on 25-Jan-2016

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La Estadística Inferencial en el Proceso Investigativo

Henry Gallardo Pérez

La UFPS soy yo, eres tú, somos todos

Page 2: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La UFPS soy yo, eres tú, somos todos

Page 3: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

ObjetivosObjetivos

•Identificar las propiedades de los estimadores y aplicarlas en la solución de problemas•Utilizar métodos formales para realizar estimaciones y pruebas de hipótesis•Establecer criterios de evaluación, especificación y verificación del modelo estadístico•Establecer fundamentos básicos para la toma de decisiones con base en las inferencias obtenidas a partir del modelo

•Identificar las propiedades de los estimadores y aplicarlas en la solución de problemas•Utilizar métodos formales para realizar estimaciones y pruebas de hipótesis•Establecer criterios de evaluación, especificación y verificación del modelo estadístico•Establecer fundamentos básicos para la toma de decisiones con base en las inferencias obtenidas a partir del modelo

Especialización en Estadística AplicadaEstadística Inferencial

Page 4: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Contenidos TemáticosContenidos Temáticos

•Introducción•Población y Muestra•Estimación

•Estimadores

•Estimación puntual

•Estimación por intervalo

•Pruebas de Hipótesis•Pruebas paramétricas

•Pruebas no paramétricas

•Introducción•Población y Muestra•Estimación

•Estimadores

•Estimación puntual

•Estimación por intervalo

•Pruebas de Hipótesis•Pruebas paramétricas

•Pruebas no paramétricas

Especialización en Estadística AplicadaEstadística Inferencial

Page 5: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

BibliografíaBibliografía

•PEÑA SANCHEZ DE RIVERA, DANIEL. Estadística Modelos y Métodos, 1. Fundamentos, Alianza Editorial, Madrid•BICKEL, PETER. Matematical Statistics, Prentice Hall, New Jersey•MENDENHALL, W., SCHEAFFER, WACKERLY. Estadísica Matemática con Aplicaciones, Editorial Iberoamérica, México•WALPOLE, R., R. MYERS, S. MIERS. Probabilidad y Estadística para Ingenieros, Pearson, Ed.

•PEÑA SANCHEZ DE RIVERA, DANIEL. Estadística Modelos y Métodos, 1. Fundamentos, Alianza Editorial, Madrid•BICKEL, PETER. Matematical Statistics, Prentice Hall, New Jersey•MENDENHALL, W., SCHEAFFER, WACKERLY. Estadísica Matemática con Aplicaciones, Editorial Iberoamérica, México•WALPOLE, R., R. MYERS, S. MIERS. Probabilidad y Estadística para Ingenieros, Pearson, Ed.

Especialización en Estadística AplicadaEstadística Inferencial

Page 6: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

¿Para qué sirve la Estadística?¿Para qué sirve la Estadística?

La Ciencia se ocupa en general de fenómenos observablesLa Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyesLos modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico)La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza

La Ciencia se ocupa en general de fenómenos observablesLa Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyesLos modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico)La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza

Especialización en Estadística AplicadaEstadística Inferencial

Page 7: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

¿Para qué sirve la Estadística?¿Para qué sirve la Estadística?

La Estadística es la Ciencia de la

•Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de

•deducir las leyes que rigen esos fenómenos,

•y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

La Estadística es la Ciencia de la

•Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de

•deducir las leyes que rigen esos fenómenos,

•y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

Especialización en Estadística AplicadaEstadística Inferencial

Descrip

tiva

Probabili

dad

Infe

rencia

Page 8: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

DefiniciónDefinición

Estadística es la ciencia de: Recolectar Describir Organizar Interpretar

para transformarlos en información, para la toma mas eficiente de decisiones.

Estadística es la ciencia de: Recolectar Describir Organizar Interpretar

para transformarlos en información, para la toma mas eficiente de decisiones.

Especialización en Estadística AplicadaEstadística Inferencial

Datos

Page 9: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tipos de EstadísticaTipos de Estadística

Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa.

Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra.

Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa.

Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra.

Especialización en Estadística AplicadaEstadística Inferencial

Page 10: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Método Científico y EstadísticaMétodo Científico y Estadística

Especialización en Estadística AplicadaEstadística Inferencial

Teoría o Conocimiento Actual

Observaciones

Resultados

Conclusiones

Hipótesis operativa

Hipótesis conceptual

Identificación de un problema

Diseño

Recolección de datos

Análisis

Interpreta-ción

Generalización

Page 11: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Método Científico y EstadísticaMétodo Científico y Estadística

Especialización en Estadística AplicadaEstadística Inferencial

Plantear hipótesis

Obtenerconclusiones

Recoger datosy analizarlos

Diseñar experimento

Page 12: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Especialización en Estadística AplicadaEstadística Inferencial

Problema realProblema realProblema realProblema real

Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)

Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)

Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)

Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)

Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)

Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)

Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios

Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios

Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)

Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)

Page 13: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Especialización en Estadística AplicadaEstadística Inferencial

Contrastes de SimplificaciónContrastes de Simplificación(Contrastes de hipótesis)(Contrastes de hipótesis)

Crítica y Diagnosis del ModeloCrítica y Diagnosis del Modelo(Análisis de datos)(Análisis de datos)

Nuevo Conocimiento Nuevo Conocimiento

PrevisionesPrevisiones DecisionesDecisiones

Page 14: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La UFPS soy yo, eres tú, somos todos

Page 15: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Universo de EstudioUniverso de Estudio

Universo Ideal:

Conjunto sobre el cual el investigador, pretende obtener alguna información.

Sobre el cual recaerán las consecuencias de las decisiones basadas en los resultados de la encuesta

Universo Ideal:

Conjunto sobre el cual el investigador, pretende obtener alguna información.

Sobre el cual recaerán las consecuencias de las decisiones basadas en los resultados de la encuesta

Especialización en Estadística AplicadaEstadística Inferencial

Page 16: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Universo de EstudioUniverso de Estudio

Población Objetivo:

Conjunto de elementos que partiendo del universo ideal puede realmente ser alcanzado por el investigador.

Se obtiene de los ajustes y/o recortes por operatividad, razones políticas, económicas o sociales

Población Objetivo:

Conjunto de elementos que partiendo del universo ideal puede realmente ser alcanzado por el investigador.

Se obtiene de los ajustes y/o recortes por operatividad, razones políticas, económicas o sociales

Especialización en Estadística AplicadaEstadística Inferencial

Page 17: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Universo de EstudioUniverso de Estudio

Marco de Muestreo:

Dispositivo que permite identificar y ubicar los sujetos que toman parte en los diferentes procesos de selección al azar.

Tipos de Marco: Lista o área.

Marco de Muestreo:

Dispositivo que permite identificar y ubicar los sujetos que toman parte en los diferentes procesos de selección al azar.

Tipos de Marco: Lista o área.

Especialización en Estadística AplicadaEstadística Inferencial

Page 18: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Universo de EstudioUniverso de Estudio

Población susceptible de encuesta:

Conjunto de elementos del marco muestral con probabilidad mayor a cero de ser incluidos en la muestra.

Esto, porque el hecho de ubicar los elementos no implica tener acceso a ellos.

Población susceptible de encuesta:

Conjunto de elementos del marco muestral con probabilidad mayor a cero de ser incluidos en la muestra.

Esto, porque el hecho de ubicar los elementos no implica tener acceso a ellos.

Especialización en Estadística AplicadaEstadística Inferencial

Page 19: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Universo de EstudioUniverso de Estudio

La meta del muestrista es encontrar mecanismos que cierren la brecha entre el universo ideal del investigador y la población susceptible de encuesta.

Considerar diferentes marcos de muestreo y planear formas de acceso adecuadas para diversos subconjuntos del universo

La meta del muestrista es encontrar mecanismos que cierren la brecha entre el universo ideal del investigador y la población susceptible de encuesta.

Considerar diferentes marcos de muestreo y planear formas de acceso adecuadas para diversos subconjuntos del universo

Especialización en Estadística AplicadaEstadística Inferencial

Page 20: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Población y MuestraPoblación y Muestra

Población: Conjunto de todas las unidades de análisis de interés para una investigación

Muestra: Subconjunto de la población

Una muestra es representativa si es de un tamaño suficientemente grande y mantiene una estructura similar a la de la población

Población: Conjunto de todas las unidades de análisis de interés para una investigación

Muestra: Subconjunto de la población

Una muestra es representativa si es de un tamaño suficientemente grande y mantiene una estructura similar a la de la población

Especialización en Estadística AplicadaEstadística Inferencial

Page 21: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Población y MuestraPoblación y Muestra

Especialización en Estadística AplicadaEstadística Inferencial

Población

Muestra

Page 22: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Criterios de Inclusión y de exclusiónCriterios de Inclusión y de exclusión

Criterios de inclusión: son las características necesarias para que las unidades de análisis formen parte de la población de estudio.

Criterios de exclusión: son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio.

Criterios de inclusión: son las características necesarias para que las unidades de análisis formen parte de la población de estudio.

Criterios de exclusión: son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio.

Especialización en Estadística AplicadaEstadística Inferencial

Page 23: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Parámetro y EstadísticaParámetro y Estadística

• Parámetro: Es un indicador de la población calculado con base en la información de todas las unidades de análisis

• Estadística: Indicador de la población calculado con base en la información suministrada por la muestra

• Parámetro: Es un indicador de la población calculado con base en la información de todas las unidades de análisis

• Estadística: Indicador de la población calculado con base en la información suministrada por la muestra

Especialización en Estadística AplicadaEstadística Inferencial

Page 24: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Muestra RepresentativaMuestra Representativa

•Reúne las características principales de la población en relación a la variable o condición particular que se estudia, por lo tanto, los resultados y conclusiones obtenidos en esta muestra se pueden generalizar a la población de la cual fue extraída.•La representatividad de una muestra está dada por:

•Su tamaño•El tipo de muestreo que garantiza la inclusión de las variables relevantes presentes en la población

•Reúne las características principales de la población en relación a la variable o condición particular que se estudia, por lo tanto, los resultados y conclusiones obtenidos en esta muestra se pueden generalizar a la población de la cual fue extraída.•La representatividad de una muestra está dada por:

•Su tamaño•El tipo de muestreo que garantiza la inclusión de las variables relevantes presentes en la población

Especialización en Estadística AplicadaEstadística Inferencial

Page 25: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Plan de MuestreoPlan de Muestreo

•Definición concreta y clara de los objetivos de la encuesta o estudio.

•Traducción de los objetivos del estudio en resultados estadísticos.

•Especificación de la Población Objetivo.

•Construcción, revisión del marco muestral.

•Inventario de Recursos disponibles.

•Definición concreta y clara de los objetivos de la encuesta o estudio.

•Traducción de los objetivos del estudio en resultados estadísticos.

•Especificación de la Población Objetivo.

•Construcción, revisión del marco muestral.

•Inventario de Recursos disponibles.

Especialización en Estadística AplicadaEstadística Inferencial

Page 26: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Plan de MuestreoPlan de Muestreo

•Especificaciones de los acuerdos necesarios con el usuario.

•Especificaciones de los métodos de recolección de Información, elaboración de los instrumentos de recolección, cuestionarios, manuales, capacitación, mapas.

•Especificación del diseño muestral, mecanismos de selección, varianza de los estimadores.

•Especificaciones de los acuerdos necesarios con el usuario.

•Especificaciones de los métodos de recolección de Información, elaboración de los instrumentos de recolección, cuestionarios, manuales, capacitación, mapas.

•Especificación del diseño muestral, mecanismos de selección, varianza de los estimadores.

Especialización en Estadística AplicadaEstadística Inferencial

Page 27: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Plan de MuestreoPlan de Muestreo

•Determinación del tipo de procesamiento a realizar, critica e imputación.

•Especificación de las fórmulas de estimación y de las medidas de calidad.

•Planear el trabajo de campo

•Diseño del plan de control y evaluación.

•Determinación del tipo de procesamiento a realizar, critica e imputación.

•Especificación de las fórmulas de estimación y de las medidas de calidad.

•Planear el trabajo de campo

•Diseño del plan de control y evaluación.

Especialización en Estadística AplicadaEstadística Inferencial

Page 28: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Investigación Total y ParcialInvestigación Total y Parcial

Dependiendo del objetivo que se persiga, puede realizarse una investigación exhaustiva o una parcial. • EXHAUSTIVA: Se observan todas las unidades que constituyen la población o universo, objeto de investigación. • La enumeración total de toda la población en un tiempo dado, recibe el nombre de CENSO (censo de población, de industria manufacturera de tiendas del sector agropecuario, de establecimientos educativos, etc.)

Dependiendo del objetivo que se persiga, puede realizarse una investigación exhaustiva o una parcial. • EXHAUSTIVA: Se observan todas las unidades que constituyen la población o universo, objeto de investigación. • La enumeración total de toda la población en un tiempo dado, recibe el nombre de CENSO (censo de población, de industria manufacturera de tiendas del sector agropecuario, de establecimientos educativos, etc.)

Especialización en Estadística AplicadaEstadística Inferencial

Page 29: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Cuándo no se recomienda un censoCuándo no se recomienda un censo

• Cuando la población sea infinita. • Cuando aún siendo finita es muy numerosa• Por motivos de tiempo• Cuando el costo es superior a los recursos disponibles• Cuando la observación implique destrucción de los elementos.• Cuando se desea obtener información especializada.• Cuando la característica sea homogénea

• Cuando la población sea infinita. • Cuando aún siendo finita es muy numerosa• Por motivos de tiempo• Cuando el costo es superior a los recursos disponibles• Cuando la observación implique destrucción de los elementos.• Cuando se desea obtener información especializada.• Cuando la característica sea homogénea

Especialización en Estadística AplicadaEstadística Inferencial

Page 30: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Error en la InvestigaciónError en la Investigación

Especialización en Estadística AplicadaEstadística Inferencial

Error de

M uestreo

S ust itución de la inf ormación

M edición - A nálisis de datos

Defi nición de la población

Estructura de la muestra

Errores del

I nvest igador

S elección de los entrevistados

Preguntar

Registro

Engaño

Errores del

Entrevistador

I ncapacidad

Falta de voluntad

Errores del

Entrevistado

Error en la Respuesta Error de no Respuesta

Error N o de

muestreo

ERRO R T O T A L

Page 31: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

VariablesVariables

•Una variable es un aspecto, rasgo, cualidad o característica de un sujeto, objeto o fenómeno que, por su misma naturaleza, tiende a variar o a adoptar distintas magnitudes, medibles cuantitativamente o cualitativamente •Son manifestaciones de la realidad. Por intermedio de ellas podemos conocer y medir la realidad, el hecho o fenómeno. •La información que disponemos de cada individuo es resumida en variables

•Una variable es un aspecto, rasgo, cualidad o característica de un sujeto, objeto o fenómeno que, por su misma naturaleza, tiende a variar o a adoptar distintas magnitudes, medibles cuantitativamente o cualitativamente •Son manifestaciones de la realidad. Por intermedio de ellas podemos conocer y medir la realidad, el hecho o fenómeno. •La información que disponemos de cada individuo es resumida en variables

Especialización en Estadística AplicadaEstadística Inferencial

Page 32: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Variables de InterésVariables de Interés

Existe una diferencia importante entre la variable ideal del investigador y la variable operacional, es decir aquella que está en condiciones de ser observada y ser objeto de medición.

Encontrar la forma en que la variable operacional refleje lo más cercanamente posible el concepto que el investigador pretende estudiar.

Existe una diferencia importante entre la variable ideal del investigador y la variable operacional, es decir aquella que está en condiciones de ser observada y ser objeto de medición.

Encontrar la forma en que la variable operacional refleje lo más cercanamente posible el concepto que el investigador pretende estudiar.

Especialización en Estadística AplicadaEstadística Inferencial

Page 33: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Operacionalización de VariablesOperacionalización de Variables

Especialización en Estadística AplicadaEstadística Inferencial

Page 34: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Características de las VariablesCaracterísticas de las Variables

1. Ser parte de un todo: El conjunto de variables constituye el todo objeto de la investigación; o el todo, con fines de análisis investigativo, se descompone en variables, cuya estructura y evolución hay que estudiar.

2. Ser observable.- directa o indirectamente.

3. Ser susceptibles de variación cuantitativa o cualitativa: ser una magnitud en proceso.

1. Ser parte de un todo: El conjunto de variables constituye el todo objeto de la investigación; o el todo, con fines de análisis investigativo, se descompone en variables, cuya estructura y evolución hay que estudiar.

2. Ser observable.- directa o indirectamente.

3. Ser susceptibles de variación cuantitativa o cualitativa: ser una magnitud en proceso.

Especialización en Estadística AplicadaEstadística Inferencial

Page 35: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Funciones de las Variables en el Proceso de Investigación

Funciones de las Variables en el Proceso de Investigación

1. Analiza la realidad objeto de investigación.Para conocer la realidad, hay que seguir un proceso analítico, descomponiéndola en variables. Un esfuerzo de síntesis posterior será restituir el todo.

1. Analiza la realidad objeto de investigación.Para conocer la realidad, hay que seguir un proceso analítico, descomponiéndola en variables. Un esfuerzo de síntesis posterior será restituir el todo.

Especialización en Estadística AplicadaEstadística Inferencial

Page 36: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Funciones de las Variables en el Proceso de Investigación

Funciones de las Variables en el Proceso de Investigación

2. Orienta el establecimiento de indicadores. Un riesgo que constantemente se vive en el proceso de investigación es el de dudar. Este riesgo se supera si se tienen establecidas las variables, las que provienen de un marco teórico bien fundamentado. De las variables determinadas provienen las indicaciones, que nos señalan cual es la información que necesitamos para llegar a conclusiones científicas.

2. Orienta el establecimiento de indicadores. Un riesgo que constantemente se vive en el proceso de investigación es el de dudar. Este riesgo se supera si se tienen establecidas las variables, las que provienen de un marco teórico bien fundamentado. De las variables determinadas provienen las indicaciones, que nos señalan cual es la información que necesitamos para llegar a conclusiones científicas.

Especialización en Estadística AplicadaEstadística Inferencial

Page 37: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Funciones de las Variables en el Proceso de Investigación

Funciones de las Variables en el Proceso de Investigación

3. Permiten descubrir las fuentes de información.Las variables e indicadores nos señalan cuál es la información que necesitamos y donde podemos encontrarla.

3. Permiten descubrir las fuentes de información.Las variables e indicadores nos señalan cuál es la información que necesitamos y donde podemos encontrarla.

Especialización en Estadística AplicadaEstadística Inferencial

Page 38: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Funciones de las Variables en el Proceso de Investigación

Funciones de las Variables en el Proceso de Investigación

4. Miden el grado de variabilidad del problema de investigación.Todo está en permanente movimiento, al momento de investigar se debe identificar el ritmo de este movimiento en el fenómeno o hecho de investigación.

4. Miden el grado de variabilidad del problema de investigación.Todo está en permanente movimiento, al momento de investigar se debe identificar el ritmo de este movimiento en el fenómeno o hecho de investigación.

Especialización en Estadística AplicadaEstadística Inferencial

Page 39: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Clases de VariablesClases de Variables

Existen innumerables tipos de variables, vamos a describir las más útiles:

I.- Según como se expresan los valores o por naturaleza de su medición pueden ser:a) Categórica – cualitativa b) Cuantitativa – numérica

Variable discreta o discontinua Variable continua

Existen innumerables tipos de variables, vamos a describir las más útiles:

I.- Según como se expresan los valores o por naturaleza de su medición pueden ser:a) Categórica – cualitativa b) Cuantitativa – numérica

Variable discreta o discontinua Variable continua

Especialización en Estadística AplicadaEstadística Inferencial

Page 40: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Clases de VariablesClases de Variables

II.- Según la búsqueda de obtener explicación causal del problema o fenómeno estudiado o la relación entre las mismas variables.

a) Variable independiente b) Variable dependiente.c) Variable interviniente d) Variable de control e) Variables de confusión

II.- Según la búsqueda de obtener explicación causal del problema o fenómeno estudiado o la relación entre las mismas variables.

a) Variable independiente b) Variable dependiente.c) Variable interviniente d) Variable de control e) Variables de confusión

Especialización en Estadística AplicadaEstadística Inferencial

Page 41: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Escalas de MediciónEscalas de Medición

Escalas de medición de variables:Escala nominalEscala ordinal.Escala de intervalo.Escala de razón

Escalas de medición de variables:Escala nominalEscala ordinal.Escala de intervalo.Escala de razón

Especialización en Estadística AplicadaEstadística Inferencial

Page 42: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Escalas de MediciónEscalas de Medición

Escala Nominal: Es la escala más rudimentaria donde los objetos se distinguen con base en su nombre, en ocasiones dado por un número

Escala Ordinal: Las mediciones sólo indican orden (“ranking”). Los objetos se distinguen con base en una cantidad relativa de una característica que poseen

Escala de Intervalo: Cuando las diferencias entre objetos tiene sentido, es decir que la unidad de medida es fija. Generalmente tienen un cero, aunque este es arbitrario

Escala de Razón: Cuando; además de los anterior, los cocientes (razones) de valores tienen sentido, la escala es racional. El cero es absoluto en esta escala.

Escala Nominal: Es la escala más rudimentaria donde los objetos se distinguen con base en su nombre, en ocasiones dado por un número

Escala Ordinal: Las mediciones sólo indican orden (“ranking”). Los objetos se distinguen con base en una cantidad relativa de una característica que poseen

Escala de Intervalo: Cuando las diferencias entre objetos tiene sentido, es decir que la unidad de medida es fija. Generalmente tienen un cero, aunque este es arbitrario

Escala de Razón: Cuando; además de los anterior, los cocientes (razones) de valores tienen sentido, la escala es racional. El cero es absoluto en esta escala.

Especialización en Estadística AplicadaEstadística Inferencial

Page 43: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tipos de Variables y Escalas de Medición

Tipos de Variables y Escalas de Medición

Especialización en Estadística AplicadaEstadística Inferencial

N om in a l

O rd in a l

E sca la d e m ed ic ió n

C u a lita t iva o A trib u to

In te rva lo

R azó n

E sca la d e m ed ic ió n

D isc re ta

C on tin u a

C u an tita tiva o N ú m erica

V ariab les

Page 44: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La UFPS soy yo, eres tú, somos todos

Page 45: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Inferencia EstadísticaInferencia Estadística

Estimación: Aproximación del valor del parámetro poblacional a partir de la estadística calculada con base en la información de la muestra

Prueba de Hipótesis: Con base en los resultados obtenidos a partir de la información de la muestra se acepta o rechaza una afirmación acerca de uno o varios parámetros o sobre la forma de la distribución

Estimación: Aproximación del valor del parámetro poblacional a partir de la estadística calculada con base en la información de la muestra

Prueba de Hipótesis: Con base en los resultados obtenidos a partir de la información de la muestra se acepta o rechaza una afirmación acerca de uno o varios parámetros o sobre la forma de la distribución

Especialización en Estadística AplicadaEstadística Inferencial

Page 46: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Características de un Buen Estimador

Características de un Buen Estimador

Insesgado: Si el valor esperado del mismo es igual al parámetro poblacional.Eficiente: Se refiere a lo cerca que se encuentre el valor estimado del parámetro.Consistente: Se obtiene cuando el tamaño de la muestra se incrementa en tal forma que la varianza disminuya.Suficiente: Es un estimador que utiliza toda la información que posee una muestra para estimar el parámetro.

Insesgado: Si el valor esperado del mismo es igual al parámetro poblacional.Eficiente: Se refiere a lo cerca que se encuentre el valor estimado del parámetro.Consistente: Se obtiene cuando el tamaño de la muestra se incrementa en tal forma que la varianza disminuya.Suficiente: Es un estimador que utiliza toda la información que posee una muestra para estimar el parámetro.

Especialización en Estadística AplicadaEstadística Inferencial

Page 47: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

HipótesisHipótesis

Hipótesis: Afirmación o conjetura acerca de una o más poblaciones

Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis

La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla

El rechazo implica que la evidencia de la muestra refuta la hipótesis

Hipótesis: Afirmación o conjetura acerca de una o más poblaciones

Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis

La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla

El rechazo implica que la evidencia de la muestra refuta la hipótesis

Especialización en Estadística AplicadaEstadística Inferencial

Page 48: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La UFPS soy yo, eres tú, somos todos

Page 49: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

EstimadorEstimador

Regla que establece cómo calcular una estimación basada en las mediciones contenidas en la muestra.

Cualesquier estadística (función de variables aleatorias) observable, que es también una variable aleatoria, cuyos valores se usan para estimar un parámetro θ o una función del parámetro θ.

Regla que establece cómo calcular una estimación basada en las mediciones contenidas en la muestra.

Cualesquier estadística (función de variables aleatorias) observable, que es también una variable aleatoria, cuyos valores se usan para estimar un parámetro θ o una función del parámetro θ.

Especialización en Estadística AplicadaEstadística Inferencial

Page 50: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Propiedades: 1. InsesgamientoPropiedades: 1. Insesgamiento

es estimador insesgado de si

En caso contrario, es sesgado

Ejemplos

es estimador insesgado de si

En caso contrario, es sesgado

Ejemplos

Especialización en Estadística AplicadaEstadística Inferencial

ˆE

ˆˆ ESesgo

XE 22 SE

Page 51: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Cuadrado Medio del ErrorCuadrado Medio del Error

Especialización en Estadística AplicadaEstadística Inferencial

2ˆˆ ECME

ˆvarˆˆ 2 sesgoCME

Page 52: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Propiedades: 2. ConsistenciaPropiedades: 2. Consistencia

Si se aumenta el tamaño de la muestra, se espera que el valor del estimador se acerque al verdadero valor

Un estimador es un estimador consistente de si converge estocásticamente a cuando

Si se aumenta el tamaño de la muestra, se espera que el valor del estimador se acerque al verdadero valor

Un estimador es un estimador consistente de si converge estocásticamente a cuando

Especialización en Estadística AplicadaEstadística Inferencial

n

Page 53: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Propiedades: 2. ConsistenciaPropiedades: 2. Consistencia

converge estocásticamente a cuando si para dos números positivos arbitrariamente pequeños, se puede tomar una muestra suficientemente grande tal que

es estimador consistente de

converge estocásticamente a cuando si para dos números positivos arbitrariamente pequeños, se puede tomar una muestra suficientemente grande tal que

es estimador consistente de

Especialización en Estadística AplicadaEstadística Inferencial

ˆP

n ,

X

Page 54: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Desigualdad de ChebyshevDesigualdad de Chebyshev

Sea X una variable aleatoria continua con función de densidad de probabilidad , media , varianza Para dado:

Sea X una variable aleatoria continua con función de densidad de probabilidad , media , varianza Para dado:

Especialización en Estadística AplicadaEstadística Inferencial

f

2

1

XP

02

2

11

XP

Page 55: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Propiedades: 3. Eficiencia (precisión)Propiedades: 3. Eficiencia (precisión)

es un estimador eficiente de si:

• se aproxima a la normal cuando

• Para cualesquier otro estimador para el cual se aproxime a la normal se cumple que

La eficiencia de respecto a está dada por

es un estimador eficiente de si:

• se aproxima a la normal cuando

• Para cualesquier otro estimador para el cual se aproxime a la normal se cumple que

La eficiencia de respecto a está dada por

Especialización en Estadística AplicadaEstadística Inferencial

ˆn 2,0 N

n

ˆ ˆn

2,0 N 22

ˆ 2

2

Ef

Page 56: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Propiedades: 4. SuficienciaPropiedades: 4. Suficiencia

es un estimador suficiente de :

• Si aporta toda la posible información que le provee la muestra

• Si y sólo si la distribución condicional de dado no depende de

• Si se conoce ya se tiene toda la información de

es un estimador suficiente de :

• Si aporta toda la posible información que le provee la muestra

• Si y sólo si la distribución condicional de dado no depende de

• Si se conoce ya se tiene toda la información de

Especialización en Estadística AplicadaEstadística Inferencial

nXXX ,...,, 21

Page 57: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Criterio de factorizaciónCriterio de factorización

Se emplea para encontrar estimadores suficientes

Sea una muestra aleatoria de tamaño n de una densidad , donde el parámetro puede ser un vector

Una estadística es suficiente si y sólo si la densidad conjunta de (la cual es, )

se puede escribir así:

Se emplea para encontrar estimadores suficientes

Sea una muestra aleatoria de tamaño n de una densidad , donde el parámetro puede ser un vector

Una estadística es suficiente si y sólo si la densidad conjunta de (la cual es, )

se puede escribir así:

Especialización en Estadística AplicadaEstadística Inferencial

nXXX ,...,, 21

f

nXXXT ,...,, 21

nXXX ,...,, 21

n

iixf

1

;

Page 58: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Criterio de factorizaciónCriterio de factorización

donde es no negativa y no envuelve el parámetro y la función es no negativa y depende de y la estadística

donde es no negativa y no envuelve el parámetro y la función es no negativa y depende de y la estadística

Especialización en Estadística AplicadaEstadística Inferencial

nnnXXX XXXtgXXXhXXXfn

,...,,,*,...,,,...,, 212121,...,, 21

hg

nXXXt ,...,, 21

Page 59: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Propiedades: 5. Robustez (resistencia)

Propiedades: 5. Robustez (resistencia)

es un estimador robusto de :

si continúa siendo razonablemente bueno como estimador de si el modelo experimenta una pequeña modificación

• Los estimadores robustos no son tan eficientes como los óptimos cuando el modelo es correcto, pero el cambio en sus propiedades es leve ante contaminaciones o alteraciones en la función de densidad de la variable

es un estimador robusto de :

si continúa siendo razonablemente bueno como estimador de si el modelo experimenta una pequeña modificación

• Los estimadores robustos no son tan eficientes como los óptimos cuando el modelo es correcto, pero el cambio en sus propiedades es leve ante contaminaciones o alteraciones en la función de densidad de la variable

Especialización en Estadística AplicadaEstadística Inferencial

Page 60: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Función de verosimilitudFunción de verosimilitud

La función de verosimilitud de n variables aleatorias se define como la densidad conjunta de las n variables, esto es: , la cual se considera como una función de

En particular, si es una muestra aleatoria de , entonces la función de verosimilitud es

La función de verosimilitud de n variables aleatorias se define como la densidad conjunta de las n variables, esto es: , la cual se considera como una función de

En particular, si es una muestra aleatoria de , entonces la función de verosimilitud es

Especialización en Estadística AplicadaEstadística Inferencial

f

nXXX ,...,, 21

,,...,, 21,...,, 21 nXXX XXXf

n

n

iiXfXL

1

,

nXXXX ,...,, 21

Page 61: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Método de máxima verosimilitudMétodo de máxima verosimilitud

Un estimador máximo verosímil satisfaceUn estimador máximo verosímil satisface

Especialización en Estadística AplicadaEstadística Inferencial

0

,

XL

0

,ln

XL

Page 62: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La UFPS soy yo, eres tú, somos todos

Page 63: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos ProbabilísticosModelos Probabilísticos

El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.

En estos casos aparece la noción de variable aleatoria: Función que asigna a cada suceso un número.

Las variables aleatorias pueden ser discretas o continuas.

El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.

En estos casos aparece la noción de variable aleatoria: Función que asigna a cada suceso un número.

Las variables aleatorias pueden ser discretas o continuas.

Especialización en Estadística AplicadaEstadística Inferencial

Page 64: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

Función de masa (v. a. discreta)

Modelos Probabilísticos

Función de masa (v. a. discreta)

Asigna a cada posible valor de una variable discreta su probabilidad.

EjemploNúmero de caras al lanzar 3 monedas.

Asigna a cada posible valor de una variable discreta su probabilidad.

EjemploNúmero de caras al lanzar 3 monedas.

Especialización en Estadística AplicadaEstadística Inferencial

0%

5%

10%

15%

20%

25%

30%

35%

40%

0 1 2 3

Page 65: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

Función de densidad (v. a. continua)

Modelos Probabilísticos

Función de densidad (v. a. continua)

Definición•Es una función no negativa •Su integral (el área bajo la curva) es 1.

Puede verse como la generalización del histograma de frecuencias relativas para variables continuas.

Definición•Es una función no negativa •Su integral (el área bajo la curva) es 1.

Puede verse como la generalización del histograma de frecuencias relativas para variables continuas.

Especialización en Estadística AplicadaEstadística Inferencial

Page 66: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

¿para qué sirve la función de densidad?

Modelos Probabilísticos

¿para qué sirve la función de densidad?

Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas sus funciones de densidad de probabilidad

Identificamos la probabilidad de que la v. a. tome valores en un intervalo con el área bajo la función de densidad.

Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas sus funciones de densidad de probabilidad

Identificamos la probabilidad de que la v. a. tome valores en un intervalo con el área bajo la función de densidad.

Especialización en Estadística AplicadaEstadística Inferencial

Page 67: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

Función de Distribución

Modelos Probabilísticos

Función de Distribución

•Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.•La generalización de las frecuencias acumuladas.

A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.

•La encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…

•Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.•La generalización de las frecuencias acumuladas.

A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.

•La encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…

Especialización en Estadística AplicadaEstadística Inferencial

Page 68: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

Distribución Normal o de Gauss

Modelos Probabilísticos

Distribución Normal o de Gauss

Aparece de manera natural:Errores de medida.Distancia de frenado. Altura, peso, CI, Pruebas de estado, … Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5).

Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ.Su función de densidad es:

Aparece de manera natural:Errores de medida.Distancia de frenado. Altura, peso, CI, Pruebas de estado, … Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5).

Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ.Su función de densidad es:

Especialización en Estadística AplicadaEstadística Inferencial

2

2

1

2

1)(

x

exf

Page 69: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

N(μ, σ2): Interpretación Geométrica

Modelos Probabilísticos

N(μ, σ2): Interpretación Geométrica

La media se interpreta como un factor de traslación.

La desviación estándar como un factor de escala, grado de dispersión,

La media se interpreta como un factor de traslación.

La desviación estándar como un factor de escala, grado de dispersión,

Especialización en Estadística AplicadaEstadística Inferencial

Page 70: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

N(μ, σ2): Interpretación Probabilística

Modelos Probabilísticos

N(μ, σ2): Interpretación Probabilística

Entre la media y una desviación estándar tenemos siempre la misma probabilidad: aprox. 68%

Entre la media y dos desviaciones estándar aprox. 95%

Entre la media y una desviación estándar tenemos siempre la misma probabilidad: aprox. 68%

Entre la media y dos desviaciones estándar aprox. 95%

Especialización en Estadística AplicadaEstadística Inferencial

Page 71: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

Algunas características de N(μ, σ2)

Modelos Probabilísticos

Algunas características de N(μ, σ2)

La función de densidad es simétrica, mesocúrtica y unimodal.

Media, mediana y moda coinciden.Los puntos de inflexión de la función de densidad están a distancia σ de μ.Si tomamos intervalos centrados en μ, y cuyos extremos están…

a distancia σ, tenemos probabilidad 68,26%a distancia 2 σ, tenemos probabilidad 95,45%a distancia 3 σ tenemos probabilidad 99,73%

No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.Todas las distribuciones normales N(μ, σ2), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal estandarizada o tipificada.

La función de densidad es simétrica, mesocúrtica y unimodal.

Media, mediana y moda coinciden.Los puntos de inflexión de la función de densidad están a distancia σ de μ.Si tomamos intervalos centrados en μ, y cuyos extremos están…

a distancia σ, tenemos probabilidad 68,26%a distancia 2 σ, tenemos probabilidad 95,45%a distancia 3 σ tenemos probabilidad 99,73%

No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.Todas las distribuciones normales N(μ, σ2), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal estandarizada o tipificada.

Especialización en Estadística AplicadaEstadística Inferencial

Page 72: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Modelos Probabilísticos

Estandarización o Tipificación

Modelos Probabilísticos

Estandarización o Tipificación

Dada una variable de media μ y desviación estándar σ, se denomina valor tipificado o valor estandarizado, z, de una observación x, a la distancia (con signo) con respecto a la media, medida en desviaciones estándar, es decir

En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ2), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo (acumulada).

Nos permite así comparar entre valores de distribuciones normales diferentes

Dada una variable de media μ y desviación estándar σ, se denomina valor tipificado o valor estandarizado, z, de una observación x, a la distancia (con signo) con respecto a la media, medida en desviaciones estándar, es decir

En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ2), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo (acumulada).

Nos permite así comparar entre valores de distribuciones normales diferentes

Especialización en Estadística AplicadaEstadística Inferencial

x

z

Page 73: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

EjemploEjemplo

Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico.

El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1).El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,102).

SoluciónNo podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos estandarizar y observar las puntuaciones sobre una distribución de referencia N(0,1)

Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.

Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico.

El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1).El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,102).

SoluciónNo podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos estandarizar y observar las puntuaciones sobre una distribución de referencia N(0,1)

Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.

Especialización en Estadística AplicadaEstadística Inferencial

110

7080

21

68

B

xz

xz

BBB

A

AAA

Page 74: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Distribución NormalDistribución Normal

Especialización en Estadística AplicadaEstadística Inferencial

2

2

1

2

1)(

Z

ezf

zy

dyzZPzF e2

2

1

2

1

12

1 2

2

111 dzZPF

z

e

Page 75: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Distribución NormalDistribución Normal

Especialización en Estadística AplicadaEstadística Inferencial

Resultados ECAES Ingeniería de Sistemas, Año 2003

Resultados ECAES Ingeniería de Sistemas, Año 2004

Page 76: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

¿Por qué es importante la distribución normal?

¿Por qué es importante la distribución normal?

Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante.

La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar es posible que posean una distribución normal.

Es decir, tengan las distribución que tengan nuestros datos, los ‘objetos’ que resumen la información de una muestra, posiblemente pueden tener distribución normal (o una distribución asociada).

Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante.

La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar es posible que posean una distribución normal.

Es decir, tengan las distribución que tengan nuestros datos, los ‘objetos’ que resumen la información de una muestra, posiblemente pueden tener distribución normal (o una distribución asociada).

Especialización en Estadística AplicadaEstadística Inferencial

Page 77: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La distribución de la Media Aritmética Muestral

La distribución de la Media Aritmética Muestral

Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo 150-190.

Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación estándar.

Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo 150-190.

Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación estándar.

Especialización en Estadística AplicadaEstadística Inferencial

Page 78: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La distribución de la Media Aritmética MuestralLa distribución de la Media Aritmética Muestral

A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio.

Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral.

Observemos que las nuevas cantidades están más o menos cerca de la media de la variable original.

Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable.

A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio.

Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral.

Observemos que las nuevas cantidades están más o menos cerca de la media de la variable original.

Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable.

Especialización en Estadística AplicadaEstadística Inferencial

MuestraMuestra

1ª1ª 2ª2ª 3ª3ª185185 190190 179179

174174 169169 163163

167167 170170 167167

160160 159159 152152

172172 179179 178178

183183 175175 183183

188188 159159 155155

178178 152152 165165

152152 185185 185185

175175 152152 152152

173 169 168 …

Page 79: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La distribución de la Media Aritmética MuestralLa distribución de la Media Aritmética Muestral

La distribución de los promedios muestrales tiene distribución aproximadamente normal.

La media de esta nueva variable (promedio de la distribución muestral) es muy parecida a la de la variable original.

Las observaciones de la nueva variable están menos dispersas. (Observar el rango).

La desviación estándar es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación estándar de esta nueva variable.

La distribución de los promedios muestrales tiene distribución aproximadamente normal.

La media de esta nueva variable (promedio de la distribución muestral) es muy parecida a la de la variable original.

Las observaciones de la nueva variable están menos dispersas. (Observar el rango).

La desviación estándar es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación estándar de esta nueva variable.

Especialización en Estadística AplicadaEstadística Inferencial

Page 80: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Teorema del Límite CentralTeorema del Límite Central

Dada una v.a. cualquiera, si extraemos muestras de tamaño n, y calculamos los promedios muestrales, entonces:•dichos promedios tienen distribución aproximadamente normal;•La media de los promedios muestrales es la misma que la de la variable original.•La desviación estándar de los promedios disminuye en un factor “raíz de n” (error estándar).Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.

Dada una v.a. cualquiera, si extraemos muestras de tamaño n, y calculamos los promedios muestrales, entonces:•dichos promedios tienen distribución aproximadamente normal;•La media de los promedios muestrales es la misma que la de la variable original.•La desviación estándar de los promedios disminuye en un factor “raíz de n” (error estándar).Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.

Especialización en Estadística AplicadaEstadística Inferencial

Page 81: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Teorema del Límite CentralTeorema del Límite Central

A medida que n aumenta, la distribución de la media se aproxima más a la normalA medida que n aumenta, la distribución de la media se aproxima más a la normal

Especialización en Estadística AplicadaEstadística Inferencial

Page 82: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Distribuciones asociadas a la NormalDistribuciones asociadas a la Normal

Al hacer inferencia estadística, la distribución normal aparece de forma casi inevitable.

Dependiendo del problema, podemos encontrar otras (asociadas):

X2 (chi cuadrado)t - studentF de Fisher

Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.

Al hacer inferencia estadística, la distribución normal aparece de forma casi inevitable.

Dependiendo del problema, podemos encontrar otras (asociadas):

X2 (chi cuadrado)t - studentF de Fisher

Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.

Especialización en Estadística AplicadaEstadística Inferencial

Page 83: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La distribución chi cuadrado La distribución chi cuadrado

Tiene un sólo parámetro denominado grados de libertad.

La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos.

La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad.

Consideraremos atípicos aquellos valores de la variable de la “cola de la derecha”.

Tiene un sólo parámetro denominado grados de libertad.

La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos.

La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad.

Consideraremos atípicos aquellos valores de la variable de la “cola de la derecha”.

Especialización en Estadística AplicadaEstadística Inferencial

Page 84: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La distribución t - studentLa distribución t - student

Tiene un parámetro denominado grados de libertad.

Cuando aumentan los grados de libertad, más se acerca a N(0,1).

Es simétrica con respecto al cero.

Se consideran valores atípicos los que se alejan de cero (positivos o negativos).

Tiene un parámetro denominado grados de libertad.

Cuando aumentan los grados de libertad, más se acerca a N(0,1).

Es simétrica con respecto al cero.

Se consideran valores atípicos los que se alejan de cero (positivos o negativos).

Especialización en Estadística AplicadaEstadística Inferencial

Page 85: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La distribución FisherLa distribución Fisher

Tiene dos parámetros denominados grados de libertad.

Sólo toma valores positivos. Es asimétrica positiva.

Se consideran valores atípicos los de la cola de la derecha.

Tiene dos parámetros denominados grados de libertad.

Sólo toma valores positivos. Es asimétrica positiva.

Se consideran valores atípicos los de la cola de la derecha.

Especialización en Estadística AplicadaEstadística Inferencial

Page 86: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La UFPS soy yo, eres tú, somos todos

Page 87: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Estimación por IntervaloEstimación por Intervalo

Una muestra aleatoria de una densidad Dos estadísticas yque satisfacenTal que

Entonces, el intervalo aleatorio:

se llama un intervalo de confianza para

Una muestra aleatoria de una densidad Dos estadísticas yque satisfacenTal que

Entonces, el intervalo aleatorio:

se llama un intervalo de confianza para

Especialización en Estadística AplicadaEstadística Inferencial

nXXX ,...,, 21

f nXXXT ,...,, 211 nXXXT ,...,, 212

21 TT

121 TTP

21,TT

%1001

Page 88: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Estimación por IntervaloEstimación por Intervalo

Alrededor del estimador se construye un intervalo dentro del cual se afirma que está el parámetro, con una cierta probabilidad

Nivel de confianza: (1-α) Probabilidad de que el parámetro esté dentro del intervalo construido alrededor del estimador

Alrededor del estimador se construye un intervalo dentro del cual se afirma que está el parámetro, con una cierta probabilidad

Nivel de confianza: (1-α) Probabilidad de que el parámetro esté dentro del intervalo construido alrededor del estimador

Especialización en Estadística AplicadaEstadística Inferencial

Page 89: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Nivel de ConfianzaNivel de Confianza

Especialización en Estadística AplicadaEstadística Inferencial

2Z 2Z

2

1 - 1 - αα

2

Page 90: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ

(σ conocida)

Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ

(σ conocida)

Confiabilidad (1-α) Intervalo de Confianza:

Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

Confiabilidad (1-α) Intervalo de Confianza:

Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

Especialización en Estadística AplicadaEstadística Inferencial

12/

N

nN

nZX

nZX

2/

Page 91: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ

(σ desconocida)

Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ

(σ desconocida)

Confiabilidad (1-α) Intervalo de Confianza:

Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

Confiabilidad (1-α) Intervalo de Confianza:

Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

Especialización en Estadística AplicadaEstadística Inferencial

12/,1

N

nN

n

StX n

n

StX n 2/,1

Page 92: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Ejemplo 1Ejemplo 1

Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11

11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida.

Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11

11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida.

Especialización en Estadística AplicadaEstadística Inferencial

Page 93: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Ejemplo 1Ejemplo 1

Como σ2 es desconocido, lo estimamos por S2=18,7. Luego, un intervalo de confianza aproximado es:

En consecuencia, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

Como σ2 es desconocido, lo estimamos por S2=18,7. Luego, un intervalo de confianza aproximado es:

En consecuencia, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

Especialización en Estadística AplicadaEstadística Inferencial

Page 94: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Ejemplo 2Ejemplo 2

Una muestra de ocho cigarrillos de cierta marca, arroja los siguientes contenidos de alquitrán:

20, 17, 21, 19, 22, 21, 20 y 16 mg.

Se desea estimar el contenido promedio de alquitrán en los cigarrillos de esta marca, con una confiabilidad de 95%

Una muestra de ocho cigarrillos de cierta marca, arroja los siguientes contenidos de alquitrán:

20, 17, 21, 19, 22, 21, 20 y 16 mg.

Se desea estimar el contenido promedio de alquitrán en los cigarrillos de esta marca, con una confiabilidad de 95%

Especialización en Estadística AplicadaEstadística Inferencial

Page 95: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Ejemplo 2Ejemplo 2

Especialización en Estadística AplicadaEstadística Inferencial

mg 2,09S 5,19 mgX

365,2 t71-8gl 95%-1 7,0.025

8

2,072,36519,5

21,2317,77

73,119,5

Page 96: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Estimación de la diferencia entre dos promedios

Estimación de la diferencia entre dos promedios

Intervalo para µ1-µ2; σ1

2, σ22 conocidas

Intervalo para µ1-µ2; σ1

2=σ22 desconocidas

(poblaciones normales)

Intervalo para µ1-µ2; σ1

2, σ22 conocidas

Intervalo para µ1-µ2; σ1

2=σ22 desconocidas

(poblaciones normales)

Especialización en Estadística AplicadaEstadística Inferencial

21)2/,(21

11X

nnStX p

2.. 21 nnlg

2

11

21

222

2112

nn

SnSnS p

2

22

1

21

2/21Xnn

ZX

Page 97: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Estimación de la diferencia entre dos promedios

Estimación de la diferencia entre dos promedios

Intervalo para µ1-µ2

σ12≠σ2

2 desconocidas

(poblaciones normales)

Intervalo para µ1-µ2

σ12≠σ2

2 desconocidas

(poblaciones normales)

Especialización en Estadística AplicadaEstadística Inferencial

11 2

2

2

22

1

2

1

21

2

2

22

1

21

nnS

nnS

nS

nS

2

22

1

21

)2/,(21Xn

S

n

StX

Page 98: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Ejemplo 3Ejemplo 3

Los siguientes datos corresponden a los resultados en una prueba diagnóstica de una muestra de estudiantes de los cursos 7ºA y 7ºB

7ºA: 83, 64, 87, 75

7ºB: 78, 86, 85, 68, 89, 94

Estime la diferencia entre los promedios para ambos grupos

Los siguientes datos corresponden a los resultados en una prueba diagnóstica de una muestra de estudiantes de los cursos 7ºA y 7ºB

7ºA: 83, 64, 87, 75

7ºB: 78, 86, 85, 68, 89, 94

Estime la diferencia entre los promedios para ambos grupos

Especialización en Estadística AplicadaEstadística Inferencial

Page 99: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Observaciones pareadasObservaciones pareadas

Cada unidad experimental tiene un par de observaciones, una para cada poblaciónCada unidad experimental tiene un par de observaciones, una para cada población

Especialización en Estadística AplicadaEstadística Inferencial

n

St dn )2/,1(d

iii XXD 21

Page 100: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Ejemplo 4Ejemplo 4

Un proyecto de investigación pretende establecer el avance de los estudiantes en manejo de operaciones matemáticas básicas. Para ello se seleccionan 12 estudiantes de 4º grado, se les aplica una prueba diagnóstica y los resultados se comparan con los obtenidos en una prueba similar aplicada al final.

Un proyecto de investigación pretende establecer el avance de los estudiantes en manejo de operaciones matemáticas básicas. Para ello se seleccionan 12 estudiantes de 4º grado, se les aplica una prueba diagnóstica y los resultados se comparan con los obtenidos en una prueba similar aplicada al final.

Especialización en Estadística AplicadaEstadística Inferencial

Page 101: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Ejemplo 4Ejemplo 4

Los resultados fueron:Los resultados fueron:

Especialización en Estadística AplicadaEstadística Inferencial

IniIni 3344

2255

3355

3355

2277

3311

3333

3311

2277

2288

2299

3311

FiFinn

3388

4422

2299

4444

3366

3300

3388

2244

2277

3311

3366

4400

Page 102: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Estimación de una proporciónEstimación de una proporción

Un estimador puntual de la proporción P en un experimento binomial es p=x/n, donde x es el número de éxitos en n ensayos

Intervalo de confianza para estimar P de una muestra grande

Un estimador puntual de la proporción P en un experimento binomial es p=x/n, donde x es el número de éxitos en n ensayos

Intervalo de confianza para estimar P de una muestra grande

Especialización en Estadística AplicadaEstadística Inferencial

n

PQ

n

PPp

12 1,0~ˆˆ

ˆN

nqp

PpZ

Pp

n

qpZp

ˆˆˆ 2/

1

ˆˆˆ 2/

N

nN

n

qpZp

Page 103: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Estimación de la diferencia entre dos proporciones

Estimación de la diferencia entre dos proporciones

Especialización en Estadística AplicadaEstadística Inferencial

2

22

1

112/21

ˆˆˆˆˆˆ

n

qp

n

qpZpp

Page 104: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Estimación de la varianzaEstimación de la varianza

Especialización en Estadística AplicadaEstadística Inferencial

212

2

~1

n

Sn

2

21,1

22

22,1

2 11

nn

SnSn

Page 105: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Estimación de la razón de dos varianzas

Estimación de la razón de dos varianzas

Especialización en Estadística AplicadaEstadística Inferencial

1,1,22

21

21

22

22

22

21

21

2121~

S

S

S

S nnFF

2121 ,,2122

21

22

21

,,222

21 11

FS

S

FS

S

12

21

,,222

21

22

21

,,222

21 1

F

S

S

FS

S

Page 106: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tamaño de la muestra (n)Tamaño de la muestra (n)

Es la decisión mas importante que se debe tomar en una investigación por muestreo.

Una muestra debe ser pequeña a un costo bajo y bastante grande para que el error de muestreo sea admisible.

Algunos creen que el tamaño de la muestra crece indefinidamente a medida que aumenta el tamaño poblacional pero eso no es cierto, ya que existe un punto en el cual el tamaño de la muestra permanece constante, así el tamaño poblacional aumente.

Es la decisión mas importante que se debe tomar en una investigación por muestreo.

Una muestra debe ser pequeña a un costo bajo y bastante grande para que el error de muestreo sea admisible.

Algunos creen que el tamaño de la muestra crece indefinidamente a medida que aumenta el tamaño poblacional pero eso no es cierto, ya que existe un punto en el cual el tamaño de la muestra permanece constante, así el tamaño poblacional aumente.

Especialización en Estadística AplicadaEstadística Inferencial

Page 107: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tamaño de la muestra (n)Tamaño de la muestra (n)

En el calculo del tamaño óptimo se debe tener en cuenta los siguientes componentes:•El error máximo admisible.•El nivel de confianza.•El error de muestreo.•El error de no-muestreo.•La varianza, grado de variabilidad de la característica principal.

En el calculo del tamaño óptimo se debe tener en cuenta los siguientes componentes:•El error máximo admisible.•El nivel de confianza.•El error de muestreo.•El error de no-muestreo.•La varianza, grado de variabilidad de la característica principal.

Especialización en Estadística AplicadaEstadística Inferencial

Page 108: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Error de MuestreoError de Muestreo

Es la diferencia entre el valor poblacional (Parámetro) y la estimación misma (Estadística) obtenida por medio de una muestra aleatoria.

El tamaño óptimo solo se puede conseguir a partir del conocimiento de la población (variabilidad); se debe prefijar el error máximo admisible que representa la precisión mínima a exigir de los resultados y el coeficiente de seguridad ó confianza.

Es la diferencia entre el valor poblacional (Parámetro) y la estimación misma (Estadística) obtenida por medio de una muestra aleatoria.

El tamaño óptimo solo se puede conseguir a partir del conocimiento de la población (variabilidad); se debe prefijar el error máximo admisible que representa la precisión mínima a exigir de los resultados y el coeficiente de seguridad ó confianza.

Especialización en Estadística AplicadaEstadística Inferencial

Page 109: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Error no de muestreoError no de muestreo

Son los errores ajenos al muestreo que no se pueden medir, se consideran como el resultado de instrumentos de medición incorrectos o mal aplicados, cuestionarios mal definidos, errores que comete el entrevistador al efectuar las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas, en otros casos son una mala planeación del trabajo de campo y falta de definición en los estándares de calidad del trabajo de campo.

Son los errores ajenos al muestreo que no se pueden medir, se consideran como el resultado de instrumentos de medición incorrectos o mal aplicados, cuestionarios mal definidos, errores que comete el entrevistador al efectuar las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas, en otros casos son una mala planeación del trabajo de campo y falta de definición en los estándares de calidad del trabajo de campo.

Especialización en Estadística AplicadaEstadística Inferencial

Page 110: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Fuentes potenciales de errorFuentes potenciales de error

•Estimación de la varianza Población•Carencia de Marco de Muestreo•Poblaciones con características Heterogéneas, alta variabilidad.

•Estimación de la varianza Población•Carencia de Marco de Muestreo•Poblaciones con características Heterogéneas, alta variabilidad.

Especialización en Estadística AplicadaEstadística Inferencial

Page 111: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Error totalError total

Variación entre el valor real de la medida en la población de la variable que se estudia y el valor de la medida observada en la investigación.

Variación entre el valor real de la medida en la población de la variable que se estudia y el valor de la medida observada en la investigación.

Especialización en Estadística AplicadaEstadística Inferencial

Page 112: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tamaño de muestra para estimar la media aritmética

Tamaño de muestra para estimar la media aritmética

Cuando se conoce el tamaño poblacional

Cuando el tamaño de la población es desconocido

Cuando se conoce el tamaño poblacional

Cuando el tamaño de la población es desconocido

Especialización en Estadística AplicadaEstadística Inferencial

2

2

SZ

n

222

2

22

2

)1(

NSZ

NSZn

Page 113: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tamaño de muestra para estimar la media aritmética

Tamaño de muestra para estimar la media aritmética

Para obtener una estimación inicial de la desviación estándar se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la desviación estándar obtenida en un estudio anterior

•Estimar inicialmente la desviación estándar a partir de una muestra piloto

•Asumir inicialmente: S=Rango/4 , esto es, asumir que la desviación estándar es aproximadamente igual a la cuarta parte del rango de los datos

Para obtener una estimación inicial de la desviación estándar se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la desviación estándar obtenida en un estudio anterior

•Estimar inicialmente la desviación estándar a partir de una muestra piloto

•Asumir inicialmente: S=Rango/4 , esto es, asumir que la desviación estándar es aproximadamente igual a la cuarta parte del rango de los datos

Especialización en Estadística AplicadaEstadística Inferencial

Page 114: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tamaño de muestra para estimar la proporción

Tamaño de muestra para estimar la proporción

Cuando se conoce el tamaño poblacional

Cuando el tamaño de la población es desconocido

Cuando se conoce el tamaño poblacional

Cuando el tamaño de la población es desconocido

Especialización en Estadística AplicadaEstadística Inferencial

2

2

2)1(

ppZ

n

22

2

2

2

)1()1(

)1(

NppZ

NppZn

Page 115: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tamaño de muestra para estimar la proporción

Tamaño de muestra para estimar la proporción

Para obtener una estimación inicial de la proporción se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la proporción obtenida en un estudio anterior•Estimar inicialmente la proporción a partir de una muestra piloto•Asumir inicialmente: P=0.5 , esto es, asumir que la proporción, o probabilidad de observar el suceso, es del 50%. Con este supuesto se obtiene el máximo valor de p(1-p), lo cual garantiza que se toma una muestra de tamaño ligeramente mayor de lo necesario.

Para obtener una estimación inicial de la proporción se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la proporción obtenida en un estudio anterior•Estimar inicialmente la proporción a partir de una muestra piloto•Asumir inicialmente: P=0.5 , esto es, asumir que la proporción, o probabilidad de observar el suceso, es del 50%. Con este supuesto se obtiene el máximo valor de p(1-p), lo cual garantiza que se toma una muestra de tamaño ligeramente mayor de lo necesario.

Especialización en Estadística AplicadaEstadística Inferencial

Page 116: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

La UFPS soy yo, eres tú, somos todos

Page 117: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

HipótesisHipótesis

¿Qué son las Hipótesis?• Son conjeturas lógicas acerca

de la solución de un problema. • Son explicaciones tentativas

del fenómeno investigado formuladas a manera de proposiciones.

• Nos indican lo que estamos buscando o tratando de probar.

¿Qué son las Hipótesis?• Son conjeturas lógicas acerca

de la solución de un problema. • Son explicaciones tentativas

del fenómeno investigado formuladas a manera de proposiciones.

• Nos indican lo que estamos buscando o tratando de probar.

Especialización en Estadística AplicadaEstadística Inferencial

Page 118: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

HipótesisHipótesis

¿Qué características debe tener una hipótesis?

• Las hipótesis deben referirse a una situación real.

• La relación entre las variables debe de ser clara y verosímil.

• Deben ser medibles y observables.

• Deben estar relacionadas con técnicas disponibles para probarlas.

¿Qué características debe tener una hipótesis?

• Las hipótesis deben referirse a una situación real.

• La relación entre las variables debe de ser clara y verosímil.

• Deben ser medibles y observables.

• Deben estar relacionadas con técnicas disponibles para probarlas.

Especialización en Estadística AplicadaEstadística Inferencial

Page 119: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

HipótesisHipótesis

• Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación.

• Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados

• Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.

• Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación.

• Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados

• Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.

Especialización en Estadística AplicadaEstadística Inferencial

Page 120: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

HipótesisHipótesis

Hipótesis: Afirmación o conjetura acerca de una o más poblaciones

Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis

• La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla• El rechazo implica que la evidencia de la muestra refuta la hipótesis

Hipótesis: Afirmación o conjetura acerca de una o más poblaciones

Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis

• La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla• El rechazo implica que la evidencia de la muestra refuta la hipótesis

Especialización en Estadística AplicadaEstadística Inferencial

Page 121: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Tipos de HipótesisTipos de Hipótesis

Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población

Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0

Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población

Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0

Especialización en Estadística AplicadaEstadística Inferencial

Page 122: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Formulación de HipótesisFormulación de Hipótesis

Partes de una HipótesisVariable 1 y variable 2 o variable

independiente y variable dependiente.

Unidad de análisis. Conectores lógicos

Partes de una HipótesisVariable 1 y variable 2 o variable

independiente y variable dependiente.

Unidad de análisis. Conectores lógicos

Especialización en Estadística AplicadaEstadística Inferencial

Page 123: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Formulación de HipótesisFormulación de Hipótesis

¿Qué tipos de hipótesis hay?• Hipótesis de Investigación. • Hipótesis nula. • Hipótesis alternativas. • Hipótesis “estadísticas”.

¿Qué tipos de hipótesis hay?• Hipótesis de Investigación. • Hipótesis nula. • Hipótesis alternativas. • Hipótesis “estadísticas”.

Especialización en Estadística AplicadaEstadística Inferencial

Page 124: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Formulación de HipótesisFormulación de Hipótesis

Hipótesis de Investigación (Hi)Hipótesis descriptiva del valor de

una variable o variables.Hipótesis de asociaciónHipótesis CorrelacionalesHipótesis que establecen

relaciones de causalidadHipótesis de la diferencia entre

grupos

Hipótesis de Investigación (Hi)Hipótesis descriptiva del valor de

una variable o variables.Hipótesis de asociaciónHipótesis CorrelacionalesHipótesis que establecen

relaciones de causalidadHipótesis de la diferencia entre

grupos

Especialización en Estadística AplicadaEstadística Inferencial

Page 125: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Formulación de HipótesisFormulación de Hipótesis

Hipótesis Nula (H0)Sirven para refutar o negar lo que

afirma la hipótesis de investigación.

Hay tantos tipos de hipótesis nulas como de investigación.

Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.

Hipótesis Nula (H0)Sirven para refutar o negar lo que

afirma la hipótesis de investigación.

Hay tantos tipos de hipótesis nulas como de investigación.

Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.

Especialización en Estadística AplicadaEstadística Inferencial

Page 126: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Formulación de HipótesisFormulación de Hipótesis

Hipótesis alternativas (Ha o H1)Son posibilidades “alternas” ante

las hipótesis de investigación y nula.

Pueden ser más de una. Son las hipótesis que se aceptan

en caso de rechazar la hipótesis nula

Hipótesis alternativas (Ha o H1)Son posibilidades “alternas” ante

las hipótesis de investigación y nula.

Pueden ser más de una. Son las hipótesis que se aceptan

en caso de rechazar la hipótesis nula

Especialización en Estadística AplicadaEstadística Inferencial

Page 127: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Formulación de HipótesisFormulación de Hipótesis

Hipótesis “Estadísticas”.Son las transformaciones de las

hipótesis de investigación, nulas y alternativas en símbolos estadísticos.

• Del valor de una variable• De asociación.• De correlación.• De relaciones causales.• De diferencia de grupos.

Hipótesis “Estadísticas”.Son las transformaciones de las

hipótesis de investigación, nulas y alternativas en símbolos estadísticos.

• Del valor de una variable• De asociación.• De correlación.• De relaciones causales.• De diferencia de grupos.

Especialización en Estadística AplicadaEstadística Inferencial

Page 128: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Prueba de HipótesisPrueba de Hipótesis

Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula

Errores•Error tipo I: Rechazar afirmaciones (H0) verdaderas

•Error tipo II: Aceptar afirmaciones (H1) falsas

Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula

Errores•Error tipo I: Rechazar afirmaciones (H0) verdaderas

•Error tipo II: Aceptar afirmaciones (H1) falsas

Especialización en Estadística AplicadaEstadística Inferencial

Page 129: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Prueba de HipótesisPrueba de Hipótesis

Especialización en Estadística AplicadaEstadística Inferencial

Estado de la Naturaleza

Decisión

Aceptar Ho Rechazar Ho

Ho verdaderaDecisión correcta

Error tipo I

Ho falsaError tipo II Decisión

correcta

Page 130: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Prueba de HipótesisPrueba de Hipótesis

•Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera•Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera

•α = P(E.T.I)•β = p(E.T.II)•Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo

•Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera•Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera

•α = P(E.T.I)•β = p(E.T.II)•Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo

Especialización en Estadística AplicadaEstadística Inferencial

Page 131: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Proceso para Prueba de HipótesisProceso para Prueba de Hipótesis

•Establecer H0: θ = θ0

•Seleccionar H1: H1: θ ≠ θ0 ; H1: θ < θ0 ; H1: θ > θ0

•Seleccionar el nivel de significación: α

•Seleccionar el estadístico de prueba apropiado y establecer la región crítica

•Calcular el valor del estadístico de prueba con los datos muestrales

•Tomar la decisión

•Establecer H0: θ = θ0

•Seleccionar H1: H1: θ ≠ θ0 ; H1: θ < θ0 ; H1: θ > θ0

•Seleccionar el nivel de significación: α

•Seleccionar el estadístico de prueba apropiado y establecer la región crítica

•Calcular el valor del estadístico de prueba con los datos muestrales

•Tomar la decisión

Especialización en Estadística AplicadaEstadística Inferencial

Page 132: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Razonamiento BásicoRazonamiento Básico

Especialización en Estadística AplicadaEstadística Inferencial

4020X

Si supongo que H0 es cierta...

... el resultado del experimento sería improbable. Sin embargo ocurrió.

¿qué hace un científico cuando su teoría no coincide con sus predicciones?

Page 133: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Razonamiento BásicoRazonamiento Básico

Especialización en Estadística AplicadaEstadística Inferencial

4020X

Si supongo que H0 es cierta...

... el resultado del experimento sería improbable. Sin embargo ocurrió.

Rechazo que H0 sea cierta.

Page 134: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Razonamiento BásicoRazonamiento Básico

Especialización en Estadística AplicadaEstadística Inferencial

4038X

Si supongo que H0 es cierta...

... el resultado del experimento es coherente.

• No hay evidencia contra H0

•No se rechaza H0

•El experimento no es concluyente•El contraste no es significativo

¿Si una teoría hace predicciones con éxito, queda probado que es cierta?

Page 135: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Región crítica y nivel de significaciónRegión crítica y nivel de significación

Especialización en Estadística AplicadaEstadística Inferencial

Región crítica• Valores ‘improbables’ si...• Es conocida antes de realizar el

experimento: resultados experimentales que refutarían H0

Nivel de significación: • Número pequeño: 1% , 5%• Fijado de antemano por el

investigador• Es la probabilidad de rechazar

H0 cuando es cierta

No rechazo H0

Reg. Crit.Reg. Crit.

=5%

=40

Page 136: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Contrastes unilateral y bilateralContrastes unilateral y bilateral

Especialización en Estadística AplicadaEstadística Inferencial

La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H1: <40 H1: >40

H1: 40

Page 137: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Significación pSignificación p

Especialización en Estadística AplicadaEstadística Inferencial

H0: =40

Page 138: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Significación pSignificación p

Especialización en Estadística AplicadaEstadística Inferencial

43X

No se rechazaH0: =40

H0: =40

Page 139: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Significación pSignificación p

Especialización en Estadística AplicadaEstadística Inferencial

43X

No se rechazaH0: =40

Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.p es conocido después de realizar el experimento aleatorioEl contraste es no significativo cuando p>

P

P

Page 140: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Significación pSignificación p

Especialización en Estadística AplicadaEstadística Inferencial

50X

Se rechaza H0: =40

Se acepta H1: >40

Page 141: La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres tú, somos todos

Significación pSignificación p

Especialización en Estadística AplicadaEstadística Inferencial

P

P

50X

Se rechaza H0: =40

Se acepta H1: >40

El contraste es estadísticamente significativo cuando p<Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.