guia - imprimir.doc

66
ESCUELA POLITÉCNICA DEL EJÉRCITO MAESTRÍA EN GERENCIA HOSPITALARIA MÓDULO: Estadística - Bioestadística 1. DATOS INFORMATIVOS DEL MÓDULO Nº de horas de trabajo en el aula: 32 Nº de horas de trabajo fuera del aula: 32 créditos: 4 FECHAS HORARIO 1 Sábado 02 y Domingo 03 Junio 2012 08h00 a 18h00 2 Sábado 16 y Domingo 17 Junio 2012 08h00 a 18h00 2. DATOS INFORMATIVOS DEL DOCENTE Nombre y Apellidos: SERGIO ALBERTO CASTILLO PAEZ Formación académica: - Ingeniero matemático, mención Estadística, Finanzas y Gestión Empresarial (Escuela Politécnica Nacional) - Magister en Docencia Universitaria (ESPE) - Especialización Superior en Finanzas (Univ. Andina Simón Bolivar) Experiencia profesional y docente: - Asesor estadístico y financiero en varios proyectos de ingeniería y medio ambiente: CCICEV-EPN, DED-GTZ, Tesalia, Fundación METIS, etc. - Gerente Técnico de la Corporación de Estudios y Desarrollo Cooperativo, coordinando y ejecutando proyectos de capacitación profesional en Panamá, Italia, Argentina, Chile, etc. 1

Upload: vane-poma

Post on 26-Sep-2015

225 views

Category:

Documents


0 download

TRANSCRIPT

ESCUELA POLITCNICA DEL EJRCITO

ESCUELA POLITCNICA DEL EJRCITO

MAESTRA EN GERENCIA HOSPITALARIAMDULO: Estadstica - Bioestadstica

1. DATOS INFORMATIVOS DEL MDULO

N de horas de trabajo en el aula: 32

N de horas de trabajo fuera del aula: 32N crditos: 4

FECHASHORARIO

1Sbado 02 y Domingo 03 Junio 201208h00 a 18h00

2Sbado 16 y Domingo 17

Junio 201208h00 a 18h00

2. DATOS INFORMATIVOS DEL DOCENTE

Nombre y Apellidos: SERGIO ALBERTO CASTILLO PAEZFormacin acadmica:

Ingeniero matemtico, mencin Estadstica, Finanzas y Gestin Empresarial (Escuela Politcnica Nacional) Magister en Docencia Universitaria (ESPE) Especializacin Superior en Finanzas (Univ. Andina Simn Bolivar)Experiencia profesional y docente:

Asesor estadstico y financiero en varios proyectos de ingeniera y medio ambiente: CCICEV-EPN, DED-GTZ, Tesalia, Fundacin METIS, etc.

Gerente Tcnico de la Corporacin de Estudios y Desarrollo Cooperativo, coordinando y ejecutando proyectos de capacitacin profesional en Panam, Italia, Argentina, Chile, etc.

Ha colaborado como docente en varias universidades: Universidad Estatal de Milagro, Universidad Politcnica Salesiana, Universidad Iberoamericana del Ecuador, Universidad Internacional SEK.

Actual docente de la ESPE en el departamento de Ciencias Exactas, en reas de Estadstica.

Facilitador en temas relacionados a la Investigacin Cientfica y Estadstica para docentes en UISEK, UNEMI, ESPE, etc.Telfonos:022-435-825, 099-319-366Direccin electrnica: [email protected]. PRESENTACIN

En toda profesin, en especial en aquellas carreras relacionadas con la salud, es de imperiosa necesidad un correcto manejo de datos e informacin. Esto a su vez, implica conocer, manejar y validar aquellas herramientas y tcnicas que permitan dar confiabilidad, tanto a la recoleccin de informacin como los resultados que suelen encontrarse en estudios e investigaciones relacionadas al rea de la salud. La estadstica, es una ciencia que nos ayuda para estos fines, asegurando un correcto manejo de la informacin y un adecuado anlisis e interpretacin de la misma, permitiendo a travs de tcnicas estadsticas confiables, la toma de decisiones y comprobacin de hiptesis altamente objetiva.

4. OBJETIVOS

GENERAL:

Aplicar eficientemente los conceptos, tcnicas y herramientas estadsticas en actividades afines la gerencia hospitalaria y a la investigacin en salud.ESPECFICOS:

Comprender las nociones estadsticas y su relacin con los procesos de investigacin cientfica Manejar tcnicas estadsticas apropiadas segn el propsito de investigacin

Analizar y sistematizar informacin en funcin de los resultados estadsticos encontrados

5. COMPETENCIAS A DESARROLLAR EN EL POSGRADISTA

El participante al final del mdulo, estar en capacidad de:

Entender el proceso estadstico, sus variables y conceptos: y podr reconocerlos y aplicarlos en problemas de investigacin cientfica y administracin hospitalaria Manejar conjuntos grandes de datos y poder resumir la informacin inherente a los mismos, identificando aspectos relevantes por medio de tcnicas de representacin de datos. Utilizar paquetes informticos para la aplicacin eficiente de herramientas estadsticas que le permitirn asegurar un eficiente control y validacin de la informacin

Interpretar resultados y tomar decisiones con alto grado de confiabilidad y transparencia estadstica6. AGENDA DE TRABAJO

Primer daCONTENIDOS

HORAS

Sbado 02 de Junio de 2012Tema 1: Relacionando los conceptos estadsticos

- El proceso estadstico: Parmetro, poblacin, muestra, estadstico, tipos de datos. La Estadstica Descriptiva e Inferencial respecto a la Investigacin CientficaTema 2: Organizando la informacin: Las tablas y grficos estadsticos

- Las tablas de distribucin de frecuencia- Los histogramas, ojivas y polgonos de frecuencia: su importancia y caractersticas de uso

- Los grficos circulares: cundo se utilizan?RECESO

Tema 3: Resumiendo la informacin: La estadstica descriptiva.

- Las medidas de tendencia central como valores representativos: Promedio, Mediana, Moda. Su seleccin y anlisis

- Las medidas de dispersin: Rango, Varianza y Desviacin estndar. Su interpretacin y anlisis08h00 a 09h30(1 hora, 30 minutos)

09h30 a 13h00

(3 hora, 30 minutos)

13h00 a 14h00

(1 hora)

14h00 a 18h00

(4 horas)

Segundo da HORAS

Domingo 03 de Junio de 2012Primera Evaluacin ParcialTema 4: El manejo de la incertidumbre: Las probabilidades

- Las probabilidades, sus tipos y usos.

- El clculo de probabilidades en funcin de las tablas de frecuencias.

- Las probabilidades respecto a un conjunto: La probabilidad marginal, conjunta y condicionalTema 5: Aplicaciones de probabilidades en excel

- Tablas y grficos dinmicos aplicadosRECESO

Tema 6: Analizando el comportamiento de los datos: Introduccin a las distribuciones de probabilidad

- Que son las distribuciones de probabilidad: ventajas de analizar el comportamiento global

- Distribucin discretas: Binomial- Distribuciones continuas: Caractersticas bsicas

Tema 7: La distribucin normal: El comportamiento comn de los datos por excelencia

- Vdeo: La distribucin normal

- La distribucin Normal: aplicaciones y forma de calcular08h00 a 09h00

(1 hora)

09h00 a 11h00

(2 horas)

11h00 a 13h00

(2 horas)

13h00 a 14h00

(1 hora)

14h00 a 16h00

(2 horas)

16h00 a 18h00

(2 horas)

Tercer da

HORAS

Sbado 16 de

Junio 2012

Evaluacin de orientacin: Revisin de tareas individuales y grupalesTema 8: De la muestra a la poblacin: las distribuciones muestrales

- El comportamiento de los estadsticos muestrales

- El teorema del lmite central

- Aplicaciones para la media y la proporcin poblacional

Tema 9: Las estimaciones por intervalo- Construccin de un intervalo de confianza

- Intervalos de confianza en muestras grandes

- Intervalos de confianza en muestras pequeas

- Intervalos de confianza para proporciones poblacionales

Tema 10: Tcnicas de muestreo

- Introduccin al muestreo- Muestreo probabilstico- Muestreo no probabilsticoRECESOTema 11: Comprobacin de supuestos: Los contrastes de hiptesis- La identificacin del proceso estadstico

- El proceso de las pruebas de hiptesis

- AplicacionesTema 12: Pruebas para una poblacin- Prueba Z: condiciones y anlisis

- Prueba t: condiciones y anlisis

- Pruebas para Proporciones poblacionales

- Pruebas de una y de dos colas08h00 a 08h30

(30 minutos)

08h30 a 10h00

(1 hora, 30 minutos)

10h00 a 12h00(2 horas)

12h00 a 13h00(1 hora)13h00 a 14h00

(1 hora)

14h00 a 15h00

(1 hora)

15h00 a 18h00

(3 horas)

Cuarto da

HORAS

Domingo 17 de Junio de 2012

Segunda evaluacin parcial

Tema 13: Pruebas de comparacin para dos poblaciones- Pruebas para muestreos pareados

- Pruebas para muestreos independientes: Caso 1, 2 y 3- Pruebas de comparacin de proporciones

RECESO

Tema 14: Pruebas Ji cuadrada y Anlisis de Varianza

- Prueba Ji cuadrada

- Pruebas F

- Anlisis de varianza de uno y dos factores

Tema 15: Anlisis de correlaciones y regresiones

- Correlacin lineal

- Regresin lineal

- Proyecciones 08h00 a 09h00

(1 hora)

09h00 a 13h00

(4 horas)

13h00 a 14h00

(1 hora)

14h00 a 16h00

(2 horas)

16h00 a 18h00

(2 horas)

7. METODOLOGA

La metodologa estar basada en principios andraggicos con enfoque al desarrollo de competencias en los tres niveles: cognitivo, procedimental y actitudinal.

Se utilizarn tcnicas como exposiciones magistrales, apoyadas en el uso de TICs con:

Presentaciones en powerpoint

Videos temticos

Consultas bibliogrficas

Batera de preguntas guas Trabajos grupales Resolucin de problemas afines a la temtica del curso

Manejo de Microsoft Excel como paquete informtico estadstico. Trabajos individuales archivos prediseados para aplicacin especfica de las tcnicas a estudiar.

8. POLTICAS DE EVALUACIN- ACREDITACIN-CALIFICACIN

Considerando la siguiente escala de evaluacin, sobre una nota total de 10 puntos:

Puntaje entre:Calificacin

10,0 09,1:

A (Aprobado)

09,0 08,1:

B (Aprobado)

08,0 07,0:

C (Aprobado)

6,99 menosD (Reprobado)

F (reprobado por inasistencia)

En base a esta escala, se realizarn las siguientes actividades de evaluacin: Trabajos grupales: Implican la resolucin de casos prcticos en Excel Trabajos individuales: Es la entrega de consultas y deberes individuales a realizar. Pruebas parciales: Se tomar dos pruebas, cada una de 30 minutos. Trabajo final: Implica la realizacin de un trabajo prctico, con bases de datos generadas para el efecto.La ponderacin de cada actividad es la siguiente:

Trabajos grupales:

2 puntos

Trabajos individuales: 2 puntos

Pruebas parciales:

4 puntos

Trabajo final:

2 puntos

9. BIBLIOGRAFIA

Rus Daz, Barn Lopez, Snchez y Parras, Bioestadstica: Mtodos y aplicaciones,Universidad de Mlaga, Espaa Pardo, Antonio; Ruiz, Miguel ngel y San Martn, Anlisis de datos I en ciencias sociales y de la salud, 2009

Jack Levin, Fundamentos de Estadstica en la investigacin social, Oxford University Press, Mxico

Daniel Pea y Juan Romo, Introduccin a la estadstica para las ciencias sociales, Mc Graw Hill 1997, Espaa

Juan Fernandez Chavesta, Estadstica aplicada: Tcnicas para la investigacin. Parte I 2da edicin. Editorial San Marcos, 1993, Per.

Juan Fernandez Chavesta, Estadstica aplicada: Tcnicas para la investigacin. Parte II 2da edicin. Editorial San Marcos, 1993, Per.

Haroldo Elorza, Estadstica para las ciencias sociales y del comportamiento, 2da edicin, Oxford University Press, Mxico

David Clark-Carter, Investigacin cuantitativa en psicologa, Oxford University Press, 2002, Mxico

R. Sierra Bravo, Diccionario prctico de estadstica, Edit. Paraninfo, 1991, EspaaTEMA 1: RELACIONANDO LOS CONCEPTOS ESTADSTICOS

Objetivo del tema a estudiar: Identificar los conceptos bsicos que definen a la Estadstica, el proceso estadstico y su vinculacin con la investigacin cientfica:

Temas a tratar: El proceso estadstico: Parmetro, poblacin, muestra, estadstico, tipos de datos. La Estadstica Descriptiva e Inferencial respecto al proceso estadstico

1. Qu es La Estadstica?

Es la ciencia que estudia la ordenacin y anlisis de datos muestrales y de las inferencias que se puedan realizar sobre la poblacin.

La Estadstica se suele dividir en las siguientes reas de estudio: Estadstica Descriptiva: Es el estudio de la informacin obtenida a partir de un conjunto de datos Probabilidades: Es el estudio de la incertidumbre y el comportamiento de los datos Estadstica Inferencial: Es el estudio de las comprobaciones de hiptesis y de los comportamientos muestralesIDEA: Para entender como funciona la Estadstica es necesario conocer El Proceso Estadstico

2. PROCESO ESTADSTICO:Poblacin: Es el conjunto total de datos sobre el cual se establecen las mediciones o la informacin a conocer. Debe estar perfectamente delimitado (tiempo, lugar, caractersticas especficas)Parmetro: Es la informacin de la poblacin que se desea conocer

Muestra: Es un subconjunto representativo de la Poblacin

Estimador o estadstico: Es la informacin relativa al parmetro, obtenida a partir de la muestra

Error muestral: Es la diferencia entre el Parmetro y el EstadsticoEl proceso estadstico se basa en lo siguiente: Queremos conocer cierta informacin respecto a la poblacin (parmetro), pero no podemos analizar a TODA la poblacin (por cantidad, tiempo, dinero, etc.) Entonces, debemos tomar una muestra de dicha poblacin y a partir de esa muestra obtener la informacin que queremos conocer (estadstico).Pregunta 1: Cul es la informacin que se suele investigar en una poblacin? Existen varios tipos de parmetros, pero generalmente se trabaja con 2: La media poblacional ( (promedios) y la proporcin poblacional ( (%)Pregunta 2: Cmo se debe medir la informacin? Para medir la informacin, debemos identificar el tipo de dato que se va a obtener al realizar el muestreoTIPOS DE DATOS O VARIABLES

Numricos:Discretos: Se expresan por nmero enterosProcesos de conteo: Nro. Enfermos por paludismo, nro nios desnutridos, etc.

Se expresa por medio de nmerosContinuos: Se expresa por nmeros realesProcesos de medicin: tiempo de reaccin a una vacuna, peso del paciente, etc.

Categricos:Ordinales: Son categoras que tienen un orden implcitoImplican nombre o categoras de escala: Ejm: Bueno, Regular, Malo.

Se expresa por medio de categoras (se miden por %)Nominales: Son categoras que NO tienen orden implcitoImplican nombres o categora sin escala o priorizacin: Sexo, Estado civil, Procedencia, etc.

IDEA: El parmetro es quien determina el tipo de dato que debemos utilizar. Por lo general: Si queremos estimar (, se utilizan datos numricos; Si utilizamos datos categricos, por lo general se trata de estimar (.Estos datos, se obtienen a partir de las muestras, y deben ser organizados, resumidos, representados grficamente y se debe sistematizar toda su informacin. Las tcnicas que se utilizan para este proceso provienen de la Estadstica DescriptivaPregunta 3: Es la informacin obtenida en una muestra igual a la informacin que representa a toda la poblacin? La respuesta es NO. Porque no sabemos que tan confiable es la muestra. La diferencia entre lo que nos dice la muestra y el valor real de la poblacin, es lo que se conoce como Error Muestral.

Se puede decir que La Estadstica es la ciencia de la incertidumbre, eso significa que nunca estaremos 100% seguros de nuestros resultados (a menos que trabajemos con toda la poblacin). Pero la estadstica nos permite acercarnos al valor real de la poblacin, utilizando tcnicas que aumentan la confiabilidad de los resultados, tomando en cuenta el comportamiento de los datos de la poblacin. Pregunta 4: Qu implica conocer el comportamiento de los datos de la poblacin? Desde el punto de la estadstica, significa determinar que tan probable es haber obtenido la informacin de la muestra. Las tcnicas para estudiar el comportamiento de una poblacin provienen de las ProbabilidadesPregunta 5: Si todas las muestras tienen errores, como podemos determinar el parmetro? Calculando los estadsticos muestrales (con estadstica descriptiva), conociendo el comportamiento de la poblacin (asignando probabilidades) y controlando los errores muestrales, podemos estimar o aproximarnos al valor real del parmetro. Las tcnicas para controlar los errores muestrales y estimar parmetros poblacionales a partir de los estadsticos, es el objeto de estudio de la Inferencia EstadsticaIDEA: Para un correcto anlisis e interpretacin de resultados, es necesario que en todo proceso de investigacin se identifiquen todos los elementos del proceso estadstico: Poblacin, parmetro, muestra, estadstico y tipo de dato utilizado

El primer paso en el estudio de la estadstica, es organizar, resumir y calcular los estadsticos muestrales de una muestra. Es decir, primero debemos dominar las tcnicas relativas de la estadstica descriptiva.TEMA 2: ORGANIZANDO LA INFORMACINObjetivo del tema a estudiar:Manejar tcnicas que permitan resumir y representar grficamente la informacin de una muestra.

Temas a tratar:

- Las tablas de distribucin de frecuencia- Los histogramas, ojivas y polgonos de frecuencia: su importancia y caractersticas de uso

- Los grficos circulares y otros grficos especiales: cundo se utilizan?IDEA: Antes de determinar que tcnica se va a utilizar se debe identificar el tipo de dato: numrico o categrico 1. TABLAS DE DISTRIBUCION DE FRECUENCIAS

Permiten exponer la informacin recogida en la muestra, de forma resumida o agrupada. Para esto se deben construir clases:

Clases: Implica agrupar los posibles resultados de una variable en intervalos. Las clases deben forman un sistema exhaustivo y excluyente EXHAUSTIVO: No podemos olvidar ningn posible valor de la variable

Mal: Cul es su color del pelo: (Rubio, Moreno)?

Bien: Cul es su grupo sanguneo? EXCLUYENTE: No se pueden presentar dos resultados simultneos: Mal: De los siguientes, qu le gusta: (deporte, cine)

Bien: Le gusta el deporte: (S, No)

Bien: Le gusta el cine: (S, No)

Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)IDEA: Las clases se construyen en relacin a los tems desarrollados en los instrumentos de recoleccin de informacin (preguntas abiertas, cerradas de encuestas, entrevistas, guas, etc.)

PASOS PARA CONSTRUIR UNA TABLA DE FRECUENCIA PARA VARIABLES NUMERICAS:

1. Identificar el nmero de clases a construir (nc)

2. Identificar el tamao de la muestra n, y calcular el Mximo y el Mnimo.

3. Calcular el Rango R = max min

4. Calcular el Intervalo de clase IC = R / nc 5. Construir los lmites inferiores de clase:

a. Limite inferior de la 1ra clase = Mnimo

b. Limite de la clase siguiente = Limite de la clase anterior + IC

6. Los limites superiores se calculan tomando en cuenta que los lmites superior e inferior no se superpongan

7. Para cada clase, se calculan las: Frecuencias absolutas: Contabilizan el nmero de datos en cada clase Frecuencias relativas (porcentajes): Idem, pero dividido por el tamao muestral (n) Frecuencias acumuladas: Se va acumulando el resultado de la clase actual y todas las anteriores. Puede acumularse la frecuencia absoluta o la frecuencia relativaLim. Inf.Lim. SupFrec. AbsFrec. Abs. Ac.

Frec. Relat. (%)Frec. Relat Ac.

MinF1F1%1 = F1/n%1

Min + ICF2F1 + F2%2 = F2/n%1 + %2

Min + 2 ICF3F1 + F2 + F3%3 = F3/n%1 + %2 + %3

.Max (aprox).....

suma = nSuma= 100%

IDEA: Las clases en variables categricas estn determinadas por las mismas categoras. No se calculan limites, pero si las frecuencias

Qu informacin nos dan las frecuencias?

Las frecuencias absolutas: nos indica cuantos datos pertenecen a cada clase e permite identificar las clases ms relevantes

Las frecuencias relativas: expresan en % la composicin de la muestra por clases, y comparar informacin entre clases

Las frecuencias acumuladas: permiten observar la acumulacin desde la primera clase. Es muy buena para observar tendencias de acumulacin. (Principio de Pareto)2. HISTOGRAMAS, POLIGONOS Y OJIVAS DE FRECUENCIA

Puesto que la tabla o matriz de los datos no muestra las cualidades de los datos, se usan representaciones grficas que ayudan a captar tendencias, apreciar caractersticas y establecer modelos probabilsticos de manera global.

Los diagramas y grficos que comnmente son utilizados, para organizar las observaciones de modo que entendamos mejor la informacin que contienen y apreciemos sus caractersticas se presentan a continuacin:

El Histograma es un grfico de barras en el que se presentan las frecuencias absolutas o las relativas (en porcentaje). En el caso de datos numricos, la longitud de cada clase (subintervalo) es igual a la extensin o rango de los datos dividido para el nmero de clases.

La curva dibujada sobre las barras, se denomina Polgono de frecuencias, y se realiza uniendo los puntos medios de cada barra por medio de lneas rectas. Permite analizar el comportamiento de los datos en la muestra.

El segundo grfico observado se denomina La Ojiva de frecuencias, y se construye con las frecuencias acumuladas (absolutas y relativas). Este grfico permite analizar tendencias como grupo. Si las clases estn ordenadas de mayor a menor frecuencia, se puede aplicar el Principio de Pareto.3. GRAFICOS CIRCULARES Y GRAFICOS ESPECIALESGrfico de pastel: es una forma de resumir un conjunto de datos categricos. Es un crculo dividido en segmentos, donde el rea de cada uno de los segmentos es proporcional al nmero de casos en la categora correspondiente.

Cmo se construye? Para conocer el ngulo (medido en grados) podramos aplicar una simple regla de tres (proporcin): si el nmero total de datos corresponde a 360 grados, el nmero ACUMULADOS de casos en una determinada categora, a cuntos grados le corresponde?.

Grfico de barras: los datos categricos se exhiben mediante un nmero de rectngulos, del mismo ancho, cada uno de los cuales representa una categora particular. La longitud (y por lo tanto el rea) de cada rectngulo es proporcional al nmero de casos en la categora que representa. Es similar a un histograma, donde cada categora es una clase.Utilizacin: Se prefiere realizar el grfico con las barras horizontales especialmente cuando a continuacin se va a representar una pirmide, desagregando la poblacin en dos categoras, por ejemplo considerando el sexo, es decir la poblacin de hombres a la izquierda y de mujeres a la derecha.Pictogramas: son grficos fciles de entender, en donde se deja en evidencia la frecuencia de cada clase.

TEMA 3: RESUMIENDO LA INFORMACION: LA ESTADISTICA DESCRIPTIVAObjetivo del tema a estudiar:Conocer los diferentes estadsticos muestrales y sus propiedades de uso.

Temas a tratar:

- Las medidas de tendencia central como valores representativos: Promedio, Mediana, Moda: su seleccin y anlisis

- Las medidas de dispersin: Rango, Varianza y Desviacin estndar. Su interpretacin y anlisis

1. RECORDANDO EL PROCESO ESTADISTICO Parmetro: Es una cantidad numrica calculada sobre una poblacin

La altura media de los individuos de un pas

La idea es resumir toda la informacin que hay en la poblacin en unos pocos nmeros (parmetros).

Estadstico: dem (cambiar poblacin por muestra)

La altura media de los que estamos en esta aula.

Somos una muestra (representativa?) de la poblacin.

Si un estadstico se usa para aproximar un parmetro tambin se le suele llamar estimador.

Normalmente nos interesa conocer un parmetro, pero por la dificultad que conlleva estudiar a *TODA* la poblacin, calculamos un estimador sobre una muestra y confiamos en que sean prximos (Nunca son iguales debido al error muestral). Ms adelante veremos como elegir muestras para que el error sea confiablemente pequeo.

Qu informacin podemos obtener de una muestra?

Medidas de tendencia central: Indica el valor medio o representativo de los datos

Medidas de dispersin: calculan de donde a donde van los datos (mnimos y mximos), mide concentracin de los datos respecto a su valor representativo

Medidas de Posicin: Dividen a la muestra en sectores con la misma cantidad de individuos.

Medidas de forma: Indican si los distribuciones de los datos (lase frecuencias) tienen una determinada forma.

IDEA: Para procesos futuros de estimacin de parmetros, se estudiar a mayor profundidad a las medidas de tendencia central y de dispersin

2. MEDIDAS DE TENDENCIA CENTRAL EN UNA MUESTRAIDEA: Son los valores alrededor de los cuales, los datos tienden a agruparse. Son estimadores de la media poblacional

Media o Promedio: Es la media aritmtica (promedio) de los valores de una variable. Suma de los valores dividido por el tamao muestral.

Media de 2,2,3,7 es (2+2+3+7)/4=3,5

Conveniente cuando los datos se concentran simtricamente con respecto a ese valor. Muy sensible a valores extremos. (datos atpicos) Centro de gravedad de los datos

Mediana: Tambin conocida como percentil 50, es el valor en cual el 50% de los datos estn bajo ella y el otro 50% estn sobre ella. Su posicin se encuentra con la frmula:Posicin Mediana = (n+1) / 2 Mediana de 1,2,4,5,6,6,8 es 5

Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5

Es conveniente cuando los datos son asimtricos. No es sensible a valores extremos.

Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7!

Moda: Es el/los valor/es donde la distribucin de frecuencia alcanza un mximo. Es el valor o los valores mas frecuentes. Su uso es restringido porque pueden existir varias modas o su frecuencia puede ser irrelevante con respecto a la frecuencia de los otros datos, en especial cuando los datos son de tipo continuo. Entre promedio mediana y moda escojo el promedio siempre y cuando no haya datos atpicos o extremos luego escojo la mediana porque es ms estable que el promedio. Los datos atpicos solo se eliminan si son error o dependiendo de la naturaleza de la investigacin. La moda puede no existir por lo tanto no se la utiliza ya que no es estable. Se la utiliza mas como clase modal en variables cualitativas. Unimodal, bimodal o multimodal.

IDEA: Para identificar los datos atpicos, podemos guiarnos por alguna tcnica grfica desarrollada en el tema anterior o utilizando las medidas de dispersin.

Cmo identificamos cul medida de tendencia central utilizar? La medida de tendencia central por excelencia es la media o promedio, siempre y cuando no existan datos atpicos. Si estos existen, se seleccionar la mediana. La moda tiene mejores aplicaciones en el caso de datos categricos.3. MEDIDAS DE DISPERSIN:3.1. FUENTES DE VARIABILIDAD tiene mas peso que el promedioLos estudiantes de Odontologa reciben diferentes calificaciones en la asignatura de Anatoma (variabilidad). A qu puede deberse? Diferencias individuales en el conocimiento de la materia.

Podra haber otras razones (fuentes de variabilidad)?

Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. Las notas seran las mismas en todos? Seguramente No. Dormir poco el da del examen, el desayuno estaba envenenado!!!!.... Diferencias individuales en la habilidad para hacer un examen.

El examen no es una medida perfecta del conocimiento.

Variabilidad por error de medida.

En alguna pregunta difcil, se duda entre varias opciones, y al azar se elige la mala

Variabilidad por azar, aleatoriedad.

Las medidas de dispersin miden la variabilidad, independientemente de su causa.

3.2. MEDIDAS DE DISPERSIN EN UNA MUESTRAIDEA: Con estos valores tratamos de estimar el parmetro ( (sigma) que es la desviacin estndar de la poblacin, que es una medida de cmo se agrupan los datos de la poblacin respecto a su media .Entre las medidas de dispersin muestrales tenemos:

1. R = Rango = Mximo Mnimo

2. S2 =

3. S =

La varianza se puede entender como el promedio del cuadrado de las distancias de cada observacin respecto al promedio, y sus unidades estn siempre al cuadrado. La desviacin estndar o tpica es igual a la raz cuadrada de la varianza, es siempre un valor positivo, y su unidad de medida es la misma que corresponde a los datos originales.

Para tener una nocin de lo que representa una desviacin estndar en relacin a las observaciones, se puede comprobar que el intervalo, que va desde la media mas/menos 2 desviaciones estndar, contiene al menos el 90% de los datos. Por tanto, los valores que no estn dentro de este intervalo se pueden considerar como valores atpicos.

A mayor dispersin de los datos, mayor varianza y por lo tanto menor confiabilidad.Homocedasticidad significa que las varianzas entre grupos deben ser iguales.NOTA IMPORTANTE: Las medidas de tendencia central y de dispersin son diferentes si se trata de una muestra (estadsticos) o de una poblacin (parmetros) (*Tema de consulta)Adicionalmente se pueden calcular las medidas de posicin y de forma (curtosis, cuartiles, etc) Estas medidas se pueden calcular directamente en Excel.VER HOJA DE TAREA UNOTEMA 4: MANEJO DE LA INCERTIDUMBRE: PROBABILIDADESObjetivo del tema a estudiar:Medir la certeza de que un resultado ocurra.

Temas a tratar:

- Las probabilidades, sus tipos y usos.

- El clculo de probabilidades en funcin de las tablas de frecuencias.

- Las probabilidades respecto a un conjunto: La probabilidad marginal, conjunta y condicional1. INTRODUCCION A LAS PROBABILIDADESCul es la probabilidad de aprobar este mdulo?, Qu tan probable es que me gane el pozo millonario este fin de semana?, Cul es la probabilidad de que una nia de 7 meses de edad cuyos padres son analfabetos tengan bajo peso?

Para responder estas preguntas es necesario conocer la Teora de probabilidades. Esta teora analiza el comportamiento de los datos para dar una medida de certeza respecto a la posibilidad de que cierto suceso (o evento) se presente.

IDEA: La idea de probabilidad siempre gira alrededor del concepto de la ocurrencia de un suceso o eventoCmo se calculan las probabilidades? Depende del tipo de probabilidad a calcular:

Probabilidad Frecuentista (objetiva): Es la frecuencia relativa (%) de veces que ocurrira el suceso al realizar un experimento repetidas veces.

Probabilidad Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es personal: Cul es la probabilidad de que L.D.U. gane La Copa Libertadores de Amrica?2. LOS SUCESOS: SUS TIPOS Y RELACIONES

Cuando se realiza un experimento aleatorio, diversos resultados son posibles. El conjunto de todos los resultados posibles se llama espacio muestral (E). En un estudio sobre nios con desnutricin, el curso que un estudiante en una escuela se puede determinar en el conjunto: E = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ao de bsica}

Se llama suceso a un subconjunto de dichos resultados:

Si Jos est por entrar al bachillerato, por lo tanto, En qu curso est Jos? J = {Jos} ={10}

Se llama suceso contrario ( o complementario) de un suceso A, A, al formado por los elementos que no estn en A J = En qu cursos NO est Jos = {1, 2, 3, 4, 5, 6, 7, 8, 9 }

Se pueden hacer operaciones entre sucesos

Se llama suceso interseccin de A y B, AB, al formado por los elementos que estn en A y B al mismo tiempo Significa aquellos resultados que pueden suceder simultneamente A = {doctores con 5 aos de experiencia en salud pblica} B = {doctores con dominio del ingls}

Entonces, para acceder a una beca a una maestra en EEUU, debes pertenecer al suceso {AB} Se llama suceso unin de A y B, AUB, al formado por los resultados experimentales que estn en A o en B (incluyendo los que estn en ambos) Significan aquellos resultados donde se pueden presentar el uno, el otro o ambos al mismo tiempo A = {faltar ms del 30% de las clases} B = {tener una nota final inferior a 14 / 20}

Entonces, un alumno que pierde el mdulo, pertenece al suceso {AUB}IDEA: Una forma de identificar un suceso es preguntndose de cuantas formas puede ocurrir dicho suceso

3. PROBABILIDADES: LEYES Y PROPIEDADES

Las probabilidades miden la certeza de que un suceso ocurra. Desde el punto de vista de los conjuntos, se puede decir que la probabilidad mide el tamao relativo del suceso, respecto al total del espacio muestral.

Las propiedades de las probabilidades son:

P(E)=1 (la probabilidad de todo el espacio muestral es 1)

0P(A) 1 (la probabilidad de cualquier suceso esta siempre entre 0 y 1) P(AUB)=P(A)+P(B) si AB= (las probabilidades de las uniones de eventos se obtienen por sumas, siempre y cuando no hayan sucesos simultneos)

Para calcular las probabilidades, utilizaremos el enfoque de la Probabilidad frecuentista

IDEA: El clculo de una probabilidad implica el mismo proceso de clculo que una frecuencia relativa, es decir, a partir de una tabla de frecuencias

4. TIPOS DE PROBABILIDADES

Los diferentes tipos de probabilidades dependen respecto a que conjunto estamos midiendo:

Probabilidad de un suceso = frecuencia relativa del suceso especfico respecto al conjunto total

Probabilidad marginal de un suceso = frecuencia relativa del suceso, sin importar la forma especfica en que puede ocurrir Probabilidad conjunta (de interseccin) = frecuencia relativa de eventos simultneos respecto al total

Probabilidad condicional = frecuencia relativa de eventos simultneos respecto a un subgrupo del total

IDEA: Para entender los conceptos y aplicacin de las probabilidades, es preferible usar Tablas de Contingencia TEMA 5: APLICACIONES DE PROBABILIDADESObjetivo del tema a estudiar:Calcular y analizar los diferentes tipos de probabilidades, a partir de una Tabla de Datos

Temas a tratar:

Construccin de una Tabla de contingencia (Usando Tablas dinmicas en Excel) Clculo de probabilidades a partir de una tabla de contingencia (Editando tablas dinmicas)

Representar grficamente las probabilidades como tamaos relativos de los conjuntos totales (Usando grficos dinmicos)1. LAS TABLAS DE CONTINGENCIA:Supngase que usted est realizando una investigacin en salud. Su primer paso es tomar una muestra, y por medio de algn instrumento de recoleccin de informacin ha construido una base de datos, que contiene algunas variables a analizar. Usted est interesado en analizar la posible relacin que existe entre una variable A y una variable B. (por ejemplo, el peso de un beb versus el nivel acadmico de los padres). En estos casos, podemos construir una Tabla de contigencia. Por ejemplo:FrecuenciasNIVEL ACADEMICO (B)

PESO (A)ANALFABETOPRIMARIASECUNDARIASUPERIORTotal general

EXCELENTE2282050

INSUFICIENTE9110

REGULAR12166640

Total general21381526100

Como podemos observar, en una tabla de contingencia, se tienen las frecuencias absolutas (por conteo) de cuantos de los 100 bebs analizados pertenecen a cada categora (cruce de la tabla)

Hay que observar que existe varia informacin a considerar, por ejemplo:

De los 100 bebs, 50 tienen peso excelente (Total por fila) De los 100 bebs, 15 tienen sus padres nivel acadmico secundaria (Total por columna)

De los 100 bebs, 8 tienen peso excelente Y tienen sus padres nivel acadmico secundaria (valor cruce fila columna respecto al total general) De los 50 bebs que tienen peso excelente, 8 tienen sus padres nivel acadmico secundaria (valor cruce fila-columna, respecto al total de Fila)Pueden establecer en este punto, la diferencia entre cada tipo de informacin?IDEA: Si queremos analizar la informacin de una sola variable, utilizamos tablas de distribucin de frecuencia, para analizar dos variables (cruce de datos) utilizamos tablas de contingenciaIDEA: Estas tablas son muy fciles de construir utilizando el comando Tablas dinmicas de Microsoft Excel2. CALCULO DE PROBABILIDADES EN LAS TABLAS DE CONTINGENCIA:

Sigamos con el ejemplo anterior, si usted considera a los 100 bebs como su grupo total para analizar. Si dividimos cada uno de los valores de la tabla para el total (100), la tabla anterior se convierte en una tabla de probabilidades:ProbabilidadesACADEMICO

PESOANALFABETOPRIMARIASECUNDARIASUPERIORTotal general

EXCELENTE0.00%22.00%8.00%20.00%50.00%

INSUFICIENTE9.00%0.00%1.00%0.00%10.00%

REGULAR12.00%16.00%6.00%6.00%40.00%

Total general21.00%38.00%15.00%26.00%100.00%

Qu probabilidades tenemos aqu?:

El 50% del total de bebs, tienen peso excelente (probabilidad marginal por fila)

El 15% del total de bebs, tienen sus padres nivel acadmico secundaria (probabilidad marginal por columna)

El 8% del total de bebs, tienen peso excelente Y tienen sus padres nivel acadmico secundaria (probabilidad conjunta de interseccin de fila y columna)

Y las probabilidades condicionales?

Si consideramos como total de anlisis, por ejemplo al PESO (total de fila), se tiene la siguiente tabla:

ProbabilidadesACADEMICO

PESOANALFABETOPRIMARIASECUNDARIASUPERIORTotal general

EXCELENTE0.00%44.00%16.00%40.00%100.00%

INSUFICIENTE90.00%0.00%10.00%0.00%100.00%

REGULAR30.00%40.00%15.00%15.00%100.00%

Total general21.00%38.00%15.00%26.00%100.00%

El 16% de los bebs con peso excelente, tienen a sus padres con nivel acadmico secundaria (probabilidad condicional de columna, dada la fila) Ntese la diferencia entre la tabla anterior y al actual: Qu valor corresponde a nuestro 100% de anlisis en cada caso?

IDEA: Cuando sucede un evento cuyas probabilidades de ocurrencia son muy bajas (usualmente menores al 10%) se suele decir que es un evento ESTADISTICAMENTE SIGNIFICATIVO.. (Tan poco probable Y sin embargo, ocurri!!!!)Finalmente, cuando se realice un anlisis de porcentajes (probabilidades), siempre hay que analizar respecto a que grupo se est calculando dicho valor (es decir, si se trata de una probabilidad marginal, conjunta o condicional)

TEMA 6: INTRODUCCION A LAS DISTRIBUCIONES DE PROBABILIDADObjetivo del tema a estudiar:Conocer los diferentes tipos de comportamiento de ciertos fenmenos probabilsticos.

Temas a tratar:

- Que son las distribuciones de probabilidad: ventajas de analizar el comportamiento global

- Distribucin discretas: Binomial- Distribuciones continuas: Caractersticas bsicas

1. INTRODUCCION A LAS DISTRIBUCIONES DE PROBABILIDADPara entender mejor las distribuciones, es necesario definir algunos conceptos bsicos:Variable Aleatoria:

Es una variable X cuyos valores se deben al azar. Pueden ser discretas o continuas. Ejm: Nmero de estudiantes por aula, Notas de cada alumno, horas de estudio diario, etc.

Distribucin de probabilidad: Es una lista de todos los posibles resultados xi de un experimento y de la probabilidad P(X = xi) asociada a cada resultado xi. Se puede presentar como tabla, grfico o frmula. (Lase Tabla de Distribucin de frecuencias)Propiedades:

0 ( P(X = xi) ( 1; ( P(X = xi) = 1

Media Aritmtica de variables aleatorias:

La media aritmtica ( ( o promedio) de una v.a. X, se llama Valor Esperado de X.

(( =E[X]). Su clculo depende del tipo de distribucin, aunque bsicamente se trata de un promedio ponderado de todos los resultados posibles (xi), tomando como pesos las probabilidades asociadas a cada resultado (p(xi)):

Varianza de variables aletorias:

El concepto de varianza es el mismo que el de las medidas de dispersin.Nota: Cada distribucin tiene su propia media y varianza.Ventajas de las distribuciones de probabilidad:Si nosotros identificamos el tipo de distribucin que tiene una determinada poblacin, podemos establecer su comportamiento probabilstico, y el proceso de estimacin de los parmetros sern estadsticamente ms confiables.

IDEA: Para identificar el tipo de distribucin, debemos primero analizar el tipo de dato que estamos analizando y posteriormente el tipo de fenmeno que ocurre en la muestra2. DISTRIBUCIONES DISCRETASLas distribuciones discretas se presentan en variables discretas. Existen varias distribuciones de probabilidad, las que vamos a analizar son: Binomial, Hipergeomtrica y de Poisson.

2.1. DISTRIBUCION BINOMIALLa distribucin binomial, surge de analizar el siguiente suceso: De una poblacin, donde el porcentaje de xito ( es conocido, se toma una muestra de n datos, cul es la probabilidad de que en dicha muestra encuentre x de xitos?

Donde:

n es el nmero de ensayos.

x es el nmero de xitos

( Es la probabilidad del xito en cada ensayo.

Observe que utilizamos la letra griega ( para denotar un parmetro de una poblacin. No debe confundirse con la constante matemtica igual a 3.1416.La distribucin binomial, tiene como media a = n (, y su varianza es ( = n ( (1 - ()

IDEA: Para facilitar el clculo de estas distribuciones se utilizan las Combinaciones: nCrEjemplo en clase: Se supone que la tasa de reaccin a una nueva vacuna es del 30% Cul es la probabilidad de que al aplicar la vacuna en 20 pacientes, 13 de ellos presente alguna reaccin? Si el porcentaje del 30% se cumpliera, a cuantos se esperara que presenten alguna reaccin?3. DISTRIBUCIONES CONTINUASCuando la variable en estudio proviene de un proceso de medicin, es decir, en variables continuas. Puede tomar infinitos valores y depende del instrumento de medicin. Ejm: Distribucin Uniforme, Exponencial, Normal.Por sus aplicaciones estadsticas, estudiaremos la Distribucin Normal, que representa la base de toda la Inferencia Estadstica.TEMA 7: LA DISTRIBUCIN NORMALObjetivo del tema a estudiar:Determinar las caractersticas y aplicaciones estadsticas fundamentales derivadas de la distribucin normal.

Temas a tratar:

- Vdeo: La distribucin normal

- La distribucin Normal: aplicaciones y forma de calcular1. INTRODUCCION A LA DISTRIBUCION NORMALPara entender las nociones bsicas de la distribucin normal, veamos un video donde se explican sus principales caractersticas y aplicaciones.Despus de ver el vdeo Puede identificar la forma, los parmetros y las principales caractersticas de esta distribucin?2. LA DISTRIBUCIN NORMAL: CALCULO Y APLICACIONESLa distribucin normal es una curva con forma de campana, con eje de simetra en el punto correspondiente al promedio de la poblacin. La distancia entre el eje de simetra de la campana y el punto de inflexin de la curva es igual a la desviacin standard de la poblacin:

El rea total debajo de la curva es igual a 1. El rea debajo de la curva comprendida entre - ( y + ( es aproximadamente igual a 0,68 del rea total; entre -2( y +2( es aproximadamente igual a 0,95 del rea total:

Es importante ver que los nicos parmetros necesarios para dibujar el grfico de la distribucin normal son la Media y desviacin standard de la poblacin. Con estos dos parmetros sabemos donde situar la campana de Gauss (En el punto correspondiente a la media) y cual es su ancho (Determinado por la desviacin standard).

La Distribucin normal estndar.

Sea Z = ,

Esta es la frmula de la Distribucin Normal Standard o Tipificada. Como podemos observar, en ella hay un slo parmetro, Z, que incluye al promedio y la desviacin standard de la poblacin. Esta funcin est tabulada, y para ingresar en la tabla es necesario calcular Z, para lo cual necesitamos la media y la desviacin standard de la poblacin. Al calcular Z, lo que estamos haciendo, en realidad, es un cambio de variable por el cual movemos la campana de Gauss centrndola en el 0 del eje X, y modificamos el ancho para que la desviacin standard sea 1:

El cambio de variable hace que se conserve la forma de la funcin y que sirva para cualquier poblacin, siempre y cuando esa poblacin tenga una distribucin normal. Cuando queremos calcular las probabilidades para una poblacin real, calculamos Z y entramos en la tabla de la funcin normal standard: (ver tabla Z)

Puede calcular, usando la tabla Z, el rea sombreada? VER HOJA DE TAREA DOSTEMA 8: LAS DISTRIBUCIONES MUESTRALESObjetivo del tema a estudiar:Determinar las caractersticas y aplicaciones estadsticas fundamentales derivadas de la distribucin normal.

Temas a tratar:

- El comportamiento de los estadsticos muestrales

- El teorema del lmite central

- Aplicaciones para la media y la proporcin poblacional

1. EL COMPORTAMIENTO DE LOS ESTADISTICOS MUESTRALESRecordemos lo que vimos al inicio del mdulo, respecto al proceso estadstico:PROCESO ESTADSTICO:Poblacin: Es el conjunto total de datos sobre el cual se establecen las mediciones o la informacin a conocer. Debe estar perfectamente delimitado (tiempo, lugar, caractersticas especficas)

Parmetro: Es la informacin de la poblacin que se desea conocer

Muestra: Es un subconjunto representativo de la Poblacin

Estimador o estadstico: Es la informacin relativa al parmetro, obtenida a partir de la muestra

Error muestral: Es la diferencia entre el Parmetro y el Estadstico ()IDEA: A partir de este momento, no trabajamos con valores individuales de la poblacin, sino con MUESTRAS. Es decir, con los estadsticos muestralesLos estadsticos muestrales sirven para estimar o acercarnos al valor del parmetro, pero siempre hay que recordar que el estadstico representa a una muestra de n datos.PARAMETROSIMBOLOFORMULAESTADISTICOSIMBOLOFORMULA

Media Poblacional

Promedio Muestral

Varianza Poblacional

Varianza Muestral

Desviacin Poblacional

Desviacin estndar muestral

Proporcin Poblacional

Proporcin muestral

Si nosotros conocemos los parmetros poblacionales, entonces podemos conocer el comportamiento probabilstico de UN individuo, utilizando las distribuciones de probabilidades revisadas anteriormente. La pregunta que surge es: El comportamiento de los datos individuales es el mismo de los estadsticos muestrales?La respuesta es NO. La inferencia estadstica ha demostrado que los estadsticos muestrales se comportan de manera distinta a los individuos de la poblacin, y que su comportamiento depende de las caractersticas de la muestra de la cual provienen. Estos resultados se derivan de lo que se conoce como EL TEOREMA DEL LIMITE CENTRAL

2. EL TEOREMA DEL LIMITE CENTRAL T.L.C.Dada una v.a. cualquiera, si extraemos muestras de tamao n, y calculamos los promedios muestrales, entonces: Dichos promedios tienen distribucin aproximadamente normal;

La media de los promedios muestrales es la misma que la de la variable original.

La desviacin tpica de los promedios disminuye en un factor raz de n (error estndar).

Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.

Este teorema justifica la importancia de la distribucin normal.

Sea lo que sea lo que midamos, cuando se promedie sobre una muestra grande (n>30) nos va a aparecer de manera natural la distribucin normal.

3. APLICACIONES DEL T.L.C. PARA MEDIAS Y PROPORCIONES POBLACIONALESRecordemos que si una poblacin es normal, entonces podemos calcular cualquier probabilidad de un individuo X, utilizando Z = ,

Si tomamos una muestra de dicha poblacin, donde n>30, y calculamos su promedio muestral , entonces, para calcular las probabilidades respecto a este estadstico sera: Z =

IDEA: Ntese que la frmula anterior cumple todas las caractersticas del TLC, pero tiene condiciones para ser utilizadas. Ms abajo se tiene un resumen de las condiciones del TLCLa frmula anterior sirve en el caso de medias poblacionales, cuando se tienen muestras grandes (n >30). La otra pregunta es, qu pasa si n < 30? Simplemente, en lugar de utilizar la distribucin Z, debemos utilizar otra distribucin llamada t o de Student, la cual la veremos ms adelante (en el estudio de muestras pequeas). El uso de T implica adems algunas suposiciones de ndole estadsticas adicionales que deben ser verificadasEn el caso de proporciones poblacionales, tambin se puede aplicar el TLC con sus respectivas condiciones sobre la frmula de Z

PARAMETROSIMBOLOT.L.C.CONDICIONES DE USO

Media Poblacional (Muestra Grande)

Z =

n mayor o igual a 30.Si no se conoce , se puede reemplazar por el estadstico s

Media Poblacional (Muestra pequea)

T =

n menor a 30Siempre se debe suponer que la poblacin es normal ???Solo se utiliza s

Proporcin Poblacional

Z =

Al menos 5 xitos y 5 fracasos en la muestra

TEMA 9: LAS ESTIMACIONES POR INTERVALOObjetivo del tema a estudiar:Construir un rango de valores altamente confiable, dentro del cual se confa que se encuentre el parmetro poblacional, a partir de la informacin de una muestraTemas a tratar:

- Construccin de un intervalo de confianza

- Intervalos de confianza en muestras grandes

- Intervalos de confianza en muestras pequeas

- Intervalos de confianza para proporciones poblacionales1. CONSTRUCCION DE UN INTERVALO DE CONFIANZASupongamos que deseamos inferir algo sobre el valor del parmetro de la media poblacional basados en el valor de la media muestral. Una de las aplicaciones ms importantes de la estadstica inferencial es la construccin de intervalos de confianza (IC)Un intervalo de confianza es un rango de valores dentro del cual se espera que est el valor real del parmetro poblacional buscado, con una probabilidad de error conocida como error de confianza denotado por el valor ( (alfa). El valor 1 - (, se conocer como el nivel de confianza.

LIC

LSC

Observ que el ancho del intervalo de confianza, nos da una medida del error muestral del estadstico respecto al parmetro.2. INTERVALOS DE CONFIANZA PARA LOS DIFERENTES PARMETROSPARAMETROT.L.C.Clculo de las distribucionesCONDICIONES DE USO

Media Poblacional (Muestra Grande) ( Z

El valor 1 ( ( / 2) se busca en la tabla Zn mayor o igual a 30.

Si no se conoce , se puede reemplazar por el estadstico s

Media Poblacional (Muestra pequea) ( T

El valor (, y los grados de libertad = n-1, se buscan en la tabla Tn menor a 30

Siempre se debe suponer que la poblacin es normalSolo se utiliza s

Proporcin Poblacional ( Z

El valor 1 (( / 2) se busca en la tabla ZAl menos 5 xitos y 5 fracasos en la muestra

TEMA 10: TECNICAS DE MUESTREOObjetivo del tema a estudiar:Conocer las tcnicas que permitan tomar muestras con error muestral controlado

Temas a tratar:

- Introduccin al muestreo- Muestreos probabilsticos- Muestreos no probabilisticos

1. INTRODUCCION AL MUESTREO

Si en una investigacin se pudiera abarcar a todos los miembros de una poblacin, la toma de muestras sera innecesaria, as como los clculos estadsticos de probabilidades para estimar el grado de representatividad de dicha muestra no tendran sentido, puesto que los atributos cuantitativos encontrados (si se ha medido bien) al grupo observado sera la poblacin misma.Tambin habra que considerar si vale la pena tomarse la molestia de extraer una muestra significativa con procedimientos tcnicamente correctos y rigurosos, cuando la investigacin es slo un estudio preliminar o exploratorio, cuya metodologa es incierta o bien los instrumentos de observacin se encuentran en etapas de ensayo y validacin. Todas las etapas del estudio deberan tener un grado o nivel de rigurosidad similar.

Una buena cantidad de experiencias e investigaciones han eludido el problema de la toma de muestras con mucho ingenio. Por ejemplo, al comparar dos grupos cursos con caractersticas similares, a los cuales se les va a aplicar dos metodologas pedaggicas diferentes para demostrar la efectividad de una de ellas. Los estudiantes podran ser distribuidos en ambos cursos por una tcnica de pareo .Tambin, es posible realizar un sorteo con una tabla de nmeros aleatorios (o generando muestras a travs de Excel)

Jean Piaget y su escuela de Ginebra realizaron numerosas investigaciones sobre el desarrollo psicolgico de los nios, utilizando muestras escogidas o muestras arbitrarias de pocos nios.

Ellos partan de ciertos postulados (principios aceptados que no requieren demostracin) sobre la uniformidad del desarrollo y de la maduracin biolgica y psicolgica de los seres humanos. Otro caso, sera el de un inspector sanitario que toma pequeas muestras del agua de una piscina, para analizar su composicin qumica y la contaminacin bacteriolgica que pudiera tener el contenido de la alberca; aqu se postula que la solucin del agua es homognea en toda la piscina.1.1. TIPOS DE MUESTREOS

El muestreo utilizado, as como las forma de delimitar la poblacin objetivo, determinan el valor de las generalizaciones que se pueden extraer de la muestra escogida.

1.2. TERMINOS TCNICOS PARA REALIZAR MUESTREOS

Elementos: Es un objeto en el cual se toman las mediciones Poblacin: Es una coleccin de elementos acerca de los cuales deseamos hacer alguna inferencia

Unidades de muestreo: Son colecciones de elementos no traslapadas de elementos de la poblacin que cubren la poblacin completa

Marco muestral: Es una lista de las unidades de muestreo

Muestra: Es una coleccin de unidades muestrales seleccionadas de un marco o de varios marcos muestrales

Mortalidad experimental. Se refiere a los sujetos escogidos para someterse a observacin en una muestra en estudio y no se les ubica, o bien no es posible lograr que proporcionen la informacin que se necesita. Si la mortalidad experimental es alta, la investigacin pierde su credibilidad. El plan de muestreo debe considerar este factor.

EJEMPLO:

Para investigar sobre la calidad de las mediciones de los laboratorios clnicos de Quito, se podra definir lo siguiente Elementos: Es un laboratorio clnico Poblacin: Todos los laboratorios clnicos, en el sector urbano del DMQ, que se encuentren en operaciones durante el ao 2010 Unidades de muestreo: Separamos la ciudad por regiones o zonas: norte, centro, sur, etc. Y ubicamos en cada zona los laboratorios que se encuentren en operaciones Marco muestral: Es el listado de laboratorios clnicos por zona (donde se podra obtener?) Muestra: Dependiendo de la tcnica a utilizar, la muestra se puede tomar por zonas Mortalidad experimental: Posiblemente algun laboratorio cerr el ultimo ao, o cambio su direccin.La respuesta definitiva ser cuando se utilice en especfico una tcnica de muestreo

2. MUESTREOS PROBABILISTICOS

A) MUESTRAS ALEATORIAS SIMPLES.Constituyen la base para los diferentes procedimientos de muestreo aleatorio. Sus Principales ventajas son: * Ms econmica que otros procedimientos aleatorios; * Asegura la equiprobabilidad de la eleccin. Desventajas:* No provee suficientes casos de grupos minoritarios.

Los pasos a seguir:1. Obtener un listado de todos los integrantes de la poblacin. (el marco)2. Numerar a todos los sujetos de la poblacin (o unidades de muestreo).

3. Utilizar una Tabla de Nmeros Aleatorios o un procedimiento similar (Excel) para seleccionar a los sujetos de la muestra.

4. Ubicar a los sujetos seleccionados y administrar los instrumentos de recopilacin de datos. 5. Aquellos sujetos seleccionados que por alguna razn no sean sometidos a observacin integrarn la categora de mortalidad experimental.

NOTA: Una mortalidad experimental mayor al 5% de la muestra aleatoria simple se estima que afecta seriamente a la confiabilidad de los resultados obtenidos.

Toda tcnica de muestreo debe considerar dos cosas: el nivel de error (o nivel de confianza al cual va a trabajar) y el error muestral que quiere asignarle a dicha muestra (recuerde los intervalos de confianza). Tambin depende si se trata de medias poblacionales o proporciones poblacionales. Considerando a un nivel de confianza del 95%, se tiene que:PARAMETROTAMAO MUESTRALCONDICIONES

Media Poblacionaln =

N = Tamao poblacional(2 = Varianza poblacional (se estima de una muestra piloto)

E = mximo error muestral asignado

Proporcin Poblacionaln =

p = estimacin de la proporcin poblacional de una muestra piloto, o 50%q = 1 p (probabilidad de fracaso)

B) MUESTRAS ESTRATIFICADASPueden ser convenientes cuando en la poblacin blanco se presentan categoras o subconjuntos de individuos que representen un inters particular de observar y compararlas con otras categoras. En este caso, su ventaja es: Lograr una muestra ms homognea.

Los criterios para establecer estratos pueden ser las variables: sexo, edad, profesin, nivel educacional, nivel socioeconmico, nacionalidad, religin, etc.

La investigacin que requiera este tipo de muestra, deber definir los estratos correspondientes y justificar en el proyecto sus bases de comparacin.C) MUESTRAS POR CONGLOMERADO.

Se utilizan cuando los individuos constituyen agrupaciones naturales, por ejemplo los alumnos del mismo curso, las familias nucleares, etc. En este caso, la unidad de muestreo no es el individuo, sino el conglomerado. Los pasos a seguir ahora, son los mismos que el grupo anterior; obteniendo un listado de los conglomerados, etc.

Entre sus ventajas se destacan:* Son ms econmicas y rpidas que el procedimiento anterior, facilitando el trabajo de los investigadores de campo;

Como desventaja:

* Pueden tener cierta prdida del carcter aleatorio del procedimiento y * Disminucin de la precisin de sus resultados.

Esta ltima crtica pierde fuerza si el nmero de conglomerados es mayor que 30.

3. MUESTREOS NO PROBABILISTICOS

A) MUESTRAS ERRTICAS O CASUALESPor ejemplo, las personas que van saliendo de la biblioteca o del casino a la hora que aparece el encuestador. Esta es una tcnica tpica de reporteros de prensa y TV, como ejemplo las encuestas a boca de urna. Tambin es utilizada por algunas agencias de publicidad y de estudios de mercado. Tcnicamente es incorrecto hacer generalizaciones a un grupo mayor que el de los mismos entrevistados (problema de validez externa).

Ventajas (si las tiene):

* De bajo costo y no requieren de personal entrenado;

* Se sacan conclusiones rpidamente.

Desventajas:

* Carencia de validez externa y confiabilidad;

* Presenta sesgos de muestreo por criterios arbitrarios de seleccin de los sujetos (aunque el entrevistador no los advierta).

B) MUESTRAS INTENCIONADAS O RACIONALESEn este caso se selecciona a los sujetos de acuerdo a un criterio establecido por un experto. Por ejemplo, los estudiantes que tienen problemas de aprendizaje, o aquellos que demuestran ausentismo escolar elevado.

Ventajas:

* Rpida y de bajo costo,

* Tiene una validez relativa para estudios de caso;

* Es muy til para estudios exploratorios,

* Para la optimizacin de instrumentos de observacin,

* Para ampliar el marco terico y la formulacin de hiptesis.

Desventajas:

* Hay problemas en los criterios de seleccin de los sujetos,

* carece de validez externa y confiabilidad al intentar generalizar hacia grupos mayores.

C) MUESTRAS POR CUOTASEs equivalente a las muestras aleatorias estratificadas. A los entrevistadores se les fijan cuotas de individuos, especificndoles sus caractersticas, por ejemplo: solteras, con hijos o embarazadas o estudiantes varones de pelo largo y con aros. Cada entrevistador selecciona por su cuenta y entrevista con ayuda de una lista (entrevista dirigida).

Ventajas:

* Rpida y eficiente;

* Es un sustituto de muestras estratificadas til para estudiantes;

* puede servir para un ensayo preliminar de dicha tcnica.

Desventajas:

* El sesgo del entrevistador para elegir a los sujetos es su defecto ms evidente.

D) MUESTRAS BOLA DE NIEVERecomendada para el estudio de casos de inters especial, que son difciles de identificar, por ejemplo: drogadictos, homosexuales, miembros de una secta, etc. La tcnica consiste en localizar algunos individuos tpicos, los cuales conducen a otros y as sucesivamente va creciendo la bola de nieve. Es una tcnica apropiada para la investigacin cualitativa y estudios de casos.

Ventajas:

* Acumula informacin enriquecedora para construir marcos tericos.* Recomendada para estudios sociolgicos y problemas sicopedaggicos.

Desventajas:

* Requiere entrevistadores profesionales bien entrenados; * La interpretacin de los resultados tiene problemas de confiabilidad; * Puede haber sesgo en la seleccin de los sujetos.

TEMA 11: COMPROBACION DE SUPUESTOS: LOS CONTRASTES DE HIPOTESISObjetivo del tema a estudiar:Determinar si una suposicin sobre el parmetro poblacional es falsa o no, a partir de la informacin de una muestra

Temas a tratar:

- La identificacin del proceso estadstico y las pruebas de hiptesis

- El proceso de las pruebas de hiptesis

- Aplicaciones en la investigacin cientfica

1. EL PROCESO ESTADSTICO Y LAS PRUEBAS DE HIPTESISLas pruebas de hiptesis constituyen una herramienta fundamental en los procesos de investigacin. Tiene una relacin directa sobre la comprobacin de un parmetro poblacional, utilizando la informacin de un estadstico muestral

Una hiptesis estadstica no es ms que una afirmacin que se hace sobre una o ms caractersticas de una poblacin. Para contrastar la hiptesis que se formula acerca de la poblacin, podramos tomar todas y cada uno de los elementos de la poblacin y ver que la afirmacin que se hace es cierta o falsa, no siempre es factible realizar este proceso ya que la forma de llevar a cabo la investigacin es destructiva o muy costosa, entonces es necesario tomar una muestra para inferir sobre la poblacin.

IDEA: Las pruebas de hiptesis se centran en el concepto de distancia o diferencia entre lo supuesto (como hiptesis) y lo observado (en una muestra)

Lo que se debe considerar, es que no podemos comparar directamente entre el valor del parmetro y el estadstico, pues siempre existe el error muestral inherente en la muestra. Por tanto, para poder comparar las hiptesis debemos considerar los siguientes aspectos:

Qu parmetro estamos probando: (media o proporcin poblacional)

El comportamiento de la poblacin (es decir, a que distribucin pertenece: Z o T) De donde proviene la evidencia de la prueba (es decir si es muestra grande o pequea)2. EL PROCESO DE LAS PRUEBAS DE HIPTESISPara la realizacin del contraste se utiliza un estadstico cuya distribucin en el muestreo se conoce si la hiptesis que se ha planteado es verdadera. El estadstico tomar valores que pueden llevarnos a sospechar que la hiptesis no es razonable y debe ser rechazada, o por el contrario, puede considerarse como justificacin de la hiptesis, en ambos casos podemos equivocarnos, es decir rechazar una hiptesis siendo verdadera (error tipo 1) o bien aceptarla error (tipo 2)

Para trabajar con contrastes de Hiptesis es necesario tener claro los siguientes conceptos:

Hiptesis nula H0: Es la hiptesis que se quiere contrastar y es por lo tanto la que se acepta o rechaza como conclusin del contraste. Trabaja con los signos =; ; Hiptesis alternativa H1: Es la hiptesis que nos sita como alternativa ante Ho de tal forma que si se acepta H1 se rechaza Ho y viceversa. Trabaja con los signos ,

Estadstico de contraste: Es una funcin de la muestra aleatoria simple cuya distribucin se utiliza para el contraste. (puede ser Z o T, dependiendo las condiciones y del parmetro) Error de Tipo 1: Error que se comente en la decisin del contraste cuando se rechaza la hiptesis nula, siendo correcta.

Nivel de significacin: Probabilidad de cometer el error de tipo 1, se denota por ( (alfa). Debe ser determinado ANTES de realizar el experimento Error de Tipo II: Error que se comente en la decisin del contraste cuando se acepta la hiptesis nula, siendo falsa. Se le llama ( (beta)

Realidad

InocenteCulpable

veredictoInocenteOKError Tipo IIMenos grave

CulpableError Tipo IMuy graveOK

Contraste Bilateral: Es aquel cuya regin crtica est formada por dos conjunto de puntos de la recta real. Se utiliza en pruebas con signos =;

Contraste Unilateral: Es aquel cuya regin crtica est formada por un solo conjunto puntos de la recta real. Trabaja con los signos ; ; >; a

IDEA: Si ( > P-valor , entonces Ho es rechazada, caso contrario no se rechaza

Las pruebas de hiptesis son quizs unas de las herramientas ms poderosas que tiene la estadstica, cuyas aplicaciones van desde la medicina y la agricultura, hasta el diseo de experimentos, finanzas y las investigaciones de mercado.

La forma de calcular estas Pruebas de Hiptesis depende del tipo de prueba que se est utilizando.

2. EL PROCESO DE LAS PRUEBAS DE HIPTESIS Y SU APLICACIN EN LA INVESTIGACION CIENTFICAUna prueba de hiptesis responde a la metodologa de la investigacin cientfica, lo que implica que debe responder a un orden metodolgico y de anlisis que consta de los siguientes pasosPASO 1: Determinar el sistema de hiptesis: Es decir, plantear la hiptesis nula Ho y la alternativa H1 (con sus signos respectivos)PASO 2: Determinar el nivel de significacin de la prueba

Implica establecer un valor ( para la prueba (por lo general entre el 1% y el 10%)PASO 3: Tomar una muestra e Identificar el estadstico de prueba

Implica utilizar Z o T, dependiendo el parmetro y el tamao muestral y otras condiciones inherentes.PASO 4: Establecer la regla de decisin y Calcular los valores crticos Implica saber, en funcin de (,cuando se rechaza la Ho o no.PASO 5: Tomar e interpretar la decisin:

Tomar Ho o H1 en funcin de la relacin entre ( y el P-valorLas aplicaciones de este proceso en la investigacin cientfica permitirn comprobar las hiptesis establecidas en dichos procesos, con un alto grado de confiabilidad estadstica.TEMA 12: PRUEBAS PARA UNA POBLACIONObjetivo del tema a estudiar:Realizar pruebas de hiptesis sobre una poblacin, analizando los diferentes casos que pueden presentarseTemas a tratar:

- Prueba Z: condiciones y anlisis

- Prueba t: condiciones y anlisis

- Pruebas para Proporciones poblacionales

- Pruebas de una y de dos colas: Bilaterales y Unilaterales1. CUADRO DE ESTADISTICOS DE PRUEBA PARA CADA PARAMETROPARAMETROTIPO PRUEBAESTADISTICOS DE PRUEBA

Media Poblacional (Muestra Grande)Prueba Z para

Ztest =

Media Poblacional (Muestra pequea)Prueba T para

Ttest =

Proporcin PoblacionalPrueba Z para

Ztest =

Como se puede observar, el estadstico de prueba es exactamente igual al TLC para cada parmetro, la nica diferencia es que se utilizan los valores hipotticos de los parmetros para el clculo respectivo. Cabe recalcar, que las condiciones que se tenan anteriormente para el uso de TLC se aplican igualmente en este caso.

Tambin es importante recordar que existen varios signos con los que podemos trabajar, y en funcin de esos signos, hay que determinar:

Si estamos trabajando sobre la Ho la H1

Si la prueba es Bilateral o Unilateral (revise el tema anterior)EJEMPLOS DE APLICACIONES: En los siguientes recortes, identifique la hiptesis nula, la alternativa y si la prueba es bilateral o unilateral:

Nota:En las pruebas de hiptesis, es importante que la tomar una decisin, siempre tendremos una interpretacin asociada a la misma, adems que nunca estaremos 100% de esta decisin, puesto que la evidencia que tenemos la hemos obtenido a partir de una muestra, que siempre tendr asociado un error muestral. TEMA 13: PRUEBAS DE COMPARACIN DE DOS POBLACIONESObjetivo del tema a estudiar:Realizar pruebas de hiptesis para comparar dos parmetros poblacionales, analizando los diferentes casos que pueden presentarse

Temas a tratar:

- Pruebas para muestreos pareados

- Pruebas para muestreos independientes: Caso 1, 2 y 3- Pruebas de comparacin de proporciones

1. INTRODUCCION A LAS PRUEBAS DE COMPARACION:

En el caso de las pruebas para una poblacin, se trataba de comparar un parmetro respecto a un valor fijo, pero qu sucede si queremos comparar dos parmetros de dos poblaciones distintas entre s? El Porcentaje de desnutricin ser el mismo en Quito que en Guayaquil? Las mediciones promedio de un laboratorio sern las mismas que las obtenidas por otro laboratorio, utilizando la misma muestra patrn?

El promedio de reduccin de la presin arterial en pacientes hipertensos, ser mejor con la nueva medicina, que con la medicina genrica?

En estos casos, no nos interesa saber cul es el valor de cada parmetro, sino saber cul es ms alto respecto al otro, o si efectivamente son iguales. Para estos casos, debemos trabajar en base a diferencias positivas o negativas: Si 1 > 2 , entonces 1 - 2 > 0 (diferencia positiva) Asimismo, si (1 (2 , entonces (1 - (2 0 (diferencia negativa)IDEA: Para identificar las pruebas que debemos hacer, primero debemos establecer que tipos de muestras se tienen en cada poblacin: Pareadas o Independientes Muestras pareadas: Trabajamos sobre la misma poblacin, pero medida ANTES y DESPUES de realizar un tratamiento sobre ella. Siempre consideramos a los mismos elementos o individuos muestrales Muestras independientes: Tomamos muestras e individuos distintos en cada muestra. Puede ser la mismas o distintas poblaciones. Existen tres casos: Prueba Z: cuando se conocen las desviaciones poblacionales de cada poblacin

Prueba T: cuando no se conocen las desviaciones poblacionales, pero se suponen iguales (misma poblacin)

Prueba T: cuando no se conocen las desviaciones poblacionales, pero se suponen distintas (diferentes poblaciones)

IDEA: Las frmulas de clculo suelen ser muy engorrosas. Las aplicaciones se pueden realizar en Microsoft Excel o en cualquier programa estadsticoLa forma de realizar las pruebas es exactamente parecida, es decir, se mantienen los mismos 5 pasos que vimos en los temas anteriores.2. PRUEBA F: COMO COMPARAR LAS VARIANZAS

La prueba F sirve, entre otras cosas para comparar las varianzas de dos poblaciones. El proceso estadstico es el siguiente:

El estadstico F es: F = (S12)/ (S22) , donde siempre se tiene que: (S12) > (S22)

En el ejemplo analizado, F = 1.37

Para verificar la hiptesis de varianzas iguales, es decir Ho: (12 = (22, frente a su hiptesis alternativa Ha: (12 ( (22, la idea principal es que el valor de F debe ser cercana a 1 superiormente (pues se tom S12 > S22 ), pero esto no se consigue puesto que se trabaja con muestras, entonces se debe buscar un valor crtico para F de manera que si este F no supera a este valor crtico, entonces no se puede rechazar Ho, y se pueden suponer varianzas iguales.

El valor crtico para F (Fc), depender del valor de confianza ( y de los grados de libertad: numerador (n1 1) y denominador (n2 1). Para este fin, se utiliza la tabla F. Aunque este valor es mejor que se calcule por medio de algn programa informtico.

NOTA: En todos estos casos, se est asumiendo que las variables analizadas (es decir, las diferencias) siguen una distribucin normal. Caso contrario, debemos utilizar pruebas no paramtricas. TEMA 14: PRUEBAS JI CUADRADA Y ANALISIS DE VARIANZAObjetivo del tema a estudiar:Realizar pruebas para comprobar comportamiento y para probar suposiciones simultneamente en varias poblacionesTemas a tratar:

- Prueba Ji cuadrada

- Anlisis de varianza de uno y dos factores

1. PRUEBA JI CUADRADAEsta prueba est diseada para verificar si un conjunto de datos tiene un comportamiento determinado. Por lo general, los datos se encuentran distribuidos por clases (una tabla de distribucin de frecuencias, o no tabla de contingencia). Se determina con la frmula:

, con grados de libertad = K m 1,Donde:

Oi es la frecuencia observada en la muestra Ei es la frecuencia esperada que debera aparecer en la muestra K es el nmero de categoras o clases

m es el nmero de parmetros estimados en base a la muestra2. ANALISIS DE VARIANZA UNIDIRECCIONAL (ANOVA)Sirve para probar la igualdad de varias medias poblacionales (no solamente de 2 en 2, como las pruebas de comparacin). Se basa en el estadstico F.

El proceso estadstico se basa en la comparacin de los efectos de diferentes tratamientos al ser aplicados estos en diferentes muestras (que contienen varias unidades experimentales) en varias (c) poblaciones

Ho: (1 =(2 =(3 =...= ( c

Ha: No todas las medias son iguales (al menos una es diferente)

..........

3.1. SUPUESTOS BASICOS DEL ANOVADiseo completamente aleatorizado: Significa que las unidades experimentales fueron asignados a un tratamiento de forma indistinta.

Modelo de efectos fijos: Los tratamientos son fijos o conocidos desde el inicio del estudio.

Adems:

Todas las poblaciones son normales.

Todas las poblaciones tienen varianzas iguales

Las muestras se eligen de manera independiente. (no es muestreo pareado)

A cada muestra se le aplic un determinado tratamiento.Aunque el ANOVA trata de comparar las medias poblacionales de varias poblaciones sometidas a diferentes tratamientos, el anlisis se basa en el estudio de las variaciones inherentes a dichos tratamientos. Hay tres variaciones en el anlisis ANOVA: Variacin Intramuestral: Es la variacin de cada muestra independiente

Variacin Intermuestral: Es la variacin entre los diferentes muestras, es decir, entre los diferentes tratamientos.

Variacin Total: Es la variacin de todos los datos, considerando a la suma de todas las muestras tomadas como si fuera una sola muestra grande. Asimismo, la variacin total es la suma de las dos variaciones anteriores.La variacin intramuestral no se debe a los tratamientos, puesto que cada unidad experimental es diferente en s misma, pero estn sometidas al mismo tratamiento. Como se supone que las varianzas poblacionales son iguales, entonces esta variacin debe ser igual dentro de cada muestra.

El efecto de cada tratamiento sobre cada muestra (si este existe) slo est reflejada sobre la variacin Intermuestral, y esta variacin debe ser mayor a la intramuestral, porque aumenta mayores fluctuaciones a los datos. En este caso, los tratamientos no son iguales y Ho es rechazada. Para comparar entonces los tratamientos, se debe comparar sus variaciones utilizando el estadstico F = Variacin Intermuestral / Variacin Intramuestral.

3.2. CONSTRUCCION DE LA TABLA ANOVA

Los clculos necesarios para construir una tabla ANOVA de un factor implican clculos muy engorrosos, pero para entender el proceso de anlisis de los resultados, veamos el siguiente ejemplo:

Usted ha aplicado tres tipos diferentes de programas de capacitacin a sus empleados del hospital para aumentar sus calificaciones en las evaluaciones internas respectivas. Luego de dicha capacitacin, usted les ha tomado un examen evaluativo para conocer los resultados de cada programa:

Nro de empleadosTipo de capacitacin

Programa 1Programa 2Programa 3

1858082

2728480

3838185

4807890

5*8288

Promedio ()808185

Esta informacin nos dice que cada muestra tiene un diferente tratamiento y tambin diferente informacin. Es posible concluir que todos los programas de capacitacin son iguales?

Ntese que cada muestra tiene un tamao ni. Es decir:

n1= 4; n2= 5; n3= 5;

el tamao total es n = n1 + n2 + n3= 14;

Como hay 3 programas diferentes, c = 3

Luego, se calcula el promedio de cada muestra, y luego la media general :

= == 82,14

SUMAS DE CUADRADOS

Suma Cuadrada Total = SST = = 251,7(es decir, a cada valor se le resta la media general y se eleva al cuadrado y se suma) (Variacin Total)

Suma Cuadrada del Tratamiento = SSTR == 65,7(a cada promedio muestral se le resta la media general, se eleva al cuadrado, se multiplica por el tamao de la muestra y se suma) (Variacin intermuestral)

Suma Cuadrada del Error = SSE = = 186,0(a cada valor, se le resta el promedio de su muestra, se eleva al cuadrado y se suma) (Variacin Intramuestral)

Se puede comprobar que: SST = SSTR + SSE , es decir: 251,7 = 65,7 + 186,0

En la prctica, se calcular SSE de esta ltima expresin, es decir: SSE = SST SSTR = 251,7 65,7 = 186,0

MEDIAS CUADRADAS

Luego de calcular las sumas cuadradas, se calculan las medias cuadradas, de la siguiente manera:

Media Cuadrada Total = MST = = 19,4

Media Cuadrada del Tratamiento = MSTR = = 32,9

Media Cuadrada del Error = MSE = = 16,9

CALCULO DE F: Como se explic anteriormente, F es la razn entre la variacin intermuestral y la intramuestral:

F = = 1,94

VALOR CRITICO DE F (Fc): Depende del error de confianza (, y de los grados de libertad del numerador (c 1) y del denominador (n c). En nuestro ejemplo, y con un nivel de confianza de 95%, entonces Fc = F0,05;2;11= 3,98

REGLA DE DECISIN: Ho es rechazada si F > Fc, de lo contrario no se rechaza. En nuestro caso, como F = 1,94 y Fc = 3,98, entonces Ho no es rechazada. Se puede suponer que los tres programas de formacin son iguales.

TABLA ANOVA

Fuente de variacinSuma CuadradasGrados de LibertadMedias Cuad.Valor FFc

Intermuestral (tratamiento)SSTRc 1SSTR / (c -1)MSTR/MSEF(;c-1;n-c

Intramuestral (error)SSEn cSSE / (n c )

Variacin totalSSTn 1

IDEA: El ANOVA de un factor es cuando comparamos efectos solo por columnas, tambin se puede utilizar para comparar las filas. Esto se conoce que ANOVA de dos factoresTEMA 15: ANALISIS DE CORRELACIONES Y REGRESIONESObjetivo del tema a estudiar:Determinar la relacin existente entre dos variables, si sta existe.Temas a tratar:

- Correlacin lineal

- Regresin lineal

- Proyecciones

1. TIPOS DE RELACIONES ENTRE VARIABLES

Cmo medimos el tipo de relacin? Calculando la covarianza:

IDEA: Una cosa es establecer una relacin directa o inversa, y otra muy distinta es establecer causalidad: es decir, que una variacin en X produce una variacin en Y.Si queremos establecer una relacin de causalidad, debemos establecer primero que tipo de relacin puede existir entre las variables. Para nuestro anlisis, asumiremos que esta relacin es lineal.2. CORRELACION LINEAL

El coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales). Tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relacin sea directa o inversa. r es til para determinar si hay relacin lineal entre dos variables, pero no servir para otro tipo de relaciones (cuadrtica, logartmica,...)

ANALISIS DE LA CORRELACION LINEAL Es adimensional Slo toma valores en [-1,1] Las variables son incorreladas ( r=0 Relacin lineal perfecta entre dos variables ( r=+1 o r=-1 Excluimos los casos de puntos alineados horiz. o verticalmente. Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin lineal.(R >0,7) Siempre que no existan observaciones anmalas.

3. REGRESION LINEAL

El anlisis de regresin sirve para predecir una medida en funcin de otra medida (o varias). Y = Variable dependiente predicha explicada X = Variable independiente predictora explicativa Es posible descubrir una relacin? Y = f(X) + error f es una funcin de un tipo determinado el error es aleatorio, pequeo, y no depende de XEn nuestro caso, estudiaremos las regresiones de tipo lineal, es decir, que f(x) es una recta.

MODELO DE REGRESION LINEAL SIMPLE

En el modelo de regresin lineal simple, dado dos variables Y (dependiente) X (independiente, explicativa, predictora) buscamos encontrar una funcin de X muy simple (lineal) que nos permita aproximar Y mediante MODELO DE REGRESION LINEAL: = b0 + b1XDonde: b0 (ordenada en el origen, constante) b1 (pendiente de la recta) Y e rara vez coincidirn por muy bueno que sea el modelo de regresin. A la cantidad e=Y- se le denomina residuo o error residual.

El clculo de los coeficientes se realiza por la siguientes frmulas:

IDEA: No siempre se tiene una regresin lineal. Tambin puede ser polinomial, exponencial, logartmica, etc. Asimismo, se puede hacer una regresin con varias variables causales (mltiple)Las regresiones son un excelente mtodo de prediccin, siempre y cuando se comprueben ciertas hiptesis estadsticas (implicara otro curso ms especializado, para aplicaciones de investigacin predictiva)HOJA DE TAREA UNO:TAREA INDIVIDUAL: Consultar acerca de las medidas de tendencia central y de dispersin poblacionales. Haga hincapi en las diferencias que hubieren entre stas y las medidas muestrales estudiadas en este documento, en especial en lo referente al concepto de Grados de Libertad La consulta debe realizarse a mano, en mximo una pgina tamao A4, y entregarse en la primera sesin presencial de la prxima semana.TAREA GRUPAL:

Grupos de mximo 3 integrantes. Cada grupo deber realizar un bosquejo de investigacin exploratoria, para lo cual deber realizar las siguientes actividades: Identificar, dentro del contexto educativo, un proceso estadstico sobre el cual quisiera investigar, para lo cual debe definir claramente: La poblacin sobre la cual va a trabajar El parmetro sobre el cual quiere realizar el estudio: Puede ser una media poblacional ( (promedio) o una proporcin poblacional ( (%) Determinar la forma en la cual va a conseguir la muestra. La muestra debe tener al menos 30 observaciones Una vez identificado las fases del proceso estadstico, debe disear un instrumento de recoleccin de datos (encuestas) para obtener informacin muestral acerca del parmetro definido anteriormente, bajo las siguientes condiciones: La encuesta debe tener al menos 4 preguntas: 2 de tipo cuantitativo, 2 de tipo categrico

Recuerde que cada pregunta debe ser exhaustiva y excluyenteCada grupo deber entregar en la primera sesin de la prxima semana, un documento impreso, realizado en computadora, que contenga lo siguiente

Cartula, con el nombre de los integrantes del Grupo

Objetivo de la Investigacin (En base al parmetro) Poblacin objeto del estudio

Muestra y metodologa de muestreo

Encuesta a aplicar

NOTAS: Trate de enfocar la investigacin en una poblacin donde le sea factible conseguir datos fcil y rpidamente. Todava no debe realizar la recoleccin de datos (aplicar la encuesta), solo disearla.HOJA DE TAREA DOS:TAREA INDIVIDUAL: Resuelva los siguientes ejercicios de probabilidades:1. Tabla de probabilidades:Un investigador desea determinar el efecto de la edad de un cirujano respecto a la disposicin de los pacientes para dejarse intervenir por el mismo. Para esto, en una muestra de 130 potenciales pacientes, se les indic que un experto cirujano iba a realizar la operacin. El experto fue descrito con las mismas caractersticas para todos, excepto que a la mitad de los pacientes se les dijo que el experto tiene 65 aos, y a la otra mitad se le dijo que tena 30 aos. Posteriormente, se le pregunt a cada paciente si estaran dispuestos a ser operados por dicho experto. De cada grupo, 22 y 38 alumnos respectivamente, manifestaron que si permitiran ser intervenidos. El resto indic que lo contrario. En base a estos resultados:a. Construya la tabla de probabilidades marginales

b. Construya la tabla de probabilidades condicionales respecto a los subgrupos de intersc. Analice los resultados encontrados. Existen indicios acerca del efecto edad en la disposicin de los pacientes a ser operados?2. Distribuciones de probabilidad:

a. Daando los cromosomas del vulo o del espermatozoide, pueden causarse mutaciones que conducen a abortos, defectos de nacimiento, u otras deficiencias genticas. La probabilidad de que tal mutacin se produzca por radiacin es del 10 %. De las siguientes 150 mutaciones causadas por cromosomas daados, cuntas se esperara que se debiesen a radiaciones? Cul es la probabilidad de que solamente 10 se debiesen a radiaciones?b. Una prueba de laboratorio para detectar herona en sangre tiene un 92% de precisin. Si se analizan 72 muestras en un mes, cul es la probabilidad de que: - 60 o menos estn correctamente evaluadas?

- menos de 60 estn correctamente evaluadas?

- exactamente 60 estn correctamente evaluadas?c. Entre los diabticos, el nivel de glucosa en sangre X, en ayunas, puede suponerse de distribucin aproximadamente normal, con media 106 mg/100 ml y desviacin tpica 8 mg/100 ml.

- Qu porcentaje de diabticos tienen niveles comprendidos entre 90 y 120?.

- Hallar P[106 < X < 110].

- Hallar P[X < 121].- Hallar el punto x caracterizado por la propiedad de que el 25% de todos los diabticos tiene un nivel de glucosa en ayunas inferior o igual a x.TABLA DE VALORES DE Z (Probabilidad acumulada)Z0,000,010,020,030,040,050,060,070,080,09

0,00,50000,50400,50800,51200,51600,51990,52390,52790,53190,5359

0,10,53980,54380,54780,55170,55570,55960,56360,56750,57140,5753

0,20,57930,58320,58710,59100,59480,59870,60260,60640,61030,6141

0,30,61790,62170,62550,62930,63310,63680,64060,64430,64800,6517

0,40,65540,65910,66280,66640,67000,67360,67720,68080,68440,6879

0,50,69150,69500,69850,70190,70540,70880,71230,71570,71900,7224

0,60,72570,72910,73240,73570,73890,74220,74540,74860,75170,7549

0,70,75800,76110,76420,76730,77040,77340,77640,77940,78230,7852

0,80,78810,79100,79390,79670,79950,80230,80510,80780,81060,8133

0,90,81590,81860,82120,82380,82640,82890,83150,83400,83650,8389

1,00,84130,84380,84610,84850,85080,85310,85540,85770,85990,8621

1,10,86430,86650,86860,87080,87290,87490,87700,87900,88100,8830

1,20,88490,88690,88880,89070,89250,89440,89620,89800,89970,9015

1,30,90320,90490,90660,90820,90990,91150,91310,91470,91620,9177

1,40,91920,92070,92220,92360,92510,92650,92790,92920,93060,9319

1,50,93320,93450,93570,93700,93820,93940,94060,94180,94290,9441

1,60,94520,94630,94740,94840,94950,95050,95150,95250,95350,9545

1,70,95540,95640,95730,95820,95910,95990,96080,96160,96250,9633

1,80,96410,96490,96560,96640,96710,96780,96860,96930,96990,9706

1,90,97130,97190,97260,97320,97380,97440,97500,97560,97610,9767

2,00,97720,97780,97830,97880,97930,97980,98030,98080,98120,9817

2,10,98210,98260,98300,98340,98380,98420,98460,98500,98540,9857

2,20,98610,98640,98680,98710,98750,98780,98810,98840,98870,9890

2,30,98930,98960,98980,99010,99040,99060,99090,99110,99130,9916

2,40,99180,99200,99220,99250,99270,99290,99310,99320,99340,9936

2,50,99380,99400,99410,99430,99450,99460,99480,99490,99510,9952

2,60,99530,99550,99560,99570,99590,99600,99610,99620,99630,9964

2,70,99650,99660,99670,99680,99690,99700,99710,99720,99730,9974

2,80,99740,99750,99760,99770,99770,99780,99790,99790,99800,9981

2,90,99810,99820,99820,99830,99840,99840,99850,99850,99860,9986

3,00,99870,99870,99870,99880,99880,99890,99890,99890,99900,9990

3,10,99900,99910,99910,99910,99920,99920,99920,99920,99930,9993

3,20,99930,99930,99940,99940,99940,99940,99940,99950,99950,9995

3,30,99950,99950,99950,99960,99960,99960,99960,99960,99960,9997

3,40,99970,99970,99970,99970,99970,99970,99970,99970,99970,9998

3,50,99980,99980,99980,99980,99980,99980,99980,99980,99980,9998

3,60,99980,99980,99990,99990,99990,99990,99990,99990,99990,9999

3,70,99990,99990,99990,99990,99990,99990,99990,99990,99990,9999

3,80,99990,99990,99990,99990,99990,99990,99990,99990,99990,9999

3,91,00001,00001,00001,00001,00001,00001,00001,00001,00001,0000

TABLA DE VALORES DE T ALFA0,200,150,100,050,040,030,020,01BILATERAL

G.L.0,1000,0750,0500,0250,0200,0150,0100,005UNILATERAL

13,0784,1656,31412,70615,89521,20531,82163,657

21,8862,2822,9204,3034,8495,6436,9659,925

31,6381,9242,3533,1823,4823,8964,5415,841

41,5331,7782,1322,7762,9993,2983,7474,604

51,4761,6992,0152,5712,7573,0033,3654,032

61,4401,6501,9432,4472,6122,8293,1433,707

71,4151,6171,8952,3652,5172,7152,9983,499

81,3971,5921,8602,3062,4492,6342,8963,355

91,3831,5741,8332,2622,3982,5742,8213,250

101,3721,5591,8122,2282,3592,5272,7643,169

111,3631,5481,7962,2012,3282,4912,7183,106

121,3561,5381,7822,1792,3032,4612,6813,055

131,3501,5301,7712,1602,2822,4362,6503,012

141,3451,5231,7612,1452,2642,4152,6242,977

151,3411,5171,7532,1312,2492,3972,6022,947

161,3371,5121,7462,1202,2352,3822,5832,921

171,3331,5081,7402,1102,2242,3682,5672,898

181,3301,5041,7342,1012,2142,3562,5522,878

191,3281,5001,7292,0932,2052,3462,5392,861

201,3251,4971,7252,0862,1972,3362,5282,845

211,3231,4941,7212,0802,1892,3282,5182,831

221,3211,4921,7172,0742,1832,3202,5082,819

231,3191,4891,7142,0692,1772,3132,5002,807

241,3181,4871,7112,0642,1722,3072,4922,797

251,3161,4851,7082,0602,1672,3012,4852,787

261,3151,4831,7062,0562,1622,2962,4792,779

271,3141,4821,7032,0522,1582,2912,4732,771

281,3131,4801,7012,0482,1542,2862,4672,763

291,3111,4791,6992,0452,1502,2822,4622,756

301,3101,4771,6972,0422,1472,2782,4572,750

TABLA DE VALORES DE JI CUADRADAX2 (Alfa)0,9950,9900,9000,1000,0500,0250,0200,0100,005

G.L

10,0000,0000,0162,7063,8415,0245,4126,6357,879

20,0100,0200,2114,6055,9917,3787,8249,21010,597

30,0720,1150,5846,2517,8159,3489,83711,34512,838

40,2070,2971,0647,7799,48811,14311,66813,27714,860

50,4120,5541,6109,23611,07012,83313,38815,08616,750

60,6760,8722,20410,64512,59214,44915,03316,81218,548

70,9891,2392,83312,01714,06716,01316,62218,47520,278

81,3441,6463,49013,36215,50717,53518,16820,09021,955

91,7352,0884,16814,68416,91919,02319,67921,66623,589

102,1562,5584,86515,98718,30720,48321,16123,20925,188

112,6033,0535,57817,27519,67521,92022,61824,72526,757

123,0743,5716,30418,54921,02623,33724,05426,21728,300

133,5654,1077,04219,81222,36224,73625,47227,68829,819

144,0754,6607,79021,06423,68526,11926,87329,14131,319

154,6015,2298,54722,30724,99627,48828,25930,57832,801

165,1425,8129,31223,54226,29628,84529,63332,00034,267

175,6976,40810,08524,76927,58730,19130,99533,40935,718

186,2657,01510,86525,98928,86931,52632,34634,80537,156

196,8447,63311,65127,20430,14432,85233,68736,19138,582

207,4348,26012,44328,41231,41034,17035,02037,56639,997

218,0348,89713,24029,61532,67135,47936,34338,93241,401

228,6439,54214,04130,81333,92436,78137,65940,28942,796

239,26010,19614,84832,00735,17238,07638,96841,63844,181

249,88610,85615,65933,19636,41539,36440,27042,98045,559

2510,52011,52416,47334,38237,65240,64641,56644,31446,928

2611,16012,19817,29235,56338,88541,92342,85645,64248,290

2711,80812,87918,11436,74140,11343,19544,14046,96349,645

2