estadistica

38
ESTADÍSTICA MATEMÁTICA Juan Carlos Ballabriga Departamento de Matemáticas IES Benjamín de Tudela

Upload: carlosprofesor2001

Post on 02-Aug-2015

138 views

Category:

Documents


0 download

TRANSCRIPT

1. ESTADSTICA MATEMTICA Juan Carlos Ballabriga Departamento de Matemticas IES Benjamn de Tudela 2. Estadstica para qu Un sondeo de opinin El control de calidad de un artculo Un estudio para conocer la efectividad de unmedicamento Calcular la composicin futura de unapoblacin .... esto es estadstica 3. Tipos de Estadstica La Estadstica descriptiva: Trata del recuento, ordenacin y clasificacin de losdatos obtenidos de las observaciones: Construccin de tablas, grficos y clculo de parmetros. La Estadstica inferencial: Utiliza los resultados de la estadstica descriptiva y seapoya en el clculo de probabilidades para la obtencinde conclusiones sobre una poblacin a partir de losresultados obtenidos de una muestra. 4. CentralizacinParmetros DispersinEstadsticadescriptiva GrficosEstadsticaInferenciaestadsticaInvestigacin 5. Nociones bsicasPoblacin: Conjunto de elementos que se quiere estudiar. Votantes de una ciudad, comunidad, pas Televisores fabricados en una fbrica.Alumnos de primero de bachilleratoMuestra: Cualquier subconjunto de una poblacin. El nmero deelementos de una muestra se llama tamao. 6. PoblacinNo representativa muestra Con sesgoRepresentativa Sin sesgo 7. Tipos de muestreo Probabilstico: sabemos la probabilidad de que un individuo sea elegido en la muestra Muestreo aleatorio simple (m.a.s.): Todos tienen las mismasposibilidades de ser elegidos Muestreo aleatorio estratificado: Se divide la poblacin enestratos y se hace un m.a.s. en cada uno Muestreo sistemtico: Se selecciona el primer individuo al azary los siguientes estableciendo una pauta Muestreo no probabilstico: no se sabe la probabilidad de que un individuo sea elegido 8. Variable estadstica: Cada uno de los rasgos o caractersticas quese quiere estudiar de los elementos de la poblacin, susceptible o node medida.Ejemplos: Color del pelo: negro, castao, rubio o pelirrojo Sexo: hombre o mujer Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5 Alturas de alumnos:178, 169, 172, 183, N de suspensos en determinada asignatura: 0, 1, 2, 3,Gastos en vacaciones de una familia: 1000,1500,.. 9. Variables cualitativas y cuantitativas Poblacin: Alumnos de bachillerato de una localidad determinada Sexo Cualitativas Modelo de zapatillas deportivas Barrio de la localidad en que vive (modalidad) Deporte preferido Nmero de hermanos Nm.de suspensos en la 1 evaluacinVariables DiscretasNm de libros ledos trimestralmente (Recuentos)Num. de llamadas telefnicas diarias Cuantitativas (nmeros) Tiempo diario delante del televisor Tiempo de estudioContinuas Altura(CualquierPesocantidad en Tiempo empleado en llamadasun intervalo) 10. Frecuencias Frecuencia absoluta: N de veces que aparece un determinado valor de la variable fi Si sumamos todas las frecuencias obtenemos el de datos N f1 f 2 f 3 f r Frecuencia relativa: fini N Frecuencia absoluta acumulada: Acumula lasfrecuencias absolutas hasta determinado valor de lavariable,Fi Frecuencia relativa acumulada: Acumula lasfrecuencias relativas hasta determinado valor de lavariable Ni 11. Tabla de frecuenciasPoblacin : Alumnos deBachilleratoVariable: Preferencias musicalesTipo: CualitativaTamao de la muestra 120 fi Fini NiClsica 11 0,008333330,00833333Rock 36 37 0,3 0,30833333Pop49 86 0,408333330,71666667Jazz4 90 0,03333333 0,75Flamenco2 92 0,016666670,76666667Techno 28120 0,233333331 N120 12. Variables cualitativas: Representacin grfica 50 451 40 35 Clsica 30 22836 Rock 25 Pop 20 4 Jazz 15 Flamenco 10 49Techno5 0Clsica Rock Pop Jazz Flamenco Techno Diagrama de Barras Diagrama de Sectores 13. Variable discretaEjemplo: Un profesor tiene anotadas en su cuaderno lasnotas de 30 alumnos de un clase: 534 1289 876 6798 771 0159 980 8889 57Lo primero que tenemos que hacer es contar los datos 14. Tabla de frecuenciasNotas Frec. Abs. Frec. Abs. Frec. Relat. Frec. Relat. AcumuladasAcumuladas xi fi Fi ni Ni0 220,07 0,071 350,10 0,172 160,03 0,203 170,03 0,234 180,03 0,275 311 0,10 0,376 213 0,07 0,437 518 0,17 0,608 725 0,23 0,839 530 0,17 1,00Suma 301 15. Algunos diagramas 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10Frecuencias absolutasDiagrama de barras y polgono de frecuencias 16. Con frecuencias acumuladas353025201510 50 1 2 3 4 5 6 7 8 9 10 Frecuencias absolutas acumuladasDiagrama de barras y polgono de frecuencias 17. Cuidado al interpretar datos1201008060 40 20 0E F M A My J Jl A S O N DEvolucin de las ventas de coches en undeterminado concesionario 18. la cruda realidad 16 14 12 10 8 6 4 2 0E F M A My J Jl A S O N D 19. Parmetros estadsticos Centralizacin: Media aritmtica: La suma de todos los valores dividido por el nmero de datos X Moda: Valor que ms se repite. Si hay ms de una, se llama bimodal, trimodal,Mo Mediana: La mediana de una coleccin de datos ordenados de menor a mayor es el valor que est en medio, es decir que la mitad de los datos son mayores que l y la otra mitad son menores que l, si hay un nmero impar de datos; si el nmero de datos es par, la mediana es la media aritmtica entre los dos valores centrales. Me 20. Clculo de parmetros La media aritmtica cuando tenemos la tabla de frecuencias se calcula asx x x3 xN x1 f1 x2 f 2 xr f rX 1 2 x f i iN f1 f 2 xr f i xifix i* f iFi02 0 213 3 521 2 631 3 741 4 853151162121375351887562595453030 175Media 5,83 21. La moda y medianaLa moda por simple observacin: Mo = 8xifix i* f iFi0 2 0 212313256 La mediana: Es el valor que3 1 3 74 1 4 8 ocupa el sitio central. Se puede5 315116 21213 plantear de la siguiente manera7 535188 756259 54530 Si N impar Me x N 130175 2 xN xN 1 Si N par Me 22 2 N N 30 como es par 15 buscamoslos valores que ocupen 2 NN las posiciones 15 y 16, es decir Me 7 22 22. Dispersin Rango: Diferencia entre el mayor y el menor valor de la variableRango: V max V min Desviacin Media D.M. D.M . x X fi i f x X 2i fi Varianza: 2 i fi Desviacin tpica: 23. Dispersin Coeficiente de variacin: C.V . Sin unidades X No depende de la variable Permite comparar poblaciones y variables distintasEjemplo 1 Ejemplo 2Desv.CoeficienteMedia TpicavariacinClase A Clase BVariable Notas72 0,28571429 Nota media 7,4 6,5 Desv. Tpica 2,8 2,5 Variable Ingresos 1500 1450,09666667 24. Clculo de parmetros Variable:Notas asignaturaTipo: DiscretaPoblacin:Alumnos BachilleratoTABLA PARA UNA VARIABLE ESTADSTICA DISCRETA Datos (xi)Frecuencias (fi) Fr. Relativas (hi) xi*fi xi-X(xi-X)2 (xi-X)2 * fi Fr. Acumuladas 020,06670-5,83 33,9889 67,9778 2 130,1 3-4,83 23,3289 69,9867 5 210,03332-3,83 14,6689 14,6689 6 310,03333-2,838,00898,0089 7 410,03334-1,833,34893,3489 8 530,115-0,830,68892,066711 620,0667 12 0,170,02890,057813 750,1667 35 1,171,36896,844518 870,2333 56 2,174,7089 32,962325 950,1667 45 3,17 10,0489 50,244530 30 1175256,167 MEDIA (X)5,83 MODA (Mo)8MEDIANA (Me)7 VARIANZA 8,5389DESVIACIN TPICA2,9221 COEFICIENTE DE VARIACIN0,501250,12%RANGO 9 25. Los grficos DIAGRAMA DE BARRAS YPOLGONO DE FRECUENCIASDIAGRAMA Y POLGONO DE FRECUENCIAS8ACUMULADO357306255204153102 51 000 12 34 5 6 7 8 901 2 34 567 8 9Valores de la variable Valores de la variable 26. Variable continua: Agrupacin de datos Si la variable es continua, o discreta con un nmero de datos muy grande, es aconsejableagrupar los datos en CLASES. Cul es el nmero idneo de clases? El nmero clases debe ser aproximadamente igual a la raz cuadrada positiva del nmero dedatos. Cmo escoger las clases? Es aconsejable que los lmites de clase (tanto el superior como el inferior) sean nmerosredondos, como mltiplos de 5, 10, Se debe procurar que todas las clases tengan la misma amplitud o tamao. Los intervalos se deben construir de modo que el lmite superior de una clase coincida con ellmite inferior de la siguiente. Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por laderecha. 27. Variable continua EjemploSe ha aplicado un test sobre satisfaccin en el trabajo a 88 empleados de unafbrica, obtenindose las resultados: Puntuaciones Nm. de trabajadores [38-44) 7 [44-50) 8 [50-56)15 [56-62)25 [62-68)18 [68-74) 9 [74-80) 6 28. Variable: Satisfaccin empleadosTipo:ContinuaPoblacin: Empleados de una fbricaTABLA PARA UNA VARIABLE ESTADSTICA CONTINUA IntervaloMarca (xi) Frecuencias (fi) Fr. Relativas (hi)xi*fi xi-X(xi-X)2 (xi-X)2 * fi Fr. Acumuladas38 4441 70,0795 287 -18,14329,062303,4172744 5047 80,0909 376 -12,14147,381179,0368 1550 5653150,1705 795-6,14 37,6996565,494 3056 6259250,28411475-0,140,01960,495562 6865180,20451170 5,86 34,3396 618,1128 7368 7471 90,1023 63911,86140,661265,9364 8274 8077 60,0682 46217,86318,981913,8776 8888888888 1 5204 7846,3648 MEDIA (X)59,14 INTERVALO MODAL [56,62)MODA (Mo) 59 INTERVALO MEDIANA [56,62) MEDIANA (Me) 59 VARIANZA89,1632DESVIACIN TPICA 9,4426 COEFICIENTE DE VARIACIN 0,1597 15,97%RANGO 42 29. Grficos: Histograma HISTOGRAMA Y POLGONO DE FRECUENCIAS3025201510 5 0 [38,44) [44,50) [50,56) [56,62)[62,68) [68,74) [74,80) Valores de la variable 30. HISTOGRAMA Y POLGONO DE FRECUENCIAS ACUMULADO100 90 80 70 60 50 40 30 20 10 0[38,44) [44,50) [50,56) [56,62) [62,68) [68,74) [74,80)Valores de la variable 31. Parmetros en variable continua Cuando estamos trabajando con variable continua algunas de las frmulasutilizadas se deben ajustar para que sean ms fiables f i f i 1Mo Li 1 ai Moda f i f i 1 f i f i 1 N Fi 1 Mediana Me Li 1 2 aifirN Fi 1 PercentilesPr Li 1 100aifi 32. Del anterior test sobre satisfaccin en el trabajo a 88 empleados de una fbrica,cuyos resultados son:Puntuaciones Nm. de trabajadores[38-44) 7[44-50) 8[50-56)15[56-62)25[62-68)18[68-74) 9[74-80) 6 Calcular:a) El cuartil primero.b) Los percentiles de orden 40 y 90 33. Q1 deja la cuarta parte de la distribucin a su izquierda :N/4=22 Clases fi Fi [38-44) 7 7 [44-50) 8 15 22 Clase del primer [56-62)25 55 cuartil: [50-56) [62-68)18 73 [68-74) 9 82 [74-80) 6 88 Aplicando la frmula: Li-1 = 50 ai = 6 22 15 N/4 = 22Q1 50 6 52.815 Fi-1 = 15 fi = 15 34. P40 deja el 40% de los datos a su izquierda :88.40/100=35.2ClasesfiFi[38-44) 7 7[44-50) 8 15[50-56) 1530 < 35.2[56-62) 2555 > 35.2 Clase de P40:[62-68) 1873[56-62)[68-74) 9 82[74-80) 6 88 Aplicando la frmula:Li-1 = 56ai = 6 35.2 3040.N/100 = 35.2 P40 56 6 57.25Fi-1 = 30 25fi = 25 35. P90 deja el 90% de los datos a su izquierda :88.90/100=79.2ClasesfiFi Clase de P90:[38-44) 7 7[68-74)[44-50) 8 159 6.2[50-56) 15306 x[56-62) 2555[62-68) 1873 < 79.2 9[68-74) 9 82 > 79.26.2[74-80) 6 88x Aplicando la frmula:68 6 74Li-1 = 68ai = 6 79.2 7390.N/100 = 79.2 P90 68 6 72.13Fi-1 = 739fi = 9