tema 0 - estadistica.ppt

30
Estadística Al hacer Un sondeo de opinión El control de calidad de un artículo Un estudio para conocer la efectividad de un medicamento Calcular la composición futura de una población .... Estamos haciendo

Upload: christianantonio

Post on 21-Nov-2015

23 views

Category:

Documents


0 download

TRANSCRIPT

  • EstadsticaAl hacerUn sondeo de opininEl control de calidad de un artculoUn estudio para conocer la efectividad de un medicamentoCalcular la composicin futura de una poblacin .... Estamos haciendo

  • Tipos de EstadsticaLa Estadstica descriptiva o deductiva:Trata del recuento, ordenacin y clasificacin de los datos obtenidos de las observaciones:Construccin de tablas, grficos y clculo de parmetros. La Estadstica inferencial o inductiva:Utiliza los resultados de la estadstica descriptiva y se apoya en el clculo de probabilidades para la obtencin de conclusiones sobre una poblacin a partir de los resultados obtenidos de una muestra.

  • Poblacin, muestra y variable estadstica Habitantes de una ciudad. Televisores fabricados en una factora.Alumnos de primero de bachillerato. Color del pelo: negro, castao, rubio o pelirrojo Sexo: hombre o mujerMiembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5 Alturas de alumnos:178, 169, 172, 183, Variable estadstica: Cada uno de los rasgos o caractersticas que se quiere estudiar de los elementos de la poblacin, susceptible o no de medida. Poblacin: Conjunto de elementos que se quiere estudiar.Muestra: Cualquier subconjunto de una poblacin. El nmero de elementos de una muestra se llama tamao.

  • Variables cualitativas y cuantitativas(modalidad)(nmeros)Poblacin: Alumnos de bachillerato de una localidad determinadaNmero de hermanosNm.de suspensos en la 1 evaluacinNm de libros ledos trimestralmenteNum. de llamadas telefnicas diariasTiempo diario delante del televisorTiempo de estudioAltura PesoTiempo empleado en llamadasSexoModelo de zapatillas deportivasBarrio de la localidad en que viveDeporte preferido(Recuentos)(Cualquier cantidad en un intervalo)

  • Las frecuencias absolutas fi , i= 1,..., r, verifican: I ni 0II n1 + n2 + n3 + ... + nr = NLas frecuencias relativas hi, i= 1,..., r, verifican: I hi 0II h1 + h2 + h3 + ... + hr = 1Clase modal o modaVariables cualitativas: Distribucin de frecuenciasFrecuencia absoluta del valor xi:Nmero de veces que se repite. Se representa por fi.Frecuencia relativa del valor xi:Cociente entre la frecuencia absoluta de xi y el nmero total de datos de la distribucin.Se representa por hi.Propiedades:

    Hoja1

    Preferencias musicales de 120 alumnos

    FrecuenciasFrecuencias

    Msicaabsolutasrelativas

    fihi

    Clsica10.0080.83

    Rock360.30030.00

    Pop490.40840.83

    Jazz40.0333.33

    Flamenco20.0171.67

    Techno280.23323.33

    Sumas1201100.000

    Hoja1

    1

    36

    49

    4

    2

    28

    Msica elegida

    Frecuencias absolutas

    Preferencias musicales de 120 alumnos de bachillerato

    Hoja2

    Hoja3

  • Variables cualitativas: Representacin grficaDiagrama de BarrasDiagrama de Sectores

    Grfico1

    18

    12

    10

    10

    Frecuencias

    Sabores de refescos

    Hoja1

    Naranja18

    Limn12

    Pia10

    Manzana10

    Hoja1

    Frecuencias

    Sabores de refescos

    Hoja2

    Hoja3

    Grfico2

    18

    12

    10

    10

    Hoja1

    Naranja18

    Limn12

    Pia10

    Manzana10

    Hoja1

    Frecuencias

    Sabores de refescos

    Hoja2

    Hoja3

  • Variables cuantitativas discretas: Distribucin de frecuenciasTabla de FrecuenciasUn profesor tiene anotadas en su cuaderno las notas de 30 alumnos de un clase: 534128987667987710159980888957

    NotasFrec. Abs.Frec. Abs.Frec. Relat.Frec. Relat.AcumuladasAcumuladasxifiFihiHi0220,070,071350,100,172160,030,203170,030,234180,030,2753110,100,3762130,070,4375180,170,6087250,230,8395300,171,00Suma301

  • Frecuencia absoluta acumulada de xi: Suma de las frecuencias absoluta de todos los valores anteriores a xi ms la frecuencia absoluta de xi: Fi=f1+f2+f3++f1 Frecuencia relativa acumulada de xi: Cociente entre la frecuencia absoluta acumulada de xi y el nmero total de datos:Hi = Fi/N = h1+h2+h3++hi

  • Frecuencias absolutas acumuladasDiagrama de barras y polgono de frecuenciasFrecuencias absolutasDiagrama de barras y polgono de frecuencias

    Grfico4

    22

    55

    66

    77

    88

    1111

    1313

    1818

    2525

    3030

    Notas de alumnos

    N de alumnos (Frec. Abs. acumuladas)

    Hoja1

    NotasFrec. Abs.Frec. Abs.Frec. Relat.Frec. Relat.

    AcumuladasAcumuladas

    xifiFihiHi

    0220.070.07

    1350.100.17

    2160.030.20

    3170.030.23

    4180.030.27

    53110.100.37

    62130.070.43

    75180.170.60

    87250.230.83

    95300.171.00

    Suma301

    Hoja1

    Notas de alumnos

    N de alumnos (Frec. Abs. acumuladas)

    Hoja2

    Hoja3

    Grfico3

    22

    33

    11

    11

    11

    33

    22

    55

    77

    55

    Notas de alumnos

    Nmero de alumnos (Frec. absolutas)

    Hoja1

    NotasFrec. Abs.Frec. Abs.Frec. Relat.Frec. Relat.

    AcumuladasAcumuladas

    xifiFihiHi

    0220.070.07

    1350.100.17

    2160.030.20

    3170.030.23

    4180.030.27

    53110.100.37

    62130.070.43

    75180.170.60

    87250.230.83

    95300.171.00

    Suma301

    Hoja1

    Notas de alumnos

    Nmero de alumnos (Frec. absolutas)

    Hoja2

    Hoja3

  • Agrupacin de datosSi la variable es continua, o discreta con un nmero de datos muy grande, es aconsejable agrupar los datos en CLASES.Cul es el nmero idneo de clases?El nmero clases debe ser aproximadamente igual a la raz cuadrada positiva del nmero de datos.Cmo escoger las clases?Es aconsejable que los lmites de clase (tanto el superior como el inferior) sean nmeros redondos, como mltiplos de 5, 10, Se debe procurar que todas las clases tengan la misma amplitud o tamao.Los intervalos se deben construir de modo que el lmite superior de una clase coincida con el lmite inferior de la siguiente.Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha.

  • Las edades de las personas que acuden al logopeda a lo largo de un mes son:321113432456734532562715421124362913617613651226Variables cuantitativas discretas: Datos agrupadosTabla estadsticaComo hay 36 datos, el nmero de clases que debemos formar puede ser aproximadamente 6. Si el intervalo lo extendemos desde 0 hasta 30, al dividir por 6 se tiene que la amplitud de cada clase debe ser 5.

    ClasesMarcas de clasefiFihiHi[0,5)2,513130,360,36[5,10)7,511240,310,67[10,15)12,56300,170,83[15,20)17,52320,060,89[20,25)22.51330,030,92[25,30)27,53360,081Sumas361

  • Variables cuantitativas discretas: Datos agrupadosTabla estadsticaHistogramaLos rectngulos tienen como base la longitud de los intervalos y como altura la frecuencia absoluta de cada intervaloLos histogramas se utilizan generalmente para distribuciones de variable continua o discreta con gran nmero de datos y que se han agrupado en clases.Si los intervalos no son de igual amplitud, la altura de los rectngulos deben calcularse teniendo en cuenta que sus reas sean proporcionales a la frecuencia de cada intervalo.

  • Variables cuantitativas: Medidas de posicinSi conocemos la frecuencia de cada uno de los datos:

  • Las calificaciones en la asignatura de historia de los 40 alumnos de una clase viene dada por la tabla:Se ha aplicado un test sobre satisfaccin en el trabajo a 88 empleados de una fbrica, obtenindose las resultados:Hoja de clculoHoja de clculo

    Calificaciones123456789N de alumnos224589343

    PuntuacionesNm. de trabajadores[38-44)[44-50)[50-56)[56-62)[62-68)[68-74)[74-80)7815251896

  • Variables cuantitativas: Medidas de posicinEn el caso de datos agrupados en intervalos, es fcil determinar la clase modal (clase con mayor frecuencia), pero el valor dentro del intervalo se obtiene mediante la expresin:Li = Lmite inferior de la clase modalC = amplitud de los intervalosD1 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior.D2 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase siguiente.

  • Mediana: Se llama mediana de una variable estadstica a un valor de la variable, tal que el nmero de observaciones menores que l es igual al nmero de observaciones mayores que l. Se representa por M.Variables cuantitativas: Medidas de posicin

  • Datos agrupados:Se construye la tabla de frecuencias acumuladas. La mediana es el primer valor de la variable cuya frecuencia acumulada excede a la mitad del nmero de datos. Cuando la mitad del nmero de datos coincida con la frecuencia acumulada de un valor, la mediana es la semisuma entre ese valor y el siguiente de la tabla.Datos simples: Si el n de datos es impar, el valor central de la variable es nico.Si el n de datos es par, existen dos trminos centrales. Se toma como valor de la mediana la semisuma de estos dos valores. Clculo de la medianaVariable estadstica discreta

  • Clculo de la mediana (II)Variable estadstica continua o discreta con datos agrupados en intervalosPara determinar la clase mediana se procede del mismo modo que en el caso de variables discretas con datos no agrupados en intervalos. Para determinar el valor concreto de la variable que deja a su izquierda igual nmero de datos que a su derecha, aplicamos la frmula:Li = Lmite inferior de la clase modalc = amplitud de los intervalosN = Nmero total de datosFi-1 = Frecuencia absoluta acumulada de la clase anterior a la clase mediana.Fi = frecuencia absoluta de la clase mediana.

  • Test sobre satisfaccin en el trabajo: N=88Clase mediana: [56-62)M=56+3.36=59.36Aplicando la frmula: Li = 56c = 6N/2 = 44Fi-1 = 30fi = 25

    ClasesfiFi[38-44)[44-50)[50-56)[56-62)[62-68)[68-74)[74-80)781525189671530 < 4455 > 44738288

  • Mtodo grfico para el clculo de la medianaRepresentamos el histograma de frecuencias acumuladas porcentualesTrazamos el polgono de frecuencias acumuladas, uniendo los vrtices superiores derechos de los rectngulos del histograma.Sobre el polgono determinamos el valor de la variable que corresponde a una frecuencia acumulada del 50%.

  • Cuantiles: La mediana divide los datos de la distribucin en dos partes iguales.Podemos estudiar otros parmetros que dividan la distribucin de datos en otras proporciones.Variables cuantitativas: Medidas de posicin

  • Los deciles son nueve valores que dividen la distribucin de datos en 10 partes iguales, dejando debajo de ellos el 10%, el 20 %, 30%, , y el 90 % de los datos respectivamente. Se representan por D1, D2, D3,., D9.Los percentiles son noventa y nueve valores que dividen la distribucin de datos en 100 partes iguales, dejando debajo de ellos el 1%, el 2 %, 30%, , y el 99 % de los datos respectivamente. Se representan por P1, P2, P3,., P99.

  • Las calificaciones en la asignatura de historia de los 40 alumnos de una clase viene dada por la tabla:Calcular los cuartiles primero y tercero y los percentiles de orden 30 y 70Clculo de Q1N/4=10.10Q1=4Clculo de Q33.N/4=30=30Q3=6.5Clculo de P3030.N/100=12>12P30=4Clculo de P7070.N/100=28>28P70=6
  • Se ha aplicado un test sobre satisfaccin en el trabajo a 88 empleados de una fbrica, obtenindose las resultados:Calcular: a) Los cuartiles primero y tercero.b) Los percentiles de orden 40 y 90

    PuntuacionesNm. de trabajadores[38-44)[44-50)[50-56)[56-62)[62-68)[68-74)[74-80)7815251896

  • Test sobre satisfaccin en el trabajo: N=88Clase del primer cuartil: [50-56)M=50+2.8=52.8Aplicando la frmula: Li = 50c = 6N/4 = 22Fi-1 = 15fi = 1567x155056Q1 deja la cuarta parte de la distribucin a su izquierda :N/4=2222

    ClasesfiFi[38-44)[44-50)[50-56)[56-62)[62-68)[68-74)[74-80)78152518967153055 738288

  • Test sobre satisfaccin en el trabajo: N=88Clase del tercer cuartil: [62-68)M=62+3.67=65.67Aplicando la frmula: Li = 62c = 6N/4 = 66Fi-1 = 55fi = 18611x186268Q3 deja las tres cuartas partes de los datos a su izquierda :3.N/4=6666

    ClasesfiFi[38-44)[44-50)[50-56)[56-62)[62-68)[68-74)[74-80)78152518967153055 738288

  • Test sobre satisfaccin en el trabajo: N=88Clase de P40: [56-62)M=56+1.25=57.25Aplicando la frmula: Li = 56c = 640.N/100 = 35.2Fi-1 = 30fi = 2565.2x255662P40 deja el 40% de los datos a su izquierda :88.40/100=35.2< 35.2> 35.2

    ClasesfiFi[38-44)[44-50)[50-56)[56-62)[62-68)[68-74)[74-80)78152518967153055 738288

  • Test sobre satisfaccin en el trabajo: N=88Clase de P90: [68-74)M=68+4.13=72.13Aplicando la frmula: Li = 68c = 690.N/100 = 79.2Fi-1 = 73fi = 966.2x96874P90 deja el 90% de los datos a su izquierda :88.90/100=79.2< 79.2> 79.2

    ClasesfiFi[38-44)[44-50)[50-56)[56-62)[62-68)[68-74)[74-80)78152518967153055 738288

  • Mtodo grfico para el clculo de los cuantilesRepresentamos el histograma de frecuencias acumuladas porcentualesTrazamos el polgono de frecuencias acumuladas, uniendo los vrtices superiores derechos de los rectngulos del histograma.Sobre el polgono determinamos el valor de la variable que corresponde a una frecuencia acumulada correspondiente al cuantil deseado