sesión 8 tema: profesor: víctor manuel reyes asignatura: matemática ii sede: osorno objetivo:...

34
Sesión 8 Tema: Profesor: Víctor Manuel Reyes Asignatura: Matemática II Sede: Osorno Objetivo: Resolver situaciones que puedan se explicadas en términos de funciones trigonométricas Estadística descriptiva Carrera: TNS de Electricidad en Potencia

Upload: manuela-suarez-padilla

Post on 03-Feb-2016

216 views

Category:

Documents


0 download

TRANSCRIPT

Diapositiva 1

Sesin 8Tema:Profesor: Vctor Manuel Reyes

Asignatura: Matemtica II

Sede: OsornoObjetivo:Resolver situaciones que puedan se explicadas en trminos de funciones trigonomtricas Estadstica descriptivaCarrera: TNS de Electricidad en PotenciaContenidosEstadstica descriptiva: Tcnicas que tratan de describir conjuntos de datos resumiendo la informacin que stos proporcionan utilizando como herramientas: Tablas de frecuenciasPosicin o centralizacin Grficos Medidas numricas:DispersinForma o asimetraConceptos fundamentalesPoblacin: conjunto de elementos o individuos de los que interesa estudiar alguna caracterstica.Variable : Es la caracterstica que se desea estudiar. Puede ser cualitativas, cuando sus valores indican cualidad y no son numricos, o cuantitativas, cuando sus valores son numricos. Las variables cuantitativas tambin se llaman variables estadsticas.Conceptos fundamentalesMuestra: subconjunto finito de una poblacin.Razones para estudiar una muestra: coste, tiempo, personal cualificado, procesos destructivos,...La estadstica siempre trabaja con muestras: es decir, con un conjunto de datos x1, x2 ,..., xn que vienen del estudio de una caracterstica o variable X.EjemplosPoblacin: Estudiantes de la EUIMuestra: Alumnos de este grupoVariables cualitativas: Sexo, color de pelo, grado de satisfaccin ante el funcionamiento de una instalacin de la EUI,...Variables cuantitativas: Edad, n de llamadas de mvil en un da, tiempo empleado en cada llamada, salario que se cobra mensualmente, n de conexiones diarias a Internet...Distribucin de frecuenciasPara estudiar una variable X se parte de una muestra de tamao n,x1, x2 ,..., xn, entre los que suponemos que aparecen como valoresdistintos x1, x2 ,..., xk .Frecuencia absoluta de xi: Es el nmero, ni, de veces que se repite xi.Frecuencia relativa de xi: es el cociente entre la frecuencia absoluta y n.

Distribucin de frecuenciasFrecuencia absoluta(relativa) acumulada de xi: Si llamamos x*1, x*2 ,..., x*k a los valores ordenados de menor a mayor (slo sentido variables cuantitativas o estadsticas):Frecuencia absoluta acumulada de x*iFrecuencia relativa acumulada de x*i

Propiedades de frecuencias La suma de las frecuencias absolutas es el nmero de datos.

La suma de las frecuencias relativas es 1. Si la frecuencia relativa de un dato se multiplica por 100, tenemos el porcentaje que ese dato representa del total.

Propiedades de frecuenciasLa frecuencia absoluta acumulada del ltimo dato coincide con el nmero de datos.

La frecuencia relativa acumulada del ltimo dato es 1. Si la frecuencia relativa acumulada de un dato se multiplica por 100, tenemos el porcentaje que ese dato y todos los menores representan sobre el total.

Tabla o distribucin de FrecuenciasEs el conjunto de valores distintos que toma la variable acompaados de sus respectivas frecuencias.Tiene sentido para variables cuantitativas y para variables cualitativas (en este caso, slo las frecuencias absolutas y relativas)Ejemplo: Nmero de accesos de un procesador a un determinado mdulo de memoria en una hora.Se toma una muestra de tamao 14:1, 2, 4, 8, 2, 1, 4, 4, 8, 3, 2, 2, 7, 3.

Tabla de FrecuenciasTabla de FrecuenciasOtras tablas de frecuencias

Las tablas de frecuencia son tiles para resumir la informacin de una variable cuando se tiene una muestra con pocos valores distintos (orientativo, a lo sumo 20).Si el nmero de valores distintos de la muestra es grande (mayor que 20), se agrupan los datos en intervalos para construir la tabla de frecuencias.Llamaremos a estas ltimas Variables agrupadas. Al resto nos referiremos como Variables no agrupadas o sin agrupar.Tabla de FrecuenciasUna regla usual para el nmero de intervalos es elegir un entero cercano a 1 + 3.3log10(n).Tabla de FrecuenciasPoblacin: hogares osorninosVariable o caracterstica: Consumo mensual de leche, en litros.Muestra: 40 familias osorninos

Tenemos 22 valores distintos: vamos a agrupar en intervalos.Mnimo = 10, mximo = 103.3; 1 + 3.3log10(40) = 6.29 6.Conviene trabaja con intervalos fciles, por ejemplo, que tengan extremos enteros.

Tabla de Frecuencias

Como puede observarse el primer intervalo contienen ms del 30% (12) y el ltimo menos del 5% (2) de los datos.Representaciones GrficasDiagrama de barrasHistogramaSe realiza cuando el nmero de datos distintos es pequeo (menos de 20 con Statgraphics).Sobre cada valor de los datos se levanta una barra cuya altura es igual o proporcional a su frecuencia.Se pueden representar las frecuencias absolutas o relativas.

Diagrama de barrasHistogramaEs una representacin que se usa cuando hay muchos datos distintos y, por tanto, hay que agrupar los datos en intervalos.En este caso, cada intervalo se representa mediante un rectngulo cuya altura es igual o proporcional a su frecuencia.Se pueden representar las frecuencias absolutas o relativas

Medidas de tendencia central O Medidas de centralizacin o posicinTienen sentido solamente para variables cuantitativas (valores numricos)Son valores en torno a los cuales se agrupa la variable (Valores centrales).Las principales son:ModaMedia aritmticaMedianaCuantilesModaEs el dato con mayor frecuencia absoluta (el que ms se repite).Puede haber ms de una moda o no haber moda (si todos los datos tienen frecuencia 1)Ejemplo: 2, 2, 3, 3, 4, 4, 4, 5, 6, 6, 6, 7, 7, 8, 8 (muestra tamao 15)

Este ejemplo tiene dos modas:4 y 6Media aritmtica

La media es la suma de todos los valores de la variable dividido entre el nmero total de datos (primera frmula).Si se dispone de las frecuencias absolutas (relativas) de los datos, la media se puede calcular usando la segunda (tercera) expresin de la media donde representan los valores distintos de la variable.Todas las medidas que estudiemos tienen esta dos versiones.Media aritmticaCon los datos anteriores: 2, 2, 3, 3, 4, 4, 4, 5, 6, 6, 6, 7, 7, 8, 8 (muestra tamao 15), se tiene:

MedianaEs un valor tal que, ordenados de menor a mayor los datos, el 50% es menor o igual que l y el 50% mayor o igual que l. Se denota como Me.Con los datos del ejemplo anterior:

En este caso hay un valor central porque el nmero de datos es impar. En el caso de tener un nmero par de datos, la mediana esla semisuma de los dos datos centrales (en este caso no tiene porqu ser uno de los datos)Si aadimos a los datos anteriores el valor 8, la mediana es 5.5, que no es uno de los datos.Comparacin media-medianaLa media contiene ms informacin porque usa los valores de todos los datos.La mediana es ms robusta frente a los cambios en los datos, es decir, es menos sensible a cambios en los datos.Ejemplo: si a los datos anteriores 2 2 3 3 4 4 4 5 6 6 6 7 7 8 8, le aadimos el dato 34, tenemos:Nueva media: = 6.8 (antes era 5)Nueva mediana: Me = 5.5 (antes era 5)La media es ms sencilla de calcular y se presta mejor a los clculos algebraicos.Deben calcularse ambas pues proporcionan informacin complementaria.PercentilesPercentil de orden k = cuantil de orden k/100La mediana es el percentil 50El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.Primer cuartil = Percentil 25 = Cuantil 0,25Segundo cuartil = Percentil 50 = Cuantil 0,5 = medianaTercer cuartil = Percentil 75 = cuantil 0,75Q1 es un valor tal que el 25% de los datos es menor o igual que l y el resto, mayor o igual que l. P18 es un valor tal que el 18% de los datos es menor o igual que l y el resto mayor o igual que l.PercentilesEn el calculo se ordenan los datos de menor a mayor.Ejemplo: 2,2,3,3,4,4,4,5,6,6,6,7,7,8,8 en este ejemplo n=15Encontrar un valor tal que el 25% de los datos sea menor o igual que lEsto significa que el 25% de los datos son menores o iguales que 3 y el otro 75% son mayores o iguales que 3.n = 15*0.25 = 3.75Medidas de dispersinSe calculan solamente para variables cuantitativasLas medidas de dispersin completan la informacin que dan las medidas de centralizacin e indican si stas son ms o menos representativas del conjunto de datos.A menor valor de la medida, menor dispersin en el conjunto de datos.Las ms importantes son:Rango o recorridoRecorrido intercuartlicoVarianza y Desviacin tpicaCoeficiente de variacinNecesidad de medidas deDispersinLas medidas de centralizacin proporcionan una informacin incompleta del conjunto de datos.

Ejemplo: sean X e Y las notas de dos grupos de cuarenta alumnos, con distribuciones de frecuencias:Para ambas variables la mediaes 5, pero en el segundo caso 5es un valor ms representativode los datos que en el primero.Intuitivamente los datos de X estn ms dispersos (ms separados) que los de Y, entre ellos y respecto de la media.Rango o recorrido & Recorrido intercuartlicoEl rango o recorrido y el recorrido intercuartlico miden la amplitudde los datos.Se definen como:Rango o recorrido:R = xmayor xmenorRecorrido intercuartlico:RQ = Q3 - Q1En el ejemplo de las notas de las dos clases X e Y, se observa que X es ms dispersa que Y al calcular R y RQ :

Varianza y desviacin tpicaAmbas son medidas de dispersin asociadas a la media. Miden, entonces, la representatividad de la media en el conjunto de datos.Varianza:

Representa una especie de distancia media de los datos a la media aritmtica. A mayor varianza, mayor distancia de los datos a la media y por tanto, menor representatividad de la media.La varianza siempre es mayor o igual que 0 y est medida en unidades al cuadrado.Varianza y desviacin tpicaDesviacin tpica:

medida en las mismas unidades que los datosEn el ejemplo de las notas de los dos grupos de cuarenta alumnos, con distribuciones de frecuencias:

Para ambas variables la media es 5, pero en el segundo caso 5 es un valor ms representativo de los datos que en el primero como se puede observar al calcular la varianza.Coeficiente de variacin de PearsonLa varianza NO sirve como medida si lo que se quiere es comparar, de entre varios conjuntos de datos, cual es el ms disperso respecto de la media salvo si todos los conjuntos de datos tiene la misma media (ejemplo de las notas).Coeficiente de variacin de Pearson:

(asociado a la media)Este coeficiente es adimensional y elimina la influencia de la de la magnitud y unidades de medida de los datos.Multiplicado por 100 se interpreta como un porcentaje.Ejemplo de cmo la varianza NO sirve para comparar la dispersin de dos conjuntos de datos cuando la media es diferente:Se tienen datos del peso de varios lagartos (X) y del peso de una poblacin de tiburones (Y), en Kg.

Para X: media = 0.473, V = 0.026,CV = 0.34Para Y: media = 404, V= 9.846,CV = 0.0076La varianza de Y es mayor que la de X pero est influenciado por la magnitud de los datos y por las unidades de medida.No podemos comparar la dispersin de los datos con la varianza porque las medias son distintas.Coeficiente de asimetra de Fisher

Si al calcular este valor con nuestros datos sucede que:CAF > 0, la distribucin es asimtrica a la derecha.CAF = 0, la distribucin es simtrica.CAF < 0, la distribucin es simtrica a la izquierda.