estadistica elemental

Upload: yerson-pajares-alvitres

Post on 13-Oct-2015

147 views

Category:

Documents


4 download

TRANSCRIPT

Estadstica General

Con Minitab y ExcelEstadstica Elemental19171614121120151050CAJAMARCA - 2013Mg. Miguel Angel Macetas Hernndez

NDICE

I.CAPITULO Qu es la Estadstica?41.1Introduccin41.2Qu se entiende por estadstica?41.3Por qu hay que estudiar Estadstica?51.4Tipos de estadstica71.5Elementos que caracterizan a los problemas estadsticos81.6Definiciones bsicas81.7Clasificacin de las Variables10A.Segn la Naturaleza de la Variable10B.Segn la Escala de Medicin11ESCALAS DE MEDICIN21C.Segn la Relacin Entre Variables22II.CAPITULO Presentacin de Datos242.1.Clasificacin y cmputo de datos uni. y bivariables:.24A.Codificacin y tabulacin24B.Presentacin tabular de los Datos: cuadros de distribucin de frecuencias24C.Cuadros estadsticos24D.Partes Principales de un Cuadro Estadstico252.2.Cuadros de Frecuencias de Variables Discretas30A.DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS:36B.REPRESENTACIN GRAFICA DE LA VARIABLE CUALITATIVAS:37D.REPRESENTACIN GRAFICA DE LA CUANTITATIVAS DISCRETAS:432.3.Cuadros de Frecuencias de Variables Continuas46E.DISTRIBUCIN DE FRECUENCIAS, DE LA VARIABLE CUANTITATIVA CONTINUA:55F.REPRESENTACIN GRAFICA DE LA CUANTITATIVAS CONTINUA:60Grficos Estadsticos72Clasificacin De Los Grficos72III.CAPITULO Medidas de Resumen873.1Medidas de resumen para variables cualitativas873.2Razn e ndice. Definicin. Clculo e interpretacin873.3Medidas de resumen para variables cuantitativas.993.3.1Medidas de Posicin Centrales (Tendencia Central)991.La Media Aritmtica992.La Mediana (Me)1013.Moda (Mo) (Valor Modal o Promedio Tpico)105Caractersticas de las Medidas de Posicin Centrales107

4.Media Geomtrica: , 114

5.Media Armnica: , 118IV.CAPITULO Estadgrafos de Tendencia No central1214.1.Estadgrafos de Tendencia No central121A.Los Cuartiles121B.Para elaborar un diagrama de caja y bigotes es necesario saber:123C.Deciles127D.Percentiles o Centiles129V.CAPITULO Medidas de Dispersin1325.1.Medidas de dispersin132A.Recorrido o rango (R)132B.Recorrido Semi Cuartil (Q)132C.Varianza (s2)132D.Desviacin Estndar o Tpica (s)134E.Coeficiente de Variacin (CV)134VI.CAPITULO Estadgrafos de Deformacin135Asimetra.-135A.Relacin Entre La Media, Mediana y Moda135B.Distribucin Simtrica135C.Importancia de la Asimetra.-136D.Coeficiente de Asimetra.136E.Kurtosis o Apuntamiento.-136VII.CAPITULO Regresin y Correlacin Lineal142Regresin y Correlacin Lineal142

I. CAPITULO Qu es la Estadstica?

1.1 Introduccin

La importancia de la estadstica en la actualidad, no se pone en discusin. Casi todos los programas profesionales universitarios incluyen en su currculo, al menos un curso de estadstica. En muchos pases, inclusive en el Per, la estadstica forma parte del currculo de la educacin secundaria e inclusive se incluyen algunos tpicos en la educacin primaria.

La dinmica del mundo moderno, exige que todo ciudadano, para ejercer sus derechos y comprender su entorno, requiera de una alfabetizacin en estadstica.

1.2 Qu se entiende por estadstica?

Al revisar el texto, vemos que esta parte se encuentra desarrollada posteriormente a las razones por las que se debe estudiar estadstica, aqu lo hacemos primero, para iniciar entendiendo lo que significa la Estadstica.

Realice la lectura de este acpite e identifique las ideas principales al respecto. Le sugiero que subraye las ideas principales que encuentre.Est de acuerdo en que la idea central se relaciona con el tratamiento de informacin numrica?

Lo invito ahora a que enuncie su propia definicin sobre la estadstica.

Le parece a usted que podramos definir a la estadstica como la ciencia que nos proporciona los elementos de juicio necesarios para llegar a tomar decisiones adecuadas?, si est de acuerdo reflexione sobre las razones que le llevan a estarlo; si no lo est tambin reflexione sobre la definicin adecuada y regrese al texto para constatarlo.

De las diferentes formas de enunciar lo que significa la estadstica, realice ahora un cuadro sinptico en la que se resuman las ideas claves que se observan en cualquiera de las definiciones encontradas. Para ello lea detenidamente este acpite que se encuentra en el texto bsico y reflexione sobre los distintos ejemplos que se han planteado all.

1.3 Por qu hay que estudiar Estadstica?Si se revisa un catlogo de informacin de la universidad, se descubrir que la educacin estadstica se requiere en muchos Facultades. Por qu pasa esto?. Cules son las diferencias en los cursos de Estadstica impartidos en una Facultades de la Universidad. La mayor diferencia son los ejemplos utilizados.Bsicamente, el contenido del curso es el mismo; Por ejemplo en una Escuela Profesional de Administracin interesan cosas como las ganancias, horas de trabajo, y salarios. En un Departamento de Salud interesan los resultados de las pruebas, y en una Facultad de Ingeniera pueden interesar cuntas unidades son producidas por una mquina en especial. Sin embargo, las tres reas tienen inters en lo que es un valor tpico y en la cantidad de variacin existente en la informacin. Es posible que tambin exista una diferencia en el nivel de matemticas requerido. Un curso de Estadstica en ingeniera generalmente requiere del Clculo, los cursos de Estadstica en escuelas de administracin y en la educacin, generalmente ensean un curso orientado a aplicaciones. Entonces, por qu se requiere estudiar Estadstica en tantas carreras?.

La primera razn es que en todos lados encontramos informacin numrica. Si se revisan los peridicos, revistas de informacin, revistas de negocios, publicaciones de inters general, o revistas de deportes, uno estar bombardeado con informacin numrica.

Presentamos aqu algunos ejemplos:

Ford reporta que en 2011 sus ventas fueron de $146900 millones (de dlares), arriba en un 7,2%; sus ganancias fueron de $4400 millones, con ascenso en un 7,0%, y el efectivo neto circulante fue de S/.7200 millones. Los egresados de postgrado de la Universidad, contaron con un sueldo promedio inicial de $400 dlares y un 70% de ellos consiguieron trabajo a los tres meses de la graduacin. Para los futbolistas que gustan de jugar en campos deportivos, el alquiler de los campos promediaban S/.500 nuevos soles por semana.

Cmo podemos determinar si las conclusiones presentadas son razonables?, las muestras fueron suficientemente grandes?, cmo se seleccionaron las unidades de la muestra? Para poder ser un consumidor con conocimientos sobre esta informacin, necesitamos poder leer los cuadros, las grficas y entender la discusin de la informacin numrica. El entender los conceptos bsicos de la Estadstica ser de gran ayuda.

La segunda razn para tomar el curso de Estadstica es que las tcnicas estadsticas se utilizan para tomar decisiones que afectan nuestra vida diaria. Esto quiere decir que afectan a nuestro bienestar personal. He aqu algunos ejemplos:

Las compaas de seguros utilizan anlisis estadsticos para establecer las tarifas de los seguros de casa, automvil, vida y salud. Existen tablas que resumen la probabilidad de que una mujer de 25 aos de edad viva el ao siguiente, los siguientes cinco aos, etc. Las primas del seguro de vida se pueden establecer basndose en estas probabilidades. La Agencia de Proteccin al Medio Ambiente est interesada en la calidad del agua en el Lago Ene. Peridicamente toman muestras de agua para establecer el nivel de contaminacin y mantener el nivel de calidad. Los investigadores mdicos estudian las tasas de cura de enfermedades, basndose en el uso de diferentes medicamentos y distintas formas de tratamiento. Por ejemplo, cul es el efecto de tratar cierto tipo de dao a la rodilla con ciruga o con terapia fsica? Si se toma una aspirina diaria, se reducir el riesgo de sufrir un ataque cardiaco?

La tercera razn para tomar el curso de Estadstica es que el conocimiento de los mtodos estadsticos ayudar a entender por qu se toman ciertas decisiones, y le aportarn una mejor comprensin sobre la manera en la que lo afectan.Sin importar el tipo de trabajo que seleccione, encontrar que tiene que enfrentar la toma de decisiones con la ayuda del anlisis de datos. Para poder realizar una decisin basada en la informacin, necesitar:

1. Determinar si la informacin existente es adecuada o si se requiere informacin adicional.2. Reunir informacin adicional, si es necesario, de tal forma que no hayan resultados errneos.3. Resumir la informacin de una forma til e informativa.4. Analizar la informacin disponible.5. Sacar las conclusiones y realizar las deducciones necesarias, al tiempo que se evala el riesgo de llegar a una conclusin incorrecta.

1.4 Tipos de estadstica Por lo general, el estudio de la estadstica se divide en dos categoras

Estadstica Descriptiva: cuando se recoleccin, clasificacin resumen, procesamiento y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. No pretende ir ms all del conjunto de datos investigados.

Estadstica Inferencial: cuando apoyndose en el clculo de probabilidades y a partir de datos muestrales, efecta estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos.

Figura N 01

1.5 Elementos que caracterizan a los problemas estadsticos La poblacin de inters y el procedimiento cientfico que se emple para tomar la muestra de la poblacin. La muestra y el anlisis matemtico de su informacin. Las inferencias estadsticas que resultan del anlisis de la muestra. La probabilidad de que las inferencias sean correctas.

1.6 Definiciones bsicas Poblacin o Universo (N) Est referido a un colectivo finito o infinito de elementos individuales. Poblacin es un conjunto completo de individuos u objetos que poseen alguna caracterstica comn observable. Poblacin es el nmero de elementos que definen la cobertura de un estudio. La poblacin es el universo de estudio que est integrado por la totalidad de todas las unidades de anlisis. Por ejemplo Alumnos de Ingeniera Civil matriculados en ciclo acadmico 2012 en la Universidad. Alumnos de IV ciclo de la Escuela Profesional de Ingeniera Civil de la Universidad. Ingenieros Civiles Colegiados en el departamento de Cajamarca en el ao 2012.

Muestra (n) Es la parte o subconjunto de una poblacin. La muestra est constituida de elementos seleccionados de una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra slo da informacin de aquella poblacin de la que ha sido extrada. POBLACIN (N) MUESTRA (n) Muestreo

Inferencia 2

Figura N 02 Unidad de Anlisis o Unidad de Observacin Es el objeto o elemento indivisible que ser estudiado en una poblacin sobre los cuales se va a obtener datos. La unidad de anlisis no es el fenmeno investigado sino el que genera el fenmeno y proporciona datos concretos. Por ejemplo El tipo de anlisis al que se someter la informacin es determinante para elegir la unidad de anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin del usuario de un servicio mdico, la unidad de anlisis natural es el paciente atendido, o la persona que se atiende en ese servicio mdico.

La unidad de muestreo corresponde a la entidad bsica mediante la cual se acceder a la unidad de anlisis. En algunos casos, ambas se corresponden. Por ejemplo: Si se desea estimar la prevalencia de dao auditivo en relacin con niveles de ruido ambiental en una muestra de trabajadores de una fbrica, la unidad de muestreo puede corresponder a la entidad "sujeto", si se dispone de un registro detallado de cada sujeto. La unidad de anlisis es por cierto el trabajador de la fbrica.

Dato. Es el valor o respuesta que adquiere variable la en cada unidad de anlisis. Dato es el resultado de la observacin, entrevista o recopilacin en general. Los datos son. materia prima de la Estadstica.

Parmetro. Es una medida usada para describir algunas caractersticas de una poblacin, y para determinar su valor es necesario utilizar la informacin de la poblacin completa y por lo tanto, las decisiones se tomaran con certidumbre total. Por ejemplo:Media poblacional (), Varianza poblacional (2), Proporcin poblacional (p).

Estadgrafo. Es una medida usada para describir alguna caracterstica de la muestra y la toma de decisiones contiene un grado de incertidumbre. Por ejemplo:Media muestral (), Varianza muestral (), Proporcin muestral ()

Variable: Es una caracterstica que puede tomar diferentes valores o atributos. Las variables son caractersticas observables, susceptibles de adoptar distintos valores (cuantificado) o ser expresados en varias categoras

VariableValores o atributo

Rendimiento acadmico Genero Calidad de atencin de un restaurante Peso de alumnos Nmero de hijos 12, 14, 17, 20 Masculino, femenino Psimo, malo, regular bueno excelente

45,6 Kg. 57,8 Kg. 73,6 Kg 1, 2, 3,

1.7 Clasificacin de las Variables

Podemos considerar muchos criterios de clasificacin como:A. Segn la Naturaleza de la Variable

a) Variables Cualitativas o Estadsticas de Atributos.

Cuando expresan una cualidad, caracterstica o atributo, tienen carcter cualitativo sus datos se expresan mediante una palabra es no numrico. Por ejemplo:

Estado civil, los colores, lugar de nacimiento, profesiones, actividad econmica, causas de accidentes, etc.

b) Variables Cuantitativas.

Cuando el valor de la variable se expresa por una cantidad, es de, carcter numrico. El dato o valor puede resultar de la operacin de contar o de medir. Por ejemplo:

Edad nmero de hijos por familia, ingresos, viviendas por centro poblado, niveles de, desempleo, produccin, utilidades por empresas, etc.,

Las variables cuantitativas pueden ser: discreta y continua.

b.1. Variable Discreta.Cuando el valor de la variable resulta de la operacin de contar su valor est representado slo por nmeros naturales (enteros positivos). Por Ejemplos:

Hijos por familia nmero de accidentes por da, trabajadores por empresa; poblacin por distritos, habitaciones por vivienda. etc.

b.2. Variable Contina.Cuando la variable es susceptible de medirse es toda variable cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Las variables continuas pueden tener cualquier valor dentro de su rango o recorrido por tanto se expresa por cualquier nmero real. Por ejemplos:

Ingresos monetarios, produccin de maz, peso, estatura, tiempo de servicios, horas trabajadas, niveles de empleo. etc.

B. Segn la Escala de Medicina) La escala nominal o categricaLa medicin en su nivel ms dbil existe cuando los nmeros u otros smbolos se usan simplemente para clasificar un objeto, una persona o una caracterstica. Cuando se emplean nmeros u otros smbolos para identificar los grupos a los cuales pertenecen varios objetos, estos nmeros o smbolos constituyen una escala nominal o categrica. Esta escala se conoce como escala clasificatoria. Por ejemplo: Se resumen en preguntas dicotmicas, o aquellas con dos opciones de respuesta, y de seleccin mltiple, o aquellas con tres o ms opciones de respuesta. Veamos algunos ejemplos:DicotmicasGnero:FemeninoMasculinoHas comprado el producto X?SINOSeleccin mltipleEn tus prximas compras incluirs el producto X? SINONo sabe

Propiedades FormalesTodas las escalas tienen ciertas propiedades formales, las cuales proporcionan definiciones casi exactas de las caractersticas de la escala; definiciones ms exactas que las que pueden darse en trminos verbales. Estas propiedades pueden ser formuladas de manera ms abstracta de lo que hemos hecho aqu, por un conjunto de axiomas que especifican las operaciones de la escala y las relaciones entre los objetos que han sido escalados.En una escala nominal, las operaciones de la escala dividen a una clase dada en un conjunto de subclases mutuamente excluyentes. La nica relacin implica- da es la de equivalencia; esto es, los miembros de cualquier subclase deben ser equivalentes en la propiedad que est siendo escalada. Esta relacin se simboliza por el signo familiar de "igual" (=). La relacin de equivalencia es reflexiva, simtrica y transitiva.Considrese un conjunto de objetos . . Supngase que el objeto x, tiene algn atributo verdadero, A (x). Entonces, para cualquier par de atributos en el conjunto

Operaciones AdmisiblesYa que en una escala nominal la clasificacin puede estar igualmente bien representada por cualquier conjunto de smbolos, se dice que la escala nominal es "nica hasta una transformacin de uno a uno". Los smbolos que designan las variadas subclases en la escala pueden ser intercambiados si esto se hace de manera cabal y consistentemente. Por ejemplo: Cuando se emiten nuevas placas para automviles, el cdigo que previamente perteneca a una ciudad puede ser intercambiado con el de otra ciudad. La escala nominal podra preservarse si este cambio se ejecutara cabal y consistentemente en la emisin de todas las placas.Ya que los smbolos que designan los variados grupos de una escala nominal pueden ser intercambiados sin alterar la informacin esencial en la escala, el nico tipo de estadsticos descriptivos admisibles son aquellos que pueden ser incambiables por tal transformacin: la moda, la cuenta de frecuencias, etc. En ciertas condiciones, podemos probar hiptesis considerando la distribucin de casos entre las categoras, usando pruebas no paramtricas tales como la ji cuadrada o una prueba basada en la distribucin binomial. Estas pruebas son adecuadas para da- tos escalados nominalmente debido a que se enfocan sobre la frecuencia en las categoras, es decir, sobre datos enumerativos. En suma, cuando los datos en una escala nominal, podemos rotular las categoras "1", "2", "3",.., en cualquier orden que el Vamos. En una muestra podemos contar el nmero de "1", el nmero de "2", etc. (Estas son cuentas de frecuencia) Podemos calcular el porcentaje de "1" en la muestra, el porcentaje de "2", etc. (Esta es la distribucin de frecuencia relativa.) Y podemos registrar qu categora tiene la frecuencia ms grande. (sta es la moda.) Pero en general, no podemos "sumar" las categoras "1" y "2" para formar la categora "3", ya que podramos violar las suposiciones de un sistema de clasificacin nominal. En captulos posteriores estudiaremos diferentes tcnicas estadsticas adecuadas para datos categricos o escalados nominalmente.

b) La escala ordinal o de rangosPuede suceder que los objetos en una categora de una escala no sean tan slo diferentes de los objetos en otras categoras de esa escala, sino que tambin exista algn tipo de relacin entre ellos. Las relaciones tpicas entre las clases son: ms alto, ms preferido, ms difcil, ms perturbador, ms maduro, etc. Tales relaciones se denotan por medio del smbolo >, el cual en general significa "mayor que". En referencia a escalas particulares, > puede ser usado para designar que es preferido a, es ms alto que, es ms difcil que, etc. Su significado especfico depende de la naturaleza de la relacin que define la escala.Dado un grupo de clases de equivalencia (esto es, dado una escala nominal), si la relacin > se sostiene entre algunos pero no todos los pares de clases, tenemos una escala parcialmente ordenada. Si la relacin > se sostiene para todos los pares de clases, de manera que es posible un rango completo ordenado de clases, tenemos una escala ordinal. Por ejemplo: Grado de Instruccin: Primaria Secundaria Superior Intensidad del dolor: Leve Moderado Intenso

Propiedades FormalesAxiomticamente, la diferencia fundamental entre una escala nominal y una ordinal es que esta ltima incorpora no slo la relacin de equivalencia (=), sino tambin la relacin "mayor que" (>). Esta ltima relacin es irreflexiva, asimtrica y transitiva.Considrese un conjunto de objetos . Supngase que existe alguna relacin en el atributo verdadero entre los objetos de cada categora, adems de la equivalencia dentro de las categoras. Esto es,

Es decir, la funcin de clasificacin ordena los objetos en el mismo modo en que de hecho estn ordenados los atributos.

Operaciones AdmisiblesYa que cualquier transformacin que preserve el orden no cambia la informacin contenida en la escala ordinal, se dice que la escala es "nica hasta una transformacin monotnica". Una transformacin monotnica es aquella que preserva el orden de los objetos. Esto es, no importa qu nmeros demos a un par de clases o a los miembros de esas clases, siempre que les sea asignado un nmero mayor a los miembros de la clase que es "mayor que" o "ms preferida". (Naturalmente, se pueden usar nmeros menores para las clases "ms preferidas". As nos referimos generalmente a una ejecucin excelente como "primera clase", y a ejecuciones progresivamente inferiores como "segunda clase" y "tercera clase". Siempre que seamos consistentes, no importa si se usan nmeros mayores o menores para denotar "mayor que" o "ms preferido".) Por ejemplo: En el ejrcito un cabo usa dos bandas en su manga y un sargento usa tres. Estas insignias denotan que el sargento > el cabo, y el smbolo > denota "mayor rango que". Esta relacin podra ser igualmente bien expresada si el cabo usara cuatro bandas y el sargento siete. Vale decir, una transformacin que no cambia el orden de las clases es completamente admisible ya que no implica prdida alguna de informacin. Cualesquiera o todos los nmeros que se aplican a las clases en una escala ordinal pueden ser cambiados de cualquier forma que no altere el orden (rango) de los objetos. Puede aplicarse cualquier transformacin montnica y an preservarse las propiedades de la escala, esto es, preservar la relacin entre los objetos.El estadstico ms, apropiado para describir la tendencia central de las puntuaciones en una escala ordinal es la mediana, ya que en relacin con la distribucin de puntuaciones, la mediana no es afectada por los cambios en cualesquiera de las puntuaciones que estn por arriba o por abajo de ella, siempre que el nmero de puntuaciones por arriba y por debajo permanezca constante. Con el escalamiento ordinal, las hiptesis pueden ser probadas usando el gran grupo de pruebas estadsticas no paramtricas que en ocasiones se llaman estadsticos de rango o estadsticos de orden.

c) La escala de IntervaloCuando una escala tiene todas las caractersticas de una escala ordinal y cuando adems tienen sentido las distancias o diferencias entre cualesquiera dos nmeros de la escala, se ha logrado una medicin considerablemente ms fuerte que la ordinal. En tal caso, la medicin ha sido lograda en el sentido de una escala de intervalo. Esto es, si nuestro mapeo de varias clases de objetos es tan preciso que conocemos cun grandes son los intervalos (distancias) entre todos los objetos de la escala, y estos intervalos tienen significado sustantivo, entonces hemos logrado una medida de intervalo. Una escala de intervalo est caracterizada por una unidad comn y constante de medida que asigna un nmero a todos los pares de objetos en el orden establecido. En esta clase de medicin, la razn de cualesquiera dos intervalos es independiente de la unidad de medida y del punto cero. En la escala de intervalo, el punto cero y la unidad de medida son arbitrarios. Por ejemplo Medimos la temperatura en una escala de intervalo. De hecho, comnmente se usan dos diferentes escalas: Celsius y Fahrenheit. Al medir la temperatura, la unidad de medida y el punto cero son arbitrarios; son diferentes en ambas escalas. Sin embargo, las dos escalas contienen la misma cantidad y la misma clase de informacin. Esto es as debido a que estn linealmente relacionadas. Es decir, una lectura en una escala puede ser transformada en la lectura equivalente de la otra por medio de una transformacin lineal.

DondeF = nmero de grados en la escala Fahrenheit C = nmero de grados en la escala CelsiusSe puede mostrar que las razones de las diferencias de temperatura (intervalos) son independientes de la unidad de medida y del punto cero. Por ejemplo, el punto de "congelacin" ocurre en 0 en la escala Celsius, y el punto de "ebullicin" ocurre en los 100. En la escala Fahrenheit, la "congelacin" ocurre en los 32 y la "ebullicin" en 212. Algunas otras lecturas de la misma temperatura en las dos escalas son las siguientes:Celsius 1801030100

Fahrenheit0325086212

Ntese que la razn de las diferencias entre las lecturas de temperatura en una escala, es igual a la razn entre las diferencias equivalentes en la otra escala. Por ejemplo, En la escala Celsius la razn de las diferencias entre 30 y 10, y 10 y 0 es (30 10) / (10 0) = 2. Para las lecturas comparables en la escala Fahrenheit, la razn es (86 50) / (50 32) = 2. En ambos casos las razones son las mismas; a saber, 2. En otras palabras, en una escala de intervalo, la razn de cualesquiera dos intervalos es independiente de la unidad usada y del punto cero, siendo ambos arbitrarios.

Muchos cientficos de la conducta aspiran a crear escalas de intervalo, y en pocas ocasiones tienen xito. Sin embargo, generalmente lo que es tomado como xito son suposiciones no probadas que el constructor de la escala voluntariamente cree. Una suposicin frecuente es que la variable que est siendo escalada est normalmente distribuida entre los individuos a los que se evala con base en esta suposicin, el constructor de la escala manipula las unidades de la escala hasta que se encuentre la supuesta distribucin normal de las puntuaciones de los individuos. Naturalmente, el procedimiento es slo tan bueno como la intuicin del investigador al elegir la distribucin que supone.

Otra suposicin que se hace a menudo para crear una escala de intervalo aparente es la suposicin de que las respuestas "afirmativas" de las personas en cualquier reactivo son exactamente equivalentes a responder de manera afirmativa en cualquier otro reactivo. Esta suposicin se hace para satisfacer el requisito de que una escala de intervalo debe tener una unidad de medida comn y constante. En escalas de habilidades o de aptitudes, la suposicin de equivalencia consiste en que dar la respuesta correcta a cualquier reactivo es exactamente equivalente (en la cantidad de habilidad mostrada) a dar la respuesta correcta a cualquier otro reactivo.

Propiedades FormalesAxiomticamente, se puede mostrar que las operaciones y relaciones que dan origen a la estructura de una escala de intervalo son tales que las diferencias en la escala son isomrficas a la estructura de la aritmtica. Los nmeros pueden ser asociados con las posiciones de los objetos en una escala de intervalo tal que las operaciones de la aritmtica pueden ser significativamente ejecutadas con las diferencias entre los nmeros.Al construir una escala de intervalo no slo se deben especificar equivalencias, como en la escala nominal, y relaciones "mayor que", como en la escala ordinal, sino tambin se debe ser capaz de especificar la razn entre dos intervalos cualesquiera.

Considrese un conjunto de objetos Supngase que los atributos verdaderos de los objetos existen en alguna relacin unos con otros, adems de sus equivalencias dentro de las categoras. Esto es:

Entonces, una escala de intervalo es un sistema clasificatorio de los objetos L (x) que tienen las propiedades de una escala ordinal y, adems

Ntese que en este caso, la diferencia entre los atributos de los dos objetos es proporcional a la diferencia entre las asignaciones de clasificacin:

Operaciones Admisibles

Cualquier cambio en los nmeros asociados con las posiciones de los objetos medidos en una escala de intervalo debe preservar no slo el orden de los objetos, sino tambin las diferencias relativas entre los objetos. Esto es, la escala de intervalo es "nica hasta una transformacin lineal". As, como hemos sealado, la informacin proporcionada por la escala no es afectada si cada nmero se multiplica por una constante positiva y despus se le suma a este producto una constante, esto es. (En el ejemplo de la temperatura, c = 9/5 y b = 32.)

Ya hemos notado que en una escala de intervalo el punto cero es arbitrario. Esto es inherente al hecho de que la escala est sujeta a transformaciones que consisten en agregar una constante a los nmeros que constituyen la escala.

La escala de intervalo es la primera escala verdaderamente "cuantitativa" que hemos encontrado. Todos los estadsticos paramtricos comunes (medias, desviaciones estndar, correlaciones producto-momento, etc.) son aplicables a los datos en una escala de intervalo. Si de hecho se ha logrado una medida en una escala de intervalo y si se han encontrado adecuadamente todas las suposiciones del modelo estadstico paramtrico (dadas en la seccin "El modelo estadstico"), entonces el investigador puede utilizar pruebas estadsticas paramtricas tales como la prueba t o la prueba F. En tal caso, los mtodos no paramtricos no aprovechan toda la informacin contenida en los datos de investigacin. Puede notarse que una escala de intervalo es una condicin necesaria, pero no suficiente, para usar una prueba estadstica paramtrica que incluya la distribucin normal.

d) La escala de raznCuando una escala tiene todas las caractersticas de una escala de intervalo y, adems, tiene un punto cero verdadero en su origen, se llama escala de razn. En una escala de razn, la razn de cualesquiera dos puntos es independiente de la unidad de medida. Por ejemplo Medimos la masa o el peso en una escala de razn. La escala de onzas y libras tiene un punto cero verdadero, al igual que la escala de gramos. La razn entre cualesquiera dos pesos es independiente de la unidad de medida. Por ejemplo, si de- terminamos los pesos de dos objetos diferentes no slo en libras sino tambin en gramos, encontraremos que la razn de los dos pesos en libras es idntica a la razn de los dos pesos en gramos.

Aunque es difcil identificar ejemplos significativos en las ciencias sociales y de la conducta, los contraejemplos abundan. Consideramos dos. Notamos anteriormente que las calificaciones se miden en una escala ordinal. Considrese a dos estudiantes, uno de los cuales recibe una A y el otro una C; y supngase que las asignaciones numricas fueron 4 y 2, respectivamente. Aunque la razn de las dos calificaciones es dos (4/2 = 2), no tiene sentido decir que el estudiante con una A posee el doble de "algo" del estudiante que recibe la C. (El estudiante puede obtener el doble de ciertos puntos, pero no es claro si esto tiene algn significado sustantivo en conocimiento, habilidad o perseverancia.) Finalmente, en el caso de la temperatura, considrese un cambio en la temperatura de 100 a 30 C. No podemos decir que el incremento representa que el calor se increment al triple. Para ver esto, ntese que el cambio en la temperatura es equivalente a un cambio de 500 a 86 F. Debido a que las razones de las temperaturas en las dos escalas son claramente diferentes, la razn no tiene sentido interpretable alguno.

Propiedades Formales

Las operaciones y relaciones que dan origen a los valores numricos en una escala de razn son tales que la escala es isomrfica a la estructura de la aritmtica. Por tanto, las operaciones de la aritmtica son permisibles con los valores numricos asignados a los objetos, as como a los intervalos entre los nmeros, como en el caso de la escala de intervalo.

Las escalas de razn, que se encuentran ms comnmente en las ciencias fsicas, se logran slo cuando son operacionalmente posibles de alcanzar todas las siguientes cuatro relaciones: 1. equivalencia; 2. mayor que; 3. razn conocida entre cualesquiera dos intervalos, y 4. razn conocida entre cualesquiera dos valores de la escala.Considrese un conjunto de objetos . Supngase que el atributo verdadero de los objetos existe con alguna relacin entre cada uno de ellos, adems de la equivalencia dentro de las categoras. Esto es

Entonces, una escala de razn es un sistema clasificatorio de los objetos L (x) si

y la razn de las clasificaciones asignadas es igual a la razn de los atributos verdaderos.Operaciones Admisibles

Los nmeros asociados con los valores de la escala de razn son nmeros "ver- daderos" con un cero verdadero: slo la unidad de medida es arbitraria. As, la es- cala de razn es nica hasta la multiplicacin por una constante positiva. Esto es, las razones entre cualesquiera dos nmeros se preservan cuando los valores de la escala son todos multiplicados por una constante positiva y, adems, tal transformacin no altera la informacin contenida en la escala.Cualquier prueba estadstica paramtrica puede usarse cuando se han logrado medidas de razn y se encuentran las suposiciones adicionales concernientes a la distribucin. Ms an, existen algunos estadsticos que se aplican slo a datos que descansan en una escala de razn; debido a la fuerza de las suposiciones que sub- yacen a la escala, la mayora de estas pruebas son pararntricas.

Estadstica General2013

C. 56Mg. Miguel Angel Macetas Hernndez

ESCALAS DE MEDICIN

TipoVariables CategricasVariables numricas

NaturalezaCUALITATIVASCUANTITATIVAS

Escala(0) NOMINAL Ningn atributo(1) ORDINAL Un atributo(2) INTERVALO Dos atributos(3) RAZN Tres atributos

Atributos de la escalaOrdenDistanciaOrigenOrdenDistanciaOrigenOrdenDistanciaOrigenOrdenDistanciaOrigen

CaractersticaPosee categoras a las que se asigna un nombre sin que exista ningn orden implcito entre ellas.Posee categoras ordenadas, pero no permite cuantificar la distancia entre una categora y otra.Tiene intervalos iguales y medibles, pero no tiene un origen real. Puede asumir valores negativos.Tiene intervalos constantes entre valores; adems de un origen real. El cero significa la ausencia de la variable.

EjemplosGneroEstado CivilInstruccinIntensidadTemperaturaHora del daPeso.Hijos

Valor FinalMasculinoFemeninoSolteroCasadoConvivientePrimariaSecundariaSuperiorLeveModeradoSevero-10 C0 C20 C00 Horas10 Horas20 Horas00.00 Kg10.24 Kg20.00 KgUnoDosTres

ObservacionesDicotmicas: Tienen solamente dos categoras Ejemplos de Ordinal Dicotmica: Nuevo - ContinuadorVivo Fallecido

Sano Enfermo

Politmicas: Tienen ms de dos categoras.Continuas: Provienen de medirSe pueden representar con nmeros enteros o fraccionarios

Entre dos valores siempre existe un nmero intermedio

Discretas: Provienen de contar

Solamente pueden ser representados con nmeros enteros

D. Segn la Relacin Entre Variablesa) Variables DependientesSon aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales hay que buscar su motivo, causas o razn de ser, Es la variable que traduce la consecuencia del efecto de una varias razones o causas.

b) Variables IndependientesSon las variables explicativas o predicativas, cuya asociacin, relacin o influencia en la variable dependiente se pretende escribir en la investigacin. Las variables independientes son los que traducen o explican las causas o razones de las variaciones en la variable dependiente. Simplificando, en la relacin de variables, las causas o antecedentes seran las variables independientes (VI) y la causa o consecuente es la variable dependiente (VD). Ejemplos: En el caso ms simple, para la relacin d dos variables. El presupuesto familiar (VD) depende de los ingresos (VI). El volumen de ventas (VD) se explica por la inversin en propaganda (V). El nmero de hijos por familia (VD) tiene relacin con el nivel educativo de los padres (VI).c) Variables Intervinientes o interferentesSon aquellas que coparticipan con la variable independiente condicionando el comportamiento de la variable dependiente. En el caso de la relacin entre presupuesto familiar (VD) y los ingresos (VI), algunas variables intervinientes serian la conducta de consumo, la edad de los miembros de la familia, etc.

Elementos de una VariableLa identificacin y definicin de variables es la tarea ms delicada de toda investigacin y del trabajo estadstico. En consecuencia, para tener xito en la seleccin de variables, es recomendable distinguir las siguientes cinco caractersticas. Un nombre o denominacin. de la variable. Alguna definicin o conceptualizacin. Un conjunto de categoras. que es definida por el investigador. Las categoras no son nicas. Procedimientos para categoras las unidades de anlisis. Algunas medidas de resumen o indicadores.Ejemplo 1:a) Nombre: Estado civil o conyugal.

b) Definicin: Es la situacin de la persona empadronada en relacin con las leyes y costumbres del pas.c) Categoras: 01) Sol tero (a).02) Casado (a).03) Conviviente. 04) Viudo (a).05) Divorciado (a).06) Separado (a).d) Categorizacin: Cul es su estado civil o conyugal?e) Medidas de PorcentajesResumen Tasa de nupcialidad que indica la frecuencia de matrimonios, etc.

Ejemplo 2:a) Nombre: Ingresosb) Definicin Son los recursos monetarios netos incluyendo todas las Bonificaciones que percibe una persona por su ocupacin principal y secundaria durante el perodo de referencia de la encuesta.c) Categoras : Puede proponerse en forma de niveles o simplemente intervalos.Niveles de ingreso: alto, medio, bajo Intervalos: Por ejemplo 8 intervalosMenos de 4000; 4001 l 8000; 8001 a 12000; 1 2001 a 1 6000; 16001 a 20000: 20001 a 25000; 25001 a 30000; 30001 y ms soles.d) Categorizacin: Cul fue su ingreso total en el ltimo mes?e) Indicadores : Ingreso promedio.Dispersin de los ingresos. etc.

II. CAPITULO Presentacin de DatosClasificacin y cmputo de datos uni. y bivariables:. A. Codificacin y tabulacin La codificacin facilita la tabulacin y el conteo. (obtencin de una buena informacin) La codificacin de las respuestas da lugar a categoras o modalidades. Es recomendable que los cuestionarios tengan las alternativas de respuesta pre codificadas. Si el cuestionario tiene preguntas abiertas (respuesta libre), estas previamente debe ser clasificadas en categoras.B. Presentacin tabular de los Datos: cuadros de distribucin de frecuencias Es necesario agrupar los datos y presentarlos en cuadros y diagramas sencillos. Un cuadro de frecuencias, son cuadros que indican la distribucin de un conjunto de datos en clases o categoras y muestran el nmero de elementos y la proporcin de cada uno de los valores de la variable. Un cuadro de frecuencias, permite una buena ayuda para formularse interrogantes acerca de los datos. Un cuadro de frecuencias, es un punto de partida en la bsqueda de un modelo terico para analizar la distribucin de los datos. En la cuadro se observa la frecuencia o repeticin de cada uno de los valores de la variable. Las observaciones o recopilaciones de datos denotaremos la variable por X y los datos originales: . donde Xi representan la i sima observacin de la variable con (i = 1, 2, 3, 4,..., N). Es decir que:X1 = dato de la primera observacinX2 = dato de la segunda observacinX3 = dato de la tercera observacin.XN = dato de la N sima observacinC. Cuadros estadsticos En una investigacin, despus que los datos han sido recogidos, revisados y almacenados en una base de datos, se procede a la presentacin de los resultados en forma tabular o grfica y al anlisis estadstico de la informacin. La facilidad de su construccin y el rpido efecto en la transmisin de los contenidos, han hecho de los cuadros estadsticos los recursos idneos para la presentacin de los resultados de las investigaciones en todas las reas cientficas. La presentacin tabular y el grfico no son competidores, sino ms bien elementos que se complementan. Los grficos deben agregarse a los cuadros o distribuciones de frecuencias para llamar la atencin y despertar el inters por los datos que se presentan, as como para reforzar las argumentaciones o conclusiones a las que se haya llegado. Como un principio muy conveniente, debe adoptarse el de que en ningn caso puede considerarse que el grfico sustituye a la presentacin tabular. La prctica seguida por algunas personas, de presentar grficos omitiendo los cuadros que contienen la informacin bsica, debe ser evitada y combatida por inconveniente y por limitar la calidad y la utilidad de las publicaciones y estudios. Slo en casos de verdadera excepcin, como cuando se trata de propaganda o de artculos meramente divulgadores, podra aceptarse la prctica comentada.Objetivo Un cuadro estadstico tiene como objetivo presentar datos numricos ordenados, en filas y columnas, de acuerdo a ciertos criterios de clasificacin.Ventajas Los cuadros permiten presentar en forma resumida y ordenada muchos datos Es un instrumento que clasifica, resume y comunica informacin estadstica Facilita el anlisis de los datos Su fcil comprensin, permite que sea utilizado por muchas personas Todo cuadro estadstico debe explicarse por s mismo, sin necesidad de texto o figuras anexas, y debe ser sencillo y claroD. Partes Principales de un Cuadro EstadsticoEn general, un cuadro estadstico completo, tal como el Cuadro N 01, por ejemplo, puede tener ocho partes:1. Nmero del cuadro. 2. Ttulo.3. Encabezamiento o conceptos.4. Cuerpo.5. Nota de pie o llamadas.6. Fuente.7. Nota de unidad de medida.8. Elaboracin.

2Es el cdigo o elemento de identificacin que permite ubicar el cuadro en el interior de un documentoCUADRO N 011

Es la descripcin resumida del contenido del cuadro. La redaccin del ttulo debe ser breve, claro y completo, de modo que se puedan deducir sin ambigedad qu tipo de informa. Debe indicar1. QUE2. DONDE3. COMO4. CUANDO

POBLACIN TOTAL ECONMICAMENTE ACTIVA DE 15 AOS Y MS, DEL DEPARTAMENTO DE CAJAMARCA: POR NIVEL EDUCATIVO SEGN RAMAS DE ACTIVIDAD. CENSO DE POBLACIN 2009

DondeQue

Cuando ComoDonde

Descripcin de las filas y columnas del cuadro estadsticoExpresa en qu unidades estn las variables7

(Distribucin porcentual)

Ramas de Actividad3

PEA de15 aosy msN i v e l d e Educacin

SinNivel*PrimariaSecundariaSup. NoUniver.SuperiorUniver.No Especificado

TOTAL100,05,8942,1135,875,678,661,80

1. Agricultura, Caza, Selvicultura y Pesca100,014,9764,0515,590,701,303,404

2. Explotacin de Minas y Canteras.100,00,7541,1339,595,7912,630,11

3. Industrias Manufactureras.100,03,6043,5741,602,946,701,59

4. Electricidad, Gas y Agua.100,00,0021,9548,298,2920,490,98Es el contenido numrico del cuadro

5. Construccin.100,04,7864,3624,991,053,541,28

6. Comercio, Restaurantes y Hoteles.100,06,9545,0439,662,064,391,91

7. Transportes, Almacenamiento y Comunicaciones.100,01,3445,1846,872,283,151,18

8. Establecimientos Financieros, Seguros, Bienes Inmuebles y Servicios a las Empresas100,00,6411,6048,719,2829,250,52

9. Servicios Comunales, Sociales y Personales.100,02,1026,5643,3511,4615,221,30

10. Actividades No bien especificadas.100,09,3544,7034,993,554,972,43

11. Buscan trabajo por primera vez.100,01,9425,7556,976,707,940,71

* Incluye PEA con educacin inicial o pre escolarFuente: INE Resultados definitivos de los Censos Nacionales IX de Poblacin y IV de ViviendaElaborado: Statistic MAH.

5) NOTA DE PIE O LLAMADAS, se usa para aclarar algunos trminos o siglas, y tambin para indicar qu elementos estn o no incluidos en algunos de los conceptos del cuadro.6) FUENTE, es la indicacin al pie el cuadro, que sirve para nombrar la publicacin, entidad, estudio o fuente de donde se obtuvieron los datos utilizados para construir el cuadro. La identificacin de la fuente permite, si fuera el caso, comprobar la informacin o para obtener informacin complementaria.Hay dos tipos de fuentes: i) primaria, cuando se obtiene directamente de la unidad de anlisis o cuando se recurre a los propios formularios de una encuesta: ii) secundaria, cuando se recurre a documentos boletines o cuadros estadsticos publicados.7) Nota Unida de Medida se escribe debajo del ttulo, se usa cuando se abrevia la escritura8) ELABORACIN, es una indicacin que se coloca debajo de la fuente, y sirve para mencionar el responsable, que utilizando datos originales o de la fuente elabor el cuadro estadstico final: indica la responsabilidad de la publicacin del cuadro. A veces resulta til indicar la fecha de elaboracin.QUE : Poblacin Total Econmicamente Activa De 15 Aos Y MsDONDE : Del Departamento CajamarcaCOMO : Por Nivel Educativo Segn Ramas de ActividadCUANDO : Censo de Poblacin 2009.

CUADRO 04

PACIENTES SEGN NMERO DE LEUCOCITOS /mm3.HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA - 2007.Nmero de Leucocitos(miles)1/Nmero de Pacientes (ni )Porcentaje de Pacientes ( hi % )

5.0 - 5.96.0 - 6.97.0 - 7.98.0 - 8.99.0 - 9.910.0 - 11.031011131085.518.220.023.618.214.5

T o t a la/ 55100.0

- Nota de pie. a/. Muestra aleatoria sistemtica. 1/. Datos expresados en miles.- Fuente. H.R.C

E. Caractersticas:

1. La cuadro estadstica debe ser lo ms simple posible.2. Si se utilizan smbolos, abreviaturas, etc., debenexplicarse detalladamente en notas de pie de pgina.3. Deben ser incluidas las unidades especficas de medida que corresponden a los datos.4. Debern consignarse los totales.5. Si los datos no son originales debe quedar explcita la fuente de donde se ha tomado.6. Cuando se utilizan escalas cualitativas hay que tener cuidado si se desea comparar datos de una cuadro con otra, ya que en los criterios de clasificacin de la variable puede que el entendimiento nuestro de un concepto no coincida totalmente con el de otro investigador.7. Una cuadro estadstica puede ser completada con las frecuencias acumuladas, frecuencias relativas (porcentajes, promedios o razones), etc.

F. Tipos de cuadros.En su forma ms general los cuadros pueden dividirse en simples y compuestas.a) Cuadros Simples. Clasifican un fenmeno segn una nica variable. Ejemplo Cuadro 04.b) Cuadros Compuestos. Son las que recogen los datos de dos o ms variables, cada una de ellas con sus correspondientes criterios de clasificacin. Dentro de los cuadros compuestos las que se utilizan con mayor frecuencia son: Las cuadros dobles y las Maestras.

c) Cuadros Dobles. Resumen informacin clasificadas segn 2 variables, y estas se denominan: Cuadros de contingencia y cuadros de correlacin.

d) Cuadro de Contingencia. Cuando ambas variables son cualitativas o mixtas. Ejemplo. El cuadro siguiente muestra una distribucin bidimensional (Cuadro de contingencia) CUADRO 05REACCIN A LA VACUNACIN CONTRA EL SARAMPIN Y LA RUBOLA EN UNA MUESTRA DE 288 NIOS DE CAJAMARCA -1994.Vacunados contrasarampinVacunados contra rubolaT O T A L

Reaccin PositivaReaccin Negativa

Reaccin positivaReaccin negativa761207220148140

T O T A L19692288

La interpretacin a esta cuadro sera la siguiente: de una muestra de 288 individuos, 76 tuvieron reacciones positivas a las dos vacunaciones, 20 individuos tuvieron reaccin negativa a ambas pruebas, 120 individuos tuvieron reaccin positiva ante la vacuna contra la rubola, pero negativamente ante la vacuna contra el sarampin, y 72 nios tuvieron reaccin negativa a la vacuna contra la rubola y positiva en la vacuna contra el sarampin.

CUADRO DE CORRELACIN. Cuando ambas variables son cuantitativas. Por ejemplo

CUADRO 06

MUJERES EN EDAD FRTIL SEGN GRUPO ETREO Y NMERO DE HIJOS NACIDOS VIVOS - HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA 2007

GRUPO ETREO(Aos Cumplidos)Nmero de Hijos Nacidos VivosT O T A L

012345 y +

15 - 1920 - 2425 - 2930 - 3435 - 3940 - 4445 - 49

T o t a l

2.Cuadro Maestra. En este tipo de cuadros todos los criterios de clasificacin de cada una de las variables son sometidos a una clasificacin cruzada. Esto da lugar a una perspectiva mucho ms amplia, ya que nos permite obtener datos de una nica variable o de cualquier combinacin de las variables que entran en juego en la cuadro.Ejemplo. El cuadro muestra la composicin por edad, sexo y trabajo de un grupo de personas con Tuberculosis pulmonar en Cajamarca (Esquema) durante 2007.

CUADRO 07PERSONAS CON TBC SEGN EDAD, CONDICIN LABORAL Y SEXO - DISTRITO DE CAJAMARCA - 2007EDADTRABAJADORESNO TRABAJADOREST O T A L

HombresMujeresTotalHombresMujeresTotalHombresMujeresTotal

15 19 20 2425 29...50 5455 5960 +

TOTAL

Nota:Con este tipo de cuadros podemos extraer datos de las personas que padecen Tuberculosis en un determinado intervalo de edad (A), tambin del total de personas que no trabajan y han contrado la TBC (B), y del total de mujeres, ya sean trabajadoras o no, que tienen tuberculosis (C).

Cuadros de Frecuencias de Variables DiscretasPara este tipo de variables cuyo valor slo se puede expresar por nmero enteros positivos, los datos que caen dentro de cada clase.Elementos de un cuadro de Frecuencia

Frecuencias Absolutas o Repetidas (fi o ni).- Es el nmero de veces que se repite un determinado valor de la variable.

Frecuencia Relativa (hi ).- Es el cociente de:

Frecuencia absoluta o Repeticiones Nmero de Observaciones

CUADRO N 7.8NUMERO DE NACIMIENTOS EN EL DEPARTAMENTO DE LAMBAYEQUE, POR PROVINCIAS 2004 ProvinciasNmero de NacimientosPorcentaje de Nacimientos

Lambayequen1 = 325

Chiclayon2 =330

Ferreafen3 = 289

Totaln = 944100,00

Ejemplo con variables cualitativas Ejemplo. El restaurante "Hay Que Rico" en la ciudad de Chiclayo, usa un cuestionario para conocer la opinin de sus clientes sobre el servicio, la calidad de los alimentos, los ccteles, los precios y el ambiente del restaurante en el mes de julio del 2005. Cada caracterstica se valora en una escala: notable (O), muy bueno (V), bueno (G), mediano (A) y malo (P). Elabore un cuadro estadstico GOVGAOVGOVAG

VOPVOGAOOOGO

VVAGOVPVOOGO

OVOGAOVOOGVA

Aplicacin de la funcin de Excel en la Elaboracin de Tablas con variables cualitativas

Figura N 03 Ingreso de los datos

Paso.- 1 Se ubica en la celda A1 (Calidad) Insertar se selecciona tabla dinmica

Figura N 04 Seleccin de la tabla dinmica

Paso.- 2 En la ventana de Crear tabla dinamica se elije donde se desea colocar el informe de la tabla dinamica

Figura N 05 Crear tabla dinamica

Paso.- 3 En la ventana de lista de campos de la tabla dinmica se selecciona la variable Calidad en Etiqueta de la fila y de columnas y en valores

Figura N 06 Seleccionar campos para agregar al informe Paso.- 4 Insertamos un grfico un dinmico de barras

Figura N 07 Insertar grafico

Paso.- 4 Presentacin del grfico de barras de la variable calidad

Grafico N 01: Grafico de Barras de la variable calidad

Ejemplo:En un estudio de mercado para determinar la aceptacin de un centro comercial Shopping Plaza por departamentos ubicada en la ciudad de Cajamarca, se eligi una muestra de 35 clientes para conocer sus impresiones. Los resultados son los siguientes:ClienteRazn de visitaGasto semanalIngreso MensualNmero de hijosForma de Pago

1Oferta permanente66.0012002Efectivo

2Guardera72.5015001Crdito

3Tarjeta de crdito79.1021003Crdito

4Oferta permanente82.7020003Efectivo

5Guardera55.3015001Efectivo

6Parking amplio100.1022002Crdito

7Aire acondicionado35.3014503Efectivo

8Tarjeta de crdito60.4013101Crdito

9Aire acondicionado57.2011502Efectivo

10Parking amplio140.0023200Crdito

11Tarjeta de crdito69.1013502Efectivo

12Parking amplio73.1016401Crdito

13Guardera75.3016803Crdito

14Aire acondicionado30.0011000Efectivo

15Parking amplio95.2018502Efectivo

16Guardera65.3014101Efectivo

17Tarjeta de crdito68.0015803Crdito

18Parking amplio115.3021100Efectivo

19Parking amplio130.2021802Crdito

20Aire acondicionado48.4016403Crdito

21Guardera86.0018402Crdito

22Parking amplio102.2019503Efectivo

23Oferta permanente50.1012302Efectivo

24Tarjeta de crdito101.2020002Crdito

25Parking amplio102.2028103Crdito

26Oferta permanente58.1015304Efectivo

27Tarjeta de crdito90.3019802Crdito

28Parking amplio119.1029004Crdito

29Oferta permanente125.1026803Efectivo

30Tarjeta de crdito70.2019702Crdito

31Parking amplio118.4025603Crdito

32Oferta permanente110.1021804Crdito

33Tarjeta de crdito84.3019803Efectivo

34Oferta permanente77.2020502Crdito

35Oferta permanente104.2025004Crdito

Se copia (Ctrl + C) y se pega (Ctrl + V) al Minitab las 35 observaciones

Figura N 08: Pantalla del Minitab ingresado los datos

A. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS: Realizamos la tabulacin de la variable Razn de visita procedemos a ejecutar en el Minitab

MINITAB: Tabla de frecuencias

1. Paso 1 .- Estadsticas/Tablas/cuenta de variables individuales

Figura N 09 Estadsticas/Tablas/cuenta de variables individuales

2. Paso 2.- En la ventana cuenta de variables individuales se selecciona la variable Razn de Visita. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajes acumulados. Aceptar

Figura N 10 Ventana cuenta de variables individualesResultado del procesamiento en Minitab

Figura N 11 Cuenta de la variable Razn de visita

B. REPRESENTACIN GRAFICA DE LA VARIABLE CUALITATIVAS: Realizamos la tabulacin de la variable Razn de visita procedemos a ejecutar en el Minitab

1. Grafico Circular.- Se trabaja con los valores de las frecuencias Absolutas (ni) frecuencias relativas (hi) como la variables seleccionada es variable cualitativa (Razn de Visita)

Paso 1 .- Grfica/Grfica Circular

Figura N 12 Grfico circular en minitab

Paso 2 .- En la ventana de Grafica circular se selecciona Variables Categrica: Razn de visita

Figura N 13 Grafica Circular

Paso 3 .- En la ventana de Grafica circular se selecciona EtiquetasSeleccionar la pestaa Etiqueta de divisin de la grfica circular con: Nombre de categora/ Porcentaje /Dibujar una lnea de la etiqueta a la divisin

Figura N 14 Etiqueta de divisin de la grfica circular

Grfico N 02 Grfico Circular de Razn de visita

2. Grfico de Barras.- En el eje horizontal representa los valores o las categoras y en el eje vertical se presentan los valores de las frecuencias Absolutas (ni) frecuencias relativas (hi) como la variables seleccionada es variable cualitativa (Razn de Visita)

Paso 1 .- Grfica/Grfica de barras

Figura N 15 Grfico barras en minitab

Paso 1 .- En la ventana Grfica de barrasLas barras representan: Conteos de valores nicosBarras simples/ Aceptar

Figura N 16: Grfica de barras

Paso 2.- En la ventana Grfica de barras Conteo de valores nicos, simples se selecciona la variable categrica: Razn de visita y se selecciona Opciones de grficas

Figura N 17: Grfica de barras Conteo de valores nicos, simples

Paso 3.- En la ventana Grfica de barras Opciones de grficasOrdenar grupos de X principal por Y descendente/Aceptar

Figura N 18: Grfica de barras Opciones

Paso 4.- En la ventana Grfica de barras Conteo de valores nicos, simples se selecciona EtiquetasEn Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar

Figura N 19: Grfica de barras Etiquetas

Grfico N 03 Grfico de barras Razn de visita

C. DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE CUANTITATIVAS DISCRETAS: Realizamos la tabulacin de la variable Nmero de hijos procedemos a ejecutar en el Minitab

1. Paso 1 .- Estadsticas/Tablas/cuenta de variables individuales

Figura N 20 Estadsticas/Tablas/cuenta de variables individuales

2. Paso 2.- En la ventana cuenta de variables individuales se selecciona la variable Nmero de hijos. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajes acumulados. Aceptar

Figura N 21 Ventana cuenta de variables individuales

Resultado del procesamiento en Minitab

Figura N 22 Cuenta de la variable Nmero de hijos

D. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS DISCRETAS: Realizamos la tabulacin de la variable Nmero de hijos procedemos a ejecutar en el Minitab

1. Grfico de Barras.- Se trabaja con los valores de las frecuencias Absolutas (ni) frecuencias relativas (hi) como la variables seleccionada es variable discreta Nmero de hijos

Paso 1 .- En la ventana Grfica de barrasLas barras representan: Conteos de valores nicosBarras simples/ Aceptar

Figura N 23: Grfica de barras

Paso 2.- En la ventana Grfica de barras Conteo de valores nicos, simples se selecciona la variable categrica: Nmero de hijos y se selecciona Opciones de grficas

Figura N 24: Grfica de barras Conteo de valores nicos, simples

Paso 3.- En la ventana Grfica de barras Opciones de grficasOrdenar grupos de X principal por Y descendente/Aceptar

Figura N 25: Grfica de barras Opciones

Paso 4.- En la ventana Grfica de barras Conteo de valores nicos, simples se selecciona EtiquetasEn Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar

Figura N 26: Grfica de barras Etiquetas

Salida de Minitab

Grfico N 04 Grfico de barras Nmero de hijosCuadros de Frecuencias de Variables ContinuasLos sueldos mensuales en dlares de 60 empleados de la empresa Z.S.A., son los siguientes:440560335587613400424466565393

453650407376470560321500528526

570430618537409600550432591428

440340558460560607382667512492

450530501471660470364634580450

574509462380518480625507645382

Construir un cuadro de Frecuencias se aplica el procedimiento siguiente:Poblacin: Empleados de la empresa Z.S.A (n = 60)Variable: X = sueldo mensual en dlares.Datos: Xi = sueldo mensual en dlares Xi (i =1, 2, 3,.....,60) n =60 trabajadoresDeterminamos el mximo y mnimo de Xi, el sueldo ms alto (Xmax) y el sueldo mnimo (Xmin).X38 = Xmax = 667X17 = Xmin = 3211. Recorrido(R): Xmax Xmin = 667 321 =3462. Elegimos el nmero de Intervalos (m). Se puede considerar 5 15 intervalosSi aplicamos: Para calcular el nmero de clases de un cuadro de frecuencias podemos usar las siguientes expresiones frmulas:a) Raz cuadrada

b) Regla de Sturges m =1 + 3.322 Log(n)m=1 + 3.322 Log(60)m=7 intervalosc) Regla de Stockes

3. Determinar la amplitud de los intervalos (C)

Se puede redondear a 504. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o segmentos, cuyo extremos son: I1 I2I3 I4 I5 I6 I7

320 370 420 470520 570 620 670

Utilizaremos un concepto matemtico de intervalo abierto (parntesis) y de intervalo cerrado (corchete). Donde (Li-1 Li] significa que est abierto por la izquierda y cerrado por la derecha, es decir que en cada intervalo no est incluida el extremo inferior (Li-1) pero si lo est el extremo superior (Li).Forma de expresar:Intervalo de clase(Li-1 Li]

320 370

370 420

420 470

470 520

520 570

570 620

620 670

Punto medio de cada intervalo, es la MARCA DE CLASE se denota con yi donde

5. Elementos de una cuadro de frecuencia, en toda cuadro de frecuencia se identifica los siguientes elementos:

a) Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi de la variable X, el nmero de veces ni que se repite ese valor.

b) Frecuencia relativa (hi): Se denomina frecuencia relativa del valor xi de la variable X la relacin por cociente entre el nmero de veces que aparece el valor xi y el nmero total de valores de la variable (N).

c)

Frecuencia absoluta acumulada (Ni): Se denomina frecuencia absoluta acumulada del valor a la suma de las frecuencias absolutas de los valores de la variable X anteriores o iguales a . Su valor es con j = 1......i

d)

Frecuencia relativa acumulada (Hi): Es la frecuencia absoluta acumulada dividida por el nmero total de valores de la variable. Su valor es =. De todas estas definiciones se extraen las siguientes deducciones: La suma de las frecuencias absolutas sin acumular es igual al nmero total de los (,= N) La ltima frecuencia relativa acumulada es el total de elementos (n). La suma de todos las frecuencias relativas acumular es igual La ltima frecuencia relativa acumulada es la unidad

La distribucin de frecuencias de una variable suele presentarse ordenadamente mediante la tabla de frecuencias siguiente:

Intervalos de clasesMarca de claseFrecuencia AbsolutasFrecuencias Absolutas Acumuladas Frecuencias RelativasFrecuencias Relativas Acumuladas

nKNk = n1+...+nK=n

Totalnni =n

Los intervalos son los siguientes: [Li-1 Li>

[L1 = obs. menor= 30.0L1 = L1 +IC = 48.4>

[L2 = 48.4L2 = 66.8>

[L3 = 66.8L3 = 85.2>

[L4 = 85.2L4 = 103.6>

[L5 = 103.6L5 = 122.0>

[L6 = 122.0L7 = 140.4>

Paso 5- Tabulacin de los datos (conteo de datos)Gasto mensual[Li-1 Li>Frecuencia absoluta niFrecuencia relativa hi %Frecuencia acumulada absoluta NiFrecuencia acumulada relativa Hi %

[ 30.0 48.4>25.7125.71

[ 48.4 66.8>822.861028.57

[ 66.8 85.2>1028.572057.14

[ 85.2 103.6>720.002777.14

[103.6 122.0>514.293291.43

[122.0 140.4]38.5735100.00

Nota: Creamos una nueva variable denominada Gastos en la columna C8 Paso 6- Tabulacin de los datos (conteo de datos) con Minitab. Seleccionamos Datos/ Codificar/ Numrico a numrico

Figura N 23: Codificar de Numrico a numrico

Pas 6- En la ventana Cdigo Numrico a numrico se ingresan los valores de los intervalos mencionando a que intervalo corresponde:

Figura N 24: En la ventana Cdigo Numrico a numrico se ingresan los valores

Pas 7- Mostrar los intervalos con sus respectivos frecuencias absolutas y relativas.Seleccionamos Estadsticas/Tablas/Cuentas de variables individuales seleccionamos C8: Gastos en la ventana de variables. Tambin Conteos/Porcentajes/Conteos acumulados y porcentaje acumulados.

Figura N 24: Cuentas de variables individuales

Figura N 25: Cuentas de variables: GastosF. REPRESENTACIN GRAFICA DE LA CUANTITATIVAS CONTINUA: Realizamos la tabulacin de la variable Gasto semanal procedemos a ejecutar en el Minitab

Calculo previos para tabular la variable 1. Histogramas Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. Paso 1.- Seleccionamos Grfica/Histograma

Figura N 25: Seleccionar Histogramas

Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar

Figura N 26: Ventana Histogramas

Paso 3.- En la ventana Histograma simple en la ventana de Variables grficas: Gasto semanal

Figura N 27: Histograma simple

Paso 4.- Se selecciona Escala selecciona Tipo de escala Y

Figura N 28: Histograma Escala

Paso 5.- En la ventana Histograma Escala/tipo de escala Y/Porcentaje

Figura N 29: Histograma Escala

Paso 6.- Se ejecuta doble click en el Histograma en el eje de X

Grfico N 03: Histograma de Gasto semanal

Paso 7.- En la ventana Editar Escala se seccionamiento: Tipo de intervalo/Punto de corte. En Definicin de intervalo/posiciones de punto medio/punto de corte: 30:140.4/18.4/Aceptar

Amplitud del intervalo

Observacin Mxima

Observacin Mnima

Figura N 30: Histograma Escala

Grfico N 04: Histograma de Gasto semanal2. Histogramas Se construye con cada punto medio o marca de clase (Xi) de cada intervalo se levanta un segmento de altura igual a la respectiva Frecuencias Absolutas (ni hi).

Paso 1.- Se copia la marca de clase y frecuencia relativa

Frec. Relah = 0.00

Frec. Relah = 0.00

Se agrega una clase:131.2 + 18.4 = 149.6Se agrega una clase:39.2 18.4 =20.8

Figura N 31: Marca de clase y Frecuencia Relativa

Paso 2.- Seleccionamos Grfica/ Grfica de dispersin

Figura N 31: Grfica de dispersin

Paso 3.- En la ventana Grfica de dispersin con lnea de conexin

Figura N 32: Grfica de dispersin

Paso 4.- En la ventana Grfica de dispersin con lnea de conexin:Se agrega en la Variables Y: Frec. Rela y Variables X: Marca de Clase

Figura N 32: Grfica de dispersin con lnea de conexin

Pas 5.- En la Grfica de Frec. Rela vs Marca de ClaseDoble Crick en eje de Y en la frecuencia Relativa se muestra la venta Editar escala

Grfico N 05: Polgono de frecuencia de Gasto semanal

Pas 6.- En la venta Editar escala en el Rango de escala/Mnimo =0/ Aceptar

Figura N 32: Editar escala

Grfico N 05: Polgono de frecuencia de Gasto semanal

3. Polgonos Acumulativos de Frecuencias (Ojiva). Aquellos que se desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las distintas columnas del histograma. En el momento de la representacin de todas las frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma defrecuencias acumuladasque posibilita la diagramacin del polgono correspondiente.

Paso 1.- Seleccionamos Grfica/Histograma

Figura N 33: Seleccionar Histogramas

Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar

Figura N 34: Ventana Histogramas

Paso 3.- En la ventana Histograma simple en la ventana de Variables grficas: Gasto semanal

Figura N 35: Histograma simple

Paso 4.- Se selecciona Escala selecciona Tipo de escala Y

Figura N 36: Histograma Escala

Paso 5.- En la ventana Histograma Escala/tipo de escala Y/Porcentaje

Figura N 37: Histograma Escala

Pas 6.- Doble Click en eje de Gasto mensual donde se presenta la ventana Editar escala

Grfico N 06: Polgono de frecuencia Acumulada

Pas 7.- En la ventana de Editar Escala/Tipo intervalo/Punto de cortePosiciones de punto medio/punto de corte: 30:140.4/18.4 Aceptar

Figura N 38: Ventana de Editar Escala

Grfico N 06: Polgono de frecuencia Acumulada

4. Diagrama de Tallos y hojas: Permite obtener simultneamente una distribucin de frecuencias de la variable y su representacin grfica. Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constituye lahoja) del bloque de cifras restantes (que formar eltallo).

Paso 1.- Seleccionamos Tallo y Hoja.

Figura N 38: Seleccionar Tallo y Hoja

Grficos Estadsticos

Primero definir lo que es un grfico o diagrama en estadstica.

Un diagrama es una especie de esquemtico, formado por lneas, figuras, mapas, utilizado para representar, bien datos estadsticos a escala o segn una cierta proporcin, o bien los elementos de un sistema, las etapas de un proceso y las divisiones o subdivisiones de una clasificacin. Entre las funciones que cumplen los diagramas se pueden sealar las siguientes:

Hacen ms visibles los datos, sistemas y procesos Ponen de manifiesto sus variaciones y su evolucin histrica o espacial. Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y representar la correlacin entre dos o ms variables. Sistematizan y sintetizan los datos, sistemas y procesos. Aclaran y complementan las cuadros y las exposiciones tericas o cuantitativas. El estudio de su disposicin y de las relaciones que muestran pueden sugerir hiptesis nuevas.

Algunos de los diagramas ms importantes son el diagrama en rbol, diagrama de reas o superficies, diagrama de bandas, diagrama de barras, diagrama de bloques, diagrama circular, diagrama circular polar, diagrama de puntos, diagrama de tallo y hoja diagrama, histogramas y grficos de caja y bigote o boxplots.Clasificacin De Los GrficosLos grficos podemos clasificarlos en la siguiente forma:A. Grficos de coordenadas ortogonales. Con divisiones equidistantes: Cronodiagrama, historiograma, histograma y polgono acumulativo, grfico en Z, grfico en escalera, grfico de banderola, grfico mixto (La Banda Flaman), curva de frecuencia, estereograma, grfico de Gantt, grfico de barras, etc Con divisiones semi-equidistantes: Cuadriculado logartmico y semi-logartmico.

B. Grficos de coordenadas seudo-ortogonales.C. Grficos de coordenadas no ortogonales.Grficos de coordenadas polares, grfico en espiral, grfico triangular equiltero, etc.D. Grficos sin coordenadas. De superficies: Grficos de sectores, grficos geomtricos diversos. De volmenes: Cubo, esfera, etc. De figuras (pictrico). Cartograma de sealizacin y densidad.E. GRFICOS DE LA DISTRIBUCIN DE FRECUENCIASAbscisasOrdenadas

Las frecuencias (ni, hi, Ni, Hi) siempre son cantidades no negativas ( 0), por lo tanto el grafico de las frecuencias sean para variables discretas como para variables continuas, se construye en el primer cuadrante del plano cartesiano o rectangular. En eje de las abscisas (horizontal) se indican los valores de la variable (sean puntos o intervalos), y en el eje de las ordenadas (vertical) se anota el valor de la respectiva frecuencia.i. Frecuencias de variable DiscretaLa representacin grfica de las (ni hi) se hace mediante el Diagrama de Frecuencia. Par el efecto, en el eje horizontal se representan los valores Yi, y en el eje verticales representa los valores de las frecuencias (ni hi) Opinin de los ClientesFrecuencia AbsolutasAGOPV0510152061018212ni

Opinin de los ClientesFrecuencia absoluta niFrecuencia Relativa hi %

A612,5

G1020,8

O1837,5

P24,2

V1225,0

Total48100,0

Al considerar las frecuencias absolutas acumuladas o relativas acumuladas, la representacin grfica se hace mediante el GRFICO ACUMULATIVO DE FRECUENCIAS. En el eje horizontal se colocan los valores de la Marca de Clase (Xi), y en el eje vertical los valores Ni Hi, a continuacin, a partir de cada extremo de los segmentos se traza tramos horizontales formando una escalera como se aprecia en el siguiente grafico Intervalos de clases

(Li-1 L]Marca de claseXiFrecuencia AbsolutasniFrecuencias Absolutas AcumuladasNi

16 2721,533

27 3832,558

38 4943,51018

49 6054,5321

60 7165,5829

71 8276,5736

82 9387,5440

Total40

En el caso de Grficos de Barras, en el eje horizontal representa los valores de Yi, y en el eje vertical se presentan los valores de las frecuencias Absolutas (ni hi)

Opinin de los ClientesFrecuencia absoluta niFrecuencia Relativa hi %Convierten hi %A GradosEn Grados

A612,5

45.0

G1020,8

74.9

O1837,5135.0

P24,216.3

V1225,091.8

Total48100,0

Para los Grficos de Sectores Circulares Pastel, se convierten los valores de las frecuencias Absolutas (ni hi) a grados mediante

ii. Frecuencias de variable ContinuaEn el caso ms general, las variables continuas se agrupan en cuadros de frecuencias con intervalos, por lo tanto se trata de representar grficamente intervalos en el eje horizontal.La representacin grfica de las frecuencias (absolutas o relativas) se hace mediante el Histograma de Frecuencias, que est constituido por un conjunto de rectngulos, cuya base es igual a la amplitud de un intervalo y la altura igual a la respectiva frecuencia. Para construir el histograma de frecuencias, se indican en el eje horizontal Intervalos de clases

(Li-1 L]Frecuencia Absolutasni

16 273

27 385

38 4910

49 603

60 718

71 827

82 934

Total40

024681001627384960718293Lmite inferiorFrecuencia Absolutas

ni

Otro grfico que se usa para representar las frecuencias es el Polgono de Frecuencias, que se construye como sigue: en cada punto medio o marca de clase (Xi) de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencias Absolutas (ni hi), luego une los extremos con una lnea poligonal, resultando el Polgono de Frecuencias. Para completar los extremos, se extiende el polgono en media amplitud de cada extremo.

Intervalos de clases

(Li-1 L]Marca de claseXiFrecuencia Absolutas024681012010.521.532.543.554.565.576.587.598.5Frecuencia AbsolutaMarca de clase

ni

10.50

16 2721,53

27 3832,55

38 4943,510

49 6054,53

60 7165,58

71 8276,57

82 9387,54

98.50

Total40

Por su parte, las frecuencias acumuladas (Absolutas o Relativas) se grafican mediante los Polgonos Acumulativos de Frecuencias (Ojiva). De igual manera, en el eje horizontal se ubican los extremos los intervalos y en el eje vertical lo valores de Ni, Hi. En el extremo superior de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencia absoluta, luego partiendo del extremo inferior del primer intervalo se une, con segmentos de recta, los extremo de los segmentos verticales, obteniendo una lnea poligonal que, a partir de la ltima frecuencia acumulativa, se extiende paralelamente al eje horizontal, obtenindose la grfica del Polgono Acumulativo de Frecuencias Intervalos de clases05101520253035404501627384960Intervalo de ClaseFrecuencias Absolutas Acumuladas

718293

9715540,08330,9000

[1010 1088>10496600,10001,0000

Total601,0000

El Polgono de Frecuencias Absolutas.Para graficar el polgono de frecuencias se realiza algunos clculos

Vida til en horas

[Li-1 Li>Marca de claseNmero de Bombillas

xini

5810

[620 698>6594

[698 776>7377

[776 854>81523

[854 932>89315

[932 1010>9715

[1010 1088>10496

11270

Total60

GRAFICO N 01POLGONO DE FRECUENCIA DE LA VIDA TIL EN HORAS DE UNA MUESTRA ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS

b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas tiles oscilan entre 700 y 1000 horas.Vida til en horas

[Li-1 Li>Nmero de BombillasFrecuencia RelativaFrecuencia Relativa

nihihi %

[620 698>40,06676,667

[698 776>70,116711,667

[776 854>230,383338,333

[854 932>150,250025,000

[932 1010>50,08338,333

[1010 1088>60,100010,000

Total601,0000100,000

Calculamos el nmero de observaciones pedido:698 a 77611,666677811,6667 698 a 700 x 2 xPara encontrar el valor 698 a 700 = 11,6666667 0,2991453 = 11,3675214932 a 10108,3333788,333932 a 1000 x 68 xPara encontrar el valor 700 y 1000 horas. = 11,368 + 38,333 + 25,000 + 7,265 = 81,966% El 15 % ms durables en la categora A Basta calcular el percentil 15 y el percentil 85

Ejemplo 2. En la siguiente distribucin de frecuencias relativas calcular:a) Las desviacin cuartillitab) Discutir el sesgo y la kurtosisTiempo 0 33 66 99 1212 1515 18

hi0,040,060,400,380,100,02

SolucinTiempoXihiHixi hixi2 hi

0 31,50,040,040,060,09

3 64,50,060,100,271,215

6 97,50,400,503,0022,5

9 1210,50,380,883,9941,895

12 1513,50,100,981,3518,225

15 1816,50,021,000,335,445

Total1989,37

Directamente de la tabla: media aritmtica

Varianza Desviacin estndar S = 2,89309523

a) Las desviacin cuartillita

b) Discutir el sesgo y la kurtosis

No podemos concluir que la distribucin sea simtrica. En efecto, como la media est a la derecha de la moda la distribucin es sesgada a la derecha y usando el primer Coeficiente de Pearson tenemos:

Como Sk > 0 la distribucin es ligeramente sesgada a la derecha

Como es K>0.263, puede considerarse la distribucin que es Leptocrtica

Ejemplo 3. Al investigar el nivel socioeconmico en los valores: Bajo (B), Medio (M), Alto (A),20 familias dieron las siguientes respuestas:M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.Construir la distribucin de frecuencias y trazar su grfica.Nivel socioeconmicoFrecuencia AbsolutaFrecuencia Relativa

Medio840,0

Bajo945,0

Alto315,0

Total 20100

VII. CAPITULO Regresin y Correlacin Lineal

2. Regresin y Correlacin LinealSon dos herramientas para investigar la dependencia de una variable dependiente Y en funcin de una variable independiente X. Y = f(X)Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o respuestaX = Variable independiente, tambin se llama variable explicativa, regresor o predictorRegresin lineal - La relacin entre X y Y se representa por medio de una lnea rectaRegresin curvilinea - La relacin entre X y Y se representa por medio de una curva.

La ecuacin de la recta es la siguiente:

El trmino de error es la diferencia entre los valores reales observados Yi y los valores estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual se utiliza el mtodo de mnimos cuadrados.Se trata de minimizar la suma de todos los errores o residuos:Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el siguiente ejemplo por claridad. Se tienen los siguientes supuestos:

1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresin poblacional2. Las varianzas de los errores son las mismas en todos los valores de X (Homoscedasticidad) en caso contrario se tiene (Heteroscedasticidad)3. Los errores o residuos son independientes: No se muestra algn patrn definido.

El coeficiente de Correlacin r desarrollado por Carl Pearson es un indicador de la fuerza de la relacin entre las variables X y Y, puede asumir valores entre -1 y 1 para correlacin negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra que la variable presin tiene una correlacin positiva con el rendimiento de una caldera, se deben buscar soluciones al problema mediante acciones asociadas con la variable presin; de lo contrario, sera necesario buscar la solucin por otro lado.

Se identifican tres medidas de desviacin como sigue:

Ejemplo: Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo est relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos de tiempo tomados para n = 25 servicios se muestran a continuacin:

X ServiciosY Tiempo(Xi-X)*(Yi-Y)(Xi-X) 2(Yi-Y)2YestError

29.95119.07667238.9376364.153310.91990.9408

824.451.0998720.057621.002128.336215.1022

1131.757.4994727.61767.383237.044328.0292

1035.0010.5022723.097635.607534.14160.7369

825.020.9630720.057616.102628.336210.9969

416.8651.61267217.9776148.177116.72530.0181

214.3891.43347238.9376214.704510.919911.9721

29.60121.26067238.9376377.633710.91991.7422

924.35-3.5589280.577621.928631.238947.4563

827.500.3678720.05762.349528.33620.6991

417.0850.67987217.9776142.869416.72530.1258

1137.0021.9894727.617663.476337.04430.0020

1241.9548.56867214.1376166.854139.94704.0121

211.66108.40627238.9376301.814210.91990.5477

421.6531.30307217.977654.505716.725324.2523

417.8947.24547217.9776124.162016.72531.3564

2069.00470.014272138.29761,597.377163.168634.0052

110.30135.62547252.4176350.91788.01725.2111

1034.9310.3790723.097634.777034.14160.6216

1546.59118.68667245.6976308.255348.65514.2646

1544.88107.12707245.6976251.133748.655114.2512

1654.12194.67667260.2176629.367651.55786.5649

1756.63241.75147276.7376761.605454.46054.7068

622.1315.4622725.017647.648622.53070.1606

521.1525.54027210.497662.138519.62802.3164

206725.822,027.7132698.56006,105.9447220.0926

SxySxxSyy = SSTSSE

X promedioY Promedio

SxySxxSyy

Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de cuadrados siguientes se muestran a continuacin:

Sxy = 2027.71Sxx = 698.56Syy = 6105.94

Las ecuaciones para el clculo manual son las siguientes:

= 2.902704421

= 5.114515575

Las sumas de cuadrados son:

6,105.9447

220.0926

5,885.8521

El coeficiente de determinacin r2 y el coeficiente de correlacin r se calculan a continuacin:

= 0.9639

El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada por la regresin.

= 0.9816

El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r = 0 indicara correlacin nula.

El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica para afirmar que el tiempo de atencin est relacionado con el nmero de servicios atendidos.

EJERCICIOS:1. La energa consumida en un proceso depende del ajuste de mquinas que se realice, realizar una regresin cuadrtica con los datos siguientes y responder las preguntas.Cons_energaAjuste Mq.

YX

21.611.15

415.7

1.818.9

119.4

121.4

0.821.7

3.825.3

7.426.4

4.326.7

36.229.1

a. Trazar un diagrama de dispersinb. Obtener la ecuacin de regresin lineal y cuadrtica y compararc. Estimar el consumo de energa para un ajuste de mquina de 20 con regresin cuadrticad. Obtener los intervalos de prediccin y de confianza para un ajuste de mquina de 20e. Obtener el coeficiente de correlacin y de determinacin

2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas en una lnea area. Las quejas son por cada 100000 pasajeros.%puntosQuejasa. Trazar un diagrama de dispersinb. Obtener la ecuacin de regresin lineal c. Estimar las quejas para un porcentaje de puntualidad de 80%d. Obtener los intervalos de prediccin y de confianza para una altura de 63"e. Obtener el coeficiente de correlacin y de determinacin

AerolneaXY

A81.80.21

B76.60.58

C76.60.85

D75.70.68

E73.80.74

F72.20.93

G70.80.72

H68.51.22