material de lectura

64
Estadística Responsable: Lic. Jessica L. Oliva Gastulo Chiclayo, Marzo 2014

Upload: jose-sanchez-alarcon

Post on 09-Nov-2015

27 views

Category:

Documents


1 download

DESCRIPTION

material de lectura

TRANSCRIPT

  • Estadstica

    Responsable:

    Lic. Jessica L. Oliva Gastulo

    Chiclayo, Marzo 2014

  • Estadstica - Lic. Jessica Oliva G. Pgina | 2

    ASPECTOS BSICOS DE LA ESTADSTICA Y

    ORGANIZACIN DE DATOS

    ETIMOLOGA DE LA PALABRA ESTADSTICA

    La nocin de estadstica procedi primitivamente del vocablo estado, porque ha sido ocupacin

    tradicional de todos los gobiernos de la civilizacin llevar registros de las poblaciones que dominaban

    o gobernaban, entre eso registros se pueden mencionar: los nacimientos, las defunciones, los censos

    poblacionales, cosechas, impuestos y muchas otras clases de cosas y actividades que eran y son de

    importancia para un gobernante. Contar y medir estos hechos generan muchas clases de datos

    numricos. Esta se ha convertido en un instrumento cotidiano de todos los tipos de profesionales que

    se ponen en contacto con datos cuantitativos o extraen conclusiones de ellos. Tales tcnicos requieren

    con urgencia familiarizarse con los principios bsicos de los mtodos estadsticos para poder evaluar

    los informes numricos y otro gran cmulo de informacin para as evitar malos usos comunes de la

    estadstica como lo es la generalizacin e inferencia que es bsica en el razonamiento estadstico. Los

    estudiantes de diversas reas del conocimiento deberan tener un conocimiento prctico de los mtodos

    estadsticos.

    Son heterogneos los vocablos que se citan como antecedentes del trmino estadstica. Sin intentar ser

    exhaustivos, pero si indagando para describir los de mayor mencin, se pueden nombrar los siguientes:

    STATUS (latn), que significa situacin, posicin, estado.

    STATERA (griego), que quiere decir balanza, ya que la estadstica mide o pesa hechos.

    STAAT (alemn), que se refiere a estado como expresin de unidad poltica superior.

    LA ESTADSTICA: Segn Allen (1996), Chao (1996), Yule y Kendal (1986) y Rivas Gonzlez

    (1993) la estadstica es una ciencia (otros investigadores la consideran como un conjunto de mtodos)

    que se encarga de la recoleccin, clasificacin, presentacin, organizacin, anlisis e interpretacin de

    un conjunto de fenmenos, (naturales, econmicos, polticos o sociales) de manera metdica y

    numrica, que permitan extraer conclusiones de un hecho, en un momento determinado y as poder

    tomar decisiones valederas. De acuerdo con la definicin anterior la estadstica se encarga de la

    recoleccin, clasificacin, anlisis e interpretacin de un conjunto de datos en una investigacin

    determinada.

    Segn, algunos investigadores la estadstica, es una rama de las matemticas que se ocupa de reunir,

    organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos

    y la toma de decisiones. Tambin, se puede decir que es una rama de las matemticas que utilizando un

    conjunto de mtodos y tcnicas se encarga de la recoleccin, organizar, presentacin, analizar e

    interpretacin de datos naturales, econmicos, polticas, sociales, etc., para presentar los resultados

    obtenidos y sacar conclusiones vlidas basadas en dicho anlisis y as poder tomar una decisin. La

    funcin principal de la estadstica es elaborar principios y mtodos que ayuden a tomar decisiones

    frente a la incertidumbre. En realidad, muchos autores definen la estadstica actualmente como un

    mtodo de toma de decisiones frente a la incertidumbre. La estadstica puede presentar conclusiones

    referentes nicamente al grupo estudiado, o puede generalizarlas para grupos mayores.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 3

    El gran nmero de informacin estadstica que se ofrece al pblico, por una razn u otra, escapa al

    entendimiento, y una incertidumbre colectiva radica en que porcin de la estadstica es buena y cual

    es mala. Indudablemente, no se puede aceptar toda la informacin sin emitir crtica. Algunas veces,

    conclusiones totalmente errneas se basan en datos fehacientes. Por ejemplo, en alguna ocasin cierto

    alcalde afirm que la ciudad x era la ms sana de la nacin, ya que su ndice de mortalidad era el ms

    bajo del pas. Aunque concordamos con su afirmacin de que ser sano significa no estar muerto, existen

    otros factores que no se tomaron en consideracin: cmo la ciudad no tena hospital, sus habitantes

    tenan que ser hospitalizados en otra ciudad y si el enfermo mora el fallecimiento se registraban en el

    lugar donde ciertamente ocurri la muerte y no en la ciudad de origen del difunto. Los siguientes son

    algunos de los otros casos errnea basada en datos estadsticos, en otra informacin que eran fidedigna:

    la estadstica seala que hubo menos accidentes de aviacin en 1920 que 1990, por lo tanto, era ms

    seguro volar en 1920 que 1990, anlisis estadstico errneo aunque la estadstica es verdad. Como

    existen ms accidentes de automviles en el da que en la noche es ms seguro conducir de noche, otro

    error al realizar tal afirmacin, como se puede observar no siempre con las estadsticas se pueden hacer

    afirmaciones tomando en cuenta algunos datos estadsticos valederos, si antes no se analizan otras

    variables relacionadas con las estadsticas.

    Hay que hacer una explicacin antes de comenzar un estudio formal aplicando las tcnicas estadstica;

    se pondr en claro que los procedimientos estadsticos acertado de un problema implican mucho ms

    que hacer algunas observaciones en la elaboracin, realizar algunas operaciones y llegar a cierto tipo

    de conclusiones. Existen muchas incgnitas en la elaboracin de un estudio estadstico tales como: la

    forma en que se recolectan los datos y como se planifica una investigacin o es un estudio en su

    totalidad, es de importancia primordial. Como en cualquiera otra ciencia, en la estadstica hay que tener

    la precaucin adecuada en todo la fase de cualquiera investigacin, desde la concepcin y

    planteamiento del problema, que algunas veces es el trabajo ms dificultoso, hasta la planificacin y

    el diseo, pasando por las etapas de recoleccin, organizacin, tabulacin, anlisis e interpretacin de

    los datos, si no se toman en cuenta estas etapas no se podr llegar a una conclusin til o valedera. En

    trminos generales, ni siquiera un prolongado y elegante manejo matemtico o estadstico de los datos,

    aun con el equipo de computacin ms costoso y sofisticado del mundo, pueden salvar los estudios o

    experimentos mal diseado. En realidad, los estadsticos profesionales insisten en que hasta los estudios

    de muestreo ms simple deben llevarse a cabo con estricto apego a reglas bien definidas; de tal forma

    que, no existe una justificacin para llamar estadstico a un estudio que no se ajuste a estas normas.

    Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos

    presentados de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto popular que

    existe sobre el trmino y que cada vez est ms extendido debido a la influencia de nuestro entorno, ya

    que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc., no nos

    tope diariamente con cualquier tipo de informacin estadstica sobre accidentes de trfico, ndices de

    crecimiento de poblacin, turismo, tendencias polticas, etc. La palabra estadstica ha sido

    frecuentemente referida a la informacin cuantitativa o numrica. Tambin ha sido referida

    ampliamente a los mtodos que tratan con la informacin. Sin embargo, esto debera aclararse y llamar

    a la informacin datos estadsticos y a los mtodos utilizados para su recoleccin, tcnicas estadsticas.

    Cuando un lector tiene pocos hechos numricos, puede utilizar la informacin numrica en su mxima

    extensin sin perder mucho tiempo o pensar demasiado en analizar los hechos.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 4

    Ejemplo: Luis tiene 25 aos y Luisa tiene 18.

    Un lector puede fcilmente interpretar la informacin anterior de muchas maneras diferentes. Por

    ejemplo, Luis es un hombre joven de 25 aos de edad, pero es 5 aos mayor que Luisa; sin embargo,

    cuando un lector tiene un gran volumen de hechos numricos, puede encontrar que la informacin le

    es de poco valor, puesto que no puede interpretar la duda al mismo tiempo. Ejemplo, Luis tiene 25aos,

    Luisa tiene18 aos, Mara tiene 16 aos, Jaime tiene 26 aos, Pedro tiene 19 aos, y as sucesivamente

    hasta llegar al estudio de 1000 alumnos seleccionados en un momento determinado.

    El gran volumen de informacin numrica origina la necesidad de mtodos sistemticos, los cuales

    pueden ser utilizados para organizar, presentar, analizar e interpretar la informacin efectivamente. De

    esta manera pueden extraerse conclusiones vlidas y tomarse decisiones razonables mediante el uso de

    los mtodos. Los mtodos estadsticos son desarrollados primeramente para llenar esta necesidad.

    Slo cuando nos introducimos en un mundo ms especfico como es el campo de la investigacin de

    las Ciencias Sociales, Administracin, Contadura, Medicina, Biologa, Psicologa, etctera,

    empezamos a percibir que la Estadstica no slo es algo ms, sino que se convierte en la nica

    herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier

    tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordadas

    desde la perspectiva de las leyes deterministas. Podramos, desde un punto de vista ms amplio, definir

    la estadstica como la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de

    accin en situaciones prcticas que entraan incertidumbre.

    La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar

    regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa

    intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a

    la toma de decisiones y en su caso formular predicciones. La estadstica puede ser definida como un

    mtodo de investigacin de los fenmenos que se producen masivamente. Intenta establecer el enlace,

    formacin o estructura de una serie, as como su desarrollo temporal o la relacin entre varios de estos

    fenmenos; por consiguiente, su objetivo es el anlisis e interpretacin de los datos numricos. La

    estadstica es una ciencia auxiliar moderna que facilita el estudio de datos masivos, para as sacar

    conclusiones valederas y efectuar predicciones razonables de ellos; permitiendo una visin de conjunto

    clara y de ms fcil apreciacin, as como describirlos y compararlos.

    La Estadstica tambin es definida como parte de la matemtica que se ocupa del estudio, anlisis y

    clasificacin de los datos recogidos en una experiencia, cuando los resultados de esta no son explicables

    por una ley natural conocida, es decir, cuando del hecho estudiado no se tiene un conocimiento cierto,

    o cuando el mismo fenmeno es aleatorio. Otras definiciones que se le da a la estadstica que es una

    tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivos entendiendo

    por tales aquellos fenmenos de masa, naturales, econmicos, sociales, etc., cuya medicin requiere

    una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares. En

    una forma prctica, la estadstica proporciona los mtodos cientficos para la recopilacin,

  • Estadstica - Lic. Jessica Oliva G. Pgina | 5

    organizacin, resumen, representacin y anlisis de datos o hechos, que se presten a una evaluacin

    numrica; tales como: fenmenos sociales, econmicos, polticos, culturales, etc.

    Ya que solo a travs del empleo de los mtodos estadsticos es posible el ordenamiento, clasificacin,

    presentacin y estudio preciso de datos, hechos y ocurrencia masivas; que estn sujetas a la explicacin

    de dicha ciencia, la cual permite un mejor entendimiento del estudio que se est realizando.

    Se puede por tanto clasificar la Estadstica en descriptiva, cuando los resultados del anlisis no

    pretenden ir ms all del conjunto de datos, e Inferencial cuando el objetivo del estudio es derivar las

    conclusiones obtenidas a un conjunto de datos ms amplio.

    RAMAS DE LA ESTADSTICA

    ESTADSTICA DESCRIPTIVA: Describe, analiza y representa un grupo de datos utilizando

    mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. Se puede

    definirse como aquel mtodo que contiene la recoleccin, organizacin, presentacin y resumen de

    una serie de datos. El mencionado resumen puede ser tabular, grfico o numrico. El anlisis que se

    realiza se limita en s mismo a los datos recolectados y no se puede realizar inferencia alguna o

    generalizacin alguna, acerca de la poblacin de donde provienen esos datos estadsticos.

    Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta

    se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su

    presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos

    parmetros tiles para la explicacin de la informacin.

    La Estadstica Descriptiva es la parte de la estadstica que conocemos desde los cursos de educacin

    secundaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms

    profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la

    manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo

    anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un

    medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as

    evitar malentendidos, tergiversaciones o errores.

    La Estadstica Descriptiva analiza, estudia y describe a la totalidad de los individuos de una poblacin,

    su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda

    ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se

    desee.

    El proceso que sigue la Estadstica Descriptiva para el estudio de una cierta poblacin consta de los

    siguientes pasos:

    Seleccin de caracteres dignos de ser estudiados.

    Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres

    seleccionados.

    Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos dentro

    de cada carcter.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 6

    Representacin grfica de los resultados (elaboracin de grficos estadsticos).

    Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms relevantes de una

    distribucin estadstica.

    Por ejemplo: si un investigador aplica un test de aptitud a un grupo de graduados de un instituto superior

    recientemente contratados por una empresa; entre lo que puede hacer con las puntuaciones que resultan

    del test valindose de la estadstica descriptiva, estn los aspectos siguientes: arreglar las puntuaciones

    o clasificarlas de manera que con solo dar un vistazo a los datos se pueda obtener una imagen general

    de los mismos, construir tablas, grficas y cuadros estadsticos para visualizar el comportamiento de

    los datos o bien convertir las puntuaciones brutas en rangos o en percentiles para realizar

    comparaciones, etc.

    ESTADSTICA INFERENCIAL: Es aquella rama de la estadstica que apoyndose en el clculo de

    probabilidades y a partir de datos mustrales, efecta estimaciones, decisiones, predicciones u otras

    generalizaciones sobre un conjunto mayor de datos. Puede definirse como aquella rama de la estadstica

    que hace posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente

    a una poblacin, fundamentndose slo en los resultados de la muestra.

    La Estadstica Inferencial, por otro lado, se refiere a la rama de la estadstica que trata de los procesos

    inferenciales, la que a su vez vislumbra la teora de estimacin y prueba de hiptesis. Uno de los

    primordiales aspectos de la inferencia estadstica es el proceso que radica en utilizar estadsticos

    mustrales para adquirir conclusiones sobre los verdaderos parmetros de la poblacin.

    Los requerimientos de los mtodos de la inferencia estadstica se originan de la necesidad del muestreo.

    Al tornarse muy grande una poblacin, comnmente resulta demasiado costoso, prolongado en el tiempo

    y complicado obtener informacin de la poblacin completa. Las decisiones con respecto a las

    caractersticas de la poblacin se deben basar en la informacin contenida en una muestra de esa

    poblacin. La teora de la probabilidad suministra l vnculo, determinando la probabilidad de que los

    resultados provenientes de la muestra reflejen los resultados que se obtendran de la poblacin.

    Se pueden observar con albor estas ideas en el ejemplo de una encuesta poltica. Si el encuestador desea

    estimar el porcentaje de votos que un candidato obtendr en una eleccin especfica, no entrevistara a

    cada uno de los millares (o inclusive millones) de votantes. Ms bien, seleccionara una muestra de los

    votantes. Tomando como base el resultado de la muestra, obtendra conclusiones acerca de la poblacin

    total de votantes. A estas conclusiones se les asociara un planteamiento de probabilidad que especfica

    la esperanza o la confianza que se tiene de que los resultados de la muestra reflejen la verdadera conducta

    de los votantes de toda la poblacin.

    La fidelidad de cualquier estimacin tiene una importancia enorme. Esta precisin depende en gran parte

    de la forma de tomar la muestra y de la atencin que se ponga en que esta muestra suministre una imagen

    fiable de la poblacin, pero casi nunca la muestra representa la poblacin en toda su plenitud, y de ello

    resultar un error muestral.

    La Estadstica Inferencial complementa a la descriptiva y a travs de ella se puede inferir el

    comportamiento de un grupo grande (poblacin) a partir del estudio de una pequea parte de esa

    (muestra). La estadstica inferencial nos permite, entre otras cosas, analizar el comportamiento de los

  • Estadstica - Lic. Jessica Oliva G. Pgina | 7

    mercados a partir de las tendencias de la oferta y de la demanda, y permite tambin visualizar el futuro

    comportamiento de una empresa, permitiendo el anlisis de la eficiencia de las empresas. Tambin se

    entiende por estadstica inferencial aquella que trata de los procesos inferenciales, la que a su vez

    comprende la teora de estimacin y prueba de hiptesis. Esta, tambin provee conclusiones o inferencia,

    en base a los datos simplificados y analizados; detectando las interrelaciones que puedan unirlos, las

    leyes que los rigen y eliminando las influencias al azar; llegando ms all de las verificaciones fsicas

    posibles. Basndose, en la muestra estudiada saca conclusiones, o sea, hace inferencia o induccin, en

    cuanto al universo o poblacin, de donde se obtuvo dicha muestra. Para su estudio son necesarios

    conocimientos ms profundos de la teora de probabilidades y anlisis matemticos, ya que parte de los

    conocimientos resultantes en el proceso descriptivos, para deducir nuevos hechos o relaciones del

    conjunto observado con otros conjuntos. Un ejemplo, en el cual se aplica la estadstica inferencial es en

    la prediccin de los resultados de unas elecciones antes de que haya concluido el recuento de votos.

    FINALIDAD DE LA ESTADSTICA

    La estadstica es una ciencia o mtodo cientfico que en la actualidad es considerada como un poderoso

    auxiliar en las investigaciones cientficas, que le permite a sta aprovechar el material cuantitativo. No

    existen ciencias cuyos fenmenos no puedan ser tratados estadsticamente; por tal razn, la estadstica

    la denominan algunos investigadores (Rivas Gonzlez) como el lenguaje cientfico. La misma es

    indispensable en la formacin de cualquier profesional universitario o tcnico medio, ya que, por medio

    de esta se pueden realizar diagnsticos de cualquiera investigacin que se desee realizar. Esta es

    indispensable para realizar cualquier trabajo de investigacin que requiera una recoleccin de

    informacin. Ella permite resumir los resultados de una investigacin en una forma significativa y

    cmoda. La misma permite deducir conclusiones generales y as afirmar hasta donde se puede ampliar

    una generalizacin de una investigacin determinada. De la misma forma permite predecir qu suceder

    algo tomando en cuenta ciertas condiciones que se han analizado con datos anteriores.

    En las ciencias sociales, administrativas, polticas, medicas, en educacin y en otras ciencias permite

    analizar algunos de los factores casuales en sucesos complejos y que de alguna manera confundiran a

    un investigador determinado. De acuerdo a lo antes planteado los mtodos estadsticos son por lo tanto

    los compaeros constantes de los que realizan investigacin. La estadstica y su aplicacin, ha avanzado

    de tal forma en los ltimos aos, que hoy da se ha hecho imprescindible en todas las investigaciones

    cientficas sea cual fuere el carcter de esta ltima.

    LA ESTADSTICA EN NUESTROS DAS

    Hoy en da, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores

    de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve como herramienta

    para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir

    y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo

    de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. La

    Probabilidad, es una rama de las matemticas que se ocupa de medir o determinar cuantitativamente la

    posibilidad de que ocurra un determinado suceso. La probabilidad est basada en el estudio de la

    combinatoria y es fundamento necesario de la estadstica. Numerosas colecciones de datos se pueden

    aproximar con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de

    stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la

  • Estadstica - Lic. Jessica Oliva G. Pgina | 8

    fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un

    determinado estudio estadstico. En la actualidad la estadstica ha alcanzado tal grado de

    perfeccionamiento y especializacin, que podra decirse, que no existe disciplina cientfica en la cual

    no se apliquen los mtodos estadsticos como herramienta indispensable para iniciar cualquiera

    investigacin de envergadura.

    Todo lo que hasta apartadamente tiene que ver con la recoleccin, procesamiento, anlisis e

    interpretacin de datos numricos pertenece al dominio de la estadstica, comprende, por ejemplo, el

    clculo del aumento, en promedio, de las utilidades de una importante compaa de ventas de artculos

    por Internet los ltimos tres aos; la recoleccin y presentacin anual de la deuda a corto plazo de tres

    compaas de electricidad, as como un porcentaje de su deuda a largo plazo; la evaluacin de la eficacia

    de dos diferentes programas de computacin, destinado reducir el nmero de accidentes personales en

    una empresa, el tiempo perdido en trabajo de alto riesgo; y el anlisis de las variaciones que ocurren de

    cuando en cuando en serie de datos econmicos, ventas al menudeo, precios al consumidor y al

    mayoristas, y distribucin de dinero, precios de productos comunes, productividad del sector agrcola,

    etctera.

    La palabra estadstica, por s sola se utiliza en varias formas. En un contexto, significa un conjunto de

    datos como los que se pueden encontrar en las pginas financieras de los diarios o en los compendios

    estadsticos. Pero, en otro mbito, se refiere a la totalidad de los mtodos que se aplican en la

    recoleccin, organizacin, presentacin, anlisis e interpretacin de cualquier tipo de datos. En este

    ltimo sentido, la estadstica es una rama de las matemticas aplicadas, y es este campo de las

    matemticas el que constituye el tema central de este curso.

    Una de las manifestaciones ms comentado en los ltimos aos del pasado siglo y del presente milenio,

    ha sido el desarrollo de mtodos y conceptos estadsticos. Durante muchos aos, a la estadstica le

    concernan principalmente la recoleccin de datos y su presentacin en tablas y grfica; hoy da ha

    evolucionado hasta el punto en que su impacto se percibe en casi todas las reas de trabajo del ser

    humano. Esto es debido a que la estadstica posmoderna est relacionada directamente con el problema

    de la toma decisiones en condiciones de incertidumbre. Sin necesidad de entrar en detalles, existen

    elementos de incertidumbre en casi todo lo que el ser humano realiza actualmente.

    La caracterstica ms trascendental del reciente avance de la estadstica ha sido el cambio de los

    mtodos meramente descriptivo por otros que sirven para hacer generalizaciones o, dicho lo otra

    manera, un cambio de la estadstica descriptiva a la deductiva o inferencia estadstica. Por estadstica

    descriptiva se entiende a cualquier tratamiento de datos que este diseado para ser resumido o describir

    algunas de sus propiedades ms importantes sin intentar deducir nada que escape al alcance de los

    datos. Por ejemplo, si un gobierno informa, con base a un censo, que la poblacin del pas fue de 27

    millones de habitantes, esto pertenece al campo de estadstica descriptiva. Este sera tambin el caso si

    calculamos el crecimiento % correspondiente de una dcada a la siguiente. Sin embargo; ste no sera

    el caso si empleramos tales datos para percibir la poblacin del pas en tres aos ms o el crecimiento

    porcentual en una dcada.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 9

    La Estadstica Descriptiva es una rama importante de la estadstica y se siguen empleando ampliamente

    en el rea comercial y en otras reas de la actividad administrativa. Sin embargo, en la mayor parte de

    los casos, la informacin estadstica surge de muestras, de observaciones realizadas slo en algunos

    elementos de un conjunto grande, o de la observacin de acontecimientos pasados. El tiempo, el costo

    o la imposibilidad de hacer lo contrario suele requerir un procedimiento de este tipo, aunque nuestro

    inters real yace en todo el conjunto de elementos de los cuales provino la muestra y los

    acontecimientos futuros, no en el pasado. Las generalizaciones de cualquier tipo escapan al contenido

    de la estadstica descriptiva; se nos induce al uso de la diferencia estadstica para resolver muchos

    problemas de operaciones cotidianas y para la elaboracin de planes a corto y largo plazo. Por Ejemplo

    los mtodos de la inferencia estadstica son necesarios para decidir si un lote grande de acumuladores

    de nueve voltios para equipos de sonido cumplen en promedio con la vida til garantizada por el

    fabricante; para determinar la dosis mnima eficaz y la mxima seguridad de un nuevo medicamento

    anti-inflamatorio en el tratamiento de inflamaciones locales dolorosa, o bien para estimar la demanda

    de nuevas cauchos para vehculos rsticos en la poca de lluvia.

    No obstante, siempre que se haga una inferencia estadstica (una generalizacin que escape a los lmites

    de nuestras observaciones) se debe proceder con mucha precaucin. De hecho, hay que considerar

    concienzudamente si resulta posible hacer algunas generalizaciones vlidas del todo y, si lo es, hasta

    donde se puede generalizar. Sin embargo, algunas veces aunque se actu cautelosamente al generalizar,

    se puede errar por completo en las generalizaciones y encontrarse con algunas dificultades. En realidad,

    uno de los problemas bsicos de la inferencia estadstica es el de la apreciacin de los riesgos que

    representa hacer generalizaciones equivocadas y quizs hacer algo incorrecto, tomando como base los

    datos analizados de una muestra. El hecho de que aqu se solicite que se preste atencin a los errores

    estadsticos puede parecer una manera negativa de dar comienzo a un estudio pero, en realidad, la

    constante advertencia de que existe la posibilidad de hacer conclusiones y acciones equivocadas, y el

    deseo de controlarla, permiten dirigir correctamente el curso de la investigacin en estadstica. La

    realidad es dura e inflexible y se debe enfrentar en sus propios trminos. Se vive hoy, en un mundo

    lleno de incgnitas y no existe manera de eliminar por completo los riesgos de tomar decisiones

    equivocadas. Siendo ste el caso, el verdadero problema no consiste ahora en cmo eliminarlos, sino

    como vivir con ellos de manera inteligente. Cuanto ms pronto se comprenda esto, ms seguros se

    estar y tanto mejo se entender por qu la estadstica es una disciplina que vale la pena estudiarla.

    Una de las razones principales para estudiar estadstica es que se consagra en forma directa al problema

    universal de cmo tomar decisiones inteligentes en condiciones de incertidumbre o bien, en forma ms

    breve, al problema de la toma de decisiones con incertidumbre lo cual es muy comn para aquel

    profesional de la contadura o administracin comercial.

    EL PAPEL DE LA ESTADSTICA EN LA CIENCIA

    La importancia de la estadstica en la ingeniera, la ciencia y la administracin ha sido subrayada por

    la participacin de la industria en el aumento de la calidad. Muchas compaas se han dado cuenta de

    que la baja calidad de un producto (ya sea en la forma de defectos de fabricacin, en una baja

    confiabilidad en su rendimiento, o en ambos), tiene un efecto muy pronunciado en la productividad

    global de la compaa, en el mercado y la posicin competitiva y, finalmente, en la rentabilidad de la

    empresa. Mejorar estos aspectos de la calidad puede eliminar el desperdicio; disminuir la cantidad de

    material de desecho, la necesidad de volver a maquilar piezas, los requerimientos para inspeccin y

  • Estadstica - Lic. Jessica Oliva G. Pgina | 10

    prueba y las prdidas de garanta; adems de mejorar la satisfaccin del consumidor y permitir que la

    empresa se convierta en un productor de alta calidad y bajo costo en el mercado. La estadstica es un

    elemento decisivo en el incremento de la calidad, ya que las tcnicas estadsticas pueden emplearse

    para describir y comprender la variabilidad.

    Virtualmente todos los procesos y sistemas de la vida real exhiben variabilidad. Por ejemplo, considere

    la situacin donde, de un proceso de maquinado, se seleccionan varios componentes del motor de una

    aeronave y se mide la altura de la turbina del propulsor de cada parte. Si el instrumento de medicin

    tiene una resolucin suficiente, la altura de cada turbina ser diferente; esto es, habr variabilidad en la

    dimensin. Otro ejemplo: si se cuenta el nmero de defectos en los gabinetes para computadoras

    personales, se encontrar cierta variabilidad en los conteos, ya que algunos gabinetes tendrn pocos

    defectos, mientras que otros tendrn muchos. Esta nocin de variabilidad se extiende a todos los

    ambientes. Existe variabilidad en el espesor del recubrimiento de xido en las pastillas de silicio, en el

    rendimiento por hora de un proceso qumico, en el nmero de errores en los dibujos de ingeniera y en

    el tiempo necesario para ensamblar el motor de un automvil.

    Por qu se presenta variabilidad? En general, la variabilidad es el resultado de cambios en las

    condiciones bajo las que se hacen las observaciones. En el contexto de la manufactura, estos cambios

    pueden ser diferencias en las propiedades de los materiales utilizados, en la forma en que trabajan los

    obreros, en las variables del proceso (tales como la temperatura, la presin o el tiempo de ocupacin)

    y en factores ambientales (como la humedad relativa). La variabilidad tambin se presenta debido al

    sistema de medicin utilizado. Por ejemplo, la medicin obtenida a partir de una escala puede depender

    del lugar del panel en que se coloque el objeto que se ha de medir.

    El campo de la estadstica y la probabilidad consiste de mtodos tanto para describir y modelar la

    variabilidad, como para tomar decisiones en presencia de sta. En la Estadstica Inferencial lo que se

    desea hacer es tomar una decisin acerca de una poblacin en particular. El trmino poblacin se refiere

    a la recoleccin de mediciones de todos los elementos del universo con respecto al cual se quieren

    obtener conclusiones o tomar decisiones. En la mayora de las aplicaciones de la estadstica, los datos

    disponibles consisten de una muestra de la poblacin de inters. Esta muestra es slo un subconjunto

    de observaciones seleccionadas de una poblacin.

    El campo de la Estadstica Inferencial se ha desarrollado principalmente desde comienzos de este siglo.

    Es resultado de los mtodos para organizar y resumir datos, cuyos orgenes se remontan a varios siglos

    atrs. Estos mtodos para resumir y organizar datos se denominan Estadstica Descriptiva. La mayor

    parte del uso moderno de la estadstica, particularmente en la ciencia y la ingeniera, se dirige ms hacia

    la inferencia que a la descriptiva. Por ejemplo, un ingeniero que disea un nuevo circuito de

    computadora fabricar una muestra (prototipo) de ellos, y entonces querr conclusiones sobre la forma

    en que estos dispositivos funcionarn una vez que se produzcan a gran escala.

    Las computadoras y la estadstica

    La computadora se ha convertido en una herramienta importante en la presentacin y el anlisis de

    datos. Si bien muchas tcnicas estadsticas slo necesitan una calcula de mano, cuyo empleo consume

  • Estadstica - Lic. Jessica Oliva G. Pgina | 11

    mucho tiempo y esfuerzo, la computadora realiza las tareas con mucha mayor eficiencia. La mayor

    parte del anlisis estadstico se realiza utilizando una biblioteca de programas estadsticos. El usuario

    introduce los datos y luego selecciona los tipos de anlisis y la presentacin de los resultados que le

    interesan. 1

    CONCEPTO BSICOS

    POBLACIN: En estadstica el concepto de poblacin va ms all de lo que comnmente se

    conoce como tal. En trminos estadsticos, poblacin es un conjunto finito o infinito de personas,

    animales o cosas que presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio

    determinado. En otras palabras, la poblacin se define como la totalidad de los valores posibles

    (mediciones o conteos) de una caracterstica particular de un grupo especificado de personas, animales

    o cosas que se desean estudiar en un momento determinado. As, se puede hablar de la poblacin de

    habitantes de un pas, de la poblacin de estudiantes universitarios del Departamento de Lambayeque,

    de la poblacin de casas de la Urbanizacin Las Brisas de la ciudad de Chiclayo, el nmero de carros

    marca Toyota de la ciudad de Lambayeque, la estatura de un grupo alumnos de la USAT, la talla, etc.

    La poblacin es el conjunto formado por todos los valores posibles que puede asumir la variable objeto

    de estudio, ya que constituye la totalidad del grupo que se quiere estudiar los que van a poseer una

    caracterstica de ese grupo especfico de individuos, animales o cosas. Es la coleccin de todos los

    elementos que se estn estudiando, acerca de los cuales se intenta sacar conclusiones, el cual puede

    ser un conjunto finito o infinito de personas, animales o cosas que presentan caractersticas comunes.

    As por ejemplo, en un estudio sobre la preferencia de los electores que participaran en una eleccin

    presidencial, la poblacin consiste en todos los participantes registrados para votar en ese proceso.

    Pero el trmino no slo est asociado a la coleccin de seres humanos y organismos, tambin pueden

    ser cosas no vivientes tales como: el estudio de mercado que se realiza para determinar las ventas

    anuales de los supermercados de una zona determinada de una ciudad, luego, las ventas anuales de

    todos los supermercados constituyen as mismo la poblacin.

    MUESTRA: La muestra es un subconjunto de la poblacin, seleccionado de tal forma, que sea

    representativo de la poblacin en estudio, obtenindose con el fin de investigar alguna o algunas de

    las propiedades de la poblacin de la cual procede. En otras palabras es una parte de la poblacin que

    sirve para representarla. Es una parte o porcin extrada de un conjunto por mtodos que permiten

    considerarla como representativa del mismo. Entonces, una muestra no es ms que una parte de la

    poblacin que sirve para representarla. La muestra debe obtenerse de la poblacin que se desea

    estudiar; una muestra debe ser definida sobre la base de la poblacin determinada, y las conclusiones

    que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia.

    La muestra debe ser representativa ya que debe contener las caractersticas relevantes de la poblacin

    en las mismas proporciones en que estn incluidas en tal poblacin, es decir, contiene las caractersticas

    ms importantes de esa coleccin de elementos que representan la poblacin bajo estudio, a fin de

    investigar alguna o algunas de las propiedades de la poblacin de la cual procede; y las conclusiones

    que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia.

    1 Douglas C. Montgomery, George C. Runger: Probabilidad y Estadstica aplicadas a la Ingeniera

  • Estadstica - Lic. Jessica Oliva G. Pgina | 12

    La muestra es el elemento bsico sobre el cual se fundamenta la posterior inferencia acerca de la

    poblacin de donde se ha tomado. Por ello, su escogencia y seleccin debe hacerse siguiendo ciertos

    procedimientos o parmetros que son indispensables, es decir, se selecciona de acuerdo con una regla

    o plan definido. En estadstica, en vez de estudiar las poblaciones en su totalidad, se acude al recurso

    de considerar solamente una parte de ella, a la cual se le denomina muestra. Por lo tanto, una muestra

    es una parte de la poblacin, seleccionada de acuerdo con una regla o plan definido.

    MUESTREO: Es el procedimiento mediante el cual se obtiene una o ms muestras de una

    poblacin determinada. Existen dos tipos de muestreos a saber:

    Muestreo no Probabilstico: Es aquel en el cual se toma la muestra segn el criterio del investigador,

    estos pueden ser: muestreo intencional u opintico y el muestreo sin norma o circunstancial.

    Muestreo Probabilstico: Es aquel que se selecciona utilizando mtodos aleatorios en los que se

    utilizan las probabilidades matemticas. Entre estos se pueden mencionar: Muestreo aleatorio simple,

    muestreo estratificado, muestreo por conglomerado o por rea y muestreo sistemtico.

    UNIDAD DE ANLISIS: es el objeto o elemento indivisible que ser estudiado en una poblacin,

    sobre los cuales se van a obtener datos. Es el que genera el fenmeno estudiado y proporciona datos

    concretos.

    DATO: es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Es el resultado

    de la observacin, entrevista o recopilacin en general. Son la materia prima de la estadstica. Es el

    elemento primario de toda observacin o bsqueda.

    VARIABLES: Las variables son magnitud que puede tener un valor cualquiera de los

    comprendidos en un conjunto de valores de un estudio o investigacin determinada. Son todos aquellos

    datos u observaciones que pueden ser expresados mediante nmeros, es decir, son caractersticas de

    una poblacin determinada, susceptible de medicin. Son caractersticas que pueden ser observadas

    en determinado fenmeno natural, social, econmico, poltico etc. Las mismas son susceptibles de

    adoptar distintos valores o ser expresadas en varias categoras. Existen muchas definiciones de

    variables, entre las cuales tenemos:

    Son aquellos datos u observaciones que pueden ser expresados cuantitativamente, es decir, son

    caractersticas de una poblacin especfica, en las cuales se realiza una investigacin en un momento

    dado. Las variables por lo general se representan con letras maysculas y sus valores particulares con

    minsculas, es decir, si se hace referencia a los salarios devengados por un grupo de trabajadores la

    variable salario estara representado por una letra mayscula, en este caso Xi y varios salarios de

    diferentes trabajadores en particular, estaran representados con la letra minscula correspondiente,

    as: x1 = 180.000, x2 = 190.000, x3 = 480.00, etctera.

    Es aquella caracterstica de una poblacin que puede tomar diferentes valores en un estudio

    determinado. Son smbolos tal como X, Y, Z, A, B, etc., que puede tomar un valor cualquiera de una

    caracterstica especificada de un estudio determinado. Por ejemplo, la estatura de las personas, la talla

    de un grupo de trabajadores petroleros, la edad de un conjunto de estudiantes universitarios, el ndice

    acadmico de los estudiantes de la USAT, son variables. En otras palabras, una variable es una funcin

    que asocia a cada elemento de la poblacin la medicin de una caracterstica, particularmente de aquella

    que se desea observar.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 13

    TIPO DE VARIABLES

    Cualitativa o de Atributos: Cuando expresan una cualidad, caracterstica o atributo, tienen un

    carcter cualitativo, sus datos se expresan mediante una palabra, es no numrico, por lo tanto

    las operaciones aritmticas, como sumar y obtener promedios, no son significativas. Cuando la

    informacin es cualitativa, generalmente interesa saber cuntas o qu proporcin entra en cada

    categora.

    Ejemplos: sexo, nacionalidad, marcas de auto, grado de satisfaccin con la universidad, causas

    de accidentes, lugar de nacimiento, estado civil, etc.

    Cuantitativa o Numrica: Cuando el valor de la variable se expresa por una cantidad, es de

    carcter numrico. El dato o valor puede resultar de la operacin de contar o medir, por lo tanto

    las operaciones aritmticas, como sumar y obtener promedios, son significativas.

    Ejemplos: Nmero de hijos, kilmetros recorridos, tiempo de vuelo, la velocidad de las

    embarcaciones, etc.

    Las variables cuantitativas se pueden clasificar a su vez en discretas o continuas.

    - Cuantitativas Discretas: cuando el valor de la variable resulta de la operacin de contar,

    su valor est dado slo por nmeros (enteros positivos).

    Ejemplos: cantidad de materias aprobadas, nmero hijos, nmero de computadoras, etc.

    - Cuantitativas Continuas: cuando la variable es susceptible de medirse, es toda variable

    cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida.

    Puede asumir cualquier valor dentro del rango de medicin, por tanto se expresa en

    cualquier nmero real. Normalmente se miden magnitudes como ser longitud, superficie,

    volumen, peso, tiempo, dinero.

    Ejemplos: peso al nacer, tiempo de servicios, horas trabajadas, ingreso mensual,

    temperatura, etc.

    MEDICIN: La asignacin o magnitud que se aplica a las categoras o clases de acuerdo a ciertas

    reglas o smbolos. Consiste en la recopilacin de datos y su utilizacin mediante el empleo de una serie

    de normas de tipo estadstico; es la representacin simblica de un dato o serie de datos obtenidos por

    algn tipo de observacin.

    ESCALAS DE MEDICIN DE LAS VARIABLES

    Una escala de medicin es una asignacin de valores numricos a las caractersticas de una muestra

    o una poblacin, se mide bsicamente en proporcin de escala. Las escalas de medicin son el

    conjunto de los posibles valores que determinada variable puede tomar. Por tal razn, los tipos de

    escala de medicin estn ntimamente ligados con los tipos de variables a estudiar. Las magnitudes

    de las observaciones cuantitativas se conocen como los valores que una variable puede asumir.

    Consiste entonces, en una serie de graduaciones que permiten darle un valor numrico a las

    caractersticas que estamos midiendo; para hacer ms comprensible y que adquiera un significado

    mediante un arreglo ordenado para establecer un anlisis estadstico. Son denominaciones o

    clasificaciones de individuos o caractersticas. Las escalas de medicin es el alma fundamental de

    toda investigacin Cientfica, puesto que, slo a travs de ellas es como se pueden calibrar los

    fenmenos, sus relaciones, entre otros.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 14

    Se refieren habitualmente a las asignaciones de nmeros a observaciones, de una forma tal que los

    nmeros sean susceptibles de anlisis por medio de manipulaciones u operaciones; estas escalas

    permiten asignarle un valor numrico a las caractersticas que se estn midiendo. Por lo general

    proceden de las medidas de una o ms variables. Dependiendo de la medicin y de la esencia de

    las variables, se obtienen diversas clases de datos que originan diferentes escalas. Resulta

    intensamente conocer el tipo de escala que representan los datos, debido a que, de su esencia

    dependen las tcnicas estadsticas que se debern aplicar para su anlisis. Para lograr estadsticas

    confiables hay que manipular cuantiosos datos estadsticos, los cuales poseen determinadas

    caractersticas.

    Por ejemplo, si los datos son alumnos, entre algunas de ellos se puede sealar el peso, la estatura,

    el sexo, el rendimiento acadmico, entre otros. Al elaborar estadsticas con datos y su caracterstica

    es necesario contarlas, jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medicin

    como el proceso de asignar nmeros o establecer una correspondencia uno a uno entre objetivos y

    observaciones.

    Las escalas de medicin se clasifican de la siguiente forma: Escala Nominal, Escala Ordinal,

    Escala de Intervalos y Escalas de razn o Proporcin.

    Escala de Medicin Nominal: Es aquella en la que los nmeros slo se emplean para

    diferenciar los objetos de distintas categoras o cuando se emplean nombres. Se dice que los

    datos que se obtienen para una variable cualitativa se miden en una escala nominal. Si los datos

    observados simplemente se clasifican en distintas categoras que no implican orden, se tiene un

    nivel de medicin nominal. Ejemplos de nmeros, esta caracterstica son las que usan los

    jugadores de bisbol, los nmeros telefnicos, los nmeros de las Cedulas de Identidad,

    etctera. Se usa una escala nominal cuando se distribuyen conjuntos de objetos, personas o

    caractersticas entre dos o ms categoras. La Escala Nominal se utiliza como medida de

    identidad. Los nmeros pueden servir como indicativos o etiquetas para identificar objetos o

    clases, pues se usa cuando un objeto se diferencia de otro solamente por la nominacin con que

    se conoce. La escala nominal es la forma ms dbil de medicin porque no se puede intentar

    el conteo de las diferencias dentro de una categora determinada o especificar cualquier orden

    o direccin a lo largo de las diversas categoras. Sin embargo, no se intenta medir diferencias

    entre los valores clasificados dentro de una categora determinada.

    Propiedades de la escala Nominal

    1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos.

    2. Esta escala es considerada excluyente, es decir que la persona u objeto se incluye solamente

    en una categora.

    3. No existe un orden especfico para esta categora.

    4. No presentan el cero.

    5. No se basa en diferencia cuantitativa.

    6. Los elementos de una categora deben de ser equivalentes, idnticos.

    Ejemplos:

    Una muestra de personas puede clasificarse con base en la religin profesada:

  • Estadstica - Lic. Jessica Oliva G. Pgina | 15

    (1) Cristianos;

    (2) Judos;

    (3) Musulmanes;

    (4) Otros; y

    (5) Sin Creencia alguna.

    O bien podran clasificarse segn el sexo, el color de los ojos, algn partido poltico, etctera.

    Otros ejemplos de escala nominal puede ser el nmero de placa de los vehculos, los nmeros

    de los telfonos de una ciudad, la Cedula de Identidad de los habitantes de un pas, etctera.

    El tipo de operacin estadstica ms utilizada en la escala nominal es el conteo de las

    frecuencias con que se presentan las caractersticas en las unidades de las respectivas

    subclases. Estas frecuencias pueden ser presentadas con nmeros absolutos, porcentajes y

    proporciones. Adems, puede calcularse razones, tasas de incremento, y el coeficiente de

    contingencia.

    Escala de Medicin Ordinal: Es aquella en la que los nmeros se utilizan para diferenciar en

    orden de supremaca de acuerdo con cierto criterio jerrquico, como son los nmeros que se

    emplean para clasificar los distintos estratos socio-econmicos o para designar preferencias.

    Si los datos observados se clasifican en categoras distintas en las que existe algn orden, se

    obtiene un nivel de medicin ordinal Cuando los objetos son medidos en escala ordinal los que

    tengan la misma asignacin se consideran iguales; pero los que tengan asignaciones diferentes

    pertenecen a categoras distintas. La diferencia entre dos nmeros ordinales no tiene significado

    cuantitativo, slo expresan, por ejemplo, que una situacin es mejor que otra, pero no cunto.

    La escala ordinal es una forma un tanto ms fuerte de medicin que la nominal, porque se dice

    que un valor observado que se clasifica en una categora posee ms la propiedad que se mide

    que algn valor observado que se clasifica en otra categora.

    Tambin, la escala ordinal siegue siendo una forma de medicin dbil porque no se pueden

    hacer planteamientos numricos significativos con respecto a las diferencias entre las

    categoras. Es decir, la ordenacin establece slo cul categora es mayor, mejor o

    preferida; y no se habla cunto es mayor, mejor o ms preferida. Esta escala se emplea,

    cuando un estudio est basado en ciertas normas que se asignan a un conjunto de objetos,

    personas o caractersticas o a un conjunto de categoras ordenadas. Las categoras de la escala

    se ordenan d acuerdo con la cantidad de rasgos o caractersticas que representan cada una de

    ellas ya que la escala ordinal distingue los diferentes valores de la variable, ubicando las

    caractersticas en orden, desde la ms alta hasta la ms baja.

    Propiedades de la escala Ordinal

    1. Las observaciones o elementos se les ordena en rangos o categoras diferentes.

    2. Cada categora o rango mantiene una relacin entre s, estas relaciones se expresan en

    trminos algebraicos de desigualdades (mayor que o menor que).

    3. No es posible definir unidades de mediciones iguales en todos los puntos de la escala.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 16

    4. Las categoras son mayores o menores que otras categoras, es decir, que existe una

    clasificacin de mayor a menor (jerarqua).

    5. Las categoras son mutuamente excluyentes y exhaustivas.

    6. No presentan el cero.

    Se pueden clasificar los habitantes de una ciudad de acuerdo a su situacin econmica, a los

    estudiantes tomando en cuenta a su rendimiento acadmico, etctera. Aunque la escala ordinal

    resulta en cierta forma ms precisa que la nominal, no alcanza el grado de precisin deseado

    en una investigacin.

    Otro ejemplo, el orden jerrquico de los militares (Subteniente, Teniente, Capitn, Mayor,

    Teniente Coronel, Coronel, General) y la clasificacin acadmica de los profesores

    universitarios (instructor, asistente, agregado, asociado, titular) son ejemplos de escala ordinal.

    En la escala ordinal las unidades de las subclases guardan una cierta relacin entre s, esto se

    pone de manifiesto cuando existe la posibilidad de establecer la relacin menor que o mayor

    que, respecto a las caractersticas de las unidades escaladas. Por ejemplo, el grado militar de

    A es el de Subteniente y el de B es el de Teniente, luego el grado de B es mayor que el de A

    (BA)

    Escala de Medicin de Intervalos: Es una escala ms especializada que las dos anteriores,

    puesto que es posible ordenar las mediciones y expresar adems en cunto difiere una situacin

    de la otra. Por Ejemplo, en las mediciones de temperatura ambiental no slo se puede afirmar

    hoy hace ms calor que ayer, si no que de la misma forma se puede expresar hoy la

    temperatura es cuatro grados centgrados ms alta que la de ayer a la misma hora. Esta

    escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La distancia

    entre dos mediciones tiene un significado preciso. La escala de intervalos a diferencia de la

    nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es

    una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa.

    La escala de intervalos posee adems, de las caractersticas de la escala nominal y ordinal, la

    propiedad de que la distancia entre dos valores es de una magnitud conocida, lo que le permite

    a esta escala un mayor grado de perfeccin, ya que proporciona nmeros que manifiestan

    diferencias palpables entre individuos, objetos o cosas. Por tal razn, la escala de intervalo

    revela que un individuo u objeto es tantas unidades ms grande o ms pequeo, ms pesado o

    ms ligero, ms rpido o ms lento que otro, es decir, muestra la cantidad en la que un objeto

    se diferencia de otro cuantitativamente. En esta escala el punto cero y la unidad de medicin

    son arbitrarios. La razn entre dos intervalos es siempre independiente del punto cero y de la

    unidad que se emplee en la medicin. En el caso de las escalas de intervalos las unidades de

    medicin son iguales.

    Propiedades de la escala de Intervalo:

    1. Esta escala implica la cuantificacin de los datos

    2. En estas medidas se utilizan unidades constantes de medicin (capacidad, peso, cntimos,

    grados Fahrenheit o centgrados) los cuales producen intervalos iguales entre puntos de la

    escala.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 17

    3. Proporcionan nmeros que manifiestan diferencias palpables entre individuos, objetos o

    cosas.

    4. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario.

    5. Se pueden aplicar todas las medidas estadsticas ms conocidas, con excepcin del

    coeficiente de variacin.

    6. Son mutuamente exclusivas y exhaustivas.

    Un ejemplo de esta escala lo constituyen las escalas utilizadas para medir temperatura, bien sea

    en grados Centgrados o Fahrenheit. En estas escalas la diferencia entre 80 y 85 es igual a la

    que existe entre 90 y 95 o entre dos puntos cualesquiera de la escala. La escala de intervalo

    tiene carcter cuantitativo y esto le permite el clculo de las medidas estadsticas ms comunes

    (medias, desviaciones tpicas o estndar, coeficientes de correlacin de Pearson, entre otros),

    esto confirma l porque muchos valores estadsticos se utilizan con las escalas de intervalos.

    Escala de Medicin de Razn o Proporcin: Esta constituye el nivel ms alto de medicin,

    posee todas las caractersticas de las escalas nominales, ordinales y de intervalos; adems tiene

    un cero absoluto o natural que tiene significado fsico. Si en ella la medicin es cero, significa

    ausencia o inexistencia total de la propiedad considerada. Son posibles todas las operaciones

    aritmticas. Los nmeros indican los valores concretos de la propiedad que s est midiendo;

    peso, estatura, ingresos monetarios y gastos directos, son ejemplos de medidas con una escala

    de razn.

    La distancia entre dos valores de la escala es conocida en el sentido cuantitativo y su razn es

    independiente de las unidades empleadas. Por ejemplo, en las unidades de longitud, peso y

    capacidad el valor cero indica ausencia de medida, mientras que en la escala de intervalo si se

    tiene cero grado centgrado no se puede afirmar que hay ausencia de temperatura. La escala de

    razn permite establecer ciertas comparaciones entre los valores que no son permitidos en la

    escala de intervalo. Por lo tanto, la proporcin de un punto cualquiera de la escala a otro es

    independiente de la unidad de medida. Si una persona mide 2.00 m puede afirmarse que duplica

    en estatura a otro que mide 1.00 m Las escalas de razn ms comunes corresponden a medidas

    de longitud, peso, capacidad, sonido, entre otros. Al medir la temperatura absoluta la escala de

    Kelvin, que es de este tipo, tiene su punto cero a 273, este valor es el ms bajo posible. Cuando

    se emplea este tipo de escala, los nmeros indican razones o cocientes entre ciertas magnitudes

    de los objetos, y los datos obtenidos con tales escalas pueden ser sometidos a los tratamientos

    ms elaborados.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 18

    Propiedades de la escala a razn:

    1. La distancia entre los nmeros es un tamao conocido y constante.

    2. Los datos tienen un punto cero significativo.

    3. Puede utilizarse cualquier prueba de tipo estadstico, incluyendo el coeficiente de

    variacin.

    4. Permite hacer comparaciones entre los nmeros verdaderos con un cero aritmtico siendo

    arbitrario nicamente la unidad de medida.

    Ejemplo de escala a razn:

    Nmero de televisores vendidos en el ltimo trimestre del ao 2007

    Meses N de televisores

    Octubre 4.000

    Noviembre 6.000

    Diciembre 15.000

    Generalmente, se supone que los datos que se obtienen para una variable cuantitativa se miden

    en escalas de intervalo o de razn. Estas escalas constituyen los niveles ms elevados de

    medicin. Son formas ms fuertes de medicin que la escala nominal y ordinal, porque

    permiten comprender no slo cul de los valores de un estudio es mayor o menor, sino por

    cuntas unidades de medida. Las escalas de razn son medidas de Longitud, peso, capacidad,

    etc., los nmeros reflejan razones entre particularidades y los datos obtenidos segn tales

    escalas pueden ser sometidos a cualquier tratamiento estadstico

    LOS PARMETROS.- Son cualquiera caracterstica que se pueda medir y cuya medicin se lleve

    a cabo sobre todos los elementos que integran una poblacin determinada, los mismos suelen

    representarse con letras griegas. El valor de un parmetro poblacional es un valor fijo en un momento

    dado.

    Ejemplo: La media Aritmtica = (mu), La desviacin Tpica = , (Sigma) etctera.

    LOS ESTADGRAFOS (Estadsticos o Estimadores).- Son aquellas caractersticas medibles,

    cuya medicin se realiza sobre los componentes de una muestra, los mismos se representan con letras

    del alfabeto castellano. Los estadgrafos no tienen un valor nico, sino que pueden tomar distintos

    valores al ser calculados a partir de muestras diferentes.

    Ejemplos: la media aritmtica = X , La desviacin Tpica = S.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 19

    Elaboracin de matriz de datos en Excel.

    BARRAS DE HERRAMIENTAS DE EXCEL.

    A continuacin se relacionan para cada una de las ventanas principales de Excel los iconos que aparecen

    en la barra de herramientas.

    REA DE TRABAJO

    Veamos algunos de los conceptos bsicos de Excel:

    Un libro de Excel equivale a un documento de Word o archivo.

    Una hoja es una porcin del libro, formada por filas y columnas.

    Se sabe en qu hoja estamos trabajando si miramos su etiqueta.

    Una columna es una seleccin vertical de celdas, en cada hoja hay 16000 columnas nombradas con

    las letras de la A a la XFD.

    Una fila es una seleccin horizontal de celdas, desde la fila 1 a 1 milln por hoja.

    Una celda es la interseccin entre una fila y una columna.

    La celda activa es aquella que se representa con un contorno y es donde se encuentra el cursor.

    Excel es una hoja de clculo que facilita los clculos y la obtencin de indicadores y estadsticos

    para estudiar el comportamiento de una o varias variables.

    Se podra entender como una matriz de filas y columnas.

    Cada combinacin de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

    Un conjunto de celdas se denomina rango, y en Excel se expresa como A1:B4.

    En cada celda se puede recoger: - rtulo, nmero, frmula

  • Estadstica - Lic. Jessica Oliva G. Pgina | 20

    Como su nombre indica, la hoja de clculo nos permite calcular, hacer operaciones matemticas,

    lgicas, estadsticas, financieras, etc.

    Con la hoja de clculo EXCEL (u otras similares) se pueden obtener fcilmente estadsticos y

    medidas que resuman y caractericen una variable, una distribucin de frecuencias, o una

    distribucin bidimensional (n-dimensional) de frecuencias, es decir varias variables conjuntamente.

    La primera pantalla que aparece en Excel es la siguiente:

    Un primer recorrido por la hoja de clculo nos permite conocer las:

    - opciones de men

    - barra de herramientas

    - barra de estado.....

    Podemos utilizar la hoja de clculo:

    a. Para obtener representaciones grficas segn el tipo de variable.

    b. Para ir haciendo los clculos necesarios para obtener los distintos estadsticos (media,

    mediana, moda, cuantiles, varianzas, g1, etc.). A partir de unos datos (o de una

    distribucin de frecuencias) hacemos los clculos necesarios para desarrollar una

    frmula y paso a paso calcular hasta obtener el resultado final. (Sumas, productos,

    divisiones, potencias, races, etc.)

  • Estadstica - Lic. Jessica Oliva G. Pgina | 21

    c. Para analizar un conjunto de informacin. Se usar en el men de Herramientas la

    opcin Analizar Datos. Permite describir un conjunto de informacin correspondiente

    a una o varias variables.

    d. Permite aplicar tcnicas estadsticas ms sofisticadas (regresin, contrastes de

    hiptesis, estimacin por intervalos, etc.).

    INTRODUCCIN DE DATOS

    En Excel se distingue tres tipos de datos:

    Ttulos (texto y caracteres).

    Valores (Constantes numricas).

    Frmula o funciones.

    Una vez introducido un dato en una celda debemos pulsar INTRO o TAB para hacerlo efectivo.

    DISEO DE LA BASE DE DATOS

    Una base de datos, tabla o lista como se conoce habitualmente en Excel, no es ni ms ni menos que una

    hoja de clculo, pero con la diferencia de que lleva siempre una fila superior con una lista de ttulos o

    cabeceras.

    Los datos que contendr sern estructurados y organizados, los datos completos de una fila se

    denominarn Registro y cada dato contenido en una columna ser un campo. La primera fila siempre

    debe contener los Ttulos de los campos.

    Para crear correctamente una BASE DE DATOS debemos tener en cuenta:

    No debemos dejar filas ni columnas en blanco.

    Crear rtulos de columna en la primera fila de la lista. Excel utiliza los rtulos para generar

    informes, as como para buscar y organizar los datos.

    En los rtulos de columna utiliza una fuente, un formato o un estilo de letras maysculas que sea

    diferente del formato que se asigne a los datos de la lista.

    No insertes espacios adicionales al comienzo de una celda ya que afectarn a las clasificaciones y

    bsquedas.

    Se utilizar como ejemplo el siguiente cuestionario para la construccin de una base de datos en Excel.

    Ejemplo de cuestionario

    1. Sexo: 1. Hombre 2. Mujer

    2. Marca de gaseosa que prefiere

    3. Percepcin acerca del sabor de la gaseosa

    4. Marca de gaseosa que no comprara

    En la hoja de clculo de Excel, se procede a disear la base de datos para el cuestionario elaborado.

    La primera celda A1, debe ser el nmero de registro y a continuacin en las siguientes celdas (B1, C1,

    D1.) los nombres o abreviaturas que corresponde a la pregunta del cuestionario.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 22

    Luego que se tienen los ttulos en la primera fila, se procede al llenado de los registros (cuestionarios),

    debe tener en cuenta que cada fila es un registro.

    Una vez llenado el primer registro (Cuestionario N 1), se contina con los dems registros hasta

    completar la base datos. Para este ejemplo se completar 30 registros. Si los primeros caracteres que

    escribes en una celda coinciden con una entrada ya existente en la misma columna, Excel rellenar

    automticamente los dems. A esta operacin se la conoce como Autocompletar.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 23

    ORGANIZACIN Y PRESENTACIN DE DATOS

    Cuando se realiza la recopilacin de antecedentes con fines estadsticos, se obtiene una gran cantidad de

    datos, algunas veces estos estn en su forma natural o emprica (fuentes primarias) y otras ya estn

    organizadas en tablas, cuadros y grficos (fuentes secundarias). Los datos pueden estar incompletos,

    incorrectos, desordenados, pero en todos los casos constituyen los datos bsicos para iniciar un estudio,

    conocer y analizar el comportamiento y las caractersticas de los elementos de una poblacin.

    En el trabajo estadstico, siempre se dispone de muchos datos que, definitivamente tienen que ser

    clasificados, ordenados y presentados adecuadamente, de tal manera que facilite la comprensin,

    descripcin y anlisis del fenmeno estudiado, y obtener conclusiones vlidas para la toma de decisiones.

    En general, la organizacin y presentacin de los datos estadsticos, supone realizar los siguientes pasos:

    a) Evaluacin y crtica: consiste en inspeccionar la validez y confiabilidad de los datos, para corregir

    los errores y omisiones de acuerdo a ciertas reglas fijas. A partir de datos incorrectos no se pueden

    obtener buenos resultados.

    b) Codificacin: es una tcnica mediante la cual los datos o respuestas (numrica o verbal) se convierte

    en un nmero, smbolo o lenguaje que permita su procesamiento o tabulacin.

    c) Clasificacin: consiste en establecer las categoras de las variables.

    d) Procesamiento o tabulacin de datos: es el registro de nmero de casos (frecuencia o repeticin) en

    cada una de las categoras de la variable de acuerdo al plan de tabulacin previamente establecido.

    e) Presentacin de los datos: los resultados de la tabulacin se presentan en tablas y grficos. La

    presentacin de datos implica tener la informacin estadstica organizada para proceder al anlisis

    e interpretacin de los resultados.

    En el trabajo estadstico, lo que se tiene disponible en un primer momento es un material numrico, producto

    de la observacin o recopilacin de datos, que son categorizados, ordenados, procesados y presentados en

    tablas y grficos; hay proceso de resumen estadstico que se concreta con el clculo de indicadores.

    Hay dos formas de presentar ordenadamente los datos estadsticos:

    i) En forma de tablas estadsticas

    ii) Mediante grficos y diagramas

    Fundamentalmente se usa la forma tabular, los grficos se utilizan complementariamente para ilustrar

    mediante figuras el comportamiento de las variables y facilitar la comprensin de los fenmenos estudiados.

    TABLAS ESTADSTICAS

    Presentan ordenadamente los datos estadsticos en filas y columnas, clasificados y agrupados de acuerdo a

    un criterio especfico. Los datos presentados en tablas constituyen la informacin estadstica. Esta

    informacin no slo es un valor numrico sino que adems merece una interpretacin de tipo cualitativo

    segn el contexto que lo origin. Una tabla estadstica es el resultado de trabajos previos (planeamiento,

    recopilacin, tabulacin, clculos, etc.), son las que se incluyen frecuentemente en el cuerpo de los estudios

    de las investigaciones o de los informes.

    Son esquemas organizados en los que se registran los datos estadsticos en forma organizada con la

    frecuencia de cada uno de estos, los mismos se observan en columnas y filas con la finalidad de presentar

    la informacin recopilada de una investigacin o estudio determinado. Por lo tanto, las tablas estadsticas

    es una ordenacin de datos numricos en filas y columnas con las especificaciones correspondientes acerca

  • Estadstica - Lic. Jessica Oliva G. Pgina | 24

    de la naturaleza de los datos. Constituye una forma til de presentar los datos estadsticos obtenidos en una

    investigacin a travs de cuadros, tablas y grficos. Esta puede presentar la informacin para referencias

    generales o para un uso especfico o particular.

    La ordenacin de datos en tablas estadsticas, denominada forma tabular o tabulacin, estn constituidos

    por datos cuantitativos y stos a su vez estn en filas y columnas de acuerdo con las especificaciones de los

    datos. La tabulacin es una presentacin sistemtica de los datos estadsticos de una investigacin

    determinada, estos se presentan en forma resumida a travs de las tablas o cuadros estadsticos.

    Las tablas estadsticas estn compuestas por las siguientes partes:

    1. Ttulo.

    2. Encabezamiento.

    3. Columna Matriz. o Concepto

    4. Cuerpo.

    5. Notas de Encabezado

    6. Nota de Pie

    7. Fuente de Datos

    1. Ttulo: Es una descripcin del contenido de la tabla. Debe ser compacta y completa. Este comprende las

    siguientes partes:

    Numeracin de la tabla: cuando las tablas forman parte de un texto o de un grupo deben ser

    numerados en la parte superior central de la hoja.

    Titulo Propiamente Dicho: se debe seguir los siguientes puntos:

    - Se debe ubicar centrado en la parte superior de la tabla, y usando letras maysculas para todo el

    enunciado.

    - Se debe redactarse con precisin y que exprese brevemente los datos que se presentan en el

    cuadro.

    - Un ttulo completo indica:

    Qu son los datos incluidos en el cuerpo de la tabla?

    Dnde est el rea representada por los datos?

    Cmo estn los datos clasificados?

    Cundo ocurrieron los datos?

    2. Encabezado: Es el ttulo de la parte de una columna o columnas. Las tablas ms simples pueden consistir

    solamente de dos columnas y dos encabezados: Una para los conceptos y otra para los datos. Debe

    disponerse en la parte superior del cuadro y las designaciones que comprenden debern escribirse en lo

    posible horizontalmente, debiendo ser preciso y breves, as mismos se dispondr en un orden lgico de

    izquierda a derecha. Otra observacin para la elaboracin del encabezamiento, es que tanto l como las

    diversas columnas deben separarse con rayas, cerrando el cuadrado por la parte superior e inferior con

  • Estadstica - Lic. Jessica Oliva G. Pgina | 25

    una raya gruesa o una doble raya, en la actualidad existe la preferencia de no rayar verticalmente el

    encabezamiento.

    3. Concepto o Columnas Matriz: La descripcin en hilera de la tabla son llamados conceptos; y estos son

    colocados al lado izquierdo de la tabla. La naturaleza de las clasificaciones es indicada por los

    encabezados de las columnas, incluyendo la columna matriz. Es bueno Recordar que los datos

    estadsticos pueden referirse a clasificaciones cualitativas, cuantitativas, cronolgicas o geogrficas;

    recordar esto es importante puesto que la naturaleza de los datos tomando en cuenta esta clasificacin

    determinar en parte el arreglo en que se lleven stos a la columna matriz. Existen variadas formas de

    arreglo de los datos en la columna matriz. Es permisible disponerlos en orden alfabtico, mtodo que se

    usa habitualmente cuando los datos se clasifican geogrfica o cualitativamente. Pueden ordenarse

    tambin segn clases fijadas por la costumbre: casado, soltero, divorciado, viudo. Es factible observar

    que si las diferentes nominaciones son ordenadas alfabticamente, se hace muy sencillo localizarlas.

    Cuando se trata de clasificaciones cuantitativas, el arreglo puede hacerse en orden ascendente o

    descendente. Cuando se refiere a clasificaciones cronolgicas, se ordenan los aos en sentido ascendente:

    1995, 1996, 1997, 1998, y cuando se trate de meses se comienza por el mes de Enero.

    4. Cuerpo del cuadro: El cuerpo del cuadro es la parte que contiene los datos estadsticos presentados en

    ste. Cada dato individual ocupa en el cuadro un lugar que corresponde a la interseccin de una fila y

    una columna dada; por tanto, el significado de los datos en un lugar est indicado por las especificaciones

    o partidas combinadas de la columna y la fila que se interceptan. Cuando el valor de uno de los lugares

    del cuerpo del cuadro sea cero es conveniente marcar ese lugar con un guin, si no existe el dato, si es

    estimado, o si la cifra indica alguna consideracin distinta a la del resto de los otros, debe indicarse con

    una llamada y su respectiva aclaratoria al pie del cuadro. La representacin efectiva de los datos en la

    tabla depende de los arreglos de las columnas en hileras.

    5. Nota de Encabezado: Son usualmente escritas justamente arriba de los encabezados y debajo de los

    ttulos. Son usados para explicar ciertos puntos relacionados con la tabla completa que no han sido

    incluidos en el ttulo ni en los encabezados ni en los conceptos.

    6. Nota de Pie: Las notas de pie son usualmente colocadas debajo de los conceptos. Son usados para

    clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes, tal como las notas de

    pie en la tabla. Las notas al pie de los cuadros se utilizan para hacer aclaratorias sobre uno o varios

    elementos en particular. La nota sobre la fuente de los datos debe indicar el origen de la informacin

    presentada en el cuadro.

    7. Fuentes: Las fuentes de datos o simplemente fuentes, es usualmente escrita debajo de las notas de pie.

    Si los datos fueron recopilados y presentados por la misma persona, es costumbre no establecer la fuente

    en la tabla. El objeto de la indicacin de las fuentes de los datos es el de proporcionar el debido

    reconocimiento a la persona u organismo que recopil y /o public los datos, adems de indicar, a quienes

    deseen ampliar la informacin, el origen de la misma

    Uso de porcentajes: En las tablas estadsticas, normalmente se utilizan porcentajes. Existen cuadros que

    slo poseen datos en forma de porcentajes, mientras que otros vienen expresados tanto en valores absolutos

    como en porcentajes. La finalidad del uso de los porcentajes en los cuadros es facilitar la comparacin, de

    tal manera que las relaciones que puedan existir se perciban. Cuando se usan estos es necesario recalcar las

    bases sobre las cuales se han establecido dichos porcentajes; esto tiene como propsito indicar al lector cual

    es la base que se est utilizando para determinar el mismo.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 26

    PROPIEDADES DE LAS TABLAS ESTADSTICAS

    o Deben simplificar la presentacin de los datos

    o Tratar un solo tema

    o Elaborar un arreglo apropiado de clasificacin.

    o El tamao de la tabla debe crearse de tal manera que no sea ni muy largo y angosto, ni muy ancho o

    corto.

    o Cada signo de presentacin que se va a utilizar debe estar plenamente identificado.

    o Las notas que se encuentran al pie de los cuadros deben incluir las descripciones en forma precisa.

    Ejemplo de tabla:

    Razn de la falla N veces %

    Servidor sin memoria disponible 32 43.2

    Software del servidor 30 40.5

    Falla elctrica 6 8.1

    Hardware del servidor 4 5.4

    Conexin fsica 2 2.7

    Total 74 100.0

    Tabla N 1

    Razn de falla en el sistema de cajeros automticos del Banco UAW durante los ltimos 6 meses en la ciudad de Chiclayo

    Fuente: Banco UAW

    Nmero de cuadro

    Ttulo

    Encabezamiento

    C U E R P O

    Fuente

  • Estadstica - Lic. Jessica Oliva G. Pgina | 27

    DISTRIBUCIONES DE FRECUENCIA

    Despus de la recopilacin de los datos, es necesario resumirlos y presentarlos en forma tal, que faciliten

    su comprensin y su posterior anlisis y utilizacin. Para ello, se ordenan en cuadros numricos y luego se

    presentan en grficos.

    DISTRIBUCIN DE FRECUENCIAS PARA VARIABLE CUALITATIVA:

    Supongamos que en una muestra de n unidades estadsticas se observan k categoras o modalidades

    diferentes C1, C2,..., Ck de alguna variable cualitativa X. La tabulacin de estos n datos, es la distribucin

    de frecuencias por categoras.

    Categoras de la

    variable X

    Frecuencias

    Absoluta ni

    Frecuencias

    Relativas hi

    Frecuencia

    Porcentajes Pi

    C1

    C2

    Ck

    n1

    n2

    nk

    h1

    h2

    hk

    p1

    p2

    pk

    Total N 1.00 100.00

    La frecuencia absoluta ni, es el nmero de datos observados en cada categora o modalidad. La suma de

    todas las frecuencias absolutas es igual al total n de datos observados.

    La frecuencia relativa hi, se define en cada categora por hi = ni / n. La suma de todas las frecuencias

    relativas es igual a uno.

    La frecuencia relativa porcentual se define en cada fila por hi %= hi x 100%. El total de las frecuencias

    porcentajes es igual a cien.

    Ejemplo:

    Razn de la falla ni hi hi%

    Servidor sin memoria disponible 32 0.432 43.2

    Software del servidor 30 0.405 40.5

    Falla elctrica 6 0.081 8.1

    Hardware del servidor 4 0.054 5.4

    Conexin fsica 2 0.027 2.7

    Total 74 1.000 100.0

  • Estadstica - Lic. Jessica Oliva G. Pgina | 28

    DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS DISCRETAS

    Sea x1, x2,..., xn un conjunto de n observaciones discretas y sean y1, y2, ..., ym el conjunto de valores

    diferentes que toman las observaciones originales (m n).

    En general para construir una tabla de distribucin de frecuencias requiere realizar las siguientes

    operaciones:

    Clasificacin: que consiste en determinar las categoras, que son los distintos valores que toman las

    variables o los intervalos de clase.

    Tabulacin: que consiste en distribuir las observaciones en las respectivas categoras de la variable. Aqu

    se contabiliza cuantos elementos hay en cada categora, es decir, determinar cuntas veces se repite

    (frecuencia) cada valor distinto o categora de la variable.

    Cuando es grande el nmero de datos observados de una variable discreta, su organizacin es muy

    engorrosa. En este caso para resumir los datos y poder calcular las medidas descriptivas, es conveniente

    seguir el mtodo de organizacin de variable continua por intervalos.

    Se llama frecuencia absoluta, al nmero de veces que aparece este valor en el conjunto de observaciones

    y se representa por ni, i= 1, 2, ..., m.

    La suma de todas las frecuencias absolutas simple es igual al nmero total de observaciones.

    Valores

    diferentes

    observados

    Frecuencias

    absolutas

    ni

    Frecuencias

    Relativas

    hi

    Frecuencias

    Relativas

    Porcentuales

    hi%

    y1

    y2

    ...

    ym

    n1

    n2

    ...

    nm

    h1

    h2

    ...

    hm

    h1%

    h2%

    ...

    hm%

    Total Nm 1 100

    Se llama frecuencia relativa, al cociente de la frecuencia absoluta entre el nmero de observaciones.

    n

    nh ii

    La suma de todas las frecuencias relativas es igual a la unidad.

    Se llama frecuencia relativa porcentual, a la frecuencia relativa multiplicada por cien.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 29

    Ejemplo:

    Cantidad de Artculos

    defectuosos N Lotes hi hi%

    1

    2

    3

    4

    5

    6

    7

    8

    5

    14

    18

    25

    20

    10

    5

    3

    0.05

    0.14

    0.18

    0.25

    0.20

    0.10

    0.05

    0.03

    5

    14

    18

    25

    20

    10

    5

    3

    Total 100 1.00 100

    DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CONTINUAS

    Sea x1, x2,..., xn un conjunto de n observaciones continuas, siendo n el tamao de la muestra.

    En general para construir una tabla de distribucin de frecuencias requiere realizar los siguientes pasos:

    1. Determinar la amplitud o recorrido(R): es la longitud del recorrido de los datos. O sea:

    R = xmx xmin

    2. Determinar el nmero de intervalos(m): Haciendo uso de la frmula de STURGES

    m = 1 + 3.32 log(n)

    Se recomienda que el nmero de clases est entre 5 y 15

    3. Determinemos la amplitud de clase (C):

    C = R / m

    4. Construir los intervalos de clase partiendo de xmin luego se va sumando la amplitud de clase. Los

    extremos de un intervalo deben estar preferentemente definidos, de modo que no exista duda o

    ambigedad en el momento de la tabulacin. Un valor xi slo puede pertenecer a un intervalo y

    slo uno. En este caso denominaremos el intervalo Li-Ls que significa que es cerrado por la

    izquierda y abierto por la derecha.

    5. Luego se calcula la marca de clase, que es el punto medio del intervalo denotado por yi.

    2

    LLy sii

    Donde: Li es el lmite inferior del intervalo

    Ls es el lmite superior del intervalo

    6. Luego obtener la frecuencia absoluta (ni ) que es el procedimiento que consiste en distribuir las

    observaciones en los diferentes intervalos.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 30

    7. Calcular las frecuencias absolutas acumuladas (Ni), que es la suma de las frecuencias absolutas

    hasta la i-sima frecuencia absoluta.

    i

    1j

    ji21i nn...nnN

    8. Calcular la frecuencia relativa, que es el cociente de la frecuencia absoluta entre el nmero de

    observaciones.

    n

    nh ii

    La suma de todas las frecuencias relativas es igual a la unidad.

    9. Calcular la frecuencia relativa acumulada, que es la suma de las frecuencias absolutas hasta la

    i-sima frecuencia relativa.

    i

    1j

    jn21i hh...hhH

    o tambin: n

    NH ii

    Intervalos de

    clase

    Li-Ls

    Marcas

    de clase

    yi

    Frecuencias

    Absolutas

    ni

    Frecuencias

    Absolutas

    Acumuladas

    Ni

    Frecuencias

    Relativas

    hi

    Frecuencias

    Relativas

    Acumuladas

    Hi

    Frecuencias

    Relativas

    Porcentuales

    hi%

    Y0 y1

    y1 y2

    ....

    ym-1 ym

    y1

    y2

    ...

    ym

    n1

    n2

    ...

    nm

    N1

    N2

    ...

    Nm=n

    h1

    h2

    ...

    hm

    H1

    H2

    ...

    Hm=1

    h1%

    h2%

    ...

    hm%

    Totales n 1 100

    Ejemplo:

    Ingresos

    ($) yi ni Ni hi Hi %

    36 45 40.5 6 6 0.13 0.13 13

    45 54 49.5 5 11 0.11 0.24 11

    54 63 58.5 16 27 0.36 0.60 36

    63 72 67.5 12 39 0.27 0.87 27

    72 81 76.5 4 43 0.09 0.96 9

    81 90 85.5 2 45 0.04 1.00 4

    Total 45 1.00 100

  • Estadstica - Lic. Jessica Oliva G. Pgina | 31

    REPRESENTACIN GRFICA DE INFORMACIN ESTADSTICA

    El fin que persigue todo grfico es el de dar una idea rpida de la situacin que en ese momento se est

    investigando. Por tal motivo, la presentacin de los datos por medio de grficos debe ser de una forma

    simple y de una compresin fcil. Es preferible construir un conjunto de grficos en donde cada uno de

    ellos presente un aspecto sencillo de una situacin determinada, que presentar un solo grfico en el cual se

    observen demasiadas relaciones que se haga difcil estudiar de una forma efectiva. Por lo tanto, no debe

    sobrecargarse un grfico para tratar de mostrar demasiadas categoras, ya que, la simplicidad es una de la

    caracterstica bsica de estos.

    Existe una gran variedad de tipos de grficos entre los que se pueden mencionar los pictogramas,

    cartogramas, de cuadrados, de tringulos y crculos proporcionales, de sectores circulares, de barras,

    lineales, estereogramas, polares, etc., pero los ms utilizados y de interpretacin sencilla son los: Los

    grficos de barras, los de sectores circulares y los lineales. En esta asignatura solo se estudiaran las

    siguientes grficas:

    1. Diagrama de Barras.

    2. Diagrama Circular o de Pastel.

    3. Histograma.

    4. Polgono de Frecuencia.

    5. Diagrama de Lneas.

    Los diagramas de lneas, el histogramas, el polgono de frecuencia y la ojiva son grficos cartesianos

    porque para su construccin requieren del plano cartesiano, a estos se le denominan en trminos generales

    grficos de lneas. El diagrama de barras y el de pastel se les denomina grficos de sectores, puesto que, no

    requieren del plano cartesiano para su construccin.

    Diagrama de Barras

    Los diagramas de barras son grficas que se utilizan con mucha frecuencia para representar datos de

    una investigacin determinada, son de fcil interpretacin para cualquier lector. Estos grficos estn

    constituidos por una serie de rectngulos o barras. La longitud y anchura de cada barra representa un

    fenmeno.

  • Estadstica - Lic. Jessica Oliva G. Pgina | 32

    La forma de elaborar los mismos es la siguiente: se utiliza un sistema de coordenadas rectangulares y

    se llevan al eje de las x los valores que toma la variable en estudio y en el eje de las y se colocan las frecuencias de cada barra. Luego se construyen los rectngulos, tomando como base al eje de las

    abscisas, cuya altura ser igual a cada una de las diferentes frecuencias que presentan las variables en

    estudio. La magnitud con que viene expresada la variable se observa en la longitud de las barras

    (rectngulos). Es importante destacar que solamente la longitud de las barras y no su anchura es lo que

    denota la diferencia de magnitud entre los valores de la variable. Todas las barras tienen que tener una

    anchura igual, separadas entre s, preferiblemente por una longitud igual a la mitad del ancho de estas

    o distancias iguales entre barras. Es recomendable, que las barras no sean ni e