la estadística aplicada

12
GENERALIDADES 1. ¿QUÉ ES LA ESTADÍSTICA? Hace más de 200 años. H.G. Wells, historiador y autor inglés, señaló; “Algún día el conocimiento estadístico será tan necesario para ser un buen y eficiente ciudadano, como lo es saber leer”. Si se tuviera que hablar sobre el conocimiento estadístico en la actualidad, probablemente se diría que “el conocimiento estadístico es necesario no solo para ser un buen y eficiente ciudadano, sino también para una toma de decisiones efectiva en varias áreas de los negocios”. 1.1 ¿Qué Entiende por Estadística? ¿Cómo definimos la palabra “Estadística”? Es un término que encontramos frecuentemente en nuestro lenguaje diario. En realidad tiene dos significados. En el uso más común, la estadística se refiere a información numérica. La estadística puede presentarse gráficamente o en forma de enunciado. Por lo general se utiliza una gráfica para capturar la atención del lector y mostrar una gran cantidad de información. La asignatura estadística, como se presenta en esta explicación, tiene un significado mucho más amplio que la mera recopilación y publicación de información numérica. La Estadística se define como: Estadística es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a la toma de decisiones mas efectiva. Como indica la definición anterior, el primer paso en la investigación de un problema es la recolección de datos importantes. Estos datos deben organizarse de cierta manera, y tal vez, presentarse en un gráfico. Solo hasta que los datos hayan sido organizados es posible analizarlos e interpretarlos. 1.2 ¿Por qué estudiar estadística? Si se revisan los programas de estudio de una universidad, se descubrirá que la educación estadística se requiere en muchos programas escolares. ¿Por qué pasa esto? ¿Cuáles son las diferencias en los cursos de estadística que se imparten en la facultad de Ingeniería, en los departamentos de Psicología o Sociología de una universidad, o en la escuela de Administración? La diferencia principal está en los ejemplos que se utilizan. Básicamente el contenido de los

Upload: franklin-cumbal

Post on 30-Jun-2015

1.054 views

Category:

Documents


2 download

DESCRIPTION

estadística, aplicada, generalidades, conceptos

TRANSCRIPT

Page 1: La Estadística Aplicada

GENERALIDADES

1. ¿QUÉ ES LA ESTADÍSTICA?

Hace más de 200 años. H.G. Wells, historiador y autor inglés, señaló; “Algún día el conocimiento estadístico será tan necesario para ser un buen y eficiente ciudadano, como lo es saber leer”. Si se tuviera que hablar sobre el conocimiento estadístico en la actualidad, probablemente se diría que “el conocimiento estadístico es necesario no solo para ser un buen y eficiente ciudadano, sino también para una toma de decisiones efectiva en varias áreas de los negocios”.

1.1 ¿Qué Entiende por Estadística?

¿Cómo definimos la palabra “Estadística”? Es un término que encontramos frecuentemente en nuestro lenguaje diario. En realidad tiene dos significados. En el uso más común, la estadística se refiere a información numérica. La estadística puede presentarse gráficamente o en forma de enunciado. Por lo general se utiliza una gráfica para capturar la atención del lector y mostrar una gran cantidad de información. La asignatura estadística, como se presenta en esta explicación, tiene un significado mucho más amplio que la mera recopilación y publicación de información numérica. La Estadística se define como: Estadística es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a la toma de decisiones mas efectiva. Como indica la definición anterior, el primer paso en la investigación de un problema es la recolección de datos importantes. Estos datos deben organizarse de cierta manera, y tal vez, presentarse en un gráfico. Solo hasta que los datos hayan sido organizados es posible analizarlos e interpretarlos.

1.2 ¿Por qué estudiar estadística?

Si se revisan los programas de estudio de una universidad, se descubrirá que la educación estadística se requiere en muchos programas escolares. ¿Por qué pasa esto? ¿Cuáles son las diferencias en los cursos de estadística que se imparten en la facultad de Ingeniería, en los departamentos de Psicología o Sociología de una universidad, o en la escuela de Administración? La diferencia principal está en los ejemplos que se utilizan. Básicamente el contenido de los

Page 2: La Estadística Aplicada

cursos es el mismo. En la Escuela de Administración interesan cosas como ganancias, sueldos, horas de trabajo. En el Departamento de Psicología interesan los resultados de las pruebas, y en la Facultad de Ingeniería el interés puede centrarse en saber cuántas unidades se producen con una máquina en especial. Sin embargo las tres áreas desean saber lo que es un valor típico y la cantidad de variación que existe en la información. Entonces de ahí viene la necesidad de estudiar estadística en tantas carreras, teniendo como primera razón que en todos lados encontramos información numérica. Hay diferentes preguntas que nos hacemos el momento de tener información analizada estadísticamente con conclusiones como son: ¿Cómo podemos determinar si las conclusiones presentadas son razonables? ¿Acaso las muestras de información que se recopilaron son demasiado grandes? ¿Cómo se seleccionaron las unidades de la muestra? Para poder ser un consumidor capacitado a fin de entender esta información, se necesita poder leer diagramas y gráficas y entender el análisis de la información numérica. La comprensión de los conceptos básicos de la estadística será de gran ayuda. La segunda razón para tomar un curso de estadística es que las técnicas estadísticas se utilizan para tomar decisiones que afectan a nuestra vida diaria. Esto quiere decir que influyen en nuestro bienestar personal. La tercera razón para tomar un curso de estadística es que el conocimiento de los métodos estadísticos ayuda a entender porque tomar ciertas decisiones y aportan una mejor comprensión respecto a la forma en la que nos afectan las decisiones. Sin importar el tipo de trabajo que se elija se tendrá que enfrentarse con la toma de decisiones, para lo cual una comprensión del análisis de datos será de gran ayuda. Para tomar una decisión basada en la información, se necesita: 1. Determinar si la información existente es adecuada o si se requiere

información adicional, de tal forma que no hayan resultados erróneos. 2. Resumir la información de modo útil e informativo. 3. Analizar la información disponible. 4. Sacar las conclusiones y realizar las inferencias necesarias, al tiempo que

se evalúa el riesgo de llegar a una conclusión errónea.

1.3. Tipos de Estadística

Generalmente, el estudio de la estadística se divide en dos categorías: estadística descriptiva y estadística inferencial.

Page 3: La Estadística Aplicada

1.3.1. Estadística Descriptiva

La definición de estadística que se presentó con anterioridad menciona la “organización, presentación, análisis de datos, etc.”. Esta área de la ciencia estadística se conoce comúnmente como estadística descriptiva. Estadística descriptiva, conjunto de métodos para organizar, resumir y presentar los datos de manera informativa. Los conjuntos de datos no organizados (como el censo de población, los ingresos semanales de miles de programadores en informática y las respuestas individuales de 5.000 aspirantes a ingresar al primer año de carrera universitaria, etc.) son de poco valor. Sin embargo hay técnicas estadísticas para organizar este tipo de información de manera significativa.

1.3.2. Estadística Inferencial

Otra área es la estadística inferencial, también denominada inferencia estadística y estadística inductiva. El principal objetivo de la estadística inferencial es encontrar algo sobre una población, basándose en una muestra tomada de dicha población. Estadística inferencial, conjunto de métodos utilizados para saber algo acerca de una población, basándose en una muestra. Tenemos las palabras población y muestra en la definición de la estadística inferencial. Frecuentemente se hace referencia a la población de habitantes de un país, como es el ejemplo los habitantes del Ecuador. Sin embargo la palabra población en estadística tiene un significado más amplio. Una población puede constar de individuos, por ejemplo los estudiantes inscritos en la Escuela Superior Politécnica Ecológica Amazónica. Una población también puede incluir objetos, como número de llantas producidas en una semana, Todas las truchas que se encuentran en un estanque. Una población puede también estar formada por un grupo de medidas, como podría ser los pesos de todos los jugadores de línea defensiva del equipo de fútbol, las estaturas de los jugadores de básquetbol de la NBA. Por lo tanto población en estadística no solo se refiere a personas. Población, conjunto de todos los posibles individuos, objetos o medidas de interés. Generalmente se toma una muestra de una población para inferir algo acerca de la misma.

Page 4: La Estadística Aplicada

Muestra, una porción, o parte, de la población de interés. ¿Por qué se toma una muestra en vez de estudiar a cada miembro de la población? Una muestra de electores registrados es necesaria por el alto costo que representaría comunicarse con millones de electores antes de una elección. Sería físicamente imposible que unos cuantos biólogos marinos capturaran y marcaran a todas las focas del océano. Como se observó, el hecho de tomar una muestra para obtener información acerca de una población es una práctica muy común en los negocios, la agricultura, la política y gobierno, como se indica en el siguiente ejemplo:

- Las empresas de TV., constantemente monitorean la popularidad de sus programas contratando a empresas y a otras organizaciones para conocer La preferencia de los telespectadores.

Figura Nº 1

Población y Muestras

Tipos de Figura Nº 1

1.4. Tipos de Variables

Existen dos tipos básicos de datos: (1) los obtenidos a partir de una población cualitativa, y (2) los que resultan de una población cuantitativa. Cuando una característica o variable en estudio es no numérica, se la denomina variable cualitativa o atributo. Ejemplos de estas variables son: género sexual, religión, tipo de automóvil, estado o lugar de nacimiento, el color de los ojos de una

Page 5: La Estadística Aplicada

persona, etc. Cuando la información estudiada es cualitativa, generalmente interesa saber cuantas o que porción entra en cada categoría. Por ejemplo ¿Qué porcentaje de la población tiene ojos azules? ¿Cuántos católicos o evangélicos hay en Ecuador? ¿Qué porcentaje de la cantidad total de automóviles vendidos en un mes son BMW? Normalmente, los datos cualitativos se resumen en diagramas o gráficas de barras. Cuando la variable estudiada se puede expresar numéricamente, se denomina variable cuantitativa, y la población se conoce como cuantitativa. Ejemplos de variables cuantitativas son: el saldo de una cuenta personal, la edad de los presidentes de las empresas, la velocidad de los vehículos que transitan en el centro de Quito, número de hijos de una familia. Las variables cuantitativas pueden ser continuas y discretas. Las variables discretas solo pueden asumir solo ciertos valores y generalmente existen brechas o huecos entre ellos. Ejemplos de variables discretas son:

Page 6: La Estadística Aplicada

El número de recámaras en una casa, número de carros que pasan por el peaje en la carretera, número de estudiantes en cada grupo del curso de estadística, etc. Nótese que en cada casa se puede tener 3 o 4 recámaras, pero no 3.74 dormitorios. Por lo tanto existe una brecha entre los posibles valores. Por lo común, las variables discretas son resultado de un conteo. Las observaciones de una variable continua pueden tomar cualquier valor dentro de un intervalo determinado. Ejemplos de variables continuas son: La presión de aire de un neumático en un automóvil, el peso de un cargamento de granos, la cantidad de cereal de una caja, tiempo de vuelo para transportar vía aérea desde Orlando hasta San Diego, puede tomar 7 horas con 30 minutos, o también 7 horas con 30 minutos y 45 segundos, con unos minutos o segundos más o menos dependiendo de la precisión cronométrica. Las variables continuas generalmente resultan de medir algo.

1.5. Niveles de Medición

Los datos pueden clasificarse de acuerdo con los niveles de medición. Generalmente, el nivel de medición de un dato determina los cálculos que se pueden realizar para resumir y presentar la información y las pruebas estadísticas que pueden desarrollarse. Por ejemplo hay 6 colores de dulces en una bolsa, supongamos que al color café le asignamos el valor 1, al amarillo el 2, al azul el 3, al naranja el 4, al verde el 5, y al rojo el 6. Para una bolsa de se suman los valores asignados a los colores y el resultado se divide entre el número de dulces, resultado que el color medio es 3.56. ¿Esto significa que el color promedio es el azul o naranja? Existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. El nivel más bajo o mas primitivo es el nominal, el nivel más alto o el que proporciona la mayor cantidad de información acerca de la observación, es el nivel de medición de razón.

1.5.1 Datos del nivel nominal

Las observaciones solamente se pueden clasificar o contar. No existe ningún orden específico entre clases. Un ejemplo de nivel nominal es el género sexual. Supóngase que se cuenta el número de estudiantes que asisten a un juego de fútbol utilizando su identificación escolar y se reporta cuantos hombres y cuantas mujeres son. La siguiente tabla muestra un desglose del uso de telefonía de larga distancia de Estados Unidos. Este es el nivel nominal de medición porque se cuenta el número de veces que se utilizó cada compañía que proporciona el servicio de larga distancia.

Tabla Nº 1 Ejemplo de Nivel Nominal de Medición

Page 7: La Estadística Aplicada

Compañía Número de Llamadas Porcentaje AT&T 108 115 800 75 MCI 20 577 310 14 Sprint 8 238 740 6 Otros 7 130 620 5 Total: 144 062 470 100 La forma en que se presentan los nombres de las compañías en la anterior tabla puede ser diferente. Básicamente esto indica la característica principal del nivel nominal de medición: no hay un orden específico entre las categorías. Tales tareas son mutuamente excluyentes, lo cual quiere decir que por ejemplo una llamada en especial no puede iniciarse en AT&T como en MCI. Mutuamente excluyente propiedad de un conjunto de categorías, implica que una persona, objeto o medición se ha de incluir en sólo una categoría. Las categorías en la tabla anterior también son exhaustivas, lo que significa que cada miembro de la población, o de la muestra, debe aparecer sólo en una de las categorías. Exhaustivo Propiedad de un conjunto de categorías que implica que cada individuo, objeto, o medición debe aparecer en solo una categoría. Las propiedades del nivel nominal son las siguientes: 1.- Las categorías para los datos son mutuamente excluyentes y exhaustivas. 2.- Las categorías para los datos no tienen un orden lógico.

1.5.2 Datos de nivel ordinal

Es el siguiente nivel de datos es el nivel ordinal. Las propiedades del nivel de datos ordinal son: 1.- Las categorías para los datos son mutuamente excluyentes y exhaustivas. 2.- Dichas categorías para los datos se clasifican por intervalos. O se ordenan de Acuerdo con las características particulares que poseen.

1.5.3 Datos de Nivel Intervalo

Es el siguiente nivel en orden ascendente. Incluye todas las características del nivel ordinal pero, además la diferencia entre los valores tiene una tamaño constante. Las propiedades de la escala de intervalo son:

Page 8: La Estadística Aplicada

1.- Las categorías para los datos son mutuamente excluyentes y exhaustivas 2.- Las categorías en cuestión están ordenadas de acuerdo con la cantidad de la Característica que poseen. 3.- Diferencias iguales en la característica se representan por diferencias iguales En la medición.

1.5.4 Datos de Nivel de Razón

Prácticamente todos los datos cuantitativos son el nivel de razón. El nivel de razón es el nivel de medición más alto. Esta medida tiene todas las características del nivel de intervalo, pero además el punto 0 tiene significado, y la razón (o cociente) entre números también es significativa. Las propiedades del nivel de razón de los datos son: 1.- Las categorías de los datos son mutuamente excluyentes y exhaustivas. 2.- Dichas categorías tiene un intervalo u orden de acuerdo con la cantidad de la Característica que poseen. 3.- Diferencias iguales en la característica están representadas por diferencias Iguales en los números que se han asignado a las categorías mencionadas. 4.- El punto (o valor) 0 representa la ausencia de la característica.

Figura Nº 2 Características principales de los Niveles de Medición

Ejemplos: Nominal

Número en la camiseta de un Jugador

Marca de un Automóvil Ordinal

Page 9: La Estadística Aplicada

Calificaciones de un estudiante en su clase

Posición del Equipo en el Torneo Intervalo

Temperatura Razón

Número de pacientes atendidos

Número de llamadas de ventas realizadas

Distancia a la Escuela

1.6. Usos y abusos de la Estadística

Probablemente ya ha escuchado el dicho que expresa: “hay tres tipos de mentiras: las mentiras, la mentiras malditas y las estadísticas”. Este dicho se atribuye a Benjamín Disraeli y tiene más de un siglo. Asimismo se ha dicho que “las cifras no mienten; los mentirosos los imaginan”. Ambas declaraciones se refieren al abuso de las operaciones estadísticas, cuando los datos se presentan en tal forma que llevan a un engaño. Una de las principales metas de este texto es hacer que el lector sea consumidor de información mucho más crítico.

Page 10: La Estadística Aplicada

Hablando del término promedio no representa la totalidad de los datos. Este término se refiere a las diferentes medidas de tendencia central que más adelante se explicarán. A veces los diagramas y las gráficas también se pueden utilizarse para engañar visualmente. Algunas veces los mismos números pueden ser engañosos, desde luego se ha escrito algunos libros completos acerca de información engañosa como el famoso libro que lleva como título How to the lie with Statics (¿Cómo mentir con la Estadística?), escrito por Darrell Huff.

1.7. Aplicaciones para Computadora

En la actualidad las computadoras están al alcance de los estudiantes en la mayor parte de colegios, universidades, etc. Las hojas de cálculo como Excel de Microsoft, los paquetes de computación para estadística como MINITAB, SPSS están disponibles en un gran número de laboratorios de computación. Gran parte de las computadoras personales que se usan en los hogares incluyen aplicaciones Excel de Microsoft. El siguiente ejemplo muestra la aplicación de las computadoras en el análisis estadístico, el ejemplo trata de la venta de 20 vehículos que se vendieron en el mes anterior en Chevrolet.

Figura Nº 3 Aplicación de las Computadoras en Estadística

Page 11: La Estadística Aplicada
Page 12: La Estadística Aplicada

Si se hubiera utilizado una calculadora para obtener estas medidas y otras necesarias, para analizar completamente los precios de venta, se hubieran requerido muchas horas de cálculos. Además la probabilidad de cometer un error aritmético es alta cuando se tiene grandes cantidades de valores. Por otro lado, los paquetes de computación para estadística y las hojas de cálculo respectivas pueden proporcionar información exacta en cuestión de segundos. Dependiendo de los recursos disponibles en Computación, como es el Sistema operativo y los programas, se recomienda realizar ejercicios, con ello evitará realizar cálculos tediosos y permitirá concentrarse en el análisis de datos.