apuntes docentes

63
5/10/2018 apuntesdocentes-slidepdf.com http://slidepdf.com/reader/full/apuntes-docentes 1/63 UNIDADES TECNOLÓGICAS DE SANTANDER APUNTES DOCENTES PROFESOR: GERMÁN ERNESTO RINCÓN RE UNIDAD 1: ARREGLO Y PRESENTACIÓN DE DATOS DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página ASIGNATURA: ESTADÍSTICA

Upload: sergio-andres-castillo-supelano

Post on 09-Jul-2015

184 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 1/63

UNIDADES TECNOLÓGICAS DE SANTANDER

APUNTES DOCENTES

PROFESOR: GERMÁN ERNESTO RINCÓN RE

UNIDAD 1: ARREGLO Y PRESENTACIÓN DE DATOS

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

ASIGNATURA: ESTADÍSTICA

Page 2: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 2/63

UNIDADES TECNOLÓGICAS DE SANTANDER

ASPECTOS GENERALES DE LA ESTADÍSTICA

LOS FENÓMENOSUn fenómeno es cualquier manifestación de las actividades humanas o de la naturaleza que puede ser percibido por los sentidos o la razón. Algunos ejemplos de fenómenos son los siguientes:• El crecimiento de una planta• El comportamiento del clima• Las ventas por periodo de una empresa• Las personas, por día, que son afectadas por una enfermedad• Los accidentes de tránsito en diferentes lugares de una ciudad• La variación mensual del costo de vidaPalabras sinónimas de fenómeno son: suceso, hecho o acontecimiento

LOS FENÓMENOS PRODUCEN INFORMACIÓNPor muchos motivos los seres humanos desean poseer información sobre el comportamiento de diversfenómenos y para ello realizan registros sobre el estado de estos fenómenos en diferentes momentosespacios.

Estos registros o mediciones generan diversos volúmenes de datos y para que estos datos se conviertan einformación se pueden procesar de diferentes maneras. Una de las formas como se pueden tratar los datpara extraer la información que ellos contienen es utilizando las técnicas estadísticas

DEFINICIÓN DE ESTADÍSTICAEs una ciencia que estudia cómo debe emplearse información para facilitar la toma de decisiones esituaciones prácticas que se manifiestan bajo incertidumbre

No todos los fenómenos pueden ser estudiados con las herramientas que suministra la ciencia estadísticPara que esto sea posible se requiere que los fenómenos reúnan algunas características que se presentancontinuación:

FENÓMENOS O HECHOS QUE ESTUDIA LA ESTADÍSTICA • Fenómenos que afecten a muchos individuos o elementos• Fenómenos sobre los que se puedan recoger datos verídicos

• Fenómenos que ocurran muchas veces.• Fenómenos que se repiten con diferente frecuencia• Fenómenos que ocurran en muchos lugares

• Fenómenos que ocurran en diferentes tiempos• Fenómenos cualitativos que puedan cuantificarse

FENÓMENOS QUE NO ESTUDIA LA ESTADÍSTICA • Fenómenos individuales

• Fenómenos sobre los que no se pueden recoger datos cuando ocurren

Fenómenos que ocurren una sola vez.• Fenómenos cualitativos que no pueden cuantificarse

FINALIDADES DE LA ESTADÍSTICA • Conocer la realidad de un fenómeno• Conocer lo típico de un fenómeno• Determinar los cambios que se presentan en un fenómeno• Determinar las causas que originan un fenómeno• Relacionar dos o más fenómenos• Hacer estimaciones sobre el comportamiento futuro de un fenómeno

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

Page 3: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 3/63

UNIDADES TECNOLÓGICAS DE SANTANDER

• Sacar conclusiones sobre el comportamiento total de un fenómeno con base observaciones parcialesque se hagan sobre este fenómeno

IMPORTANCIA DE LA ESTADÍSTICA La actividad mas importantes para las personas que trabajan en las organizaciones empresariales es toma de decisiones. Dado el enorme aumento de la disponibilidad de datos (gracias a los sistemas d

información), y dada la complejidad creciente de las operaciones empresariales, los procesos de decisión sven sometidos a presiones extraordinarias.

Una de las técnicas más valiosa que ayudan en los procesos de toma de decisiones es la Estadística. Por que es indispensable que los hombres y mujeres que dirigen organizaciones o que de alguna maneparticipan en la toma de decisiones estén familiarizados con las técnicas estadísticas para poder determincuando se puede examinar un problema existente mediante la aplicación del análisis estadístico.

DIVISIÓN DE LA ESTADÍSTICA La Estadística se divide en dos grandes ramas:• La Estadística Descriptiva• La Inferencia Estadística

ESTADÍSTICA DESCRIPTIVA Son los conocimientos y métodos que tratan de la recolección, organización y presentación numéricagráfica de los datos.

INFERENCIA ESTADÍSTICA Son los conocimientos y métodos que permiten sacar conclusiones sobre el comportamiento total de ufenómeno basándose únicamente en la información recolectada sobre una parte de ese mismo fenómenEstas conclusiones se obtienen bajo incertidumbre.

FASES DE UNA INVESTIGACIÓN ESTADÍSTICA 1. Planeamiento

• Fin de la investigación• Límites de la investigación

• Definir la población• Unidad de investigación• Naturaleza o clase de los datos• Fuentes de la información• Procedimiento para recolectar los datos• Diseño de instrumentos• Presupuesto

2. Recolección de la información3. Crítica y codificación4. Tabulación y gráficas5. Análisis e interpretación

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

Page 4: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 4/63

UNIDADES TECNOLÓGICAS DE SANTANDER

CONCEPTOS BÁSICOSDATOEn términos generales un dato es un registro o anotación que se hace del estado de un fenómeno en umomento determinado

ELEMENTOSon las entidades que tienen una o varias características cuyo estado nos interesa registrar. El registro destado de estas características es lo que constituye los datos. Estos elementos pueden ser personaobjetos o sucesos.

En una investigación sobre los salarios de trabajadores los elementos son los trabajadores (personas), y característica que se observa a cada elemento es el valor de su salario. En una investigación sobre el valde las facturas que expide una comercializadora los elementos son las facturas (un objeto), y característica observada es el valor de cada factura En una investigación sobre los accidentes de tránsito lelementos son los accidentes (un suceso), y la característica observada podría ser el número de personalesionadas

POBLACIÓN • Todos los elementos que presentan una característica común• Es el conjunto de todos los elementos que hacen parte de una situación que se está estudiando y sobre

cual se intenta sacar conclusiones

Las poblaciones se deben definir con toda claridad de tal manera que no exista confusión sobre si udeterminado elemento pertenece o no a la población

TAMAÑO DE UNA POBLACIÓNEs el número total de elementos que componen una población

CLASES DE POBLACIONES Las poblaciones se dividen en dos clases:• Poblaciones finitas• Poblaciones infinitas

Poblaciones FinitasSon las poblaciones a las cuales se les pueden determinar fácilmente el número de elementos que lcomponen, es decir, su tamaño

EJEMPLO:Situación o fenómeno: La edad de los estudiantes de las UTSPoblación: Todos los estudiantes de las UTSTipo de población: Finita, porque fácilmente se pueden contabilizar sus elementos acudiendo a la oficina dla institución que registra estos datos

Poblaciones infinitas

• Son las poblaciones que físicamente es imposible numerarlas o determinar su tamaño• Son las poblaciones que aunque se puede determinar su tamaño, no es conveniente hacerlo por razone

económicas o de tiempo

EJEMPLO:Situación: Accidentes por día en un cruce de calles de la ciudadPoblación: Todas los días mientras exista este cruceTipo de población: Infinita. Es imposible determinar cuantos elementos tiene esta población

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

Page 5: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 5/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Ejemplo:Situación: Número promedio de hijos por pareja de un barrio de la ciudadPoblación: todas las parejas que habitan en el barrioTipo de población: Infinita. Es muy costoso o demanda mucho tiempo determinar su tamaño

CARACTERÍSTICAS OBSERVABLES EN UNA POBLACIÓN 

A los elementos de una población se les observan sus características o la intensidad con que se presenuna magnitud.

De acuerdo con su comportamiento las características que se observan en los elementos de una poblacióse pueden clasificar en constantes o variables

CARACTERÍSTICA CONSTANTE Una característica es constante cuando el valor que presenta esta característica no varía de un elementootro o varía muy poco; por ejemplo, la estatura de una persona adulta observada en los últimos 20 mesesla profesión de un graduado universitario.

CARACTERÍSTICA VARIABLE • Es una característica que cambia frecuentemente de valor cuando se observa en algunos o en todos lo

elementos de la población.• Es un símbolo que puede tomar diversos valores dentro de un conjunto determinado de valores qu

reciben el nombre de dominio de la variable.(Significado matemático)

La estadística solamente estudia las características variables Las características variables, comúnmendenominadas variables, pueden ser de dos clases:

Variables cualitativas: Son las que se describen mediante palabras. Se refieren a atributos, actitudespreferencias de los elementos que se están estudiando

EJEMPLOS:• Las profesiones u ocupaciones de un grupo de personas: Abogado, maestro, panadero, ingeniero, etc.• El estado civil de un grupo de personas: Soltero, casado, unión libre, etc.•

El sabor de las naranjas de una cosecha: dulce, insípido, ácido• El color favorito de un grupo de individuos: Blanco, rojo, verde, etc.• Pasatiempos de un grupo de estudiantes: Deportes, lectura, reuniones sociales, labores manuales, etc.• La calidad de un producto: Bueno o defectuoso

Las variables cualitativas sólo son susceptibles de numeración o de conteo: número de abogados o dmaestros; número de individuos que prefieren el color blanco; número de productos defectuosos.

Variables cuantitativas: Son las que se describen por medio de números, por ejemplo, la edad de loempleados de una empresa, las personas que visitan por día un museo, los saldos de las cuentas pcobrar de una empresa, el peso de los paquetes que moviliza una empresa transportadora, el número vehículos que vende un concesionario, etc.Las variables cuantitativas se pueden clasificar, también, en discretas o continuas:

Variables cuantitativas discretas son las que únicamente pueden tomar valores enteros tales como número de vehículos que vende un concesionario o el número de personas que asisten a una sala de cine

Variables cuantitativas continuas son las que se refieren a mediciones de magnitudes físicas o características apreciables en unidades monetarias y admiten valores fraccionarios o decimales tales comel peso de los paquetes que moviliza una transportadora, los saldos de las cuentas de ahorro de una entidafinanciera o el tiempo que dura el recorrido de un bus urbano.

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

Page 6: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 6/63

UNIDADES TECNOLÓGICAS DE SANTANDER

CENSO Es cuando se observa y registra el estado de una característica examinado a todos los elementos de unpoblación

Los censos rara vez se realizan debido al tiempo que demandan y a la cantidad de recursos que necesitapor lo que se recurre a tomar datos del estado de la variable en algunos de los elementos de la población

MUESTRA Es cuando se observa y registra el estado de una característica variable examinado a una parte de loelementos que pertenecen a una población

Las muestras deben ser representativas y para esto se requiere que las características de la población estérepresentadas en la muestra, en la misma proporción en que están incluidas en la población.

TAMAÑO DE LA MUESTRAEs el número de elementos que componen la muestra

PARÁMETRO Es el resultado de una medida o cálculo que se hace utilizando todos los datos relacionados con el valor q

toma una característica variable cuando se observan todos los elementos de una población, es decir, cuandse hace un censo. Por ejemplo, la edad promedio de los niños que cursan primer grado, este año, en todlas escuelas oficiales de la ciudad. El parámetro siempre es un valor constante.

ESTADÍSTICOEs el resultado de una medida o cálculo que se hace utilizando todos los datos relacionados con el valor qtoma una característica variable cuando se observan algunos de los elementos de una población, o sea, unmuestra. Por ejemplo, la edad promedio de los niños de primer grado de algunas escuelas oficiales de ciudad escogidas al azar. El estadístico es un valor que varía de muestra en muestra

TIPOS DE ESTUDIOS ESTADÍSTICOSLos estudios estadísticos pueden ser experimentales y de observación

En los estudios estadísticos experimentales el investigador controla o manipula una o varias variables cel fin de determinar su comportamiento en determinadas condiciones

En los estudios estadísticos de observación el investigador registra el estado de la característica variabque le interesa sin ejercer ninguna influencia sobre ella. El estudio estadístico de observación mas común ela encuesta.

UNIDAD DE OBSERVACIÓN O DE INVESTIGACIÓN Se llama Unidad de Observación o de Investigación a alguno de los siguientes conceptos: Al nombre genérico, que se le da a los elementos cuya característica se está registrando

A la entidad que se investiga o de la que se recolectan los datos

Al soporte de donde se extraen los datos

ESTADÍSTICAS Es cualquier conjunto ordenado de datos como por ejemplo las estadísticas de un torneo de fútbol, lasestadísticas de ventas de una empresa o las estadísticas de accidentes

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

Page 7: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 7/63

UNIDADES TECNOLÓGICAS DE SANTANDER

ARREGLO DE DATOS DE VARIABLE CONTINUAINTRODUCCIÓNPara visualizar las características de una situación representada por un conjunto de datos o establecer patrón de comportamiento de esta situación, los datos se deben organizar de alguna manera. La Estadísticpropone una metodología que consiste en agrupar los datos recolectados en clases estadísticas

CONCEPTO DE CLASEEn general, una clase es un conjunto de elementos que tienen una o varias características en común, pejemplo, las personas que compiten en algún deporte pertenecen a la clase de los deportistas, las personamayores de 60 años pertenecen a la clase de la tercera edad

CLASE ESTADÍSTICAEn estadística se llama clase, únicamente, a un conjunto de datos que están dentro de un intervadeterminado de valores. Por ejemplo, para datos correspondientes a ingresos de personas podemos creuna clase de las personas que tienen ingresos entre $500.000 y $800.000. Toda clase estadística tiene, plo tanto, un límite inferior ( $500.000 ), y un límite superior ( $800.000 )

AMPLITUD DE CLASEEs la distancia o diferencia que hay entre los límites de una clase. En el ejemplo anterior la amplitud de

clase de ingresos es de $300.000. Es decir, que para calcular la amplitud de clase se resta del límsuperior de la clase el límite inferior.

Para expresar estas ideas en símbolos, llamamos A a la amplitud de la clase, LS al límite superior de la clasy LI al límite inferior de la clase, expresando aritméticamente la amplitud de la clase así:

A = LS – LI

Para el ejemplo: A = LS - LI = $800.000 - $500.000 = $300.000

Entonces, para visualizar las características de un conjunto de datos, la Estadística propone que se agrupeestos datos en intervalos de valores o “clases”

CARACTERÍSTICAS DE LAS CLASES ESTADÍSTICASToda clase estadística, para que pueda ser considerada como tal, debe cumplir con las siguientes trescaracterísticas: Amplitud constante Mutuamente excluyentes Exhaustivas

Amplitud constante se refiere a que la amplitud de las clases en que se agrupa un determinado conjuntode datos debe ser la misma para todo el conjunto de datos

Clases mutuamente excluyentes se refiere a que cualquier dato, de un conjunto de datos en estudio, debcorresponder únicamente a una sola clase

Clases exhaustivas se refiere a que las clases que se establezcan para agrupar a un conjunto de datosdeben agrupar a todos los datos recolectados

NÚMERO DE CLASESLa primera inquietud que surge cuando se van a agrupar un conjunto de datos en clases estadísticas es ecuantas clases es conveniente o adecuado agrupar estos datos. Hay varios criterios para resolver esproblema: El número de clases es determinado por una circunstancia deseable u obligante Determinar el número de clases de clases orientándose por una norma empírica de la estadística

Determinar el número de clases utilizando la expresión empírica: No.C = 2K 

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

Page 8: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 8/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Determinar el número de clases utilizando la expresión empírica: No.C = 1 + 3,3 log( n ) Otros criterios

El primer caso se presenta, por ejemplo, cuando el estudio actual se va a comparar con un estudio anteriorun estudio realizado por otro investigador. Entonces, para facilitar las comparaciones entre los dos estudioes deseable que los datos del estudio actual se agrupen con el mismo número de clases del estudio anteri

La norma empírica de la estadística indica que el número de clases en que se deben agrupar cualquier conjunto de datos debe ser como mínimo 5 ó 6 clases y como máximo alrededor de 20 clases

En la expresión No.C = 2K, No.C es abreviatura de número de clases y K indica las clases en que, segúnesta expresión, se deben agrupar los datos.

Para un estudio contiene 155 datos esta expresión funciona así:

Sí K = 6 clases, entonces, No.C = 26 = 64 como 64 < 155 el número de clases igual a 6 no es convenientSí K = 7 clases, entonces, No.C = 27 = 128 como 128< 155 el número de clases igual a 7 no es convenienSí K = 8 clases, entonces, No.C = 28 = 256 como 256> 155 el número de clases igual a 8, según esteprocedimiento, es al más adecuado para agrupar los 155 datos del estudio.

En la expresión No.C = 1 + 3,3 log( n ), No,C es también, abreviatura de número de clases, log se refiea logaritmo con base 10 y n es la cantidad de datos que se desean agrupar 

Para el estudio de 155 datos se tiene: No.C = 1 + 3,3 log(155) = 8,23, quiere decir que el númeconveniente de clases, para agrupar estos 155 datos está entre 8 y 9 clases

Otros criterios pueden ser, por ejemplo, números de clases que hacen que los límites de las clases seamuy fáciles de establecer o que las clases automáticamente queden mutuamente excluyentes.

EJEMPLO PRÁCTICOLa siguiente tabla se refiere a los galones de gasolina corriente que tanquearon la semana pasada, en unautoservicio, una muestra de vehículos escogidos al azar 

3,8 1,7 2,8 2,0 2,5 1,8 2,9 3,6 2,2 3,0

2,8 4,7 3,3 6,9 5,0 2,6 4,0 2,7 4,1 3,4

4,8 5,3 4,9 3,0 3,9 2,0 5,6 2,3 4,5 2,9

6,1 3,0 1,9 6,4 2,6 2,0 2,0 2,6 3,1

PROCEDIMIENTO PARA PRINCIPIANTES1. Establecer el número de clases de acuerdo al volumen de datos ( No.C )2. Determinar los valores máximo y mínimo del conjunto de datos: Xmax y Xmin3. Calcular el Rango, R = Xmax – Xmin4. Calcular la amplitud de las clases A = R/ No.C5. Modificar la amplitud teniendo en cuenta los decimales de los datos ( Amod )

6. Ajustar el rango ( Rmod ), para que coincida con la nueva amplitud modificada7. Ajustar Xmin o Xmax o ambos para que coincidan con el rango modificado8. Construir los límites de las clases9. Verificar que las clases cumplan con las tres características de las clases estadísticas10. Establecer el número de observaciones dentro de cada clase ( FA ) ( tabla de conteo )11. Calcular la frecuencia relativa ( FR )12. Ajustar la frecuencia relativa para que la suma de igual a 113. Calcular la frecuencia relativa acumulada ( FRA )

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

Page 9: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 9/63

UNIDADES TECNOLÓGICAS DE SANTANDER

DESARROLLO DEL EJEMPLO1. Determinar el número de clases

No existe ninguna circunstancia que haga conveniente o deseable un determinado número de clases

Se puede escoger cualquier número de clases entre 5 y 20 dependiendo del criterio o preferencia person

del analista y se hacen varios tanteos hasta encontrar un número de clases satisfactorio

Aplicando la fórmula No.C = 2k Para K = 5 entonces 25 = 32 < 39 quiere decir que 5 no es un número conveniente de clasesPara K = 6 entonces 26 = 64 > 39 quiere decir que 6 es el número conveniente de clases

Aplicando la fórmula No.C = 1 + 3,3logn = 1 + 3,3log (39) = 6,25 quiere decir que el número de clasesconveniente está entre 6 y 7

En un primer ensayo se escogió, para este ejemplo, agrupar los datos en 6 clases

Los pasos 2 a 7 se presentan encuentran en la siguiente tabla

ARREGLO DE DATOS CONTINUOS EN 6 CLASES

Xmax = 6,9 A = 0,87 X´min = 1,5Xmin = 1,7 Amod = 0,9

R = 5,2 Rmod = 5,4No.C = 6 Rmod-R = 0,2

X´min se refiere al límite inferior de la primera clase

Los pasos restantes están desarrollados en la siguiente tabla

 

CLASES

Menor 

No. FA FAA FR FRA Que FRA

1 1,5 2,4 9 9 0,23 0,23 1,5 02 2,4 3,3 14 23 0,36 0,59 2,4 0,23

3 3,3 4,2 6 29 0,15 0,74 3,3 0,59

4 4,2 5,1 5 34 0,13 0,87 4,2 0,74

5 5,1 6,0 2 36 0,05 0,92 5,1 0,87

6 6,0 6,9 3 39 0,08 1,00 6,0 0,92

39 1,00 6,9 1,00

Esta tabla recibe el nombre de Distribución de Frecuencias. Los detalles de su construcción seránexplicados por el docente en la exposición que haga sobre este tema

LA DISTRIBUCIÓN DE FRECUENCIAS

Es la tabla compuesta por la columna CLASES y por una o varias de las siguientes columnas defrecuencias:

Frecuencia Absoluta FA: Es la cantidad de datos de la muestra que corresponden a cada clase. Seobtiene por conteo

Frecuencia Absoluta Acumulada FAA: Se obtiene, para cada clase, sumando la frecuencia absolutade la clase, FA, con la frecuencia absoluta de la clase anterior 

Frecuencia Relativa FR: Se calcula, para cada clase, dividiendo la frecuencia absoluta de la clase, FAentre el total de datos de la muestra. Es práctico que los valores de la frecuencia relativa se tomen con

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página

Page 10: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 10/63

UNIDADES TECNOLÓGICAS DE SANTANDER

dos decimales y su suma se ajuste para que dé exactamente uno

Frecuencia Relativa Acumulada FRA: Se calcula, para cualquier clase, sumando la frecuencia relativde la clase, FR, con la frecuencia relativa de la clase anterior 

LECTURA DE LA DISTRIBUCIÓN DE FRECUENCIAS

Esta tabla permite describir la situación histórica de la venta de gasolina en esta estación de servicio, pejemplo, la mayoría de los vehículos de la muestra, un 36%, tanquearon entre 2,4 y 3,3 galones dgasolina, el 5% de los vehículos de la muestra tanquearon entre 5,1 y 6,0 galones de gasolina y fue la clascon menor frecuencia de tanqueo. Solamente tres vehículos de la muestra tanquearon mas de 6,0 galones

LA TABLA MENOR QUEEs una tabla auxiliar que se construye a partir de las distribuciones de frecuencias acumuladas, FAA y FRcon el fin de facilitar la descripción de la situación utilizando estas frecuencias. Esta tabla se encuentra lado de la tabla de distribución de frecuencias y se utilizó, en este caso, la columna de frecuencia relativacumulada.

Observando esta tabla se puede ver que el 59% de los vehículos de la muestra tanquearon menos de 3galones de gasolina o que el 13% de los vehículos de la muestra tanquearon mas de 5,1 galones

REPRESENTACIÓN GRÁFICA DE LA SITUACIÓN EN ESTUDIOLa Estadística Descriptiva utiliza tres tipos de gráficos para representar cualquier situación o fenómeno enestudio: El histograma El polígono de frecuencias La ojiva

Estos gráficos permiten visualizar de manera fácil y rápida los resultados que se presentan en la distribucióde frecuencias

EL HISTOGRAMAEs un gráfico de frecuencia absoluta, FA o la frecuencia relativa, FR, donde las clases se representa

mediante rectángulos. El siguiente histograma se refiere al ejemplo práctico y se utilizó la frecuencia relativ

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 11: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 11/63

UNIDADES TECNOLÓGICAS DE SANTANDER

EL POLÍGONO DE FRECUENCIASSe hace a partir del histograma uniendo las marcas de clase proyectadas sobre el lado superior de lorectángulos y agregando, para cerrar la figura, dos clases adicionales, una, por encima del límite superior dla clase más alta y la otra, por debajo del límite inferior de la clase más baja

Para construir el polígono de frecuencias necesitamos introducir el concepto de Marca de Clase

MARCA DE CLASEEs el punto medio de una clase. Se calcula sumando los límites de cada clase y dividiendo este total por 2.El símbolo que usualmente se utiliza para representar la marca de clase es X i 

La expresión matemática de la marca de clase es:

 X i   =

Donde LS es el límite superior de la clase y LI es el límite inferior de la clase. Por ejemplo, para construir lamarca de clase de la primera clase se procede así:

 X i   = = 1,95

Las marcas de clase se utilizan, también, cuando se requiere representar todos los valores de una clase poun solo número. Por ejemplo, 1,95 galones representa todos los valores de la muestra que se encuentranentre 1,5 galones y 2,4 galones

Tanto el histograma como el polígono de frecuencias permiten visualizar algunas de las características de lasituación o fenómeno que se está estudiando, tales como: El rango de los datos Alrededor de qué valores tienden a agruparse los datos

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 12: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 12/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Valores de la muestra que se presentan con más o menos frecuencia A qué lado de la gráfica parecen agruparse más los datos

Los demás detalles de la construcción del polígono de frecuencias serán explicados por el docente en laexposición que haga sobre este tema

LA OJIVALa ojiva es un gráfico de frecuencias acumuladas que describe que cuantas unidades o qué porcentaje deunidades se encuentran por encima o por debajo de un determinado valor de la variable.

Este gráfico se construye a partir de la tabla MENOR QUE, utilizando la frecuencia absoluta acumulada, FAo la frecuencia relativa acumulada, FRA. En el gráfico que se presenta a continuación se utilizó la frecuencrelativa acumulada.

Los detalles sobre la construcción de estos gráficos serán explicados por el docente en la exposición quehaga sobre este tema

LA INTERPOLACIÓNEn general, la interpolación, es un método de cálculo para establecer el valor de la ordenada de un valor dla variable que se encuentra “dentro” de otros valores ya calculados en una tabla. En el caso de Estadística Descriptiva, se utiliza para calcular valores de la frecuencia absoluta acumulada, FAA o de frecuencia relativa acumulada, FRA, correspondientes a valores de la variable que no se encuentran en tabla MENOR QUE, pero que están dentro de los valores mínimo y máximo recolectados en el estudio.

Por ejemplo, si se quiere saber qué porcentaje de los vehículos tanquearon mas de 4,8 galones de gasolinal buscar este valor en la tabla MENOR QUE se detecta que aunque no está tabulado, se encuentra entlos valores de la variable 4,2 y 5,1 galones. Con esta información se pueden disponer los datos existenteslos buscados de la siguiente manera:

X0 =  4,2 Y0 = 0,74X1 = 4,8 Y1 = ?X2 = 5,1 Y2 = 0,87

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 13: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 13/63

UNIDADES TECNOLÓGICAS DE SANTANDER

La expresión matemática que permite realizar el cálculo de interpolación es la siguiente:

Y´1  = Y0  + (Y2 - Y0)

Reemplazando los símbolos por los valores se tiene:

Y´1  = 0,74 + ( 0,87 - 0,74 ) = 0,827 0,83

Esto quiere decir que el 83% de los vehículos de la muestra tanquearon menos de 4,8 galones, pero, comose quiere saber es que porcentaje tanqueó mas de 4,8 galones, se debe restar el resultado anterior de 1

1 - 0,83 = 0,17 = 17% = porcentaje de vehículos de la muestra que tanquearon mas de 4,8 galones

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 14: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 14/63

UNIDADES TECNOLÓGICAS DE SANTANDER

ARREGLO DE DATOS DE VARIABLE DISCRETA

PROCEDIMIENTO PARA PRINCIPIANTES

1. Establecer el número de clases de acuerdo al volumen de datos ( No.C )2. Determinar los valores máximo y mínimo del conjunto de datos: Xmax y Xmin3. Calcular el Rango, R = Xmax – Xmin4. Calcular la amplitud de las clases A = R/ No.C5. Cortar a enteros la amplitud (Amod)6. Tomar Xmin como el límite inferior de la primera clase7. Construir los límites de las clases con extremos cerrados8. Construir las clases que se requieran para que quede incluido, en la última clase, el Xmax

Al construir las clases con este procedimiento automáticamente quedan con las tres condiciones de lasclases estadísticas, es decir, de amplitudes constantes, mutuamente excluyentes y exhaustivas.

A continuación se ejecutan, de manera idéntica, los pasos 10 a 13 del procedimiento para variable continua

EJEMPLO PRÁCTICOUna muestra de 41 días del número de transacciones que se realizan por día un cajero automático sepresenta en la siguiente tabla:

73 68 76 71 60 41 91 67 85

83 56 79 62 64 87 66 74

87 91 78 49 91 72 63 68

47 81 54 90 77 63 52 75

80 84 36 67 51 45 61 57

DESARROLLO DEL EJEMPLO1. Establecer el número de clases

Utilizando la expresión logaritmíca se tiene:

No.C = 1 + 3,3 log (41) = 6,3 que indica que un número conveniente de clases para esta cantidad de datoes 6 ó 7clases. Para este ejemplo se tomaron 6 clases

Los pasos 2 a 8 se ejecutan en la siguiente tabla:

Xmax = 91Xmin = 36R = 55

No.C = 6

A = 9,16667

Amod = 9

Menor No. CLASES FA FR FRA Que FRA1 36 45 3 0,07 0,07 36 02 46 55 5 0,12 0,19 46 0,073 56 65 8 0,20 0,39 56 0,194 66 75 10 0,24 0,63 66 0,395 76 85 9 0,22 0,85 76 0,636 86 95 6 0,15 1,00 86 0,85

41 1,00 96 1,00

En la parte derecha de la tabla se puede observar que para construir la amplitud modificada, se borra toda parte decimal de la amplitud A calculada. Se observa, también, que el límite inferior de cada clase es igual

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 15: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 15/63

UNIDADES TECNOLÓGICAS DE SANTANDER

límite inferior de la clase anterior mas uno. También se puede ver que el límite superior de la última clas(95), no coincide con el Xmax (91), de los datos y el límite inferior de la primera clase es el Xmin (36), de ldatos.

Las clases construidas de esta manera se llaman CLASES CERRADAS, porque en cada clase se contabilizatodos los datos incluidos entre los dos límites de la clase. Sin embargo, estas clases, como se pued

observar, son de amplitudes constantes, mutuamente excluyentes y exhaustivas.

También se observa que la tabla MENOR QUE, se construye de manera un poco distinta a como se hizpara el caso de variable continua, nótese que el último valor de la columna Menor Que, no es igual al límisuperior de la última clase, sino a ése valor mas uno.

REPRESENTACIÓN GRÁFICA

HISTOGRAMAPara el caso de variable discreta el histograma, recibe también el nombre de DIAGRAMA DE FRECUENCIASen él las clases se encuentran separadas, como se ve en el siguiente gráfico:

Con frecuencia, en lugar de identificar cada clase con sus límites de clase, es más práctico utilizar la marca de clase,como se muestra en este gráfico, a continuación

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 16: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 16/63

UNIDADES TECNOLÓGICAS DE SANTANDER

POLÍGONO DE FRECUENCIASSe construye de la misma manera, a partir del diagrama de frecuencias y las marcas de clase, como se hizen el caso de variable continua. Nótese que en esta gráfica se presenta una distorsión debido a que lasclases no son adyacentes

Cuando la amplitud modificada es un número impar, las marcas de clase son valores fraccionarios, comoocurre en este ejemplo; esta situación es incómoda porque no refleja la realidad en los casos de variablediscreta, por lo que se prefiere agrupar los datos en clases que sean de amplitud par, como se presenta acontinuación, para el mismo ejemplo, donde la amplitud se cambió de 9 transacciones por día a 8transacciones por día

Menor 

No. CLASES FA FR FRA Que FRA

1 36 44 2 0,05 0,05 36 0

2 45 53 5 0,12 0,17 45 0,05

3 54 62 6 0,14 0,31 54 0,17

4 63 71 9 0,22 0,53 63 0,31

5 72 80 9 0,22 0,75 72 0,53

6 81 89 6 0,15 0,90 81 0,75

7 90 98 4 0,10 1,00 90 0,90

41 1,00 99 1,00

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 17: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 17/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Ahora es mucho más fácil leer el diagrama de frecuencias, por ejemplo, en el 14% de los días de la muestrse realizaron 58 transacciones, el número de transacciones por día menos frecuente, en la muestra, fue de40 transacciones por día

OJIVACuando la variable es discreta, como en este caso, la ojiva se construye de forma diferente, porque variable sólo toma valores enteros, aunque, aquí también, este gráfico se construye a partir de la tabMENOR QUE

Los detalles sobre la construcción de este gráfico serán explicados por el docente en la exposición que hagsobre este tema

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 18: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 18/63

UNIDADES TECNOLÓGICAS DE SANTANDER

ARREGLO DE DATOS PARA VARIABLE DISCRETA EN CLASES DE AMPLITUD CERO

Cuando el intervalo de valores que toma la variable es reducido y la variable es discreta, es más práctiagrupar los datos en clases de amplitud cero, como se muestra en el siguiente caso. Aquí X simboliza lvalores que toma la variable que son al mismo tiempo las clases estadísticas. Estas clases cumplen con latres características de una clase estadística: son de amplitud constante, son mutuamente excluyentes y so

exhaustivas

EJEMPLOSe tomó una muestra de 60 facturas registrando el número de errores por factura. Los resultados sepresentan en la siguiente tabla:

1 0 1 2 0 0 1 0 0 12 1 1 1 0 1 4 0 0 00 3 0 0 1 0 1 2 2 04 1 1 0 0 0 1 0 0 12 2 0 3 3 1 0 2 2 00 0 3 1 2 2 0 1 1 1

MENORX FA FR FAA FRA QUE FRA0 25 0,42 25 0,42 0 01 19 0,32 44 0,73 1 0,422 10 0,17 54 0,90 2 0,733 4 0,07 58 0,97 3 0,904 2 0,03 60 1,00 4 0,97

60 1,00 5 1,00

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 19: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 19/63

UNIDADES TECNOLÓGICAS DE SANTANDER

ARREGLO DE DATOS CUALITATIVOS

Cuando la variable es cualitativa, el arreglo y presentación de datos estadístico es limitado. Sólo se puedconstruir distribuciones de frecuencias con las frecuencias absolutas y relativas y diagramas de frecuenciaAdicionalmente, se utilizan en estos casos otros tipos de gráficos como se presenta en el siguiente ejemplo

EJEMPLOSe interrogó a una muestra de clientes de una cafetería sobre el tipo de bebida gaseosa que prefierenobteniéndose los siguientes resultados:

Cocacola Quatro Pepsicola Cocacola Postobón Link Postobón

Postobón Pepsicola Seven Up Pepsicola Cocacola Cocacola Quatro

Quatro Link Cocacola Postobón Pepsicola Sprite Pepsicola

Sprite Cocacola Postobón Cocacola Postobón Cocacola Postobón

Cocacola Quatro Pepsicola Link Cocacola Postobón Sprite

 

No. CLASES FA FR1 Cocacola 10 0,292 Link 3 0,093 Pepsicola 6 0,174 Postobón 8 0,235 Quatro 4 0,116 Seven Up 1 0,037 Sprite 3 0,08

35 1,00

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 1

Page 20: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 20/63

UNIDADES TECNOLÓGICAS DE SANTANDER

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 21: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 21/63

UNIDADES TECNOLÓGICAS DE SANTANDER

UNIDAD 2: MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN

MEDIDAS DE TENDENCIA CENTRAL

1. FORMAS ESTADÍSTICAS DE DESCRIBIR UN FENÓMENO

Anteriormente se vio que los fenómenos o hechos se pueden describir con tablas y gráficos pero, también pueden describir con números

2. CONCEPTO DE MEDIDA EN ESTADÍSTICAEn estadística se llama medida a un cálculo u operación que se realiza sobre un conjunto de datos paextraer alguna información

EJEMPLOS Calcular la estatura promedio de un grupo de personas Hallar la diferencia entre el mayor y el menor valor de un conjunto de datos Establecer el valor que más se repite dentro de un conjunto de datos

3. PARÁMETROS Y ESTADÍSTICOS

En la unidad anterior se vio que los cálculos o medidas que se realizan con los datos referidos a unsituación pueden clasificarse de dos maneras:Parámetros: Cuando el cálculo se realiza con todos los datos de la población. Los parámetros son valoreconstantesEstadísticos: Cuando el cálculo se realiza con una parte de los datos de la población, es decir, unmuestra. Los estadísticos son variables

4. CLASES DE MEDIDAS EN ESTADÍSTICAEn estadística existen dos clases de medidas: Las medidas de tendencia central Las medidas de tendencia no central o de posición Las medidas de dispersión|5. LAS MEDIDAS DE TENDENCIA CENTRALSon tres valores, con cada uno de los cuales, se pretende describir, parcialmente, el comportamiento de umuestra o de una población.

Las medidas tendencia central, reciben este nombre porque al representar el resultado de un cálculo en ugráfico de una distribución de frecuencias (histograma o polígono de frecuencias), el valor calculado siempse sitúa hacia el centro de la gráfica.

6. LAS MEDIDAS DE DISPERSIÓNLas medidas de dispersión son cálculos o valores que indican que tan concentrados están los datoalrededor de un valor especial que se toma como referencia

7. MEDIDAS PARA POBLACIONES Y MEDIDAS PARA MUESTRASLas medidas de tendencia central y de dispersión pueden clasificarse como Parámetros o Estadístico

según sea que los datos utilizados correspondan a una población o a una muestra.

Los cálculos de las medidas de tendencia central y de dispersión para poblaciones, en algunos casos, sodiferentes de los cálculos de las medidas de tendencia central y de dispersión para muestras, por lo que utilizan, en estos casos, símbolos diferentes para cada tipo de medida.

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 22: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 22/63

UNIDADES TECNOLÓGICAS DE SANTANDER

8. CLASES DE MEDIDAS DE TENDENCIA CENTRALExisten tres clases de medidas de tendencia central: La media aritmética o promedio La mediana La moda

9. LA MEDIA ARITMÉTICAExisten dos tipos de media aritmética: la Media Aritmética Simple y la Media Aritmética Ponderada. A media aritmética simple se le llama usualmente La Media y la forma de calcularla depende de sí los datestán o no agrupados en clases. 9.1 MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOSLa media aritmética, para datos no agrupados, se calcula sumando los valores registrados de la variable eestudio y dividiendo entre el total de estos valores registrados. La expresión matemática de este cálcutiene dos presentaciones: una sí los datos registrados corresponden a una población y otra sí los datocorresponden a una muestra, tal como se indica a continuación.

µ = N 

 Xi∑ Para Poblaciones = n

 Xi∑  Para Muestras

El significado de los símbolos es el siguiente:µ Es la letra del alfabeto griego “mu”, simboliza la media aritmética calculada para una población

Se lee equis trazo o equis barra, simboliza la media aritmética calculada para una muestraN Es el número de valores que toma la variable, en estudio, en la poblaciónn Es el número de valores que toma la variable, en estudio, en la muestra

Es cada uno de los valores que toma la variable en la muestra o en la población

EJEMPLOLas comisiones que un vendedor ha recibido en los 6 primeros meses del año se presentan en la siguien

tabla:

Calcular la media aritmética einterpretar el significado

La expresión para calcular la media aritmética indicaque se deben sumar todos los valores que toma lavariable y dividir por el número de datos

=

= $900 miles

Como esta forma de cálculos es poco práctica sesuman, mejor, los datos en columna como se muestra acontinuación

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Ingresos

MES (Miles de $ )

Enero 800

Febrero 950

Marzo 920

Abril 1000

Mayo 830

Junio 900

Page 23: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 23/63

UNIDADES TECNOLÓGICAS DE SANTANDER

SOLUCIÒN:

Ingresos

MES (Miles de $ )

Enero 800

Febrero 950

Marzo 920

Abril 1000

Mayo 830

Junio 900

Suma 5400

 

= 5400

= = $900 miles

Interpretación: La media aritmética es el mismopromedio y es como sí en cada uno de los 6 meses elcomisionista hubiera ganado $900.000

9.2 MEDIA ARITMÉTICA PARA DATOS AGRUPADOSLa media aritmética se calcula sumando los productos de las marcas de clase por sus respectivfrecuencias absolutas y dividiendo esta suma por el número total de datos registrados

µ = N 

 XiFAi∑ Para Poblaciones =n

 XiFAi∑ Para Muestras

el significado de los símbolos es el siguiente:µ Es la letra del alfabeto griego “mu”, simboliza la media aritmética calculada para una población

Se lee equis trazo o equis barra, simboliza la media aritmética calculada para una muestraN Es el tamaño de la poblaciónn Es el tamaño de la muestra

Es la marca de clase de cada una de las clases en que se han agrupado los datosEs la frecuencia absoluta de cada una de las clases en que se han agrupado los datos

EJEMPLOUna muestra de las facturas que se cancelan con tarjetas de crédito en una cadena de almacenes de modse presenta en la siguiente tabla:

Ventas No. de

(Miles de $) Facturas

30 36 25

36 42 3842 48 49

48 54 51

54 60 32

60 66 29

224Calcular la media aritmética einterpretar el significado

Como se debe calcular la marca de clase de cada clase ymultiplicar cada uno de esto valores por su respectivafrecuencia absoluta, estas operaciones es más prácticorealizarlas en forma tabular, como se muestra acontinuación:

Ventas No. de(Miles de $) Facturas Xi XiFAi

30 36 25 33 825

36 42 38 39 1.482

42 48 49 45 2.205

48 54 51 51 2.601

54 60 32 57 1.824

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 24: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 24/63

UNIDADES TECNOLÓGICAS DE SANTANDER

60 66 29 63 1.827

224 10.764

SOLUCIÒN:El total de la cuarta columna es = 10.764 y el total de datos, n, es 224, por lo que la mediaaritmética buscada es:

= = $48.054 miles

Interpretación: El valor de promedio de cada factura pagada con tarjeta de crédito es de $48.054 miles, quees como si cada factura fuera de este valor 

9.3 SIGNIFICADO DE LA MEDIA ARITMÉTICALa media aritmética o promedio calculada para un conjunto de datos significa que al remplazar el valpromedio por cada uno de los datos se obtiene el mismo resultado general

10. MEDIA ARITMÉTICA PONDERADA

Existen situaciones en las cuales los datos registrados sobre una situación traen in formación adicional quindica que estos valores no tienen la misma importancia relativa, como se presenta en el siguiente caso:

EJEMPLOLas notas obtenidas por un estudiante en 3 quices de un corte y las notas finales, del semestre, extraídas dpolígrafo correspondiente, se presentan en la siguiente tabla:

PRUEBA NOTAQuiz No.1 3.5Quiz No.2 4.1Quiz No.3 2.4Promedio 3.3

ASIGNATURANOTAFINAL CRÉDITOS

A 4.9 2B 3.1 4C 3.0 3

En el caso de los quices no existe ninguna información que permita pensar que estas tres notas tienediferente nivel de importancia, por lo que su promedio se puede calcular utilizando la fórmula de la medpara datos no agrupados, lo que no ocurre para el caso del polígrafo donde, por ejemplo, la nota de asignatura B vale el doble que la nota de la asignatura A; en casos como este, para calcular el promedio, utiliza una variante de la media aritmética que recibe el nombre de Media Aritmética Ponderada o PromedPonderado, cuya expresión matemática es la siguiente:

p = Media aritmética ponderada

 

p Es el símbolo de la media ponderadaRepresenta los valores que toma la variable. En el ejemplo, las notas (4.9, 3.1 y 3.0)

Representa el valor relativo de cada uno de los datos, llamados Factores de Ponderación. En ejemplo, los créditos de cada una de las asignaturas (2, 4 y 3)

Aplicando la fórmula al ejemplo se tiene:

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 25: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 25/63

UNIDADES TECNOLÓGICAS DE SANTANDER

 NOTAFINAL CRÉDITOS

ASIGNATURA Xi Wi XiWi

A 4,9 2 9,8

B 3,1 4 12,4C 3.0 3 9.0

Suma 9 31,2

= 31.2

= 9

 P = 3.47

Sí para este caso del polígrafo el promedio se calculara como media aritmética simple, ignorando información de los créditos, este cálculo daría 3.7 que es diferente del promedio ponderado que da un vade 3.47

11. PROPIEDADES DE LA MEDIA ARITMÉTICA El cálculo de la media aritmética tiene en cuenta todos los valores de la variable en estudio registrados A todas las variables cuantitativas se les puede calcular la media aritmética

Un conjunto de datos sólo tiene una media La media permite hacer comparaciones entre poblaciones o muestras La media se puede trabajar matemáticamente La media es afectada por los valores extremos No se puede calcular la media en distribuciones de frecuencias que tienen clase de extremo abierto

12. LA MEDIA GEOMÉTRICAEn muchas situaciones los datos se presentan en valores relativos tales como porcentajes o proporcioneEn tales casos el procedimiento de cálculo de la media, que se ha estado utilizando hasta ahora, puedapartarse de los resultados reales sí la variabilidad de los datos es alta.

12.1 CÁLCULO DE LA MEDIA GEOMÉTRICAExiste, entonces, una expresión matemática especial para calcular promedios en los casos en que los datoprovengan de tasas de interés, porcentajes o números índices, entre otros. A este expresión matemática le llama la media geométrica y se suele representar por la letra G

G = )...().........3)(2)(1( FCn FC  FC  FC n

G Es el símbolo de la media geométrica

FC1, FC2…..FCn se llaman Factores de Crecimiento

El índice de la raíz depende del número de factores de crecimiento. Sí los factores de crecimiento son 2, raíz es cuadrada, sí los factores de crecimiento son 6 la raíz es sexta y así sucesivamente.

Los factores de crecimiento, FCi , se determinan con la siguiente expresión:

FC = 1 +

Como el valor en porcentaje se llama comúnmente Tasa, la expresión, más apropiada, para el Factor dCrecimiento es:

FC = 1 +

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 26: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 26/63

UNIDADES TECNOLÓGICAS DE SANTANDER

EJEMPLOLa rentabilidad de un título valor ha estado variando en las últimas semanas como se presenta en siguiente tabla:

Renta-

Semana bilidad

1 3%

2 1%

3 -2%

4 0,7%5 1,5%

6 1%¿A qué tasa promedio semanal ha estadovariando la rentabilidad de este título?

Para aplicar la fórmula, las tasas derentabilidad se deben convertir a factores decrecimiento

Renta-

Semana bilidad FC

1 3% 1,03

2 1% 1,01

3 -2% 0,984 0,7% 1,007

5 1,5% 1,015

6 1% 1,01

Con los factores de crecimiento, de la tercera columna, se calcula GG =

G = 1.008557 (Factor de crecimiento promedio)

Como las unidades de este cálculo son Factores de Crecimiento, para convertir este resultado en tasa, despeja ésta de la última fórmula

FC = 1 + ==== Tasa = ( FC – 1 )x100 

Por lo tanto:Tasa promedio = (1.00856 – 1 ) x 100 = 0.856% 0.9%

Respuesta: El título ha estado aumentado a una tasa promedio del 0.9% semanal

Cuando los datos se presentan en valores absolutos, pero, se debe calcular un porcentaje promedio, lofactores de crecimiento se determinan como se indica en el siguiente ejemplo:

EJEMPLOLas ventas anuales de una empresa, en millones de pesos, se presentan en la tabla No.1. ¿A qué tapromedio anual están variando las ventas de esta empresa?

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 27: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 27/63

UNIDADES TECNOLÓGICAS DE SANTANDER

TABLA No.1

Ventas

AÑO(Millones

)

2001 68

2002 752003 32

2004 59

2005 73

2006 92

2007 108

Obsérvese que se pide la tasa promedio decrecimiento, que es un valor relativo y no laventa promedio anual, que es un valor absoluto.

Para convertir las ventas, que son valores

absolutos, en factores de crecimiento, sedivide el valor de un periodo cualquiera entreel valor del periodo inmediatamente anterior.

Por ejemplo, el factor de crecimiento del año2004 se consigue dividiendo 59 entre 32

Los demás cálculos se muestran en la tablaNo.2

TABLA No.2

Ventas

AÑO(Millone

s) FC

2001 68

2002 75 1,1029

2003 32 0,4267

2004 59 1,8438

2005 73 1,2373

2006 92 1,2603

2007 108 1,1739

Obsérvese que no se puede calcular el factor de crecimiento

del año 2001 porque no se conocen las ventas del año 2000.Con los datos de la tercera columna, FC, se calcula G

G =

G = 1.08017 (Factor de Crecimiento promedio)

Tasa Promedio = (1.08017 – 1) x 100 = 8.017%

Respuesta: Las ventas están creciendo a una tasa promediodel 8% anual

También se puede calcular la media geométrica para el caso de valores que varían en función del tiemposólo se conocen los valores iníciales y finales del periodo, como se puede ver en el siguiente ejemplo:

EJEMPLOUna persona invirtió $25 millones a 3 años, recibiendo al final de este periodo la suma de $33,306 millone¿A qué tasa promedio mensual creció esta inversión?

La expresión de la media geométrica para casos como este es la siguiente:

G =inicial valor 

  final valor n

Donde n es el número de periodos de tiempo durante el intervalo de la inversión

Para el caso del ejemplo la expresión se aplica así:

G = = 1.00800 (Factor de Crecimiento promedio)

Como la tasa que se pide es mensual el número de periodos es 36, por lo tanto, el índice de la raíz es 36

Para calcular la tasa promedio se aplica la expresión:

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 28: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 28/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Tasa = ( FC – 1 )x100 

Tasa promedio = (1.008 – 1) x 100

Tasa promedio = 0.8%

Es decir, la inversión está creciendo, en promedio al 0.8% mensual.

12.2 PROPIEDADES DE LA MEDIA GEOMÉTRICALa media geométrica siempre es menor o igual a la media aritmética, es decir: G ≤

12.3 USOS DE LA MEDIA GEOMÉTRICALa media geométrica se utiliza para calcular promedios de cantidades expresadas en porcentajes o eproporciones

13. LA MEDIANALa mediana es el valor que ocupa la posición central de un conjunto de datos cuando estos están ordenadode menor a mayor.

Para aclarar este concepto veamos el siguiente ejemplo:

EJEMPLOLa siguiente tabla presenta las notas obtenidas por una muestra de estudiantes en un examen

ESTUDIANTE NOTA ESTUDIANTE NOTAR. Martínez 4.3 L. Rueda 2.9P. Ardila 1.7 J. Zárate 4.0M. Castellanos 3.8 G. Torres 1.2A. Manjarrés 4.8 Z. Benítez 4.7O. León 3.5

Ordenando estos datos de menor a mayor donde el menor está en el extremo izquierdo y el mayor en extremo derecho de la fila se tiene:

1.2 1.7 2.9 3.5 3.8 4.0 4.3 4.7 4.8

El número que ocupa la posición central es 3.8 porque por debajo de él hay 4 datos y por encima otros 4, plo tanto, 3.8 es el valor mediano

13.1 INTERPRETACIÓN DE LA MEDIANAEl docente que tomó la muestra podría describir el comportamiento de los estudiantes en la prueba diciendque la mitad de las notas de la muestra se encuentran por debajo de 3.8 o por encima de 3.8

Alternativamente, el docente podría haber utilizado el promedio o media aritmética para describir comportamiento de los estudiantes en la muestra, como se vio anteriormente, pero, la mediana, entonces, eotra manera de describir una situación que es diferente de la media aritmética

13.2 SÍMBOLO DE LA MEDIANAEl símbolo utilizado, en estas notas, para representar la mediana es:

una equis con una onda en la parte superior que se lee equis mediana

El cálculo de la mediana para el caso de las notas se expresa así:

= 3.8

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 29: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 29/63

UNIDADES TECNOLÓGICAS DE SANTANDER

13.3 CÁLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOSNúmero impar de datosCuando en número de datos que componen la muestra es impar, como en el ejemplo de las notas, mediana se puede calcular por simple inspección como se hizo anteriormente. Pero, para situaciones qrepresenten un mayor número de datos existe una expresión matemática que es la siguiente.

=

Esta expresión indica que el valor mediano ocupa la posición (n + 1)/2 cuando los datos están ordenados eorden ascendente

Para aplicar esta expresión es preciso ordenar, entonces, los datos en orden ascendente e indicar posición u orden de cada dato como se muestra a continuación:

X1 X2 X3 X4 X5 X6 X7 X8 X9

1.2 1.7 2.9 3.5 3.8 4.0 4.3 4.7 4.8

Los Xi indican la posición de cada dato, por ejemplo, X7 indica que 4.3 ocupa la séptima posición cuandlos datos están ordenados de forma ascendente

Como el número de datos es 9, entonces (n+1)/2 es igual a 5, esto quiere decir que el valor mediano es valor que ocupa la quinta posición cuando los datos están ordenados de menor a mayor 

= = 3.8

tal como se había establecido anteriormente por simple inspección

Número par de datosCuando el número de datos sin agrupar es par, la expresión para calcular la mediana es la siguiente.

=2

12/2/ ++ nn X  X 

Esto quiere decir que el valor mediano es el resultado de promediar los valores que ocupan las posicione

2/n X  y 12/ +n X   

Para explicar esta expresión veamos el siguiente ejemplo:

EJEMPLOUna muestra de las estaturas, en metros, de 10 estudiantes de una clase se presentan en la siguiente tabla

ESTUDIANTE ESTATURA

ESTUDIANTE ESTATURA

M. Rodríguez 1.75 G. López 1.69L. Sánchez 1.68 H. Núñez 1.57D. Rojas 1.81 T. García 1.77J. Acevedo 1.65 R. Orduz 1.62F. Díaz 1.73 P. Pinzón 1.71

Al ordenar estos datos de forma ascendente e indicar la posición de cada uno de ellos se llega a la siguientabla:

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

1.57 1.62 1.65 1.68 1.69 1.71 1.72 1.75 1.77 1.81

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 2

Page 30: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 30/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Como se puede observar, en esta ocasión, no existe un valor único que se localice en el centro del conjunde datos ordenado, los valores X5 y X6 ocupan el centro de este conjunto y la mediana se localiza en el punmedio entre estos dos datos , por lo que para establecer su valor se promedian 1.69 y 1.71 así:

= 2

65X  X  +

= 2

71.169.1 +

= 1.70

Este valor se interpreta como que la mitad de los estudiantes de esta muestra miden menos de 1.70 metros se deja al lector de estas notas, que como ejercicio, verifique que la expresión de la mediana para númepar de datos produce el mismo resultado anterior 

13.4 CÁLCULO MEDIANA PARA DATOS AGRUPADOSRecordemos que cuando se habla de datos agrupados nos referimos a datos agrupados en clases

Se presentan dos casos para el cálculo de la mediana

Primer CasoLa frecuencia absoluta acumulada, FAA, hasta alguna de las clases, de la distribución de frecuenciacoincide con la cantidad total de datos dividida entre 2, es decir, ( n / 2), como se puede ver en el siguienejemplo:

EJEMPLOLos ingresos en una semana, en millones de pesos, de una muestra de tabernas se presenta en la siguientabla:

clase Ingresos No. DeNo. (Millones de $) tabernas FAA1 1,6 1,9 6 62 1,9 2,2 11 17

3 2,2 2,5 18 354 2,5 2,8 25 605 2,8 3,1 29 896 3,1 3,4 20 1097 3,4 3,7 11 120

Suma 120

Como se puede observar el número de datos de la muestra n es 120, por lo tanto, n/2 es 60 y este valcoincide con la frecuencia absoluta acumulada, FAA, hasta la cuarta clase. En este caso la mediana es igual límite superior de la cuarta clase, es decir:

= Límite superior de la clase = $2.8 millones

Este valor se puede interpretar diciendo que la venta mínima de la mitad de las tabernas de la muestra fude $2.8 millonesSegundo casoEl cálculo del total de datos de la muestra dividido entre 2, n/2, no coincide con el valor de la frecuencabsoluta acumulada, FAA, de ninguna de las clases

Para calcular la mediana en este caso se utiliza la siguiente fórmula de interpolación:

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 31: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 31/63

UNIDADES TECNOLÓGICAS DE SANTANDER

= + A

− −

i

i

 FA

 FAAn1

2/

  es el límite inferior de la clase que contiene la medianaA es la amplitud de las clases

  es la cantidad total de datos de la muestra dividida entre 2  es la frecuencia absoluta acumulada hasta la clase anterior a la clase que contiene la mediana

  es la frecuencia absoluta de la clase que contiene la mediana

Para saber cuál es la clase que contiene la mediana se compara n/2, el tamaño de la muestra dividido ent2, con las frecuencias absolutas acumuladas, FAA, de la distribución de frecuencias. La mediana sencuentra en la clase cuya frecuencia absoluta acumulada, FAA, sea inmediatamente superior a n/2. A esclase, en términos de la expresión anterior, se le llama la clase i, y la clase anterior a esta se le llama la clasi-1

Para aclarar estos conceptos revisemos el siguiente ejemplo:EJEMPLOLos saldos de los depósitos al finalizar un mes en las cuentas de ahorro de un número de cuentahabiente

de los bancos locales, escogidos al azar, se presentan en la siguiente tabla:

ClaseSALDO

MENSUAL No. DeNo. (Miles de $) depósitos FAA1 0 300 25 252 300 600 36 613 600 900 51 112 clase i - 1

4 900 1.200 42 154 clase i 

5 1.200 1.500 37 1916 1.500 1.800 30 221

7 1.800 2.100 22 2438 2.100 2.400 19 2629 Mas de 2.400 17 279

El número total de datos de la muestra es 279 depósitos, por lo tanto, n/2 es $139.5 miles. El valor, de frecuencia absoluta acumulada, FAA; inmediatamente superior a éste es $154 miles, es decir, que la clasen la que se encuentra la mediana es la cuarta clase que va de $900 a $1.200 miles. Esta es entonces clase i. La clase anterior a ésta es la tercera clase y su frecuencia absoluta acumulada hasta aquí es $1miles.

Reemplazando estos datos en la expresión de la mediana se obtiene lo siguiente:

= 900 + 300

42

1125.139

= $1.096 miles

esto quiere decir que la mitad de los clientes de la muestra tenían un saldo, al final del mes observadinferior a $1.096.000

14. LOS CUARTILESLos cuartiles son tres valores que se determinan o calculan a partir de un conjunto de datos, con particularidad de que dividen el conjunto de datos en cuatro partes iguales cuando este conjunto esordenado en forma ascendente. Estos valores son:

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 32: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 32/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Primer cuartil o Q1: Es el valor por debajo del cual se encuentran la cuarta parte de los datos o 25% de lodatos cuando están ordenados de menor a mayor 

Segundo cuartil o Q2: Es el valor por debajo del cual se encuentran la mitad de los datos o 50% de losdatos cuando están ordenados de menor a mayor, es decir, es la misma mediana

Tercer cuartil o Q3: Es el valor por debajo del cual se encuentran las tres cuartas partes de los datos o 75de los datos cuando están ordenados de menor a mayor 

Precisemos estas ideas con el siguiente ejemplo:EJEMPLOEl número de clientes que atendieron en un día once vendedores de un centro comercial escogidos al azse presenta en la siguiente tabla

Número de clientes atendidos por vendedor 15 5 20 10 23 8 3 13 18 28 32

Este conjunto de datos ordenando de menor a mayor se muestra en la siguiente tabla:

Número de clientes atendidos por vendedor 3 5 8 10 13 15 18 20 23 28 32

Q1 Q2 Q3Como se puede observar los números 8, 15 y 23 dividen el conjunto en cuatro partes iguales. Estos valorreciben, respectivamente, los nombres de Primer Cuartil, Segundo Cuartil y Tercer Cuartil

14.1 CUARTILES PARA DATOS NO AGRUPADOSRevise la guía suplementaria “CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOS”

14.2 CUARTILES PARA DATOS AGRUPADOSPrimer caso:La frecuencia absoluta acumulada hasta alguna de las clases coincide con el valor de la operación

Donde:

Qi es el valor del cuartil que se pretende calcular, es decir: 25, 50 o 75n es el tamaño de la muestra

En este caso el cuartil buscado es igual al límite superior de la clase

EJEMPLO:Las utilidades por acción del portafolio de inversiones de una empresa se presenta en la siguiente tabla:

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 33: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 33/63

UNIDADES TECNOLÓGICAS DE SANTANDER

UTILIDAD POR No. DE  

ACCIÓN ACCIONES FAA

1300 1400 100 100

1400 1500 175 275

1500 1600 230 505

1600 1700 190 695

1700 1800 150 845

1800 1900 130 975

1900 2000 125 1100

1100

Cálculo del primer cuartil:

= = 275

Como 275 es la FAA hasta la segunda clase,entonces, el primer cuartil es igual al límitesuperior de esa clase, es decir:Q1 = 1.500

Una interpretación: El 25% de las acciones, deeste portafolio, dan una utilidad inferior a$1.500

Segundo caso:La frecuencia absoluta acumulada, FAA, hasta cualquiera de las clases no coincide con el valor de operación Qixn/100

En este caso, el cálculo del cuartil se hace de manera parecida al segundo caso del cálculo de la medianLa expresión que se utiliza es la siguiente:

= + A

− −

i

i

 FA

 FAAQxn1

100/

Es el cuartil que se quiere calcular.Es el límite inferior de la clase que contiene el cuartil

A es la amplitud de las clasesEs el producto del valor del cuartil que se quiere calcular por el tamaño n de la muestra dividid

entre 100. Q toma el valor de 25, 50, ó 75, según que el cuartil que se pretenda calcular sea Q1, Q2 o Qrespectivamente Esta operación se utiliza para localizar la clase donde se encuentra el cuartil.

  Es la frecuencia absoluta acumulada hasta la clase anterior a la clase que contiene el cuartilEs la frecuencia absoluta de la clase que contiene el cuartil

EJEMPLOUtilizando el mismo ejemplo del primer caso

UTILIDAD POR No. DE  

ACCIÓN ACCIONES FAA

1300 1400 100 100

1400 1500 175 275

1500 1600 230 5051600 1700 190 695 Clase i-1

1700 1800 150 845 Clase i 

1800 1900 130 975

1900 2000 125 1100

1100

Cálculo del tercer cuartil:

= = 825

El tercer cuartil se encuentra en la clase cuyaFAA es inmediatamente superior a 825. A estaclase se le llama clase i. Reemplazando en lafórmula se tiene:

Q3 = 1700 +100

Q3 = $1787

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 34: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 34/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Interpretación: El 75% de las acciones tienen una utilidad inferior a $1787

15. LOS PERCENTILESLos percentiles son valores que dividen un conjunto de datos en 100 partes iguales, cuando este conjuntoestá ordenado de menor a mayor 

Un percentil, por lo tanto, es un valor por debajo del cual se encuentra un determinado porcentaje de losdatos. Por ejemplo:

P30 = 200 que se lee: “Percentil 30 igual a 200”, quiere decir que por debajo del valor 200, del conjuntoordenado de datos, se encuentran el 30% de los datos.

15.1 PERCENTILES PARA DATOS NO AGRUPADOSRevise la guía suplementaria “CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOS”

15.2 PERCENTILES PARA DATOS AGRUPADOSPrimer caso:

La frecuencia absoluta acumulada hasta alguna de las clases coincide con el valor de la operación:

Donde:

P es el percentil que se quiere calcular n es el tamaño de la muestra.

Sí el percentil que se quiere calcular es igual al límite superior de la clase cuya frecuencia absolu

acumulada, FAA, coincide con el valor de la operación , entonces, el valor del percentil buscado

igual al límite superior de la clase

EJEMPLOLa siguiente tabla se refiere a una muestra, al azar, del tiempo que duraron las llamadas telefónicrealizadas por el personal de oficina de una empresa

Duración llamadas No. deen minutos Llamadas FAA

0,0 2,0 46 46

2,0 4,0 67 113

4,0 6,0 44 157

6,0 8,0 31 188

8,0 10,0 25 213

Mas de 10,0 17 230230

Cálculo el percentil 20: P20

= = 46

Como 46 es la FAA hasta la primera clase,entonces, el percentil 20 es igual al límitesuperior de esa clase, es decir:P20 = 2.0

Interpretación: el 20% de las llamadas, de lamuestra, duraron menos de 2.0 minutos

Segundo caso:La frecuencia absoluta acumulada, FAA, hasta cualquiera de las clases no coincide con el valor de

operación

En este caso, el cálculo del percentil se hace de manera parecida al segundo caso del cálculo de mediana. La expresión que se utiliza es la siguiente:

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 35: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 35/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Pi   = + A

− −

i

i

 FA

 FAA Pxn1

100/

  es el límite inferior de la clase que contiene la medianaA es la amplitud de las clases

  es la operación que se hace para saber en qué clase se encuentra el percentil  es la frecuencia absoluta acumulada hasta la clase anterior a la clase que contiene el percentil

es la frecuencia absoluta de la clase que contiene el percentil

Para saber cuál es la clase que contiene el percentil se compara la operación con las frecuenciabsolutas acumuladas, FAA, de la distribución de frecuencias. El percentil se encuentra en la clase cuyfrecuencia absoluta acumulada, FAA, sea inmediatamente superior al valor de esta operación. A esta clasen términos de la expresión anterior, se le llama la clase i, y la clase anterior a esta se le llama la clase i-1

Para aclarar estos procedimientos utilizamos el ejemplo de las llamadas telefónicas

EJEMPLO

Duración llamadas No. de

en minutos Llamadas FAA

0,0 2,0 46 462,0 4,0 67 113

4,0 6,0 44 157 Clase i - 1

6,0 8,0 31 188 Clase i 

8,0 10,0 25 213

Mas de 10,0 17 230

230

Interpretación: El 70% de las llamadas, de lamuestra, fue inferior a 6.26 minutos

Cálculo del Percentil 70, P70:

= = 161

El percentil buscado se encuentra en laclase cuya FAA es inmediatamentesuperior a 161. A esta clase se le llamaclase i. Reemplazando en la fórmula setiene:

P70 = 6.0 +2.0

P70 = 6.26 minutos

EJEMPLOPara el mismo ejemplo de la duración de las llamadas ¿Cuál fue la duración mínima del 40% de lallamadas?

El valor que se pide es menor que el 40% de las llamadas, por lo tanto, este valor es superior al 60% de lallamadas de la muestra, lo que quiere decir que se requiere calcular el percentil 60

16. PROPIEDADES DE LA MEDIANA, CUARTILES Y PERCENTILES A la mediana, cuartiles y percentiles no los afectan los valores extremos

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 36: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 36/63

UNIDADES TECNOLÓGICAS DE SANTANDER

La mediana, cuartiles y percentiles se pueden calcular en distribuciones de frecuencias que tenganclases de extremo abierto

Los cálculos de la mediana, cuartiles y percentiles son más complejos que los de las demás medidas dtendencia central

La mediana, cuartiles y percentiles no se pueden operar matemáticamente Para calcular la mediana, cuartiles y percentiles los datos deben estar ordenados

17. LA MODALa moda, de un conjunto de datos, es el valor que más se repite dentro de ese conjunto.

17.1 SÍMBOLO DE LA MODAEl símbolo que se va a utilizar, en esta notas, para representar la moda es:

 que se lee equis moda

17.2 MODA PARA DATOS NO AGRUPADOSCuando los datos no están agrupados la moda se establece a simple vista.EJEMPLOUna muestra de las edades de la última promoción de graduados se presenta en la siguiente tabla:

25 21 19 23 2227 21 23 22 18

20 22 21 19 21

26 28 22 25 24

22 20 19 31 22

24 30 28 22 26

A simple vista, el valor que más se repite es 22años por lo que éste es el valor modal, esdecir:

= 22 añosInterpretación: la edad más común en lamuestra de egresados es 22 años

Observación: En este caso hay un solo valor modal

EJEMPLOLos puntajes alcanzados, en una escala de 100 puntos, en las pruebas de ingreso, por los aspirantes atrabajar en una empresa se presentan en la siguiente tabla:

71 68 70 55 57

36 51 57 68 40

57 85 50 49 68

68 39 45 57 25

Interpretación: Cuando un conjunto de datostiene más de una moda, esta medida detendencia central no es útil para describir elcomportamiento de los datos

A simple vista se puede establecer que lospuntajes que más se repiten son el 57 y el 68,con una frecuencia de 4 puntajes, por lo que elconjunto de datos tiene 2 modas, es decir:

= 57 puntos= 68 puntos

Cuando un conjunto de datos tiene más deuna moda, como en este caso, se llamaconjunto de dato Polimodal

EJEMPLOEl tiempo, en horas, que gastan los buses de una empresa de transportes en realizar el viaje entre dosciudades determinadas, en una muestra de recorridos escogidos al azar, se presenta en la siguiente tabla:

6,8 5,5 6,1 6,4 6,2

5,7 6,3 5,6 5,1 6,9

7,0 7,4 6,6 6,0 5,4

6,5 6,7 5,8 5,9 7,5

A simple vista se puede establecer queninguno de los datos se repite por lo que esteconjunto de datos no tiene moda. Por lo tanto,no se puede utilizar la moda para describir el

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 37: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 37/63

UNIDADES TECNOLÓGICAS DE SANTANDER

comportamiento de los datos de esta muestra

17.3 MODA PARA DATOS AGRUPADOSPrimer caso: Datos de variable discreta agrupados en clases de amplitud igual a ceroEn esta caso la moda corresponde al valor de la variable que tiene la frecuencia más alta

EJEMPLOUna muestra del número de motocicletas que vende por semana un distribuidor se presenta en la siguientetabla:

No. de No. de

Motos Semanas

0 1

1 3

2 5

3 124 19

5 16

6 10

más de 6 4

 

La más alta frecuencia corresponde a 19semanas y el valor de la variable para estafrecuencia es de 4 motos por semana, por loque la moda es 4, es decir:

= 4 motocicletas por semana

Interpretación: El volumen de venta másfrecuente es de 4 motos por semana

EJEMPLOSe preguntó a una muestra de profesionales, escogidos al azar, por la marca de celular que utilizan y elresultado se presenta en la siguiente tabla:

Marca de No. de

Celular Profesionales

Sony 18

Motorola 32

L. G. 15

Nokia 47

Samsung 30

iPhone 10

Otras marcas 5

La más alta frecuencia corresponde a la marcaNokia, por lo tanto, esta es la moda, es decir:

= Nokia

Interpretación: La marca de celular que conmás frecuencia utilizan los profesionales, de lamuestra, es Nokia

Como se puede observar se puede calcular lamoda para datos de variable cualitativa

Segundo caso: Datos de variable discreta y continua agrupados en clases de amplitud mayor quecero

EJEMPLOUtilizando un radar de carretera los agentes de tránsito tomaron una muestra de la velocidad, enkilómetros por hora, a la que se desplazan los vehículos al pasar por un puente. Los resultados están

en la siguiente tabla:

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 38: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 38/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Clase Velocidad No. de

No. (Kmts / hora) Vehículos

1 Hasta 40 7

2 40 50 36

3 50 60 44

4 60 70 61

5 70 80 55

6 80 90 19

7 Mas de 90 14

En este caso, la moda se encuentra en laclase que tiene la más alta frecuencia. Esta

clase es la No.4 que corresponde al intervalode 60 a 70 kilómetros por hora. Para saber enqué punto de este clase se encuentra la modase aplica la siguiente expresión:

= LI + A

LI  es el límite inferior de la clase que contiene la moda A es la amplitud de las clases

es la diferencia entre la frecuencia absoluta de la clase que contiene la moda y la frecuencia absoluta dla clase anterior a la clase que contiene la moda

es la diferencia entre la frecuencia absoluta de la clase que contiene la moda y la frecuencia absoluta dla clase posterior a la clase que contiene la moda

Aplicando la fórmula al ejemplo se tiene:

= 61 – 44 = 17

= 61 – 55 = 6Interpretación: Lo más común es que losvehículos de la muestra se desplacen por elpuente a 67.39 Kmts / hora

= 60 + 10 = 67.39 Kmts / hora

 17.4 PROPIEDADES DE LA MODA

La moda se puede calcular en situaciones de variables cualitativitas y cuantitativas A la moda no la afectan los valores extremos La moda se puede calcular en distribuciones de frecuencias que tengan clases de extremo abierto Existen conjuntos de datos que no tienen moda o que tienen más de una moda La moda no se puede operar matemáticamente

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 39: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 39/63

UNIDADES TECNOLÓGICAS DE SANTANDER

CASOS ESPECIALES DE LA MEDIANA

DISTRIBUCIONES DE FRECUENCIAS DE VARIABLE DISCRETA CON AMPLITUD IGUAL A CEROPara calcular la mediana, cuando se tienen distribuciones de frecuencia con amplitud igual a cero y datoscorrespondientes a variable discreta se tiene dos casos

PRIMER CASOLa frecuencia acumulada hasta cualquiera de las clases es diferente de n/2 Este caso se presenta cuando ninguno de los valores de la columna de frecuencias relativas acumuladas oFAA coincide con el tamaño de la muestra dividida entre 2, es decir, n/2

EJEMPLOLa siguiente tabla se refiere a una muestra del número de computadores que vendieron en un mes 112tiendas de tecnología del país escogidos al azar 

No. De unidades No. Devendidas tiendas

0 11 122 183 234 215 19

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 3

Page 40: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 40/63

UNIDADES TECNOLÓGICAS DE SANTANDER

6 18112

La distribución de frecuencias acumuladas de este ejemplo se presenta en la siguiente tabla, donde seencuentra que n/2 es igual a 112/2 = 56

No. De unidades No. Devendidas tiendas FAA

0 1 11 12 132 18 313 23 544 21 755 19 946 18 112

112

Como se observa ningún valor de FAA coincide con n/2en este caso la mediana se encuentra en la clase cuya FAA sea mas próxima por arriba a n/2. Este valor es75, entonces, la mediana se encuentra en la clase 4 (LI=4 y LS=4),. Por lo tanto la mediana es 4, es decir:

= 4

SEGUNDO CASOAlgún valor de la frecuencia absoluta acumulada coincide con n/2Este caso se da cuando en la distribución de frecuencias de la frecuencia absoluta acumulada, FAA, algúnvalor de esta columna, es igual al tamaño de la muestra dividido por 2, es decir, n/2

EJEMPLOSe tomó una muestra del número de estufas eléctricas que vendieron en el año una muestra dedistribuidores escogidos al azar 

No. De unidades No. Devendidas distribuid.

10 1211 1812 1713 2214 1515 10

94

n/2 es igual a 94/2 = 47

No. De unidades No. Devendidas distrbiud. FAA

10 12 1211 18 3012 17 4713 22 6914 15 8415 10 94

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 41: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 41/63

UNIDADES TECNOLÓGICAS DE SANTANDER

94Como se puede ver un valor de la columna FAA coincide con n/2. En este caso la mediana se encuentraentre las clases 12 y 13 y para calcularla se promedian estos dos valores.

= (12 +13)/2 = 12.5

Este resultado se puede interpretar de dos maneras así: La mitad de los distribuidores de la muestra vendieron 12 o menos unidades

La mitad de los distribuidores de la muestra vendieron 13 o más unidades

CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOSCUARTILESLos cuartiles son tres valores que se calculan a partir de un conjunto de datos dividiendo este conjunto en 4partes iguales cuando está ordenado de menor a mayor valor. Los cuartiles son:

Primer cuartil o Q1: Es el valor por debajo del cual se encuentran la cuarta parte de los datos o 25% de lodatos cuando están ordenados de menor a mayor 

Segundo cuartil o Q2: Es el valor por debajo del cual se encuentran la mitad de los datos o 50% de losdatos cuando están ordenados de menor a mayor, es decir, es la misma mediana

Tercer cuartil o Q3: Es el valor por debajo del cual se encuentran las tres cuartas partes de los datos o 75de los datos cuando están ordenados de menor a mayor 

CUARTILES PARA DATOS NO AGRUPADOSCuando los datos no están agrupados la posición de cualquier cuartil, cuando los datos están ordenados demenor a mayor, se calcula con la siguiente expresión:

 = X(n+1)Qi/100

es la posición que ocupa el cuartil cuando los datos están ordenados de menor a mayor Qi corresponde a Q1, Q2, o Q3 y toman los valores 25, 50 y 75 respectivamente

EJEMPLO No. 1

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 42: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 42/63

UNIDADES TECNOLÓGICAS DE SANTANDER

El número de clientes que atendieron en un día once vendedores de un centro comercial escogidos al azarse presenta en la siguiente tabla:

Número de clientes atendidos15 5 20 10 23 8 3 13 18 28 32

la tabla de datos ordenados de menor a mayor se presenta en la siguiente tabla donde X1, X2, X3, etc,representan la posición que ocupan los datos:

Número de clientes atendidosX1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X113 5 8 10 13 15 18 20 23 28 32

Q1 Q2 Q3

Por simple inspección se puede establecer que los números 8, 15 y 23 dividen el conjunto de datos en 4partes iguales, donde:

El primer cuartil ocupa la tercera posición, es decir, = X3 = 8 El segundo cuartil ocupa la sexta posición, es decir, = X6 = 15

El tercer cuartil ocupa la novena posición, es decir, = X9 = 23

No siempre es fácil establecer los cuartiles por simple inspección por lo que se debe aplicar la fórmula paracalcular cada uno de los cuartiles.

Cálculo del primer cuartil  = X (11+1)25/100 = X(12)25/100 = X300/100 = X3 = 8

INTERPRETACIÓN: La cuarta parte de los vendedores, de la muestra, atendieron menos de 8 clientes

La tres cuartas parte de los vendedores, de la muestra, atendieron mas de 8 clientes El número máximo de clientes que atendió la cuarta parte de los vendedores fue de 8 El número mínimo de clientes que atendieron las tres cuartas partes de los vendedores, de la muestra,

fue de 8 Cálculo del segundo cuartil

= X(11+1)50/100 = X(12)50/100 = X600/100 = X6 = 15

Cálculo del tercer cuartil= X(11+1)75/100 = X(12)75/100 = X900/100 = X9 = 23

 EJEMPLO No. 2Los ingresos en miles de pesos, en un día, de una muestra de taxis escogidos al azar se presentan en la

siguiente tabla:

INGRESOS POR TAXI EN UN DÍA(miles de pesos)

13 4 16 6 18 20 9 30 11 28 23 25

Al ordenar los datos de menor a mayor la tabla queda así:

INGRESOS POR TAXI EN UN DÍA(miles de pesos)

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 43: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 43/63

UNIDADES TECNOLÓGICAS DE SANTANDER

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X124 6 9 11 13 16 18 20 23 25 28 30

Q1 Q2 Q3

En este caso ningún cuartil coincide exactamente con alguno de los valores de la tabla de datos ordenada

Cálculo del primer cuartil= X(12+1)25/100 = X(13)25/100 = X325/100 = X3.25 

X3.25 quiere decir que el primer cuartil se encuentra entre el tercero y cuarto valor en orden ascendente. Esquiere decir que es un valor superior a X3 pero inferior a X4. Para calcular el cuartil se interpola el excedentede X3, es decir, 0.25 por la distancia que hay entre X3 y X4 así:

= X3.25 = X3 + 0.25( X4 – X3 )

Por lo tanto: Q1 = 9+0.25(11 – 9 ) = 9+0.25( 2 ) = 9+0.5 = 9.5

Cálculo del segundo cuartil

= X(12+1)50/100 = X(13)50/100 = X650/100 = X6.5 

= X6.5 = X6 + 0.5( X7 – X6 )

Por lo tanto Q2 = 16+ 0.5(18-16) = 16+0.5(2) = 16+1 = 17

Observe que el segundo cuartil es la misma mediana

Cálculo del tercer cuartil= X(12+1)75/100 = X(13)75/100 = X 975/100 = X9.75 

= X9.75 = X9 + 0.75( X10 – X9 )

Por lo tanto: Q3 = 23+0.75(25-23) = 23+075(2) = 23+1.5 = 24.5

PERCENTILESLos percentiles son valores que dividen un conjunto de datos en 100 partes iguales, cuando este conjuntoestá ordenado de menor a mayor 

El percentil de un número, es un valor de un conjunto de datos por debajo del cual se encuentra la fracciónporcentaje de los datos correspondientes a ése número. Por ejemplo:

P30 = 78.3 (se lee: percentil de 30 igual a 78.3). Indica que por debajo de 78.3 se encuentran el 30% de losdatos

Los cuartiles son casos especiales de los percentiles. Por ejemplo, el primer cuartil, Q1, equivale a P25,porque por debajo de Q1 se encuentran el 25% de los datos

PERCENTILES PARA DATOS NO AGRUPADOSPara calcular los percentiles para datos no agrupados se utiliza la siguiente expresión:

XP = X(n+1)P/100 

XP es la posición que ocupa el percentil dentro del conjunto de datos ordenados de menor a mayor 

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 44: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 44/63

UNIDADES TECNOLÓGICAS DE SANTANDER

n es el tamaño de la muestraP es el valor percentil

El cálculo de los percentiles sigue la misma mecánica que el cálculo de los cuartiles como se puede ver enlos siguientes ejemplos

EJEMPLO 3Para el caso del ejemplo 1 calcule el percentil 35, es decir, P35 e interprete el resultadoXP35 = X (11+1)35/100 = X(12)35/100 = X420/100 = X4.2 

X4.2 = X4 + 0.2( X5 – X4 )

Por lo tanto: P35 = 10 + 0.2( 13 – 10 ) = 10 + 0.2(3) = 10.6

INTERPRETACIÓN: El 35 % de los vendedores atendieron 10 o menos clientes El 65% de los vendedores atendieron 11 o mas clientes

El máximo número de clientes atendidos por el 35% de los vendedores fue de 10 El mínimo número de cliente que atendieron el 65% de los vendedores fue de 11

EJEMPLO 4Para el caso del ejemplo 2 calcule P78 e interprete el resultado

X P78 = X(12+1)78/100 = X(13)78/100 = X1014/100 = X10.14 

X10.14 = X10 + 0.14( X11  – X10 )

Por lo tanto: P78 = 25 + 0.14( 28 – 25 ) = 25 + 0.14(3) = 25.42

INTERPRETACIÓN El 78% de los taxis de la muestra tuvieron ingresos por debajo de $25.42 miles El 22% de los taxis de la muestra tuvieron ingresos superiores a $25.42 miles El ingreso máximo del 78% de los taxis de la muestra fue de $25.42 miles El ingreso mínimo del 22% de los taxis de la muestra fue de $25.42 miles

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 45: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 45/63

UNIDADES TECNOLÓGICAS DE SANTANDER

MEDIDAS DE DISPERSIÓNSe había dicho anteriormente que el objetivo de las medias de tendencia central es describir (parcialmente

el comportamiento de un conjunto de datos que pertenezcan a una muestra o a una población. Sin embargesta capacidad descriptiva de las medidas de tendencia central es parcial porque es necesacomplementarla con otra característica de las muestras y poblaciones que es la dispersión.

Para introducir el concepto de dispersión se presenta el siguiente caso:

EJEMPLOLas ventas mensuales, en millones de pesos, de dos empresas se presentan en las siguientes tablas:

DISEÑOS GALAXIA

VENTAS

MENSUALES No. De

(MILLONES) MESES

10 14 11

14 18 32

18 22 19

22 26 12

26 30 7

30 34 5

86

CREACIONES ARMANY

VENTAS

MENSUALES No. De

(MILLONES) MESES

6 10 14

10 14 13

14 18 16

18 22 11

22 26 10

26 30 10

30 34 7

34 38 5

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 46: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 46/63

UNIDADES TECNOLÓGICAS DE SANTANDER

86

Al calcular la venta promedio mensude estas dos muestras se encuentra q

es igual para ambas con un valor d$19,395 millones, por lo que se podrpensar que ambas empresas tienen ucomportamiento similar en cuanto a lventas. Sin embargo, si se comparasus polígonos de frecuencias como hace en el gráfico de la izquierda, spuede ver que sus ventas sigupatrones de comportamiento mdiferentes.

La diferencia se encuentra, entonces, eque las dos muestras tienen diferen“dispersión” de sus datos alrededor la media.

Los ventas de Diseños Galaxia smenos dispersas que las ventas Creaciones Armany

CONCEPTO DE DISPERSIÓNSe llama DISPERSIÓN al grado de variabilidad o de dispersión de un conjunto de datos alrededor de algvalor que se toma como referencia. Usualmente se toma como referencia alguna de las medidas dtendencia central.

DISPERSIÓN Y VARIABILIDADLa variabilidad hace referencia a qué tan diferentes son entre sí los datos de una muestra o una población.

La dispersión y la variabilidad son conceptos sinónimos como se puede ver en los siguientes ejemplos:

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

1 2 3 4 5 6 7 8 9 10

3,8 3,8 3,8 3,8 3,8 3,8 3,8 3,8 3,8 3,8 En este caso todas las notas son iguales, por lo tanto, no hay ninguna variabilidad y ninguna dispersión

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

1 2 3 4 5 6 7 8 9 10

3,8 3,8 3,8 3,8 3,8 3,8 4,7 3,8 3,8 3,8

Ahora hay una nota diferente a las demás, por lo tanto, existe una pequeña variabilidad entre los datos y unpequeña dispersión con respecto a la primera muestra

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

1 2 3 4 5 6 7 8 9 10

3,

0 3,5 3,8 2,5 3,8 3,7 4,7 3,8 3,9 1,9

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 47: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 47/63

UNIDADES TECNOLÓGICAS DE SANTANDER

En esta última muestra, hay un aumento notorio en la variabilidad entre los datos y en la dispersión conrespecto a la muestra anterior 

Es preciso resaltar, que la dispersión es un concepto relativo, siempre se evalúa comparando una muestra población con algún valor de referencia o con otra muestra o población

IMPORTANCIA DE LA DISPERSIÓNPara que una medida de tendencia central sea representativa de los datos que la originaron se requiere qusu valor sea similar a los datos de esa muestra o población que pretende describir, como se puede ver en esiguiente ejemplo:

MUESTRA DE BAJA DISPERSIÓN

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

1 2 3 4 5 6 7 8 9 10

3,2 3,5 3,8 3,5 3,8 3,7 3,6 3,8 3,9 3,5

= 3,6

MUESTRA DE ALTA DISPERSIÓN

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

1 2 3 4 5 6 7 8 9 10

0,1 3,5 0,7 5,0 1,0 4,7 4,9 3,8 3,9 0,9

= 2,9

Como se puede observar, en la muestra de baja dispersión, el valor del promedio es similar o está cerca d

los valores de la muestra, en cambio, en la muestra de alta dispersión, ninguno de los valores de la muestres parecido al valor de la media. Por lo tanto, el promedio de la primera muestra es verdaderamenrepresentativo de los datos de esta muestra y el de la segunda muestra no.

El concepto de dispersión, entonces, es importante porque entre mayor sea la dispersión de un conjunto ddatos, menor es fuerza representativa que tiene la medida de tendencia central calculada con esos datos

CLASES DE MEDIDAS DE DISPERSIÓNLas medidas de dispersión que se van a estudiar en estos apuntes son las siguientes: El Rango El Rango Intercuartílico La Desviación Media La Varianza La desviación Estándar 

EL RANGOEs la diferencia o distancia entre el mayor valor, de un conjunto de datos y el valor menor. Este concepto se había mencionado para agrupar los datos en clases estadísticas, por lo tanto se utilizará para enunciarel mismo símbolo, es decir la letra R, es decir,

R = Xmax  - Xmin

EJEMPLOCalcular el rango de los siguientes conjuntos de datos

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

1 2 3 4 5 6 7 8 9 10

3,2 3,5 3,8 3,5 3,8 3,7 3,6 3,8 3,9 3,5

R = 3,9 - 3,2 = 0,7

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

1 2 3 4 5 6 7 8 9 10

0,1 3,5 0,7 5,0 1,0 4,7 4,9 3,8 3,9 0,9

R = 5,0 - 0,1 = 4,9

La dispersión de la muestra de la izquierda, medida por el rango, es menor que la dispersión de la muestrade la derecha

El cálculo anterior se realizó con muestras de datos que no están agrupados. Cuando los datos ya está

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 48: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 48/63

UNIDADES TECNOLÓGICAS DE SANTANDER

agrupados en clases el rango se establece restando del valor del límite superior de la clase mas alta el valdel límite inferior de la clase mas baja. En símbolos:

R = LS clase más alta - LI clase más baja

EJEMPLO

Una muestra de las facturas que se cancelan con tarjetas de crédito en una cadena de almacenes de modase presenta en la siguiente tabla

Ventas No. de

(Miles de $) Facturas

30 36 25

36 42 38

42 48 49

48 54 51

54 60 32

60 66 29

224

R = LS clase más alta - LI clase más baja

R = 66 - 30 = $36 miles

Como no se tiene el rango de otro conjunto de datos o un valor dreferencia, para comparar, entonces, no se puede decir sí estconjunto de datos es o no disperso

CARACTERÍSTICAS DEL RANGO Es fácil de entender y de calcular  Da una idea rápida de la dispersión En el cálculo únicamente se tienen en cuenta los valores máximo y mínimo Varía mucho de una muestra a otra No se puede calcula con distribuciones de frecuencia que tienen clases de extremo abierto

EL RANGO INTERCUARTÍLICOUna de las desventajas del rango es que solamente se tienen en cuenta, para su cálculo, los valormáximo y mínimo, por lo que no indica como están distribuidos internamente los datos. Esta desventaja

puede corregir con el rango intercuartílicoPara simbolizar el rango intercuartílico se utiliza, en estas notas, RQ y se calcula restando la diferencia entel primero y el tercer cuartil, es decir:

RQ = Q3 - Q1

Este rango muestra la dispersión de la porción más central de los datos que abarca el 50% del total

EJEMPLOLas distancias en kilómetros, recorrida en un día por dos muestras de vehículos se presentan en la siguienttabla

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

Page 49: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 49/63

UNIDADES TECNOLÓGICAS DE SANTANDER

MUESTRA A

Distancia No. De

(Kilómetros) Vehículos

25 35 3

35 45 745 55 12

55 65 15

65 75 10

75 85 6

53R = Xmax - Xmin = 60 Kmts

 Q1 = 47,7 Kmts Q3 = 75,3 Kmts

RQ = 27,6 Kmts

MUESTRA B

Distancia No. De

(Kilómetros) Vehículos

25 35 3

35 45 745 55 11

55 65 19

65 75 7

75 85 6

53R = Xmax - Xmin = 60 Kmts

Q1 = 48,0 Kmts Q3 = 64,9 Kmts

RQ = 16,9 Kmts

Como se ve, aunque las dos muestras tienen el mismo rango, R, el rango intercuartílico es diferente, lo queindica que la muestra B es menos dispersa que la muestra A

LA DESVIACIÓN MEDIAEs la diferencia promedio, en valor absoluto, de los datos de la muestra o población con respecto a su

propia media. La forma de la expresión de cálculo varía dependiendo de que se trate de datos no agrupado datos agrupados

El símbolo que se utiliza en estos apuntes para la desviación media son las iniciales DM

Desviación media para datos no agrupados

DM =

Donde:DM: Símbolo de la desviación media

 : Cada uno de los datos de la muestra

: La media aritmética de la muestra

n  : El número de datos

La razón por la cual se extrae el valor absoluto es porque los números tienen una propiedad que consiste eque la suma de las diferencias de un conjunto de números con respecto a su media siempre da igual a cero

EJEMPLOUna muestra, al azar, del tiempo, en minutos, que duran las llamandas que se hacen desde un teléfono, sepresenta en la siguiente tabla

3 14 24 9 7 12

Hallar la desviación media de esta muestra   = 11,5

DM = = 5,2 minutos

Interpretación: En promedio, ladiferencia de cada llamada conrespecto a la media es de 5,2 minutos

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 4

3 -8,5 8,5

14 2,5 2,5

24 12,5 12,5

9 -2,5 2,5

7 -4,5 4,5

12 0,5 0,5

31

Page 50: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 50/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Desviación media para datos agrupados

DM =

Donde:DM : símbolo de la desviación media

 : La marca de clase de la clase i 

: La media aritmética de la muestra

: La frecuencia absoluta de la clase i n  : El número de datos

EJEMPLOLa siguiente tabla es una muestra, en miles de pesos, del valor del arriendo mensual de vivienda del estratotres.

Datos

Valor arriendo No. De

(miles de pesos) viviendas

200 220 12

220 240 15

240 260 23

260 280 22

280 300 20

300 320 18

320 340 15

125

 = $271,92 miles

Tabla de Cálculo

Valor arriendo  

(miles de pesos)

200 220 12 210 -61,920 61,92 743,04

220 240 15 230 -41,920 41,92 628,8

240 260 23 250 -21,920 21,92 504,16

260 280 22 270 -1,920 1,92 42,24280 300 20 290 18,080 18,08 361,6

300 320 18 310 38,080 38,08 685,44

320 340 15 330 58,080 58,08 871,2

125 3836,48

DM = = $30,7 miles

En promedio, los arriendos de la muestra, se diferencian de la media en $30,7 miles

La desviación media tiene en cuenta, para su cálculo, todos los datos de la muestra y es fácil de interpretarPero, la operación del valor absoluto para soslayar la propiedad anteriormente mencionada de los de losnúmeros, preocupa a los matemáticos, por lo que se utiliza mas otra medida de dispersión, donde para eviteste inconveniente se aprovecha otra propiedad de los números que consiste en que todo número elevadocuadrado tiene signo positivo. Esta medida de dispersión es la varianza.

LA VARIANZA La Varianza, al igual que la desviación media utiliza, para medir la dispersión, las desviaciones de los datocon respecto a la media, pero, en este caso, estas desviaciones se elevan al cuadrado. Por lo tanto, spuede decir que la varianza es el promedio de las desviaciones, de los datos, con respecto a la medelevadas al cuadrado.

Para el cálculo de la varianza, lo mismo que para las medidas de dispersión estudiadas anteriormente, debe tener en cuenta sí los datos están o no agrupados, pero, adicionalmente, el cálculo de la varianza eligeramente diferente según se trate con poblaciones o muestras, por lo que se utilizan símbolos diferente

para indicar cada una de estas dos situaciones

VARIANZA POBLACIONALEs la varianza que se calcula utilizando todos los datos de una población

Símbolo:

Varianza poblacional para datos no agrupados

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 51: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 51/63

UNIDADES TECNOLÓGICAS DE SANTANDER

  =Donde :

= Cada dato de la población

µ = La media de la población

N = El tamaño de la población

 EJEMPLOLos siguientes datos corresponden a los puntajes obtenidos por los aspirantes a un cargo en una

empresa

PUNTAJES

60 81 77 72 91 90

µ = 78,5 puntos

Tabla de cálculo

 

60 -18,5 342,25

81 2,5 6,25

77 -1,5 2,25

72 -6,5 42,25

91 12,5 156,2590 11,5 132,25

681,5

  =

= 113,58 puntos

cuadrado

Varianza poblacional para datos agrupados

 == Es la marca de clase de c/u de las clases en que se agrupa la

población

µ = La media de la población

= Es la frecuencia absoluta de cada clase

N = El tamaño de la población

EJEMPLOEn un programa sobre riesgo cardiovascular, se registró el peso en kilogramos de todos los empleados deuna empresa

Datos

Peso en No. de

Kilogramos Empleados

39 49 5

49 59 11

59 69 50

69 79 31

79 89 27

89 99 18

99 109 9

151

Tabla de cálculoPeso en

Kilogramos

39 49 5 44 -30,2 912,04 4560,20

49 59 11 54 -20,2 408,04 4488,44

59 69 50 64 -10,2 104,04 5202,00

69 79 31 74 -0,2 0,04 1,24

79 89 27 84 9,8 96,04 2593,08

89 99 18 94 19,8 392,04 7056,72

99 109 9 104 29,8 888,04 7992,36

151 31894,04

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 52: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 52/63

UNIDADES TECNOLÓGICAS DE SANTANDER

µ = 74,2 kilogramos   = = 211,22 Kilogramos al cuadrado

Nótese que si la población es infinita no se puede calcular la varianza poblacional porque el valor de N seríinfinito.

VARIANZA MUESTRALEs la varianza que se calcula sobre los datos de una muestra. El cálculo con respecto a la varianzpoblacional difiere en que, el divisor de la expresión ya no es N, el tamaño de la población, ahora es (n – 1que es el tamaño de la muestra, n, menos una unidad.

Símbolo:

Varianza muestral para datos no agrupados

  =

Donde:

  : Es cada uno de los datos de la muestra

  : Es la media de la muestra

n : Es el tamaño de la muestra

La razón por la cual se divide entre n - 1 es porque, de esta manera, s2, es un “estimador insesgado” de lavarianza de la población de la cual se extrajo la muestra. El concepto de estimador insesgado se estudia enel curso de Estadística Inferencial.

EJEMPLOLos saldos de las cuentas de ahorro, de empleados, de una muestra de las cuentas de ahorro de unacooperativa, escogidas al azar, se presentan en la siguiente tabla:

SALDOS DE LAS CUENTAS EN MILES DEPESOS

157 62 234 532 200 90

  = $212,5 miles

Tabla de cálculo

157 -55,5 3080,25

62 -150,5 22650,25

234 21,5 462,25

532 319,5 102080,25

200 -12,5 156,2590 -122,5 15006,25

143.435,50

 =

= 28.687,10 miles depesos al cuadrado 

Varianza muestral para datos agrupados

=

Donde:

  : Es la marca de clase de c/u de las clases en que se agrupa lamuestra

  : Es la media aritmética de la muestra

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 53: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 53/63

UNIDADES TECNOLÓGICAS DE SANTANDER

 :Es la frecuencia absoluta de cada clase

n : Es el tamaño de la muestra

EJEMPLOUna muestra del tiempo, en horas, que demora el almacén de materiales de una fábrica en surtir los pedidoque recibe:

Datos

Tiempo No. de

(Horas) pedidos

0 2 10

2 4 16

4 6 33

6 8 45

8 10 26

10 12 10140

  = 6,3 horas

Tabla de cálculo

Tiempo

(Horas)

0 2 10 1 -5,3 28,09 280,90

2 4 16 3 -3,3 10,89 174,24

4 6 33 5 -1,3 1,69 55,77

6 8 45 7 0,7 0,49 22,05

8 10 26 9 2,7 7,29 189,54

10 12 10 11 4,7 22,09 220,90140 943,40

= = 6,8 horas al cuadrado

Como se puede observar, en los ejemplos anteriores, todas las unidades de la desviación estándar estáelevadas al cuadrado por lo que es difícil interpretar el significado del valor de la varianza; esta en una de larazones por las cuales, para medir la dispersión, se prefiere otra medida que es la Desviación Estándar 

LA DESVIACIÓN ESTÁNDARConocida también como Desviación Típica, la desviación estándar es la raíz cuadrada de la varianza. L

símbolos que se utilizan son σ, para cálculo de la dispersión en poblaciones y s, para el cálculo de dispersión en muestras

DESVIACIÓN ESTÁNDAR PARA POBLACIONES

Datos no agrupados

σ = =

Datos agrupados

σ = =

DESVIACIÓN ESTÁNDAR PARA MUESTRAS

Datos no agrupados

s =  =

Datos agrupados

s =  =

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 54: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 54/63

UNIDADES TECNOLÓGICAS DE SANTANDER

Las tablas de cálculo para la desviación estándar son idénticas a las que se utilizan para la varianza, con ucálculo adicional: extraer la raíz cuadrada de la varianza

EJEMPLOEn un ejemplo anterior se vio que los puntajes de los aspirantes a un cargo, en una empresa fueron:

PUNTAJES

60 81 77 72 91 90

y se calculó que:

  = 113,58 puntos al cuadradoPor lo tanto,

σ = = = 10,7 puntos

EJEMPLOEn otro caso se estableció que el tiempo, en horas, que demora el almacén de materiales de una

fábrica en surtir los pedidos que recibe

Tiempo No. de

(Horas) pedidos

0 2 10

2 4 16

4 6 33

6 8 45

8 10 26

10 12 10

140

Y se calculó que:

= 6,8 horas al cuadrado

Por lo tanto:

s  = = = 2,6 horas

Aunque es indispensable que se conozca, a ciencia cierta, como se obtienen la cifras de los cálculos de media aritmética y la desviación estándar, en la práctica, la tecnología disponible permite que estoperaciones se hagan de forma más rápida y segura utilizando las funciones estadísticas de las calculadorcientíficas o de las hojas electrónicas de los programas de computador, por lo que se debe consultar, por menos, en los manuales de las calculadoras, los detalles de la forma como se ejecutan estas funciones.

EL COEFICIENTE DE VARIACIÓN Para introducir el concepto del coeficiente de variación se analiza la siguiente situación:

En la sección de materiales livianos del almacén de materiales de una fábrica se tomó una muestra del pesde elementos de esa sección escogidos al azar, lo mismo se hizo en la sección de materiales pesados, de misma bodega y para ambas muestras se calculó su peso promedio y la desviación estándar. Los resultadson los que se presentan a continuación:

SECCIÓN DE MATERIALES LIVIANOS

  = 4 Kilos

S = 2 Kilos

SECCIÓN DE MATERIALES PESADOS

= 50 Kilos

S = 2 kilos

La primera impresión que se obtiene de una observación desprevenida de estos resultados es que las domuestras tienen la misma dispersión porque sus desviaciones estándar son iguales. Sin embargo, si sexamina con más atención, se puede ver que en el caso de la sección de materiales livianos, la desviació

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 55: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 55/63

UNIDADES TECNOLÓGICAS DE SANTANDER

estándar equivale a la mitad del peso promedio de los materiales de la muestra. En cambio, en la sección dmateriales pesados la desviación estándar equivale únicamente a 1/25 del peso promedio de los paquetePor lo que comparadas las dos desviaciones estándar con la magnitud de su respectivo promedio, es muchmás alta la dispersión de la sección de materiales livianos.

De este análisis se concluye que la desviación estándar en casos como el del ejemplo, no permite compar

la dispersión de dos muestras y se puede agregar que esta dificultad se presenta cuando las medias de lmuestras que se están comparando son muy diferentes entre sí.

Para resolver este inconveniente, la estadística dispone de un indicador para medir la dispersión. Esindicador es el Coeficiente de Variación y se calcula con la siguiente expresión:

COEFICIENTE DE VARIACIÓN PARA POBLACIONES

SÍMBOLO : CV

CV =

COEFICIENTE DE VARIACIÓN DE MUESTRAS

SÍMBOLO : CV

CV =

El coeficiente de variación es un número sin dimensiones por lo que se puede expresar en fraccionedecimales o en porcentaje

EJEMPLOSe tomaron muestras de las ventas diarias, en miles de pesos, de dos vendedores de una empresa. ¿Cude las dos muestras es mas dispersa?

VENTAS DEL VENDEDOR A

500 450 390 600 290 400 440

= $438,6 miles

S = $96,5 miles

CV = 0,22

VENTAS DEL VENDEDOR B

80 25 23 57 90 10

  = $47,5 miles

S = $33,1 miles

CV = 0,70

Como se puede notar, la desviación estándar del vendedor A es mayor que la desviación estándar dvendedor B; sin embargo, las ventas de la muestra del vendedor A son menos dispersas que las ventas demuestra del vendedor B, porque el coeficiente de variación de las ventas del vendedor A es menor que coeficiente de variación de las ventas del vendedor B

EJEMPLOUna muestra de las ventas por día de un almacén de ropa de moda y un gran distribuidor textil se presentaen la siguientes tablas. ¿Cuál de los dos promedios de ventas por día es más confiable?

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 56: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 56/63

UNIDADES TECNOLÓGICAS DE SANTANDER

JEANS AND BREECHES

VENTAS POR DÍA

(Millones de pesos)

Ventas No. de

por día días0,9 1,1 3

1,1 1,3 9

1,3 1,5 16

1,5 1,7 23

1,7 1,9 29

1,9 2,1 20

2,1 2,3 11

111

DISTRIMODA

VENTAS POR DÍA

(Millones de pesos)

Ventas No. de

por día días9,2 10,3 12

10,3 11,4 16

11,4 12,5 25

12,5 13,6 19

13,6 14,7 10

14,7 15,8 9

91

Solamente se necesita establecer la marca de clase de ambas tablas y el resto de los cálculos se realizadirectamente aplicando las funciones estadísticas de las calculadoras científicas

JEANS AND BREECHES

VENTAS POR DÍA

(Millones de pesos)

Ventas No. de  

por día días Xi

0,9 1,1 3 1,0

1,1 1,3 9 1,2

1,3 1,5 16 1,4

1,5 1,7 23 1,6

1,7 1,9 29 1,81,9 2,1 20 2,0

2,1 2,3 11 2,2

111

= 1,706306306 CV = 0,17868609S = 0,30489321

DISTRIMODA

VENTAS POR DÍA

(Millones de pesos)

Ventas No. de  

por día días Xi

9,2 10,3 12 9,75

10,3 11,4 16 10,85

11,4 12,5 25 11,95

12,5 13,6 19 13,05

13,6 14,7 10 14,1514,7 15,8 9 15,25

91

= 12,26428571 CV = 0,13255294S = 1,62566714

Respuesta: Es más confiable el promedio diario de Distrimoda porque tiene el menor coeficiente de variació

DESIGUALDAD DE CHEBYSHEVEs una regularidad que se presenta en todas las distribuciones de frecuencias y consiste en que, simportar la forma de la distribución de frecuencias, la porción mínima de datos que se encuentra en u

intervalo comprendido entre K desviaciones estándar por debajo y por encima de la media aritmética es:

1 -

Donde K es cualquier número mayor que 1

Los límites de este intervalo se encuentran, por lo tanto, por debajo y por encima de la media aritmética. Allímite que está por debajo de la media se le llama límite inferior o LI y al límite que está por encima se le

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 57: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 57/63

UNIDADES TECNOLÓGICAS DE SANTANDER

llama límite superior o LS. Las expresiones para estos límites son:

LI =  - KsLS = + Ks

Donde s es la desviación estándar de la distribución de frecuencias

EJEMPLOUna muestra del tiempo que tienen que esperar los afiliados a una EPS para que los atiendan en el serviciode urgencias de una clínica dio una media aritmética de 32 minutos, con una desviación estándar de 8,3minutos. ¿Entre qué intervalo de tiempo tuvieron que esperar como mínimo el 80% de los afiliados de lamuestra?

Esa porción mínima es precisamente 1 – 1/K2, por lo tanto: 

0,80 = 1 -

Despejando K de la anterior ecuación se encuentra que K = 2,24

Entonces, los límites del intervalo que se pregunta son:LI =  - Ks = 32 - 2,24(8,3) = 13,4 minutos

LS = + Ks = 32 + 2,24(8,3) = 50,6 minutos

La respuesta es que, por lo menos, el 80% de los afiliados a la EPS, de la muestra, tuvieron que esperar entre 13,4 minutos y 50,6 minutos para ser atendidos en el servicio de urgencias

UNIDAD 3: REGRESIÓN Y CORRELACIÓN

REGRESIÓN1. INTRODUCCIÓNEn muchas situaciones de la actividad administrativa o cotidiana se presentan circunstancias en las queparecen estar relacionadas dos o más variables. Por ejemplo:

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 58: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 58/63

UNIDADES TECNOLÓGICAS DE SANTANDER

El número de vehículos que circulan por las vías de una ciudad y los índices de contaminación de lamisma

La tasa de desempleo y las ventas del comercio Las ventas de licor y el número de accidentes de tránsito Las horas de tutorías y el número de estudiantes que reprueban los parciales El numero de apartamentos construidos en un determinado periodo y las ventas de muebles

El número de personas que se movilizan en bus y las ventas de motos y el estado del clima

Existe una técnica para establecer matemáticamente la relación que puede existir entre variables como lasseñaladas anteriormente. Esta técnica es el análisis de regresión

2. CONCEPTO DE REGRESIÓNEs un método de cálculo para establecer una relación matemática entre dos o más variables. Este métodaplicado al análisis estadístico permite predecir matemáticamente el comportamiento de una variable a pardel comportamiento conocido de otra u otras variables. Esta relación entre las variables se establece través de una ecuación que se llama Ecuación de Regresión

3. VARIABLES DEPENDIENTES E INDEPENDIENTESAl establecer la relación entre dos variables se encuentra que el comportamiento de una variable depende

del comportamiento de otra u otras variables o que la manifestación de una variable ocurre primero que lamanifestación de otra u otras variables. A la variable que ocurre primero o que determina el comportamientode otra se le llama Variable Independiente y se suele representar por la letra X y a la otra variable se lellama Variable Dependiente y se suele representar por la letra Y

EJEMPLOS: Tasa de desempleo y ventas del comercio: La variable independiente o variable x es la tasa de

desempleo y la variable dependiente o variable y es las ventas del comercio

Accidentes de tránsito y ventas de licor: La variable independiente es las ventas de licor y la variabledependiente los accidentes de tránsito

El número de personas que se movilizan en bus puede depender de las ventas de motocicletas y del

estado del clima, por lo que el número de personas que utilizan el servicio de bus es la variabledependiente y las otras dos son las variables independientes

4. TIPOS DE RELACIÓN ENTRE DOS O MÁS VARIABLESLa relación entre dos o más variables que como dijimos anteriormente matemáticamente recibe el nombrede regresión se puede clasificar de dos formas:

Atendiendo a la cantidad de variables que se relacionan se clasifica en Regresión Univariada oRegresión Multivariada

Atendiendo a la representación gráfica de la ecuación de regresión se clasifica en Regresión Lineal oRegresión Curvilínea

4.1 Regresión UnivariadaSe presenta cuando sólo intervienen dos variables: una variable independiente y una variable dependiente

4.2 Regresión MultivaridaSe presenta cuando el comportamiento de un variable dependiente es el resultado de la interacción de dosmás variables dependientes

4.3 Regresión linealSe presenta cuando la representación gráfica de la ecuación de regresión es una línea recta

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 59: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 59/63

UNIDADES TECNOLÓGICAS DE SANTANDER

4.4 Regresión CurvilíneaSe presenta cuando la representación gráfica de la ecuación de regresión es una curva

Tanto la regresión lineal como la curvilínea tienen dos formas de manifestarse: en forma directa o en formainversa

4.5 Regresión Lineal DirectaOcurre cuando al aumentar el valor de la variable independiente aumenta, proporcionalmente, el valor de lavariable dependiente. Por lo tanto, una recta parece describir de manera apropiada la relación entre estasvariables, como se puede ver en el siguiente gráfico

0

1

2

3

4

5

6

7

8

9

10

0 5 10 15 20 25 30

Variable X

   V  a  r   i  a   b   l  e

   Y

El gráfico anterior recibe el nombre de gráfico de dispersión

La curva de regresión (una recta),que mejor describe la relación entestas dos variables, se presenta ela gráfica de la izquierda

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 5

Page 60: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 60/63

UNIDADES TECNOLÓGICAS DE SANTANDER

4.6 Regresión Lineal InversaOcurre cuando al aumentar el valor de la variable independiente disminuye el valor de la variabledependiente en una proporción similar 

La curva de regresión (una recta), quemejor describe la relación entre estas dovariables, se presenta en la gráfica de laizquierda:

4.7 Regresión Curvilínea DirectaOcurre cuando al aumentar de valor la variable independiente, la variable dependiente aumenta mas quproporcionalmente

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 6

Page 61: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 61/63

UNIDADES TECNOLÓGICAS DE SANTANDER

X Y

16 12

18 21

8 6

12 7

17 17

10 8

La curva de regresión, que mejor describe la relación entre estas dos variables, se presenta en la siguientegráfica

Regresión Curvilínea

8 10 12 14 16 18

VARIABLE X

6

9

12

15

18

21

   V   A   R   I   A   B   L   E   Y

4,8 Regresión Curvilínea InversaOcurre cuando al aumentar de valor la variable independiente, la variable dependiente disminuye de valor eforma más que proporcional

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 6

Page 62: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 62/63

UNIDADES TECNOLÓGICAS DE SANTANDER

La curva de regresión, que mejor describe la relación entre estas dos variables, se presenta en la siguientegráfica:

Regresión Curvilínea

0 4 8 12 16 20

VARIABLE X

0

3

6

9

12

15

18

   V   A   R   I   A   B   L   E   Y

4.9 Ninguna relaciónOcurre cuando la relación entre la variable dependiente e independiente no se puede describir con ningún

tipo de curva

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 6

Page 63: apuntes docentes

5/10/2018 apuntes docentes - slidepdf.com

http://slidepdf.com/reader/full/apuntes-docentes 63/63

UNIDADES TECNOLÓGICAS DE SANTANDER

X Y13 82 5

15 4

5 34 107 7

5. LA REGRESIÓN LINEALCuando los puntos del gráfico de dispersión se pueden relacionar con una recta que pase lo mas cercposible de todos ellos, a esta recta se le llama Recta de Mínimos Cuadrados, porque la suma de ladistancias al cuadrado, de los puntos del gráfico a esta recta es mínima

Esta recta tiene por ecuación Y = A + B X, donde A es el punto donde la recta corta al eje Y, y B es pendiente de la recta. El proceso para determinar el valor de los parámetros A y B es complejo, pero, estudiante interesado lo puede consultar en cualquier texto de estadística. En el curso, se determinaráutilizando las funciones de las calculadoras científicas.

LA CORRELACIÓNEl interés del analista no está solamente en establecer la forma como se relacionan dos variables, sino enmedir que tan fuerte es el grado de esta relación.

1. EL COEFICIENTE DE CORRELACIÓNEl grado de relación entre dos variables se mide con un número adimensional que recibe el nombre dcoeficiente de correlación.

Este valor se representa por r y varía entre -1 y +1. De -1 a 0 cuando la regresión es inversa y de 0 a +1cuando la regresión es directa. El valor de r  = 0 significa ausencia total de relación entre las dos variables yel valor de r = 1 significa el máximo valor de relación entre las dos variables

Como el coeficiente de correlación es un número adimensional se puede expresar también en porcentaje. Ssuele preferir valores de coeficientes de correlación superiores al 90%

2. EL COEFICIENTE DE DETERMINACIÓNEl coeficiente de determinación es el cuadrado del coeficiente de correlación y explica el porcentaje dcambio de la variable dependiente que se puede explicar por el cambio de la variable independiente. Poejemplo, un coeficiente de determinación de 64% entre los litros de licor vendidos los fines de semana ynúmero de accidentes de tránsito, en esos días, significa que el 64% de los accidentes de tránsito de lofines de semana se pueden explicar por las ventas de licor 

DEPARTAMENTO DE CIENCIAS BÁSICAS VERSIÓN 2 - 2011 Página 6