guÍa de ejercicios estadÍstica descriptiva servicios académicos para el acompañamiento y la...

11
Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA Área Matemáticas- Análisis Estadístico Módulo Básico de Ingeniería (MBI) Resultados de aprendizaje Aprender el correcto uso de la calculadora científica en modo estadístico, además de la determinación de medidas de tendencia central y dispersión en datos tabulados Contenidos 1. Estadística Descriptiva en datos tabulados 2. Cálculo de Media Aritmética, Desviación estándar, Mediana, Coeficiente de Variación y Percentil Debo saber En seguida se muestran algunas definiciones que son necesarias se tengan claras antes de empezar a trabajar en los contenidos: Población: Conjunto de todas las observaciones realizadas en las unidades de observación pertenecientes a un Universo. Muestra: Subconjunto de la población, se elige de acuerdo a un plan de muestreo. Su tamaño depende de los parámetros a estimar, pruebas de hipótesis e información especializada Marca de clase ( ): Corresponde a la mitad del intervalo para ello se deben sumar sus dos límites y dividirlo por dos, en otras palabras corresponde al promedio de dichos valores. A continuación se muestra la fórmula de la marca de clase: 2 1 i i m x x x Donde k i ,..., 1 Frecuencia absoluta o Frecuencia ( ): Número de veces que aparece un determinado valor en un estudio estadístico. Frecuencia absoluta acumulada ( ): Es la frecuencia acumulada hasta un valor determinado de la variable. Frecuencia relativa ( ): Es la proporción entre la frecuencia absoluta de un determinado intervalo con respecto al total de observaciones

Upload: lamthien

Post on 20-Sep-2018

234 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 1

GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Área Matemáticas- Análisis Estadístico Módulo Básico de Ingeniería (MBI)

Resultados de aprendizaje Aprender el correcto uso de la calculadora científica en modo estadístico, además de la

determinación de medidas de tendencia central y dispersión en datos tabulados

Contenidos 1. Estadística Descriptiva en datos tabulados

2. Cálculo de Media Aritmética, Desviación estándar, Mediana, Coeficiente de Variación y

Percentil

Debo saber En seguida se muestran algunas definiciones que son necesarias se tengan claras antes de empezar

a trabajar en los contenidos:

Población: Conjunto de todas las observaciones realizadas en las unidades de observación

pertenecientes a un Universo.

Muestra: Subconjunto de la población, se elige de acuerdo a un plan de muestreo. Su

tamaño depende de los parámetros a estimar, pruebas de hipótesis e información

especializada

Marca de clase ( ): Corresponde a la mitad del intervalo para ello se deben sumar

sus dos límites y dividirlo por dos, en otras palabras corresponde al promedio de dichos

valores. A continuación se muestra la fórmula de la marca de clase:

2

1 iim

xxx

Donde ki ,...,1

Frecuencia absoluta o Frecuencia ( ): Número de veces que aparece un determinado valor

en un estudio estadístico.

Frecuencia absoluta acumulada ( ): Es la frecuencia acumulada hasta un valor

determinado de la variable.

Frecuencia relativa ( ): Es la proporción entre la frecuencia absoluta de un determinado

intervalo con respecto al total de observaciones

Page 2: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 2

Tamaño de muestra ( ): Corresponde a la suma de las frecuencias absolutas, es decir al

número total de datos

Media aritmética o promedio ( ): Se define como la suma de los datos dividida por la

cantidad de ellos. Entonces para un grupo de n observaciones se tiene

n

x

n

xxxx

n

i

i

n

121 .....

Donde ix : Valor de la variable x en la iésima-observación; n : Tamaño de la muestra

Mediana ( ): Aquel valor de la observación que supera no más que el 50% de las

observaciones cuando estas han sido ordenada según magnitud. Se presentan dos casos:

Observaciones sin tabular y tabuladas.

o Mediana para observaciones sin tabular

n impar , es la observación del lugar

2

1nx

n par , es la observación del lugar 2

122

nn xx

o Mediana para observaciones tabuladas

Para la determinación de este caso se debe determinar el intervalo que contiene a

n/2, o bien el que supera dicho valor. Realizado lo anterior se aplica la siguiente

fórmula de cálculo.

i

i

iin

Nn

CxMe1

12

Donde 1ix es el límite inferior del intervalo que contiene la mediana;

1iN es la

frecuencia acumulada del intervalo anterior a iN ;

iC a la amplitud del intervalo i ;

in es el número de observaciones en el intervalo i

Moda: Corresponde al valor que presenta mayor frecuencia en una serie de datos. En datos

tabulados o tablas de frecuencia el modo corresponderá a aquel intervalo que presente el

mayor número de observaciones (in ).

21

11 CixMo i

Page 3: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 3

Donde 1ix es el límite inferior de la clase modal; Ci es la amplitud del intervalo de clase;

1 es la diferencia entre la in de la clase modal y la

in de la clase anterior; 2 es la

diferencia entre la in de la clase modal y la

in de la clase posterior.

Desviación estándar o típica (Sx): Dado que la unidad de medida de la varianza es un

número al cuadrado (Ejemplo: cm2, edad2, etc). Se debe obtener la raíz cuadrada de la

varianza para conseguir una medida de la dispersión en la misma unidad de medida de la

variable, y a esta expresión se le denomina Desviación estándar.

Dentro de esta medida de dispersión, se debe tener en cuenta que dos desviaciones

estándar, las cuales corresponden a la desviación estándar poblacional y la desviación

estándar muestral.

La desviación estándar poblacional será empleada cuando se trabaje con la totalidad de los

datos, es decir con la población. Su fórmula se encontrará dada por:

n

xxn

i

n

1

2

Por otra parte, la desviación estándar muestral se empleará cuando se esté en presencia de

una muestra. Su fórmula se encuentra dada por:

11

2

1

n

xx

S

n

i

nx

Cuando se tienen muchas observaciones, se recomienda utilizar la siguiente fórmula:

1

)(

1

2

1

2

2

1

1

2

n

xnXi

n

n

Xi

Xi

S

n

i

n

in

i

Coeficiente de variación ( ): Corresponde a una medida de dispersión, que expresa la

desviación estándar como una proporción de la media, por lo que es una medida

independiente de la medida de medición. Su fórmula se encuentra dada por:

Page 4: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 4

x

SxCV x)(

Donde xS corresponde a la desviación estándar muestral; x es la media aritmética.

Porcentaje de variación ( ): Corresponde a el coeficiente de variación multiplicada por cien

100)(% x

SxCV x

Percentil: Son aquellas observaciones que dividen los datos en 100 partes iguales, se

denota con la expresión Pp, donde p = 1,2,…,99. Para calcular un determinado percentil se

debe identificar la frecuencia acumulada que iguala o supera al valor que representa la

posición que se quiere buscar, de esta forma se identifica el intervalo i con que se

trabajará. Posteriormente se utiliza la siguiente fórmula:

i

i

iipn

Npn

CxP1

1100

Donde iN corresponde a la frecuencia acumulada que primero supera o iguala a

100

pn ; 1iN

es la frecuencia acumulada anterior aiN ; 1ix es límite inferior del intervalo

percentílico; iC es la amplitud del intervalo i ; in es el número de observaciones en el

intervalo i .

Page 5: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 5

2. Método de ingresar los datos a la Calculadora Lo primordial en este punto es el correcto empleo de la calculadora científica que se tenga

disponible, la cual no debe ser programable. Por lo tanto, a continuación se muestran los pasos

necesarios, en las calculadoras más comunes, para determinar las sumatorias y parámetros

estadísticos necesarios.

Calculadora CASIO fx-82MS SHIFT CLR 1 = : Para borrar la memoria Estadística de la calculadora Para datos unidimensionales: MODE 2 : Seleccionar Modo Estadístico INGRESAR SHIFT , INGRESAR M+ : Para ingresar los datos unidimensionales SHIFT 1 1 : Sumatoria de los

SHIFT 2 1 : Media de los datos ingresados

SHIFT 1 2 : Sumatoria de los SHIFT 2 1 : Desviación Estándar Poblacional

SHIFT 1 3 : Tamaño de la muestra SHIFT 2 3 : Desviación Estándar Muestral Calculadora CASIO fx-570

SHIFT 9 1 = : Para borrar la memoria Estadística de la calculadora SHIFT MODE 4 1 : Para mostrar la columna de frecuencia Para datos unidimensionales: MODE 3 1 : Seleccionar Modo Estadístico INGRESAR INGRESAR : Para ingresar los datos unidimensionales SHIFT 1 4 1 : Sumatoria de los

SHIFT 1 5 2 : Media de los datos ingresados

SHIFT 1 4 2 : Sumatoria de los SHIFT 1 5 3 : Desviación Estándar Poblacional

SHIFT 1 5 1 : Tamaño de la muestra SHIFT 1 5 4 : Desviación Estándar Muestral

Page 6: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 6

Ejercicio 1: La utilización de materiales sintéticos tales como: nylon, poliéster y látex en la

producción de telas, ha provocado debates acerca de la calidad y resistencia de estas fibras

comparadas con las fibras naturales. Es por esta razón que investigadores analizan la resistencia de

las telas con el objeto de mostrar cuál de los tipos de fibras es más conveniente implementar en la

elaboración de sus productos.

Para realizar la comparación de ambos productos textiles se seleccionan 57 unidades de telas

elaboradas con fibra sintética y 40 elaboradas con fibra natural, a las cuales se les registró su

resistencia a la tracción, en kilogramos, obteniendo la siguiente información:

El objetivo de este estudio es elegir el material más eficiente, para lo cual se utilizan tres criterios:

a) Resistencia a la tracción más homogénea.

b) Al menos el 18% de los productos textiles deben tener una resistencia a la tracción

comprendida entre el promedio más una desviación estándar y la máxima resistencia a la

tracción obtenida.

c) La mediana de la resistencia a la tracción obtenida sea mayor.

Criterio de selección del sistema utilizado: Si cumple criterio a) se asignan 7 puntos, si cumple

criterio b) 3 puntos y si cumple criterio c) se asignan 5 puntos. Se elige el producto textil que

obtiene mayor puntaje.

Utilizando medidas estadísticas adecuadas, determinar el puntaje obtenido para cada producto

textil utilizado. En base a los resultados, indique cual es el material más eficiente, justificando su

respuesta.

Resistencia a la Tracción Fibra Sintética Fibra Natural

175 – 185 4 6

185 – 195 8 6

195 – 205 12 15

205 – 215 15 9

215 – 225 9 3

225 – 235 9 1

Total

Page 7: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 7

Solución: Lo primero que se debe realizar en cada uno de los ejercicios que se desarrollen es definir

la(s) variable(s) que se empleará(n). Esta definición deberá contar con la unidad de medida con que

se está trabajando. A continuación se definen las variables:

Sean: “Resistencia a la tracción de telas elaboradas con fibras sintéticas, en kilogramos”

“Resistencia a la tracción de telas elaboradas con fibras naturales, en kilogramos”

Posteriormente, como se quiere determinar cuál de los dos materiales es más eficiente, se procede

a analizar cada uno de los puntos en cuestión.

Primero se establecerá cuál de las variables es más homogénea, para ello se empleará el coeficiente

de variación debido a que el tamaño de muestra de las variables es distinta. A continuación se

expone la tabla que contiene la información necesaria que se ingresará a la calculadora:

Al emplear los pasos definidos al inicio del documento (Método de ingresar los datos a la Calculadora) se obtiene la desviación estándar y media aritmética, las cuales son respectivamente:

En seguida se determinan los coeficientes de variación respectivos:

( )

( )

Como es sabido, mientras menor sea el valor de coeficiente de variación, la variable será menos

variable, por ende más homogénea. En conclusión, como el ( ) es menor que ( ), la

resistencia a la tracción obtenida por las telas elaboradas por fibras naturales es más homogénea

que las elaboradas por fibras sintéticas. Es decir, se le otorgan los 7 puntos a las telas elaboradas

por fibras naturales.

Tasa de rendimiento

175 – 185 180 4 6

185 – 195 190 8 6

195 – 205 200 12 15

205 – 215 210 15 9

215 – 225 220 9 3

225 – 235 230 9 1 ∑ ∑

Page 8: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 8

El segundo punto en cuestión hace referencia que al menos el 18% de los productos textiles deben

tener una resistencia a la tracción comprendida entre el promedio más una desviación estándar y la

máxima resistencia a la tracción obtenida, por lo tanto procede a determinar dicho valor de

entrada:

En seguida, para obtener la proporción se emplea la fórmula de percentil antes descrita:

i

i

iipn

Npn

CxP1

1100

(

)

i

i

iipn

Npn

CxP1

1100

(

)

Un punto muy importante corresponde a los resultados de obtenidos para cada tipo de tela, ya

que se debe tener en cuenta que dicho valor comprende a la proporción que se encuentra bajo el

valor ingresado, es decir gráficamente representa:

Sin embargo, la proporción que se debe poner a prueba corresponde a su complemento, es por ello

que se procede calcularlo:

Tasa de rendimiento

175 – 185 4 4

185 – 195 8 12

195 – 205 12 24

205 – 215 15 39

215 – 225 9 48

225 – 235 9 57 ∑

Tasa de rendimiento

175 – 185 6 6

185 – 195 6 12

195 – 205 15 27

205 – 215 9 36

215 – 225 3 39

225 – 235 1 40 ∑

222,4814

80,23%

212,4035

84,16%

Page 9: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 9

En base a los resultados obtenidos, se establece que las telas elaboradas con fibras sintéticas

cumplen con el segundo criterio, por lo que se adjudica los 3 puntos.

El tercer punto en cuestión corresponde a una comparación de medianas, por lo que se procede a

determinarlas. Para esto se debe calcular el intervalo que contenga n/2, o bien el que

inmediatamente supere dicho valor, obteniéndose para ambos casos:

Luego en base a los resultados se debe identificar el intervalo que contiene la mediana

En base a los resultados, la mediana de la resistencia a la tracción de las telas elaboradas con fibras

sintéticas es mayor en comparación a las elaboradas con fibras naturales. En consecuencia se le

otorgan los 5 puntos a las telas elaboradas con fibras sintéticas.

Finalmente la puntuación se encontrará dada por la siguiente tabla resumen:

Fibra Sintética Fibra Natural

Resistencia más homogénea – 7 puntos

Al menos 18% entre y máximo obtenido 3 puntos –

Mediana mayor 5 puntos –

8 puntos 7 puntos

Tasa de rendimiento

175 – 185 4 4

185 – 195 8 12

195 – 205 12 24

205 – 215 15 39

215 – 225 9 48

225 – 235 9 57 ∑

Tasa de rendimiento

175 – 185 6 6

185 – 195 6 12

195 – 205 15 27

205 – 215 9 36

215 – 225 3 39

225 – 235 1 40 ∑

𝑀𝑒 (𝑥) 𝑃50

𝑀𝑒(𝑥)

𝑀𝑒(𝑦) 𝑃50

𝑀𝑒(𝑦)

Page 10: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 10

Respuesta: La tasa de rendimiento obtenida al realizar trabajos de planificación simulada mediante

sistema no automatizado posee mayor puntuación, por lo que es el sistema más eficiente.

Ejercitación Propuesta.- Ejercicio 2.- Investigadores de Purdue University analizan la tasa de rendimiento obtenida al realizar trabajos de

planificación simulada mediante: un sistema automatizado y un sistema no automatizado. Para

cada uno de los sistemas utilizados se toman muestras de los trabajos realizados, registrando en

cada caso su tasa de rendimiento (definida de acuerdo a la calidad del producto), obteniendo la

siguiente información:

Tasa de rendimiento No Automatizado Automatizado

173,5 – 182,5 4 6

182,5 – 191,5 8 6

191,5 – 200,5 12 15

200,5 – 209,5 15 9

209,5 – 218,5 9 3

218,5 – 227,5 9 1

Total

El objetivo de este estudio es elegir el sistema más eficiente, para ello se utilizan tres criterios:

a) Tasa de rendimiento más variable

b) Al menos el 18,5% de los trabajos deben tener un rendimiento comprendido entre la

mínima tasa de rendimiento obtenida y el promedio menos una desviación estándar.

c) La mediana de la tasa de rendimiento obtenida sea menor.

Criterio de selección del sistema utilizado: Si cumple criterio a) se asignan 7 puntos, si cumple

criterio b) 3 puntos y si cumple criterio c) se asignan 6 puntos. Se elige el sistema que obtiene

menor puntaje.

Utilizando medidas estadísticas adecuadas, determine el puntaje obtenido para cada sistema

utilizado. En base a los resultados, indique cual es el sistema más eficiente, justificando su

respuesta.

Page 11: GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP Primera Edición - 2017 1 GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP

Primera Edición - 2017 11

𝐶𝑉(𝑥) ;𝐶𝑉(𝑦)

𝑃(𝑥<𝑥 𝑆𝑥) ; 𝑃 𝑥<𝑦 𝑆𝑦

𝑀𝑒(𝑥) ; 𝑀𝑒(𝑦)

Solución:

El sistema más eficiente corresponde al Automático.