momento 3 grupo 106

17
1 Trabajo Colaborativo: Momento 3 Estudiantes: Ximena Camacho Leidy Delgado Ricardo Jose Rodriguez Eduar Dizzieth Calderón Eduyer Rojas Tutor Alejandro Méndez Gonzales Ingeniero Forestal Universidad Nacional Abierta y a Distancia Estadística Descriptiva Grupo 204040_106 Florencia 2015

Upload: ricardo

Post on 20-Feb-2016

70 views

Category:

Documents


0 download

DESCRIPTION

trabajo de estadística

TRANSCRIPT

Page 1: Momento 3 Grupo 106

1

Trabajo Colaborativo: Momento 3

Estudiantes:

Ximena Camacho

Leidy Delgado

Ricardo Jose Rodriguez

Eduar Dizzieth Calderón

Eduyer Rojas

Tutor

Alejandro Méndez Gonzales

Ingeniero Forestal

Universidad Nacional Abierta y a Distancia

Estadística Descriptiva

Grupo 204040_106

Florencia

2015

Page 2: Momento 3 Grupo 106

2

Introducción

Se ha realizado con anterioridad una encuesta en distintas instituciones educativas, los cuales han

dado como resultado una gran cantidad de datos o valores de tipo cualitativo y cuantitativo. La

investigación estadística es una actividad que apela a diversas técnicas con el propósito de llegar

a la esencia de la realidad. La regresión lineal simple y la regresión lineal múltiple son técnicas

de análisis de las variables de una investigación estadística, en este caso desde la encuesta

realizada. Si bien es cierto estas técnicas mencionadas se pueden utilizar para solucionar

problemas comunes en los negocios o para evaluar el comportamiento de su economía y en

general se utiliza con mayor frecuencia en las ciencias económicas, también es cierto que en

muchos casos se requiere conocer más que el comportamiento de una sola variable para entender

una investigación cualquiera sea su especia. Entonces, sin importar la situación presentada se

hace necesario que practiquemos estas técnicas de regresión por medio de ejercicios salientes de

la cotidianidad, a continuación veremos pues los resultados de dicha práctica.

Page 3: Momento 3 Grupo 106

3

Justificación

Partiendo de una base de datos de distintas instituciones educativas y unos datos primarios

(encuestas) nos proponemos encontrar datos secundarios (estadísticos) con la intención de

conocer las relaciones de las variables de estos datos. Para ello, en primer lugar aplicaremos el

proceso de regresión lineal simple para determinar tanto la naturaleza como la fuerza de una

relación entre dos variables y segundo lugar la regresión lineal múltiple con la cual describiremos

la relación entre dos o más variables independientes y una variable dependiente utilizando la

ecuación de regresión múltiple; estas ecuaciones de estimaciones nos permitirá realizar una

interpretación de correlación de la investigación realizada en estas instituciones educativas. El

trabajo de laboratorio constituye una de las mejores metodologías para la aplicación de modelos

estadísticos a las variables de los hechos, es por eso que se trabaja en este sentido y no otro para

la práctica de la unidad 3 de regresión y determinación.

Page 4: Momento 3 Grupo 106

4

Objetivos

Objetivos generales

Potencializar en el estudiante habilidades y destrezas para caracterizar un situación mediante el

análisis de las medidas estadísticas bivariantes.

Calcular e interpretar adecuadamente las medidas estadísticas bivariantes, asociadas a una

situación específica.

Determinar la relación entre dos o más variables inscritas en una situación específica a partir del

análisis de regresión lineal simple y múltiple.

Objetivos específicos

Interpretar correctamente los datos de cada tabla propuestos en cada uno de los ejercicios.

Realizar diagramas de dispersión en los ejercicios de laboratorio y actividades colaborativas que

permitan determinar el tipo de asociación entre las variables escogidas en cada ejercicio.

En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple crear

modelos matemáticos que permita predecir el efecto de una variable sobre la otra para determinar

su fiabilidad.

Determinar porcentajes que permitan una explicación de modelo y grado de relación de dos

variables de los ejercicios de laboratorio y de regresión y correlación lineal simple.

En la práctica de regresión y correlación lineal múltiple identificar una variable cuantitativa

dependiente y varias variables independientes del estudio de investigación, diagramarlas y

calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su

relación.

Relacionar o analizar la información obtenida en cada problema planteado en los ejercicios de

laboratorio y colaborativo.

Page 5: Momento 3 Grupo 106

5

Laboratorio de regresión y correlación lineal

1. El rendimiento del producto de un proceso químico está relacionado con la temperatura de

operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del

oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el

condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:

X

(% de Hidro

carburos)

Y

(Pureza)

0,99 90,01

1,02 89,05

1,15 91,43

1,29 93,74

1,46 96,73

1,36 94,45

0,87 87,59

1,23 91,77

1,55 99,42

1,4 93,65

1,19 93,54

1,15 92,52

0,98 90,56

1,01 89,54

1,11 89,85

1,2 90,39

1,26 93,25

1,32 93,41

1,43 94,98

0,95 87,33

Page 6: Momento 3 Grupo 106

6

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Análisis:

La línea de tendencia central, se encuentra muy ligada a los diferentes puntos de dispersión.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. Es confiable?

El modelo matemático; el cual nos permite predecir una variable sobre la otra es la ecuación de la

tendencia de la línea, la cual corresponde a: y = 14,947x + 74,283. Según su coeficiente de

determinación; R2 = 0,8774, es confiable ya que se aproxima a 1. RTA: Por ende es confiable.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

El porcentaje de explicación del modelo: Está dado por la representación porcentual del

coeficiente de determinación, así: R2 x 100% = 0,8774 x 100% = 87,74 %.

El grado de relación de las dos variables: Está dado por la raíz cuadrada del coeficiente de

determinación, así: √R2

= √0,8774=0,9366, cuya representación porcentual seria: 0,9366 x

100%= 93,66%, lo cual señala que las dos variables de porcentaje, están relacionadas entre sí,

con un 93.66%. También se puede afirmar que como el coeficiente de correlación tiene un valor

que se encuentra entre 0.90 y 1 entonces su correlación es buena.

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

De acuerdo a lo arrojado en el diagrama de dispersión indica que

y = 14,947x + 74,283, se despeja x. y a y se le da el valor de 91.3

y = 14,947x + 74,283

R² = 0,8774

85

90

95

100

105

0 0,5 1 1,5 2

diagrama de dispersion

Page 7: Momento 3 Grupo 106

7

y = 14,947x + 74,283

91,3 = 14,947x + 74,283

1,13 = x

Conclusión: cuando la pureza del oxígeno es de 91.3 el porcentaje de hidrocarburo es

de 1.13.

2. El número de libras de vapor (y) consumidas mensualmente por una planta química, se

relaciona con la temperatura ambiental promedio (en o

F). Para el año 2014, se registraron

los siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y consumos de

vapor.

Mes

Temperatura

(oF)

Consumo de

vapor (Lb)

Ene. 21 185,79

Feb. 24 214,47

Mar. 32 288,03

Abr. 47 424,84

May. 50 455

Jun. 59 539

Jul. 68 621,55

Ago. 74 675,06

Sep. 62 562,03

Oct. 50 452,93

Nov. 41 369,95

Dic. 30 273,98

Page 8: Momento 3 Grupo 106

8

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Análisis: los puntos de dispersión siguen la línea de tendencia central

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la

otra. Es confiable?

El modelo matemático; el cual nos permite predecir una variable sobre la otra es la

ecuación de la tendencia de la línea, la cual corresponde a: y = 92,2087 x – 6,3184. Según

su coeficiente de determinación; R2 = 0, 9999 se analiza que por ser cercano a 1, se

afirma que el modelo matemático obtenido el cual relaciona las variables de porcentaje de

RTA: Temperatura y consumo a vapor es confiable.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.

R2 x 100% = 0,9999 x 100% = 99,99 %.

El grado de relación de las dos variables: Está dado por la raíz cuadrada del coeficiente de

determinación, así: √R2 = √0,9999 =0,9999499987, cuya representación porcentual seria:

0,9999 x 100%= 99,99%, lo cual señala que las dos variables de porcentaje de porcentaje

de temperatura y consumo a vapor, están relacionadas entre sí, con un 99,99%. Su

relación es muy buena.

y = 9,2087x - 6,3184 R² = 0,9999

0

200

400

600

800

0 20 40 60 80

Diagrama de dispersion

Page 9: Momento 3 Grupo 106

9

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

y = 9,2087 x - 6, 3184, la formula queda así:

y= 9,2087 x - 6, 3184

9,2087(70) – 6,3184

644,609 – 6,3184

638,2906 = y

Conclusión: el consumo de vapor cuando la temperatura es de 70 oF es de 638,2906

3. Los investigadores están estudiando la correlación entre la obesidad y la respuesta

individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La

respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que

es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables

aleatorias

x

(porcentaje

de

sobrepeso)

y (umbral de

reflejo de

flexión

nociceptiva)

89 2

90 3

75 4

30 4,5

51 5,5

75 7

62 9

45 13

90 15

20 14

Page 10: Momento 3 Grupo 106

10

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Conclusión: el diagrama sigue la línea de tendencia central

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la

otra. Es confiable?

y= - 0,062x + 11,642 y como el coeficiente de correlación es; R2 = 0,1115. RTA: Con

esto se puede concluir que el modelo no es confiable.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.

El porcentaje de explicación del modelo: así: R2 x 100% = 0,1115 x 100% = 11.15 %.

El grado de relación de las dos variables: Está dado por la raíz cuadrada del coeficiente de

determinación, así: √R2 = √0,1115= 0,3339161571 cuya representación porcentual seria:

0,3339 x 100%= 33,39%, lo cual señala que las dos variables de porcentaje de sobrepeso

y umbral de reflejo de flexión nociceptiva, están relacionadas entre sí, con un 33,39%. Su

correlación no buena.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de

sobrepeso, de 40?

y = -0,0629x + 11, 642, donde x es 40

y= -2.516 + 11,642

y = -0,0629x + 11,642 R² = 0,1115

0

2

4

6

8

10

12

14

16

0 20 40 60 80 100

Diagrama de dispersion

Page 11: Momento 3 Grupo 106

11

9,126= y

Conclusión: el reflejo de flexión nociceptiva es de 9.126 cuando el porcentaje de

sobrepeso es de 40.

Regresión y Correlación lineal Simple

- Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas.

Variable: Edad

Variable: Peso

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre

las variables.

Con los resultados obtenidos se puede asegurar según la gráfica del diagrama de dispersión que el

tipo de asociación entre las variables sigue una tendencia lineal y Creciente.

y = 4,4757x - 9,6849 R² = 0,7869

0,0

10,0

20,0

30,0

40,0

50,0

60,0

0 2 4 6 8 10 12

Pe

so

Edad

Diagrama de Dispersión

Page 12: Momento 3 Grupo 106

12

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

El modelo matemático; el cual nos permite predecir una variable sobre la otra es la ecuación de

la tendencia de la línea, la cual corresponde a: y = 4,4757 x – 9,6849. Según su coeficiente de

determinación; R2 = 0,7869 se analiza que por ser cercano a 1, se afirma que el modelo

matemático obtenido el cual relaciona las variables de porcentaje de edad y peso es confiable.

- Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.

El porcentaje de explicación del modelo: Está dado por la representación porcentual del

coeficiente de determinación, así: R2 x 100% = 0,7869 x 100% = 78,69%

El grado de relación de las dos variables: Está dado por la raíz cuadrada del coeficiente

de determinación, así: √R2 = √0,7869 =0,8870, cuya representación porcentual seria:

0,8870 x 100%= 88,70%, lo cual señala que las dos variables de porcentaje de edad y

peso, están relacionadas entre sí, con un 88,70%. También se puede afirmar que como el

coeficiente de correlación tiene un valor que se encuentra entre 0.80 y 1 entonces su

correlación es aceptable.

- Relacionar la información obtenida con el problema.

Análisis:

Con los resultados obtenidos se puede asegurar que existe una correlación con las

variables edad y peso de los estudiantes de las instituciones públicas y privadas del

municipio de san Sebastián de Mariquita, con un porcentaje de 78,69%. Según el

coeficiente de correlación lineal se analiza que su correlación es aceptable.

Page 13: Momento 3 Grupo 106

13

Regresión y Correlación Lineal Múltiple

- Identificar una variable cuantitativa dependiente y varias variables independientes del estudio

de investigación.

Variable dependiente: Peso

Variables independientes: Edad y Estatura

- Realizar el diagrama de dispersión de dichas variables.

y = 4,4757x - 9,6849 R² = 0,7869

0,0

10,0

20,0

30,0

40,0

50,0

60,0

0 2 4 6 8 10 12

Pe

so

Edad

Diagrama de Dispersión

Page 14: Momento 3 Grupo 106

14

- Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su

relación.

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,967400646

Coeficiente de determinación R^2 0,93586401

R^2 ajustado 0,934665207

Error típico 1,511415576

Observaciones 110

Coeficientes

Intercepción -78,937361

Variable x1 -0,496865439

Variable x2 86,5177139

y = 79,022x - 73,543 R² = 0,9346

0,0

10,0

20,0

30,0

40,0

50,0

60,0

0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6

Pe

so

Estatura

Diagrama de Dispersión

Page 15: Momento 3 Grupo 106

15

- Relacionar la información obtenida con el problema.

Análisis:

El coeficiente de correlación múltiple entre los variables peso, edad y estatura de los estudiantes

de las instituciones públicas y privadas del municipio de san Sebastián de mariquita es excelentes

porque da 0,96740065

El coeficiente de determinación es 0,93586401 por lo tanto se analiza que por ser cercano a 1, se

afirma que el modelo matemático obtenido el cual relaciona las variables de porcentaje peso,

edad y estatura de los estudiantes de las instituciones públicas y privadas del municipio de san

Sebastián de mariquita es confiable.

Page 16: Momento 3 Grupo 106

16

Conclusiones

La investigación es un proceso de indagación en el cual la estadística descriptiva corresponde a

metodologías de gran utilidad para la eficiencia en el que hacer investigativo, de ahí la

importancia de que como estudiantes y futuros investigadores aprendamos estas metodologías

que muy probablemente serán muy útiles en nuestro que hacer, en los procesos de investigación

que realicemos sobre situaciones específicas de realidad y en general en todo nuestro actuar.

La estadística se convierte en un área de estudio muy útil y por ello se realizó este proceso de

aprendizaje el cual ha generado diferentes aprendizajes y desarrollo de habilidades entorno a la

estadística descriptiva y su aplicación sobre realidades a las cuales nos enfrentamos.

El primer paso para determinar si existe o no una relación entre dos variables es observar la

gráfica llamada diagrama de dispersión.

El error estándar nos permite deducir la confiabilidad de la ecuación de regresión que hemos

desarrollado.

El análisis de correlación es la herramienta estadística que podemos usar para describir el grado

hasta el cual una variable esta linealmente relacionada con la otra.

La regresión simple se presenta cuando una variable independiente ejerce influencia sobre otra

variable dependiente. Ejemplo: Y = f(x)

La regresión Múltiple se presenta cuando dos o más variables independientes influyen sobre una

variable dependiente. Ejemplo: Y = f(x, w, z).

Page 17: Momento 3 Grupo 106

17

Referencias

Referencias electrónicas:

BLOG CURSO ESTADÍSTICA DESCRIPTIVA. Recuperado de:

http://estadisticadescriptivaunad100105.blogspot.com.co/

REGRESION MULTIPLE. Recuperado de:

http://www.monografias.com/trabajos30/regresion-multiple/regresion-multiple.shtml

REGRESIÓN LINEAL SIMPLE. Recuperado de:

http://html.rincondelvago.com/regresion-lineal-simple.html