examen-unidad-1-sistemas-2014-b.docx
TRANSCRIPT
Universidad Nacional del Santa Análisis Multidimensional
Examen Unidad I
1. La factura mensual del gasto telefónico de una pequeña empresa se ha incrementado notablemente en los últimos meses. Los estudios realizados por el administrador de la misma argumentan que el mayor uso de Internet dentro de la misma es la principal causa del mayor gasto en teléfono, lo que ha hecho que se estudie la posibilidad de acogerse a alguno de los múltiples bonos o tarifas especiales que ofrecen las compañías, lo que hasta la fecha todavía no se llevó a cabo. Las últimas cifras mensuales no hacen sino confirmar esta relación:
Mes Enero Febrero Marzo Abril MayoCuantía de la factura Telefónica (S/.) 55 100 118 120 142Tiempo de conexión (minutos) 200 500 700 800 1000
De acuerdo con la información anterior, responda a las siguientes preguntas:
a) Obtenga la recta de regresión ajustada.
b) Interpretar la pendiente de la recta de regresión ajustada.
Coeficientesa
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados
t Sig.
Intervalo de confianza de 95,0%
para B
B Error típ. Beta Límite inferior Límite superior
1 (Constante) 39,559 7,715 5,127 ,014 15,006 64,112
tiempo_ejecucion ,105 ,011 ,984 9,502 ,002 ,070 ,141
a. Variable dependiente: cuantia_factura
Y = a + bx
Donde:
a=39.559 Expresa que La Cuantía de la factura Telefónica es 39.559 cuando el Tiempo de conexión es 0.
b=0.105 Expresa el aumento de La Cuantía de la factura Telefónica por cada variación o aumento
unitartio del Tiempo de conexcion.
c)¿Cuál es el coeficiente de determinación? y ¿cuál el coeficiente de correlación simple? Interpretar c/u.
Resumen del modelob
Modelo
R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
dime
nsion
0
1 ,984a ,968 ,957 6,764
a. Variables predictoras: (Constante), tiempo_ejecucion
b. Variable dependiente: cuantia_factura
Coeficiente de Determinación:
R cuadrado = 0.958 = 95.8%
El 95.8% de la variación de La Cuantía de la factura Telefónica se debe al modelo lineal de
la ecuación, el porcentaje restante lo representa el Residuo.
Coeficiente de Correlacion:
R = 0.984
Entre la variable Cuantía de la factura Telefónica y Tiempo de Conexión existe un grado de
asociación muy alto.
d)Analizar los residuos utilizando un estudio inferencial de los mismos ¿se verifican las hipótesis del modelo (homocedasticidad, normalidad)?
Estadísticos sobre los residuosa
Mínimo Máximo Media
Desviación
típica N
Valor pronosticado 60,63 144,94 107,00 32,135 5
Valor pronosticado tip. -1,443 1,180 ,000 1,000 5
Error típico de valor
pronosticado
3,097 5,741 4,151 1,157 5
Valor pronosticado corregido 75,15 148,50 110,13 28,937 5
Residual -5,634 7,753 ,000 5,858 5
Residuo típ. -,833 1,146 ,000 ,866 5
Residuo estud. -1,575 1,326 -,157 1,182 5
Residuo eliminado -20,154 10,374 -3,128 11,938 5
Residuo eliminado estud. -3,096 1,683 -,372 1,796 5
Dist. de Mahalanobis ,039 2,082 ,800 ,894 5
Distancia de Cook ,080 3,198 ,782 1,354 5
Valor de influencia centrado ,010 ,520 ,200 ,224 5
a. Variable dependiente: cuantia_factura
Prueba de Kolmogorov-Smirnov para una muestra
Unstandardized
Residual
N 5
Parámetros normalesa,b Media ,0000000
Desviación típica 5,85762989
Diferencias más extremas Absoluta ,292
Positiva ,292
Negativa -,188
Z de Kolmogorov-Smirnov ,653
Sig. asintót. (bilateral) ,788
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.
Significancia=0.788
Como la significancia es mayor a 0.05 entonces el modelo se rige NORMALMENTE
e) Tabla ANOVA. ¿Qué conclusiones se obtienen de esta tabla? ¿Estos contrastes tienen alguna relación conlos contrastes individuales de la t?
ANOVAb
Modelo Suma de
cuadrados gl
Media
cuadrática F Sig.
1 Regresión 4130,753 1 4130,753 90,291 ,002a
Residual 137,247 3 45,749
Total 4268,000 4
a. Variables predictoras: (Constante), tiempo_ejecucion
b. Variable dependiente: cuantia_factura
Ho: B=0 (SI B=0 SE ACEPTA Ho)
H1: B<>0(SI B<>0 SE RECHAZA Ho)
FIJAR ALFA=0.05
COMO P=0.002<0.05 Se rechaza la Ho, entonces la ecuación del modelo de regresión lineal es
altamente significativo. Los coeficientes a y b tienen efecto significativo sobre el modelo de regresión
lineal.
2. “Los datos presentados en la tabla son relativos a diferentes variables de coches. Sepide,
N° Bankcan Trsbill CPI Usspot Usforw
1 10400 8,59 61,2 1,0164 1,01922 10317 8,70 61,5 ,9994 1,00273 10580 9,04 61,7 ,9892 ,99264 10559 8,97 62,0 ,9844 ,98875 10504 8,94 62,5 ,9800 ,98346 10946 8,99 62,8 ,9788 ,98157 10995 9,02 63,0 ,9686 ,97188 10806 9,12 63,3 ,9794 ,98279 10830 8,97 63,6 ,9766 ,9799
10 11002 9,07 64,0 ,9714 ,974711 11759 8,88 64,2 ,9722 ,975512 11843 8,41 64,5 1,0344 1,038613 11362 8,08 65,0 1,0092 1,011914 11176 7,67 65,6 1,0236 1,026215 11687 7,61 66,3 1,0481 1,051116 12049 7,55 66,7 1,0523 1,054717 11830 7,26 67,2 1,0454 1,047518 12132 7,07 67,7 1,0537 1,055219 12348 7,12 68,3 1,0578 1,059020 12024 7,16 68,6 1,0735 1,075021 12107 7,09 69,0 1,0735 1,075022 12503 7,19 69,6 1,0774 1,077723 12303 7,25 70,1 1,1036 1,103924 13416 7,18 70,6 1,1085 1,109325 12471 7,14 70,8 1,0915 1,0914
Bankcan: activos del Banco de Canadá. Trsbill: intereses de las Letras del Tesoro a 90 días. CPI: índice de precios al consumo. Usspot: razón de cambio Canadá/USA. Usforw: razón de cambio a un mes Canadá/USA.Ajustando un modelo de regresión lineal múltiple de la variable de interés Trsbill frente a las otras cuatro variables. Se pide:
1. Ajustar un modelo de regresión.
Y = B0 + B1*X1 + B2*X2 + B3*X3 + B4*X4
B0=28.421, B1=0, B2=-0.172, B3=47.708, B4=-58.889
2. ¿Cuál es el coeficiente de determinación? y ¿cuál el coeficiente de correlación múltiple?
Resumen del modelob
Modelo
R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
dime
nsion
0
1 ,948a ,899 ,878 ,29095
a. Variables predictoras: (Constante), razón de cambio a un mes
Canadá/USA, activos del Banco de Canadá, de precios al consumo, razón
de cambio Canadá/USA
b. Variable dependiente: intereses de las Letras del Tesoro a 90 días
Coeficiente de Determinación:
R cuadrado = 0.899 = 89.9% El 89.9% del modelo de regresión lineal múltiple explica el Trsbill(intereses de las
Letras del Tesoro a 90 días).
Coeficiente de Correlacion:
R = 0.949 El grado de asociación entre el Trsbill(intereses de las Letras del Tesoro a 90 días) y las demás variables independientes: Bankcan(activos del Banco de Canadá), CPI(índice de precios al consumo), Usspot(razón de cambio Canadá/USA. ) y Usforw(razón de cambio a un mes Canadá/USA); es muy alta(postiva).
3.
a). Tabla ANOVA. ¿Qué conclusiones se obtienen de esta tabla? ¿estos contrastes tienen alguna relación con los contrastes individuales de la t?
ANOVAb
Modelo Suma de
cuadrados gl
Media
cuadrática F Sig.
1 Regresión 15,004 4 3,751 44,312 ,000a
Residual 1,693 20 ,085
Total 16,697 24
a. Variables predictoras: (Constante), razón de cambio a un mes Canadá/USA, activos del
Banco de Canadá, de precios al consumo, razón de cambio Canadá/USA
b. Variable dependiente: intereses de las Letras del Tesoro a 90 días
Ho: B=0 (SI B=0 SE ACEPTA Ho)
H1: B<>0(SI B<>0 SE RECHAZA Ho)
FIJAR ALFA=0.05
COMO P=0.000<0.05 Se rechaza la Ho, entonces la ecuación del modelo de regresión lineal múltiple
es muy significativo. Los coeficientes B1, B2, B3, B4 tienen efecto significativo sobre el modelo de
regresión lineal multiple.
b).¿estos contrastes tienen alguna relación con los contrastes individuales de la t?
Si ya que en t vemos el desenvolvimiento de las variables individualmente con respecto a los datos, mientras que aquí vemos la relación de todas juntas.
4. ¿Son todas las variables significativas (contraste individual de la t)?
Coeficientesa
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados
t Sig.
Intervalo de confianza de 95,0% para B
B Error típ. Beta Límite inferior Límite superior
1 (Constante) 28,421 3,862 7,359 ,000 20,364 36,477
activos del Banco de Canadá ,000 ,000 ,214 ,971 ,343 ,000 ,001
de precios al consumo -,172 ,087 -,635 -1,970 ,063 -,353 ,010
razón de cambio Canadá/USA 47,708 116,708 2,610 ,409 ,687 -195,741 291,157
razón de cambio a un mes
Canadá/USA
-58,889 117,329 -3,149 -,502 ,621 -303,633 185,856
a. Variable dependiente: intereses de las Letras del Tesoro a 90 días
20,364 <= B0 <= 36.477La constante es significativa.
0.000 <= B1 <= 0.001La variable Bankcan(activos del Banco de Canadá) es significativa.
-3.53 <= B2 <= 0.10La variable CPI(índice de precios al consumo) no es significativa.
-195.741 <= B3 <= 291.157La variable Usspot(razón de cambio Canadá/USA. ) no es significativa.
-303.633 <= B3 <= 185.856La variable Usspot Usforw(razón de cambio a un mes Canadá/USA) no es significativa.
En conclusión, No todas las variables son significativas.
5. Analizar los residuos utilizando un estudio inferencial de los mismos¿se verifican las hipótesis del modelo (homocedasticidad, normalidad)?
Estadísticos sobre los residuosa
Mínimo Máximo Media
Desviación
típica N
Valor pronosticado 6,7475 9,0161 8,0828 ,79068 25
Valor pronosticado tip. -1,689 1,180 ,000 1,000 25
Error típico de valor
pronosticado
,067 ,209 ,125 ,037 25
Valor pronosticado corregido 6,5731 9,0154 8,0613 ,82005 25
Residual -,53877 ,50248 ,00000 ,26560 25
Residuo típ. -1,852 1,727 ,000 ,913 25
Residuo estud. -1,924 1,959 ,032 1,015 25
Residuo eliminado -,58167 ,64654 ,02155 ,33377 25
Residuo eliminado estud. -2,077 2,124 ,033 1,055 25
Dist. de Mahalanobis ,294 11,420 3,840 2,978 25
Distancia de Cook ,000 ,357 ,056 ,094 25
Valor de influencia centrado ,012 ,476 ,160 ,124 25
a. Variable dependiente: intereses de las Letras del Tesoro a 90 días
Prueba de Kolmogorov-Smirnov para una muestra
Unstandardized
Residual
N 25
Parámetros normalesa,b Media ,0000000
Desviación típica ,26559601
Diferencias más extremas Absoluta ,092
Positiva ,073
Negativa -,092
Z de Kolmogorov-Smirnov ,461
Sig. asintót. (bilateral) ,984
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.
Significancia = 0,984Como es mayor a 0.05 entonces el modelo se rige NORMALEMENTE.
3. Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y el número de unidades vendidas, se procedió a recoger datos sobre tales magnitudes durante el pasado mes en una determinada región. Los resultados obtenidos fueron los siguientes:
Precio miles euros Cantidad vendida (unidades mensuales)7,5 4509,0 42510,5 40012,0 35014,0 32516,0 30018,0 29020,5 28023,5 26027,0 200
Hallar el modelo que mejor se ajusta a los datos expresando las interpretaciones respectivas.
CompuestoResumen del modelo
R R cuadrado
R cuadrado
corregida
Error típico de la
estimación
,980 ,960 ,955 ,053
La variable independiente esprecio miles euros.
ANOVA
Suma de
cuadrados gl Media cuadrática F Sig.
Regresión ,528 1 ,528 190,713 ,000
Residual ,022 8 ,003
Total ,550 9
La variable independiente esprecio miles euros.
CrecimientoResumen del modelo
R R cuadrado
R cuadrado
corregida
Error típico de la
estimación
,980 ,960 ,955 ,053
La variable independiente esprecio miles euros.
ANOVA
Suma de
cuadrados gl Media cuadrática F Sig.
Regresión ,528 1 ,528 190,713 ,000
Residual ,022 8 ,003
Total ,550 9
La variable independiente esprecio miles euros.
Exponencial
Resumen del modelo
R R cuadrado
R cuadrado
corregida
Error típico de la
estimación
,980 ,960 ,955 ,053
La variable independiente esprecio miles euros.
ANOVA
Suma de
cuadrados gl Media cuadrática F Sig.
Regresión ,528 1 ,528 190,713 ,000
Residual ,022 8 ,003
Total ,550 9
La variable independiente esprecio miles euros.
LogísticaResumen del modelo
R R cuadrado
R cuadrado
corregida
Error típico de la
estimación
,980 ,960 ,955 ,053
La variable independiente esprecio miles euros.
ANOVA
Suma de
cuadrados gl Media cuadrática F Sig.
Regresión ,528 1 ,528 190,713 ,000
Residual ,022 8 ,003
Total ,550 9
La variable independiente esprecio miles euros.
Coeficientes
Coeficientes no estandarizados
Coeficientes
estandarizados
t Sig.B Error típico Beta
precio miles euros 1,038 ,003 2,664 366,745 ,000
(Constante) ,002 ,000 21,652 ,000
La variable dependiente es ln(1 / Cantidad vendida (unidades mensuales)).
CONCLUSION:
Los modelos que mejor se ajustan a los datos expresando son:
Compuesto Crecimiento Exponencial Logística
Los modelos mencionados anteriormente, presentan Error típico de la estimación de 0.53 lo que significa que la variabilidad de los datos, con respecto a su ecuación de regresión es muy baja.
Además que sus Coeficientes de determinación y correlación son 0,960 y 0,980 respectivamente.
Ho: B=0 (SI B=0 SE ACEPTA Ho)
H1: B<>0(SI B<>0 SE RECHAZA Ho)
FIJAR ALFA=0.05
COMO P=0.000<0.05 Se rechaza la Ho, entonces la ecuación del modelo de regresión no lineal de
cualquier modelo es muy significativo.
PERO:
Ante todos, el modelo Logístico pose el Error típico más bajo con respecto a sus coeficientes no estandarizados, entonces podría acercarse mas al ajuste de datos.