laboratorio regresion spss psico
TRANSCRIPT
-
UTALCA UNIVERSIDAD DE TALCA INSTITUTO DE MATEMTICAS Y FSICA
LABORATORIO SPSS. CLASE 7.1.
Viernes 21 de Noviembre de 2014. Prof.: Juan Barrera A.
Este taller debe ser hecho segn los grupos inscritos.
Objetivo: Realizar estimacin de Modelos de Regresin Lineal. Contenido: Activar SPSS 14.0 (versin existente en la Universidad de Talca).
En Educandus, en carpeta Bases de Datos, abrir archivo SPSS Datos para Regresin. En alumnos de primer ao que ingresaron a estudiar Psicologa en la Universidad de Talca, que asisten al curso de Tcnicas de Anlisis Estadstico en Psicologa, se desea analizar la relacin entre la nota de la prueba seis y de la nota de la prueba cinco. Vista de algunos datos:
-
Se desea estimar el modelo de regresin lineal simple en que la nota de la prueba seis depende de la prueba cinco, es decir: Y: Nota de la Prueba Seis. X: Nota de la Prueba Cinco. Para observar la asociacin lineal entre ambas variables, debemos construir un Diagrama de Dispersin: En SPSS, Grficos > Dispersin/Puntos
En Dispersin/Puntos, seleccionar Dispersin simple, Definir.
-
En Diagrama de dispersin simple, en Eje Y: ingrese nuestra variable dependiente NOTA PRUEBA SEIS, en Eje X: ingrese nuestra variable independiente NOTA PRUEBA CINCO. Aceptar.
-
SPSS muestra la siguiente salida:
La salida anterior la podemos editar:
7,06,05,04,03,02,01,0
NOTA PRUEBA CINCO
7,0
6,0
5,0
4,0
3,0
2,0
1,0
0,0
NO
TA
PR
UEB
A S
EIS
7,06,05,04,03,02,01,0
NOTA PRUEBA CINCO
7,0
6,0
5,0
4,0
3,0
2,0
1,0
0,0
NO
TA
PR
UEB
A S
EIS
-
Para describir en conjunto con la correlacin, en SPSS, en Analizar > Correlaciones > Bivariadas
En Correlaciones bivariadas, en Variables: seleccione nuestras dos variables de inters: NOTA PRUEBA SEIS Y NOTA PRUEBA CINCO. Aceptar.
-
SPSS muestra la siguiente salida:
Tenga presente que debe analizar en conjunto el coeficiente de correlacin con el respectivo diagrama de dsipersin.
Si desea probar si la correlacin es significativa, debe resolver la siguiente hiptesis:
H: = 0
H: 0
Segn la salida de SPSS, valor_p=0,000. Luego, usando un nivel de significacin del 5%, se rechaza H0, es decir, existe una
asociacin lineal significativa entre las variables NOTA PRUEBA SEIS y NOTA PRUEBA CINCO.
Correlaciones
1 ,550**
,000
84 84
,550** 1
,000
84 84
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
NOTA PRUEBA SEIS
NOTA PRUEBA CINCO
NOTA
PRUEBA
SEIS
NOTA
PRUEBA
CINCO
La correlacin es significativa al nivel 0,01 (bilateral).**.
-
Ahora, realizaremos el ajuste de los datos al modelo de regresin lineal simple. En SPSS, en Analizar > Regresin > Lineal
En Regresin lineal, en Dependiente: ingrese nuestra variable de respuesta NOTA PRUEBA SEIS, en Independientes: ingrese nuestra variable independiente NOTA PRUEBA CINCO.
-
En la ventana de Regresin Lineal, seleccione Estadsticos
En Regresin lineal: Estadsticos, seleccione Intervalos de confianza y tambin puede seleccionar Descriptivos. Continuar.
En la ventana de Regresin Lineal, seleccione Guardar
En la ventana Regresin lineal: Guardar nuevas variables, en Valores pronosticados seleccione No tipificados, en Residuos seleccione No tipificados. Continuar.
-
En la ventana de Regresin Lineal, Aceptar. SPSS mostrar las siguientes salidas:
En la salida, tambin se proporciona la correlacin:
La siguiente salida muestra un resumen del modelo ajustado:
En la salida anterior, R=0,550 representa la correlacin muestra que ya habamos
observado anteriormente. El R cuadrado representa al coeficiente de determinacin R2=0,303. El R cuadrado ajustado corresponde al coeficiente de determinacin ajustado
=0,295.
Si desea probar la hiptesis de que el modelo ajustado es significativo, debemos plantear:
H: = 0
H: 0
Para probar la hiptesis anterior, slo en regresin lineal simple, su resultado lo podemos mirar en la prueba F en ANOVA en la prueba t de Student, en donde el valor_p=0,000. Las salidas estn dadas a continuacin:
Estadsticos descriptivos
3,406 2,5011 84
2,680 1,4758 84
NOTA PRUEBA SEIS
NOTA PRUEBA CINCO
Media
Desviacin
tp. N
Correlaciones
1,000 ,550
,550 1,000
. ,000
,000 .
84 84
84 84
NOTA PRUEBA SEIS
NOTA PRUEBA CINCO
NOTA PRUEBA SEIS
NOTA PRUEBA CINCO
NOTA PRUEBA SEIS
NOTA PRUEBA CINCO
Correlacin de Pearson
Sig. (unilateral)
N
NOTA
PRUEBA
SEIS
NOTA
PRUEBA
CINCO
Resumen del modelob
,550a ,303 ,295 2,1007
Modelo
1
R R cuadrado
R cuadrado
corregida
Error tp. de la
estimacin
Variables predictoras: (Constante), NOTA PRUEBA CINCOa.
Variable dependiente: NOTA PRUEBA SEISb.
-
En la salida anterior, tambin es posible observar intervalos de confianza al 95% para los
coeficientes del modelo de regresin: Para la pendiente:
0,622 1,244
Para el intercepto: 0,044 1,855
Si desea probar la hiptesis de que en el modelo en el intercepto pasa por el origen de los ejes XY, debemos plantear:
H: = 0
H: 0
Segn la prueba t de Student, valor_p=0,061. Usando un nivel de significacin del 5%, no se rechaza H0, es decir, el intercepto del
modelo de regresin ajustado pasa por el origen de los ejes XY. En la ltima salida, es posible observar el resultado del modelo de regresin ajustado: Y = 0,906 + 0,933X
ANOVAb
157,338 1 157,338 35,653 ,000a
361,869 82 4,413
519,207 83
Regresin
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrtica F Sig.
Variables predictoras: (Constante), NOTA PRUEBA CINCOa.
Variable dependiente: NOTA PRUEBA SEISb.
Coeficientesa
,906 ,477 1,898 ,061 -,044 1,855
,933 ,156 5,971 ,000 ,622 1,244
(Constante)
NOTA PRUEBA CINCO
Modelo
1
B Error tp.
Coeficientes no
estandarizados
t Sig. Lmite inferior
Lmite
superior
Intervalo de confianza para
B al 95%
Variable dependiente: NOTA PRUEBA SEISa.
-
En Vista de datos, podrn observar que fueron incorporadas dos nuevas variables:
PRE_1 (corresponde al ) y RES_1 (corresponde al residuo e).
En hoja de Vista de variables, pueden asignar etiquetas nuevas a cada una de las variables que gener SPSS: En Etiqueta para la variable PRE_1 escriba NOTA ESTIMADA PRUEBA SEIS y para la variable RES_1 escriba RESIDUO.
-
Ahora, debemos realizar el Anlisis de Supuestos. Normalidad. En SPSS, Estadsticos descriptivos > Explorar
En Explorar, en Dependientes: seleccione la nueva variable RESIDUO.
En Explorar, seleccione Grficos
-
En Explorar: Grficos, seleccione Grficos con pruebas de normalidad. Continuar.
En Explorar, Aceptar. SPSS muestra la siguiente salida:
Con la salida anterior, es posible resolver el siguiente test de normalidad:
H: ElresiduodistribuyeNormal
H: ElresiduonodistribuyeNormal
Segn Shapiro-Wilk, valor_p=0,015. Qu concluye usando un nivel de significacin del 5%?
Pruebas de normalidad
,156 84 ,000 ,962 84 ,015RESIDUO
Estadstico gl Sig. Estadstico gl Sig.
Kolmogorov-Smirnova
Shapiro-Wilk
Correccin de la significacin de Lillieforsa.
-
Homocedasticidad. En SPSS, Grficos > Dispersin/Puntos
En Dispersin/Puntos, seleccione Dispersin simple, Definir.
-
En Diagrama de dispersin simple, en Eje Y: ingrese nuestra nueva variable RESIDUO,
en Eje X: ingrese nuestra variable independiente NOTA PRUEBA CINCO. Aceptar.
-
SPSS muestra la siguiente salida:
Editando el grfico anterior:
7,06,05,04,03,02,01,0
NOTA PRUEBA CINCO
5,00000
2,50000
0,00000
-2,50000
RESID
UO
-
En Editor de grficos, seleccione el icono de Aadir una lnea de referencia al eje Y.
En ventana Propiedades, en Y Posicin del eje: escriba 0, Aplicar. Cerrar.
-
El grfico editado tendr el siguiente aspecto, incluyendo al eje de referencia en RESIDUO igual a cero.
Segn el grfico anterior, Hay Homocedasticidad?
7,06,05,04,03,02,01,0
NOTA PRUEBA CINCO
5,0
2,5
0,0
-2,5
RE
SID
UO