ultima prÁctica… · web viewregresiones lineales y no lineales siga paso a paso, con exactitud,...

14
UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE HUMANIDADES Y EDUCACIÓN ESCUELA DE PSICOLOGÍA CÁTEDRA DE ESTADÍSTICA ESTADÍSTICA II TALLER PARA EL USO DE ORANGE, SPSS Y EXCEL APLICADOS A LA ESTADÍSTICA BIVARIADA Y MULTIVARIADA

Upload: others

Post on 12-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

UNIVERSIDAD CENTRAL DE VENEZUELAFACULTAD DE HUMANIDADES Y EDUCACIÓN

ESCUELA DE PSICOLOGÍACÁTEDRA DE ESTADÍSTICA

ESTADÍSTICA II

TALLER PARA EL USO DE ORANGE, SPSS Y EXCEL

APLICADOS A LA ESTADÍSTICA BIVARIADA Y MULTIVARIADA

Profesora María Fátima Dos Santos

Page 2: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

A continuación se presentan una serie de materiales que serán utilizados durante la

materia Estadística II, en la Escuela de Psicología de la UCV, con la finalidad de iniciar al

alumno en el uso de los programas Orange, SPSS y Excel como herramientas para el

abordaje de análisis descriptivos bivariados.

Las actividades aquí propuestas complementan las actividades teóricas y prácticas

desarrolladas en las clases de aula, y deben ser realizadas por los alumnos como asignación

fuera del horario de clases de la materia. Si los alumnos requieren ayuda con la utilización de

los paquetes estadísticos, pueden consultar al profesor, utilizar la ayuda brindada por el

programa, consultar uno de los tantos manuales disponibles o dirigirse al preparador.

El presente material sigue el ordenamiento general de los contenidos de la materia. Las

prácticas están organizadas de la siguiente manera:

UNIDAD I

PRÁCTICA I – Dispersogramas en Orange y SPSS

UNIDAD II

PRÁCTICA II – Ecuaciones lineales simples en SPSS

PRÁCTICA III - Ecuaciones lineales múltiples en SPSS

UNIDAD III

PRÁCTICA IV – Casos especiales de correlación

1

Page 3: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

UNIDAD I PRÁCTICA I:DISPERSOGRAMAS EN ORANGE Y SPSS

Siga paso a paso, con exactitud, las siguientes instrucciones:

a) Utilice la base de datos “Iris”. Para cargarla, mueva el ícono de Dataset al lienzo (“canvas”, el espacio en blanco a la derecha). Haga doble click sobre el ícono que movió a la derecha. Busque en el listado la base de datos “Iris”, haga click sobre ella y pulse aceptar.

b) Si quiere ver los valores de la base de datos, mueva el ícono “Data Table” hasta el lienzo, conéctelo con Dataset y haga doble click en Data Table. Las cuatro variables disponibles son Largo de los Sépalos, Ancho de los Sépalos, Largo de los Pétalos y Ancho de los Pétalos.

2

Page 4: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

c) Siga las instrucciones del tutorial de Orange para elaborar tres dispersogramas utilizando estas variables.

d) Juegue con los dispersogramas cambiando el color y tamaño de los puntos, las variables de los ejes, etc.

e) Pegue los tres dispersogramas en un documento de Word (use los íconos de abajo a la izquierda, como Save Image, que aparece como un diagrama de torta) y analice cada uno de ellos justo debajo. Es decir: primer dispersograma y justo debajo el análisis de ese primer dispersograma, segundo dispersograma y justo debajo el análisis de ese segundo dispersograma, etc.

f) La siguiente parte de la práctica sólo puede hacerse en SPSS (el PSPP no tiene módulo de graficación). Puede utilizar el SPSS en el laboratorio de informática de la Escuela.

g) Para trabajar con SPSS vamos a usar la base de datos Iris.xls, que le llegará por correo. Los archivos con extensión .xls están en Excel, pero pueden ser llevados a SPSS y ser grabados con extensión .sav (que es propia de SPSS).

h) Elija un directorio en su computadora y guarde allí el archivo Iris.xlsi) Entre en SPSS. Pulse “archivo”, “abrir”, “datos”. Aparecerá un cuadro de diálogo donde viene

predefinido “archivos SPSS Statistics (*.sav)”. Pulse la flecha a la derecha de esta ventana y se desplegará una lista de opciones. Elija “Excel (*.xls, *.xlsx, *.xlsm)”. Una vez hecho esto, busque en los archivos del listado superior el archivo Iris.xls. Es posible que tenga que mover la ventana hacia la derecha. Una vez lo consiga, haga doble click en él (o click simple y luego aceptar).

3

Page 5: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

j) Aparecerá un cuadro de diálogo donde está preseleccionada la ventanilla “Leer nombre de variables de la primera fila de datos”. Pulse click en aceptar (porque en la base de datos en Excel, la primera fila tiene los títulos de las variables. Si no fuera así, habría que deshabilitar esta casilla).

k) En la ventana “Vista de Variables”, revise que todas las variables se cargaron como numéricas con nivel de medición de escala (o sea, de razón), a excepción de la variable Iris, que es el tipo de flor.

l) Vaya al menú “Gráficos”, elija “Dispersión” en la ventana inferior derecha y seleccione el tipo de gráfico que está arriba a la izquierda (“Dispersión Simple”)

4

Page 6: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

m) Seleccione las variables que prefiera y arrástrelas a donde aparecen “Eje X” y “Eje Y”. Pulse aceptar.

n) El SPSS genera los resultados en una nueva ventana, llamada por defecto “Resultado 1”. La base de datos la puede grabar como Iris.sav y la salida como Iris.spo (la extensión *.spo corresponde a salidas de resultados de SPSS o PSPP).

o) Haga click sobre cada dispersograma, pulse Control+C para copiarlo, vaya a Word y péguelo allí. Haga tres dispersogramas en SPSS son las variables que elija. Péquelos en Word y analice cada dispersograma justo debajo del gráfico, como hizo con los de Orange.

p) Al final tendrá un archivo en Word con seis dispersogramas y seis análisis. Tres dispersogramas vienen de Orange y tres de SPSS. Trate de usar distintas combinaciones de variables.

q) Enviar el archivo de Word al correo [email protected]. No olvide colocar el nombre de los integrantes. No es necesario hacer bibliografía, portada ni introducción. Se agradece un párrafo de conclusiones generales.

TODOS LOS TEXTOS QUE APARECEN RESALTADOS, DE AQUÍ EN ADELANTE, ESTÁN EN REVISIÓN.

5

Page 7: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

UNIDAD II PRÁCTICA II:DISPERSOGRAMAS EN EXCEL.

REGRESIONES LINEALES Y NO LINEALES

Siga paso a paso, con exactitud, las siguientes instrucciones:

a) Introduzca en una hoja nueva de Excel las tres variables de razón utilizadas en la práctica anterior, y tomadas de la base de datos “Conociendo al Estudiante de Estadística” (Notas, Edad y P18). Debe pegar las tres columnas correspondientes, todos los 305 sujetos.

b) Sombree dos variables y vaya a “Insertar”, “Diagramas de Dispersión” y elija el diagrama que NO presenta línea.

c) Siga las instrucciones de estilo y colóquelo en la misma hoja o en una hoja nueva, como le parezca más fácil de manejar.

d) Active el gráfico haciendo un clic simple sobre éle) Consiga en el menú “Diseños de Gráfico” y busque el estilo donde se agrega línea de tendencia

y ecuación de regresión. Tenga en cuenta que Excel automáticamente considera como VI la que está en el eje X y como VD la que aparece en el eje Y.

f) Observe que se muestra la ecuación de regresión lineal y el coeficiente de correlación.g) Observe la recta producida. ¿Se ajusta a la nube de puntos o no? Analice el valor de R2

h) Vamos a explorar si una línea cuadrática se ajustaría mejor. Haga doble click sobre la recta y se abrirá la ventana “Opciones de Línea de Tendencia”. Seleccione Exponencial y pulse aceptar. Compare el ajuste de la línea respecto a la nube de puntos. Compare el R2 obtenido ahora con el anterior.

i) Entregue el informe IMPRESO EN WORD, con la siguiente estructura: Gráfico de ecuación lineal (en el gráfico debe aparecer ecuación y R2) Análisis del gráfico y el valor de R2

Gráfico de la ecuación exponencial (en el gráfico debe aparecer ecuación y R2) Análisis del gráfico y el valor de R2

Comparación de ambos R2. ¿Qué dice esto sobre la relación entre las variables?

6

Page 8: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

UNIDAD II PRÁCTICA III:ECUACIONES LINEALES SIMPLES EN SPSS

a) Utilizando la base de datos “Conociendo al Estudiante de Estadística”, vamos a calcular los coeficientes para dos regresiones:

Primero: Edad (como VI) y P18 (como VD) Segundo: Edad (como VI) y Notas (como VD)b) Entre en “Analizar” y busque “Regresión lineal”. Pase a la derecha la variable dependiente y

UNA VARIABLE INDEPENDIENTE (si pasa más de una, calculará una regresión múltiple, no simple). NOTE QUE DEBE HACER EL PROCEDIMIENTO DOS VECES: UNA PARA LA PRIMERA ECUACIÓN Y UNA PARA LA SEGUNDA.

c) Preste atención a dos cosas: El cuadro resumen del procedimiento (en especial los valores de R, R2 y error estándar) El cuadro de coeficientes. En la columna llamada B conseguirá los coeficientes no estandarizados (b, el valor que está a la derecha del nombre de la variable y a, llamado “constante”). En la columna “beta” conseguirá los coeficientes estandarizados, es decir, cuando la recta pasa por el origen de coordenadas.d) Explicite la recta de regresión reemplazando los coeficientes en la estructura de la ecuación que

tanto hemos usado.e) ANALICE LOS COEFICIENTES a Y b DE CADA ECUACIÓN.f) ENTREGUE IMPRESO EN WORD, CON LA SIGUIENTE ESTRUCTURA: Salida completa de SPSS para la primera regresión Análisis de R2, error y ambos coeficientes Salida completa de SPSS para la segunda regresión Análisis de R2, error y ambos coeficientes Comparación de lo encontrado en ambas ecuaciones

7

Page 9: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

UNIDAD II PRÁCTICA IV:ECUACIONES LINEALES MULTIPLES EN SPSS

a) Utilizando la base de datos “Conociendo al Estudiante de Estadística”, vamos a calcular regresiones para:

Primero: VI Edad y P18 y VD Notas Segundo: VI Edad y Notas y VD P18b) Entre en “Analizar” y busque “Regresión lineal”. Pase a la derecha las variables indicadas para

cada caso. NOTE QUE DEBE HACER EL PROCEDIMIENTO DOS VECES: UNA PARA LA PRIMERA ECUACIÓN Y UNA PARA LA SEGUNDA.

c) Preste atención a dos cosas: El cuadro resumen del procedimiento (en especial los valores de R, R2 y error estándar) El cuadro de coeficientes. En la columna llamada B conseguirá los coeficientes no estandarizados (b, el valor que está a la derecha del nombre de la variable y a, llamado “constante”). En la columna beta conseguirá los coeficientes estandarizados, es decir, cuando la recta pasa por el origen de coordenadas.d) Elabore la recta de regresión reemplazando los coeficientes en la estructura de la ecuación que

tanto hemos usado.e) ANALICE LOS COEFICIENTES a Y b1 y b2 DE CADA ECUACIÓN.f) ENTREGUE IMPRESO EN WORD, CON LA SIGUIENTE ESTRUCTURA: Salida completa de SPSS (las cuatro tablas) para la primera regresión Análisis de R2, error y coeficientes Salida completa de SPSS (las cuatro tablas) para la segunda regresión Análisis de R2, error y ambos coeficientes Comparación de lo encontrado en ambas ecuaciones

8

Page 10: ULTIMA PRÁCTICA… · Web viewREGRESIONES LINEALES Y NO LINEALES Siga paso a paso, con exactitud, las siguientes instrucciones: Introduzca en una hoja nueva de Excel las tres variables

UNIDAD III PRÁCTICA I:CASOS ESPECIALES DE CORRELACIÓN

a) Utilice la base de datos “Conociendo al Estudiante de Psicología”. b) Vamos primero a procesar preguntas múltiples. En el menú busque “Datos” y allí “Set de

Respuestas Múltiples”. Tiene que definir las variables que formarán parte de la pregunta múltiple. Vamos a trabajar primero con la pregunta 6. Sombree todas las columnas correspondientes a P6 (de P6_1 a P6_10) y páselas a la ventana de la derecha. Asigne un nombre a esta variable e identifique los valores de los códigos arrancando con 1 y terminando en 20 (la variable tiene 15 códigos, de modo que 20 basta y sobra). Tenga cuidado en este paso: si le dijera al programa que la variable tiene códigos del 1 al 5, el programa borraría todos los códigos superiores. Pulse aceptar. Este proceso no arroja ninguna salida.

c) Haga lo mismo con la pregunta 10, que también es múltiple.d) En el mismo menú (Datos / Respuestas Múltiples) pida ahora la frecuencia de estos dos sets.

Como puede notar, el programa adicionó todas las variables que correspondían a la misma pregunta, dando resultados globales para todas. Estas tablas las pedimos sólo para revisar que el proceso va bien.

e) Una vez que hemos sumado la información en estas dos preguntas, vamos a hacer una tabla de doble entrada. En el mismo menú (Datos / Respuestas Múltiples) pida tabla cruzada. Pase al recuadro “filas” la variable múltiple y al recuadro “columnas” la variable Género. Pulse aceptar. Haga el procedimiento una vez para P10 y una vez para P6. En estas tablas no se pueden pedir cálculos de Chi Cuadrado ni ninguna otra correlación o asociación. Preséntelas en el informe, y analícelas según la frecuencia.

f) Seleccione dos variables dicotómicas (por ejemplo, Género y Tener Teléfono Celular, P8). Recodifíquelas a los valores 0 y 1 (puede asignarlos arbitrariamente), entrando en Datos, Recodificar en una Nueva Variable. Allí tiene que indicarle al programa cuál etiqueta pasará a ser el valor 0 y cuál será el valor 1. Si tiene problemas con la recodificación puede utilizar un cualquier libro de SPSS o pedir ayuda a la profesora.

g) Entre en Analizar, Frecuencias y pida una tabla de doble entrada (2x2) y antes de seleccionar Aceptar, pida que calcule Phi. Pegue los resultados en un archivo de Word y analícelos.

h) Seleccione dos variables ordinales o de intervalo y siga los pasos que realizó en prácticas anteriores para el cálculo de la Correlación de Pearson. Esta vez pedirá el cálculo de una tau de Kendall. Pegue la tabla en Word y analice los resultados.

i) Seleccione dos variables de razón y siga los pasos que realizó en prácticas anteriores para el cálculo de la Correlación de Pearson. Pida al programa que calcule Spearman. Analice los resultados.

j) Entre al menú “Analizar”, “Correlaciones” y siga los pasos que utilizó en prácticas anterior para calcular una Correlación de Pearson. Pida al programa que calcule la correlación entre una de las variables dicotómicas recodificadas que usted produjo en el paso b y una variable de razón. Usted acaba de aplicar una correlación Punto Biserial. Analícela.

k) Dicotomice la variable de razón “Edad”. Vamos a utilizar una dicotomización arbitraria que separa a los que tienen menos o igual a 18 años, y los que tienen más. Entre en Datos, Recodificar en Diferente Variable e indique los rangos (menor o igual a 18 puede recodificarlo como 0, por ejemplo, y mayor a 18 como 1). Luego, usando Pearson, correlacione esta variable recodificada con alguna otra de las variables de razón. Usted acaba de aplicar un coeficiente de correlación Biserial.

l) Pegue cada uno de los cuadros de salida en Word y analícelos inmediatamente abajo. Entregue impreso a la profesora en la fecha señalada.

9