análisis spss

12
Sobre el modelo: Codificación de variables: Si= 1, No=0 Vidrio=1 , platico = 2 Variable dependiente (Likert) : 3,4,5 = 1 1,2=0 La muestra fue de 309 encuestados (observaciones) Se asume un nivel de significancia (alfa) de 10%, debido a que el internet aún sigue siendo un medio de recolección de datos que puede aportar sesgabilidad considerable (diferencia entre la representatividad de la población y la muestra). Significa que hay diferencias entre las respuestas que deberían ser y las que obtuvimos con nuestra muestra. Notas: El análisis factorial no pudo utilizarse como modelo, porque los datos de percepción que tenemos en escala de lickert tienen problemas de correlación cuando van juntos. Igual, hice el modelo y lo deje hasta donde indico que no se puede, como un adicional. El análisis de conglomerados no se puede hacer porque tenemos pocas variables en escala de lickert, es muy tarde para crear más, si ustedes la crean para los 309 encuestados, yo corro el modelo con conglomerados. El análisis multidimensional esta imposible hacerlo porque no tenemos variables de comparación directa y evaluación de estas, como esta en el ejemplo de dentríficos que comparan todas las marcas y ponen una escala de cuan semajantes son o cual prefieren entre las dos. Se puede crear data, pero creo que tomaría demasiado tiempo y creo que nos estaríamos desviando del tema de percepción porque estaríamos hablando de la comparación entre dos marcas y nuestro objetivo no va por ahí. Si leen todo el Word, lo entenderán, lo hice por pasos y cada paso con explicación. Por si acaso, se supone que solo escogemos un modelo de análisis para nuestra data, pero yo hice 2 y un

Upload: victor-ortiz

Post on 13-Jul-2016

53 views

Category:

Documents


2 download

DESCRIPTION

sssssdfdfdf

TRANSCRIPT

Page 1: Análisis SPSS

Sobre el modelo:

Codificación de variables:

Si= 1, No=0

Vidrio=1 , platico = 2

Variable dependiente (Likert) : 3,4,5 = 1 1,2=0

La muestra fue de 309 encuestados (observaciones)

Se asume un nivel de significancia (alfa) de 10%, debido a que el internet aún sigue siendo un medio de recolección de datos que puede aportar sesgabilidad considerable (diferencia entre la representatividad de la población y la muestra). Significa que hay diferencias entre las respuestas que deberían ser y las que obtuvimos con nuestra muestra.

Notas:

El análisis factorial no pudo utilizarse como modelo, porque los datos de percepción que tenemos en escala de lickert tienen problemas de correlación cuando van juntos. Igual, hice el modelo y lo deje hasta donde indico que no se puede, como un adicional.

El análisis de conglomerados no se puede hacer porque tenemos pocas variables en escala de lickert, es muy tarde para crear más, si ustedes la crean para los 309 encuestados, yo corro el modelo con conglomerados.

El análisis multidimensional esta imposible hacerlo porque no tenemos variables de comparación directa y evaluación de estas, como esta en el ejemplo de dentríficos que comparan todas las marcas y ponen una escala de cuan semajantes son o cual prefieren entre las dos. Se puede crear data, pero creo que tomaría demasiado tiempo y creo que nos estaríamos desviando del tema de percepción porque estaríamos hablando de la comparación entre dos marcas y nuestro objetivo no va por ahí.

Si leen todo el Word, lo entenderán, lo hice por pasos y cada paso con explicación. Por si acaso, se supone que solo escogemos un modelo de análisis para nuestra data, pero yo hice 2 y un adicional, de los 5 que existen. Así que yo creo que estamos bien.

Page 2: Análisis SPSS

Análisis logit

El modelo logit binario por lo común trata el problema de qué tan probable es que una observación pertenezca a cada grupo. Calcula la probabilidad de que una observación pertenezca a un grupo específico

La variable independiente (percepción) tiene que ser una variable binaria y las variables dependientes (influencia del sabor y estacionalidad) se muestran en escala del 1 al 5 (Likert). Como la variable independiente no tiene más de dos categorías, no es un modelo logit multinomial. El modelo Logit calcula los errores estándar de los coeficientes, por lo tanto se puede evaluar la significancia de cada variable.

Resultados del modelo logit binario:

Codificación de la variable dependiente:

Mala percepción de las bebidas carbonatadas: 0Buena percepción de las bebidas carbonatadas: 1

Page 3: Análisis SPSS

Como podemos observar, en la tabla de clasificación, son 84 personas que tienen una percepción mala acerca de las bebidas carbonatadas y 225 personas que opinan lo contrario.

Para la significancia del modelo:

H0: β=0

H1: β≠0 Sig. < α RH0

La categoría sabor pasa la prueba de significancia a diferencia de la variable estacionalidad. Esto quiere decir que, la variable estacionalidad no contribuye significativamente al modelo. Esto puede deberse a que existe mucha variabilidad en las respuestas y puede verse reflejado en los errores estándar.

La ecuación de regresión es:

P=0.432+0.219 sabor−0.111estacionalidad

Donde:

P: La probabilidad de que sea influyente en la percepción de las bebidas carbonatas

Page 4: Análisis SPSS

Luego de obtener la estimación de la ecuación de la regresión logística, podemos calcular la probabilidad de influencia del sabor y estacionalidad en la percepción que el público tiene sobre esta.

La probabilidad estimada de que una consideración alta (nivel=5 en Likert) del sabor y la estacionalidad influyan en la percepción positiva de las gaseosas, y por ende, indirectamente en el consumo es de 72.55179607%. Cuando x=5.

Fórmula de probabilidad logit:

Análisis discriminante

Es un modelo para analizar los datos, cuando la variable dependiente o de criterio es categórica, y las variables independientes están en intervalos (Likert). Por ejemplo, la variable dependiente sería la elección de una marca de computadora personal (marca A, B o C); y las variables independientes, las calificaciones de los atributos de las computadoras personales en una escala Likert de 7 puntos.

Formulación del problema:

En medida de la percepción, ya sea positiva o negativa de las bebidas carbonatas, se busca conocer si existen grupos que diferencien la importancia del sabor, estacionalidad, precio y edad en la preferencia. Así mismo, comprobar si estas variables son significativas para el modelo, reforzando la idea de medir la percepción de la población sobre las bebidas gaseosas.

Se utilizó como variable dependiente a la percepción sobre las bebidas carbonatas, en primera instancia era una variable de intervalo, luego se codificó (1, 2= 0 y 3, 4, 5= 1) para formar una variable categórica que se pueda utilizar como discriminante.

Grafica de resultados:

Page 5: Análisis SPSS

Es esta tabla se pueden observar las medias y desviaciones de cada variable dependiente.

Personas encuestadas con percepción negativa acerca de las bebidas carbonatadas:

La edad promedio es 20.33 El precio máximo en promedio que están dispuestos a gastar es 2.07 soles En una escala del 1 al 5, la importancia promedio del sabor es de 4 En una escala del 1 al 5, la influencia promedio de la estacionalidad es de 3.87 Las desviaciones se muestran por cada categoría.

Personas encuestadas con percepción positiva acerca de las bebidas carbonatadas:

La edad promedio es 20.48 El precio máximo en promedio que están dispuestos a gastar es 2.10 soles En una escala del 1 al 5, la importancia promedio del sabor es de 3.73 En una escala del 1 al 5, la influencia promedio de la estacionalidad es de 3.60 Las desviaciones se muestran por cada categoría

Se puede observar una disminución del promedio de la importancia del sabor para las personas que tienen una percepción positiva de las gaseosas frente a los que no la tienen. Esto puede deberse, a que las personas que no consumen bebidas carbonatas deben tener como requisito primordial el sabor para poder consumir gaseosas en algún momento dado, es por

Page 6: Análisis SPSS

eso que tienen mayores expectativas sobre el sabor si se decide comprar una bebida carbonatada.

Matriz de correlaciones:

Se observa que no existe multicolinealidad con ninguna de las variables dentro del modelo, por lo tanto pueden ir juntas en la regresión.

Probando la significancia del modelo:

H0: Las medias de las funciones discriminantes en todos los grupos son iguales

H1: Las medias de las funciones discriminantes en todos los grupos no son iguales

Sig. > α RH0 -> 3.094 > 0.10

Se rechaza la hipótesis nula de que las medias de las discriminantes son todas iguales. Se comprueba una discriminación significativa del modelo.

Diferencia o igualdad entre las medias por cada variable:

Page 7: Análisis SPSS

Las lambdas de Wilks son la suma de los cuadrados intragrupo y la suma total de los cuadrados. Varían entre 0 y 1. Si el valor se acerca a 1 se afirma que no existe diferencia entre las medias del grupo. Por lo tanto, podemos observar que todas las variables se encuentran con medias diferenciadas, aportan significativamente al modelo.

Resultados de clasificación:

Page 8: Análisis SPSS

En la tabla de grupos de pertenencia pronosticados se puede observar que, son las personas con percepción positiva (151) las que les dan más importancia a variables como el sabor, estacionalidad y el precio de las bebidas carbonatadas. Este grupo es conformado por el 67.1% de los encuestados frente al 32.9% de las personas que, a pesar de que tienen buena percepción sobre las gaseosas, no les dan mucha importancia a las variables de calificación.

Interpretación de los resultados:

El análisis discriminante desarrolla que, efectivamente, existen grupos que discriminan la importancia de las variables sabor, precio, estacionalidad y edad al momento de elegir su percepción acerca de las bebidas gaseosas. Fuera de lo esperado, se puede observar que no sólo las personas que tienen buena percepción discriminan las variables, sino también, y con mayor expectativas, las personas que tienen una percepción negativa de las gaseosas. Esto se refleja al momento de tomar la decisión si es que van a consumir o no bebidas carbonatadas, es por eso que tienen un nivel de exigencia mayor, y por ende se refleja en sus resultados.

Adicional:

Análisis Factorial

Page 9: Análisis SPSS

Es un tipo de análisis que se utiliza con el objetivo de detallar el comportamiento de los datos de las variables que sobresalen dentro de un conjunto o grupo. Este modelo omite la distinción entre variable dependiente y variables independientes. Es por ello que, desarrollan un comportamiento sin correlación entre sus puntuaciones y sobresalen entre los grupos pequeños.

Planteamiento del problema:

A. Objetivos del análisis factorial Identificar nuevos grupos de variables que sobresalen dentro del modelo Evaluar la importancia o influencia de estos grupos hacia la percepción que se tiene

sobre las bebidas carbonatadas Comprobar la influencia de las variables sobresalientes en el modelo

B. Variables incluidas dentro de la investigación: Importancia del sabor de las bebidas Influencia de la estacionalidad para el consumo de bebidas

C. Matriz de correlaciones:

La matriz de correlaciones muestra que los datos no están correlacionados, no existe multicolinealidad.

Resultados del análisis factorial:

Page 10: Análisis SPSS

H0: La matriz de correlación es una matriz de identidad

H1: La matriz de correlación no es una matriz de Sig. < α RH0

La prueba chi cuadrado da como resultado 0.867 con 1 grado de libertad, no es significativa a un nivel de 0.10, por lo tanto no se rechaza la hipótesis nula de que la matriz de correlaciones es una matriz de identidad. Es decir, las variables no se relacionan con las demás pero sí con ellas perfectamente. Por lo tanto, no es posible utilizar el análisis factorial como una técnica adecuada para el objetivo.