analisis e interpretacion de resultados

71
Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados 1 D.R. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006. 1 AM04003-Análisis e interpretación de resultados Sesión1. La importancia del muestreo 2 Conceptos Básicos • Elemento: Es la unidad acerca de la cual se solicita información. En una investigación con encuestas, por lo regular el elemento es el entrevistado. •Población meta: Es el conjunto de todos los elementos definidos antes de la selección de la muestra y que posee la información que busca el investigador. Una población definida adecuadamente debe definirse en términos de ELEMENTOS, UNIDADES DE MUESTREO, ALCANCE y TIEMPO. Ejemplos: 3 Conceptos Básicos Si deseamos monitorear las ventas de un nuevo producto, como un jabón de tocador, la población podría ser: ELEMENTO: Jabón de tocador UNIDADES DE MUESTREO: Supermercados, farmacias, almacenes de descuentos, tiendas de abarrotes. ALCANCE: Monterrey TIEMPO: 6 al 20 de enero de 2007 4 Conceptos Básicos La población para medir la reacción de un comprador hacia un nuevo producto químico industrial sería: ELEMENTO: Ingenieros Químicos UNIDADES DE MUESTREO: Empresas que compran mas de 2 millones de pesos en químicos por año. ALCANCE: La zona norte de la República Mexicana TIEMPO: 2007 5 Unidad de muestreo Es el elemento o elementos disponibles para su selección en alguna etapa del proceso de muestreo. En el tipo de muestreo más simple, que sería el de una sola etapa, las unidades y los elementos de muestreo son los mismos. En el caso de procedimientos más complejos, se pueden tener el número de etapas que el investigador desee, lo que se tiene que hacer es especificar la unidad de muestreo en cada una de las etapas. 6 Conceptos Básicos Por ejemplo, una muestra en tres etapas podrías ser: Etapa 1: Ciudades con población de mas de 800,000 habitantes. Etapa 2: Colonias de nivel socioeconómico C+ Etapa 3: Mujeres de 40 años y más

Upload: lletsumen

Post on 06-Aug-2015

111 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión1. La importancia del muestreo

2

Conceptos Básicos

• Elemento: Es la unidad acerca de la cual se solicita información. En una investigación con encuestas, por lo regular el elemento es el entrevistado.

•Población meta: Es el conjunto de todos los elementos definidos antes de la selección de la muestra y que posee la información que busca el investigador. Una población definida adecuadamente debe definirse en términos de ELEMENTOS, UNIDADES DE MUESTREO, ALCANCE y TIEMPO. Ejemplos:

3

Conceptos Básicos

Si deseamos monitorear las ventas de un nuevo producto, como un jabón de tocador, la población podría ser:

ELEMENTO: Jabón de tocadorUNIDADES DE MUESTREO: Supermercados, farmacias, almacenes de descuentos, tiendas de abarrotes.ALCANCE: MonterreyTIEMPO: 6 al 20 de enero de 2007

4

Conceptos Básicos

La población para medir la reacción de un comprador hacia un nuevo producto químico industrial sería:

ELEMENTO: Ingenieros QuímicosUNIDADES DE MUESTREO: Empresas que compran mas de 2 millones de pesos en químicos por año.ALCANCE: La zona norte de la República MexicanaTIEMPO: 2007

5

Unidad de muestreo

Es el elemento o elementos disponibles para su selección en alguna etapa del proceso de muestreo.

En el tipo de muestreo más simple, que sería el de una sola etapa, las unidades y los elementos de muestreo son los mismos. En el caso de procedimientos más complejos, se pueden tener el número de etapas que el investigador desee, lo que se tiene que hacer es especificar la unidad de muestreo en cada una de las etapas.

6

Conceptos Básicos

Por ejemplo, una muestra en tres etapas podrías ser:

Etapa 1: Ciudades con población de mas de 800,000 habitantes.

Etapa 2: Colonias de nivel socioeconómico C+

Etapa 3: Mujeres de 40 años y más

Page 2: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Marco muestral o de referencia

Representación de los elementos de la población meta que consiste en una lista o grupo de indicaciones para identificar a la población meta.

Un ejemplo de esto podrían ser una lista de clase, una lista de votantes registrados, una lista de empleados, directorio telefónico y hasta un mapa. En el caso del mapa se estarían muestreando partes geográficas, como por ejemplo, colonias, cuadras o manzanas dentro de una ciudad.

8

¿Por qué una muestra?

La alternativa al muestreo es realizar un censo, en el cual se estarían utilizando todos los elementos disponibles de una población definida, como el censo poblacional que realiza el gobierno, por parte de INEGI.

Los censos casi no se utilizan en la investigación de mercados, debido a que las poblaciones de interés por lo común incluyen miles o millones de individuos; aunque hay casos en el que un censo puede ser útil para una empresa de productos industriales que sólo tiene un pequeño número de clientes de un producto altamente especializado.

9

Beneficios del muestreo

1. Ahorra dinero: claramente ahorraríamos dinero entrevistando a 1000 personas en vez de un millón de personas que compondrían un población dada, en caso de hacer un censo.

2. Ahorra tiempo: definitivamente no sería lo mismo entrevistar a un millón de personas que sólo a 1000, en el caso de una muestra.

10

3. Puede ser mas preciso: a pesar de lo que pueda parecer, cuanto más pequeño sea un estudio, mayores serán las posibilidades de controlar al personal en cada una de las etapas del proceso de muestreo. Entre más personal se utilice, y más tiempo se lleve el estudio, habrá más errores y resultados menos exactos.

11

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

12

Créditos:

Lic. Ana María López Navarro

Page 3: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 2. Procedimiento de muestreo

2

Proceso de Muestreo

Definir la población

Identificar el marco muestral

Seleccionar un método de muestreo

Determinar el tamaño de la muestra

Ejecutar el plan

1

2

3

4

5

3

1. Definir la población

La población se debe definir en términos de:

• Elementos• Unidades de muestreo• Alcance • Tiempo

4

1. Definir la población

Los datos demográficos tales como edad, ingreso, nivel de estudios, etc., se utilizan mucho para definir a la población.

También los estilos de vida se pueden considerar, o bien condiciones de vida como tener poco tiempo disponible para dormir, comer, etc.

Por ejemplo, si queremos hacer una investigación para pastillas de cafeína, debemos asumir que una de las características de la población meta debe ser que tenga poco tiempo para dormir, como pueden ser choferes, doctores, enfermeras, etc.

5

2. Identificar el marco muestral

Ya que se ha definido la población, el investigador debe buscar un listado que le sirva como marco muestral.

Existen algunas fuentes tanto privadas como públicas que pueden servir, pero hay que considerar que todas tienen un grado de error muestral, hay que evaluar bien las fuentes y buscar la que mejor represente a la población meta.

6

2. Identificar el marco muestral

Para evaluar el error muestral en una “lista”, y ver si le puede servir al investigador, hay que considerar dos puntos:

• Evaluar el grado de afinidad de las características del marco muestral con los de la población meta.

• Estimar la cantidad de personas no listadas de la población meta.

Page 4: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

2. Identificar el marco muestral

Para evaluar el grado de afinidad de los miembros de la lista con los de la población meta se utiliza un “rango de incidencia” que son los que calificarían para la muestra.

Esto se puede hacer en una encuesta con preguntas de filtro, para poder descartar a las personas que no califican.

8

2. Identificar el marco muestral

Para el segundo punto, si el investigador determina que la cantidad de miembros no considerada dentro de la lista no representa un error considerable para la muestra final, la puede juzgar como aceptable.

Por ejemplo, en un club deportivo, puede ser que se tomen en cuenta solamente los registrados en Internet, pero hay unos cuantos que no están registrados, más sus hábitos de consumo no difieren en la opinión de los registrados, por lo cual podría ser válido el marco muestral.

9

3. Seleccionar un método de muestreo

Métodos de Muestreo

No Probabilísticos Probabilísticos

Por conveniencia

Por juicio Por cuotas Aleatorio simple

Estratificado

Bola de nieve SistemáticoDe grupo o

agrupamientos

10

4. Determinar el tamaño de la muestra

Número de elementos que se incluirán en la muestra.

Los factores cualitativos que se deben considerar son:• Importancia de la decisión• Naturaleza de la investigación• Número de variables• Naturaleza del análisis• Tamaños de muestra utilizados en estudios similares• Tasas de incidencia• Tasas de cumplimiento• Restricciones de recursos $

11

4. Determinar el tamaño de la muestra

En estudios concluyentes se deben tomar en cuenta factores como:

• Desviación estándar de la media• Nivel de confiabilidad• Error estándar

En estudios de naturaleza exploratorio las muestras tienden a ser más pequeñas, en estudios concluyentes las muestras deben ser más grandes.

12

5. Ejecutar el plan

En esta etapa de deben desarrollar procedimientos operacionales para la selección de la muestra.

Por ejemplo, en el caso de una encuesta casa por casa, es muy importante tener un manual detallado para los entrevistadores, ya que debe eliminarse la participación de ellos al máximo, y debe especificarse detalladamente la ruta a seguir, el salto de casas, instrucciones si la casa está vacía, si no se encuentran, si hay terrenos baldíos, etc.

Page 5: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

5. Ejecutar el plan

En una muestra probabilística es de suma importancia cuidar los procedimientos, ya que son factores críticos de éxito, y muchas veces la ejecución es la que puede constituir un obstáculo para toda la investigación.

14

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

15

Créditos:

Lic. Ana María López Navarro

Page 6: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis en interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 3. Muestreo no probabilístico

2

Muestreo no probabilístico

• De conveniencia

• De juicio

• Por cuotas

• Bola de nieve

3

Muestreo de conveniencia

Las muestras por conveniencia se seleccionan, como su nombre lo dice, de acuerdo a la conveniencia del investigador. Es muy utilizado por las empresas debido a su bajo costo y facilidad de ejecución.

Ejemplos:• Realizar entrevistas en un centro comercial.• Utilizar grupos de estudiantes de cierta universidad.• Entrevistar a las personas que pasen por cierta calle.

4

Muestreo de juicio

Se aplica a cualquier muestra en la que los criterios de selección se basan en el criterio del investigador acerca de lo que constituye una muestra representativa.

Por ejemplo, en una prueba de comercialización se hace un juicio con respecto a qué ciudades podrían considerarse como las mejores para lanzar un nuevo producto.

5

Muestreo por cuotas

Se seleccionan de manera que las características demográficas de interés para el investigador estén representadas en la muestra en las proporciones meta. Es decir, las cuotas aseguran que la composición de la muestra se la misma que la de la población en relación a las características de interés.

6

Muestreo por cuotas

Ejemplo:

Característicade control

Sexo

Masculino

Femenino

Composiciónde la población Composición de la muestra

Porcentaje Porcentaje Número

45%

65%45%

65%

450

650

Page 7: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis en interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Bola de Nieve

En este método se selecciona un grupo inicial de encuestados, generalmente al azar; después de ser entrevistados se les pide que identifiquen a otros que pertenecen a la población de interés. Este proceso es como una cadena, una referencia lleva a otra y asísucesivamente, por eso del nombre bola de nieve.

8

Bola de Nieve

Un ejemplo común de este método es cuando te llaman por teléfono para ofrecerte una tarjeta de crédito, posteriormente te piden si puedes proporcionarles los datos de algún familiar o conocido que pudiera estar interesado en la tarjeta de crédito también.

También empresas de Internet como Terra te llaman para ofrecerte los servicios, te preguntan información y posteriormente te piden datos de algún posible interesado en los servicios.

9

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

10

Créditos:

Lic. Ana María López Navarro

Page 8: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 4. Muestreo probabilístico

2

Muestreo probabilístico

Cada elemento de la población tiene la mismaprobabilidad de ser seleccionado para la muestra, hay cuatro tipos:

• Aleatorio simple

• Sistemático

• Estratificado

• Por agrupamiento

3

Muestreo aleatorio simple

Es la forma más pura del muestreo probabilístico y se realiza a partir de una lista de la población.

El procedimiento para realizarlo es:

4

1. Seleccionar un marco muestral.2. Asignar a cada elemento un número del 1 al N (tamaño

de la población).3. Generar n (tamaño de la muestra) números aleatorios

diferentes entre 1 y N. Esto se puede hacer mediante programas computacionales o tablas de números aleatorios.

4. Los números generados denotan los elementos que deberán incluirse en la muestra.

5

Muestreo aleatorio simple

Ejemplo para utilizar una tabla de números aleatorios:

PASO 1. Asigna a todos los miembros de la población un número. (supongamos que tenemos una lista de 30)

Nombre NúmeroLópez, Ricardo 1Pérez, Luis 2Flores, Ana 3Sosa, Eva 4Aldape, Josué 5Bonilla, Erik 30

6

PASO 2. Selecciona cualquier número en la tabla de números aleatorios como punto de partida y encuentra el primer número que corresponda a la lista de la población. En este ejemplo hemos seleccionado el número 32 como punto de partida.

23 15 75 48 59 0165 54 55 50 43 1003 87 16 30 28 32 Punto de partida: Nos moveremos38 97 29 49 51 94 hacia la izquierda hasta el final de la96 31 26 17 18 99 fila, después hacia abajo y hacia la11 74 27 93 81 44 derecha, posteriormente hacia abajo y43 36 58 05 59 09 así sucesivamente, en zig-zag.

Page 9: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

PASO 3. Selecciona a la persona que corresponda a los números de la lista, como vayan apareciendo, en este caso aparecen primero el 28, posteriormente el 30, luego el 16 y sigue el 87, que no lo incluye nuestra lista, este lo saltamos…llevamos por lo pronto a las siguientes personas:

#28 Brito, Javier#30 Bonilla, Erik#16 Garza, Alicia

PASO 4. Continuamos de la misma forma hasta completar el número completo de elementos para la muestra. Si encuentras un número que ya seleccionamos anteriormente, simplemente lo saltamos y seguimos en la selección.

8

Muestreo sistemático

El muestreo sistemático se utiliza a menudo como sustituto del muestreo aleatorio simple, produce muestras casi idénticas a las generadas por el simple aleatorio, pero es más sencillo de aplicar.

El procedimiento es:

9

PASO 1. Identifica un listado de la población que contenga un nivel aceptable de error.Ejemplo: El directorio telefónico de tu ciudad.

PASO 2. Calcula el intervalo de salto dividiendo el número de nombres de tu lista entre el número de la muestra.

Ejemplo: 25,000 nombres en el directorio = 50Muestra de 500 personas

El intervalo de salto sería cada 50 personas o nombres.

10

PASO 3. Utilizando números aleatorios, determina el punto de partida en la lista.

Ejemplo: •Selecciona un número aleatorio para la página del directorio donde se comenzará.•Selecciona un número aleatorio para seleccionar la columna.•Selecciona un número aleatorio para el renglón de la columna donde se comenzará, vamos a decir que ya seleccionando los puntos anteriores, empezaríamos en Fuentes, Pedro.

11

PASO 4. Aplica el intervalo de salto para determinar los nombres de la lista que se incluirán en la muestra.

Ejemplo:Si empezamos en Fuentes, Pedro, saltamos 50 nombres y seleccionamos el siguiente.

12

PASO 5. La lista se maneja de manera circular, es decir, el primer nombre que se seleccionó aleatoriamente, será el último de la lista al ir avanzando.

Ejemplo:

Empezamos en la “F” de Fuentes, seguiríamos seleccionado hasta llegar a la “Z”, donde continuaríamos en la letra “A” hasta llegar, en dado caso, nuevamente a la letra “F”.

Page 10: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Muestreo estratificado

Las muestras estratificadas son las muestras probabilísticas que se distinguen por los siguientes pasos en el procedimiento:

1. La población original o principal, se divide en dos o más subconjuntos mutuamente excluyentes y extensivos. (por ejemplo, hombre y mujer)

2. Las muestras simples aleatorias de los elementos de los dos o más subconjuntos se eligen independientemente una de la otra.

14

Procedimiento

1. Seleccionar un marco muestral.2. Seleecionar las variables de estratificación y el número

de estratos.3. Dividir la población completa en H estratos, con base

en la variable de calificación, cada elemento de la población es asignado a uno de los estratos H.

4. En cada estrato, numerar los elementos del 1 al Nh(tamaño de la población del estrato H).

15

5. Determinar el tamaño de la muestra de cada estrato, nh, con base en muestreo estratificado proporcionado o desproporcionado:

6. En cada estrato, seleccionar una muestra aleatorio simple de tamaño nh.

∑H

h=1nh = n

16

Ejemplo:

Supongamos que en Zacatecas, 70% de los niños de primaria van a escuela pública y el 30% a privadas. Si queremos 1,000 niños, lo que haremos es dividir los alumnos en 2 estratos (pública y privada) y se eligen aleatoriamente 700 niños de la pública y aleatoriamente300 de la privada.

17

Muestreo por agrupamiento

En el muestreo por conglomerados o agrupamiento, en lugar de considerar cada elemento de la población, lo que consideramos son “conglomerados de elementos”. El proceso es elegir aleatoriamente uno o varios conglomerados y la muestra estará formada por TODOSlos elementos de los conglomerados.

18

Ejemplos:

-En las encuestas durante las elecciones, los conglomerados pueden ser las mesas electorales, y lo que se hace es escoger algunas mesas al azar (y de ahí se toman todos los votos de las mesas seleccionadas).

-En otros ejemplos, los conglomerados pueden ser las colonias de viviendas, los municipios, etc.

Page 11: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

20

Créditos:

Lic. Ana María López Navarro

Page 12: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 5. Tamaño de la muestra

2

Métodos

Existen 5 enfoques o métodos para calcular el tamañode la muestra:

• Enfoque Arbitrario• Enfoque Convencional• Enfoque basado en el costo• Enfoque Estadístico• Enfoque del Intervalo de Confianza

3

Enfoque Arbitrario

Este enfoque se basa en una regla fija, donde una muestradebe ser al menos el 5% de la población total para poder ser confiable.Este enfoque es muy fácil de aplicar, pero no es eficiente ni económico.

4

Enfoque Convencional

Este enfoque se refiere a utilizar un tamaño “convencional”de muestra para el investigador. El número “convencional”puede ser el promedio de tamaños de muestra en estudios similares o puede ser el mismo tamaño de muestra que utilizó la competencia en un estudio similar.

La diferencia entre el enfoque convencional y el arbitrario es que el convencional puede tener cierta lógica, y el arbitrario no, se usa el 5% indistintamente.

5

Enfoque basado en costo

Este enfoque utiliza el presupuesto disponible de la empresa para determinar el tamaño de la muestra.Si no hubiera costos definidos para el investigador, todo podría ser manejado con censos.En este enfoque es importante valorar la importancia de los resultados de la investigación para la toma de decisiones, ya que a veces es conveniente considerar un ajuste en el presupuesto.

6

Enfoque Estadístico

En este método el tamaño de la muestra es determinado por los análisis estadísticos que van a ser utilizados, ya que ciertos análisis necesitan un mínimo de tamaño para que los resultados obtenidos sean confiables y aptos para la toma de decisiones.Los análisis estadísticos se utilizan para analizar subgrupos dentro de una muestra. Se analizan aspectos por edades, sexo, estado civil, etc.

Page 13: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Intervalo de confianza

Existe sólo un método que permite al investigador PREDETERMINAR la exactitud de los resultados de la muestra y es el de intervalo de confianza.

Este método aplica conceptos de variabilidad, intervalo de confianza, distribución de la muestra y error estándar de la media para crear un tamaño de muestra válido. Este es de los métodos más comúnmente utilizados por los investigadores.

A continuación veremos cada uno de los factores considerados en este enfoque.

8

Intervalo de confianza

Este método está basado en dos premisas básicas:

Intervalo de confianza: Es el rango en donde las terminaciones o colas definen un cierto porcentaje de las respuestas a una pregunta.

Teorema del límite central: Es una teoría que sostiene que los valores estadísticostomados repetitivamente de la muestra en unainvestigación tienen una distribución normal.

9

Intervalo de confianza

Recordamos los dos tipos de errores:– Error de No Muestreo– Error de Muestreo o error muestral: Este es el tipo de

error que estaremos controlando mediante lasfórmulas.

Fórmula de error muestral :

vecesError muestral %

10

Intervalo de confianza

Relación entre el tamaño de la muestra y el error muestral:

Tamaño de la muestra

Relación precisión/tamaño de la muestra

Pre

cisi

ón

Para una muestra de 1,000 o másse gana muy poca precisión, inclusive si se dobla la muestraa 2,000.

11

Intervalo de confianza

Variabilidad: se refiere a qué tan similar o diferentes son las respuestas a una pregunta dada.P : PorcentajeQ : 100% - P

Punto importante: A mayor variabilidad en la población estudiada, mayor será el tamaño de la muestra requerida para cumplir con un nivel de precisión estipulado.

12

Intervalo de confianza

¿Qué hemos aprendido hasta ahora?Existe una relación entre:El nivel de confianza que queremos que tengan nuestrosresultados…La variabilidad de la población y…La cantidad de error muestral aceptable (precisióndeseada) que queremos tener y…El tamaño de la muestra!

Page 14: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Intervalo de confianza

Existe una fórmula que conjuga todos estos factores, ésta es la que considera porcentajes:

Dónde:n = tamaño de la muestraz = error estándar asociado al nivel del confianza

seleccionadop = porcentaje estimado de la poblaciónq = 100 – pe = error muestral aceptable

z2(pq)e2n =

14

Intervalo de confianza

Fórmula para calcular el tamaño de la muestra queconsidera una media:

Dónde:n = tamaño de la muestraz = error estándar asociado al nivel del confianza

seleccionados = variabilidad indicada por una desviación

estándar estimadae = error muestral aceptable

s2 z2

e2n =

15

Intervalo de confianza

¿Cómo estimar la variabilidad ( p q ) en la población?

– Esperar el peor de los casos (p=50; q=50)

– Estimar la variabilidad: ¿Existen estudios anteriores? ¿Se conducirá un estudio piloto?

16

Intervalo de confianza

¿Cómo determinar el nivel de error muestral?

– El investigador debe ponerse de acuerdo con los gerentes para definir esta decisión, qué tanto error están dispuestos a tolerar?

– Lo convencional es ± 5%.

– Entre más importante sea la decisión, menor deberáser el error.

17

Intervalo de confianza

¿Cómo determinar el nivel de confianza?

– El investigador debe ponerse de acuerdo con los gerentes para definir esta decisión, a mayor nivel de confianza, mayor tamaño de la muestra.

– Lo convencional es 95%. (z=1.96)

– Entre más importante sea la decisión, mayor deberáser el nivel de confianza, 99% de confianza, z=2.58

18

Factor de corrección de la población finita

Es un ajuste al tamaño de la muestra que se hace en los casos donde la muestra es igual a 5% ó más de la población total.

Generalmente sucede en mercados muy especializados donde la población total es pequeña, como el mercado industrial o médico.

Page 15: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Factor de corrección de la población finita

Este cálculo se hace utilizando la siguiente fórmula:

Donde:n’ = tamaño revisado de la muestran = tamaño original de la muestraN = tamaño de la población

n’ = nNN + n - 1

20

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

21

Créditos:

Lic. Ana María López Navarro

Page 16: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 6. Planeación del trabajo de campo

2

Planeación de las operaciones de campo

Como contexto general, existen cuatro aspectos que son comunes en las operaciones de campo:

1. Programación del tiempo2. Presupuesto3. Trabajadores de campo4. Medición del desempeño

3

Programación del tiempo

Cualquier proyecto debe incluir una programación del tiempo que especifique:

• Comienzo e inicio del proyecto• Secuencia de actividades dentro del tiempo especificado

(usualmente se utiliza una gráfica de Gantt)

Es necesario detallar el número de días para cada actividad pero que sean realistas, ya que a veces los proyectos se atrasan por fijar metas inalcanzables.

4

Programación del tiempo

151413121110987654321

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1 2 3 4 5 6 7OCTUBRE NOVIEMBRE

1. Borrador del cuestionario de prueba2. Seleccionar la muestra de prueba3. Seleccionar los entrevistadores de prueba4. Preparar el material de capacitación5. Capacitar a los entrevistadores6. Realizar entrevistas de prueba7. Evaluar los resultados de la prueba8. Afinar cuestionario según resultados de prueba9. Seleccionar personal de campo 10. Preparar material de capacitación11. Capacitar personal de campo12. Realizar entrevistas13. Validación del trabajo de campo14. Evaluación del personal de campo15. Informe final de campo

ACTI

VID

AD

ES

Ejemplo:

5

Programación del tiempo

Cuando son proyectos muy largos, es necesario realizar una gráfica general, y otras específicas por actividades o bloques de actividades.

Debe estar muy clara la calendarización del proyecto, ya que deben cumplirse los tiempos establecidos.

6

Presupuesto

Se deben asignar costos a cada una de las actividades del programa, los costos están directamente relacionados, ya que un cambio en alguna actividad afecta a otra y el presupuesto se puede ver modificado.

Hay que detallar lo mejor posible cada uno de los rubros, y si es necesario, asignar un fondo de reserva para cubrir contingencias imprevistas.

Page 17: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Presupuesto

Para un estudio basado en entrevistas personales, por ejemplo, las principales categorías de costos son:

• Sueldos y salarios administrativos• Materiales y suministros• Teléfono• Supervisores de campo o servicios por entrevistas• Salario de entrevistadores• etc.

8

Personal

El éxito del trabajo de campo depende principalmente en la calidad del personal, es necesario realizar una cuidadosa selección y capacitación para poder exigir tiempos y el cumplimiento de adecuado de las actividades.Es necesario que el personal entienda claramente sus responsabilidades y la forma de medir su desempeño.

9

Es necesario tener un control por escrito para poder evaluar el desempeño individual del personal. Se requieren mediciones claras y fáciles de entender. Muchas veces en caso de cuestionarios se evalúa por encuesta respondida, o en el caso de entrevistas, por el número realizado. Pero existe otra información importante como rechazos, casos de ausencia, etc., con la cual pueden hacerse comparaciones interesantes.

A continuación se presenta un ejemplo en el caso de entrevistas:

Medición del desempeño

10

Medición del desempeño

MEDIDA DE DESEMPEÑO ESPERADO REAL1. Total de encuestados elegibles 1.1 Entrevistas 1.2 Rechazos 1.3 No contactos 1.4 Otro (especifique)

2. Total de encuestados no elegibles 2.1 Se mudaron 2.2 Otro (especifique)

3. Muestra total 3.1 Tasa de respuestas % % 3.2 Tasa de rechazos % % 3.3 Tasa de contactos % % 3.4 Tasa de elegibilidad % %

Ejemplo tabla de evaluación, indicadores esperados y reales:

11

Métodos de recolección de datos

Existen diferentes métodos para la recolección de datos en una investigación, y cada uno de ellos tiene sus particularidades. Los métodos son:•Entrevista personal•Entrevista telefónica•Entrevista por correo•Entrevista por computadora•Observación

12

Bibliografía

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Page 18: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Créditos:

Lic. Ana María López Navarro

Page 19: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 7. Trabajo de campo y recopilación de datos

2

Proceso del trabajo de campo y recopilación de datos

Selección de los trabajadores de campo

Capacitación de lostrabajadores de campo

Supervisión de lostrabajadores de campo

Validación del trabajode campo

Evaluación de lostrabajadores de campo

3

Selección de los trabajadores de campo

El primer paso en el proceso de trabajo de campo es la selección, ya que las características , antecedentes, y actitudes del personal de campo afectan en las respuestas de los entrevistados.

Entre mayor afinidad exista entre el personal de campo y el entrevistado, es mayor la probabilidad de que la investigación sea exitosa.

4

Selección de los trabajadores de campo

Por lo cual, antes de seleccionar al personal, debemos definir los siguientes aspectos:

– Establecer los requerimientos del proyecto, de acuerdo al método de recopilación de datos.

– Definir las características necesarias en el personal de campo.

– Contratar al personal.

5

Capacitación de los trabajadores de campo

Es muy importante tener bien capacitado al personal, ya que de eso dependen resultados uniformes durante la investigación. Se deben especificar todos los aspectos del método a utilizar, como:• Primer contacto• Realización de preguntas• Sondeo• Registro de respuestas• Conclusión de entrevista

6

Primer Contacto

En el primer contacto se decide si el entrevistado coopera o no en la investigación, por esto es muy importante capacitar al personal para que realice comentarios que inviten a participar en el estudio.

Muchas veces no se debe preguntar al entrevistado si desea participar o no, sino más bien ser asertivos y dar la pauta para empezar la entrevista. Hay que saber manejar objeciones y ser proactivos en la investigación.

Page 20: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Realización de preguntas

Realizar preguntas correctamente no es una tarea fácil, cualquier cambio en la redacción de la pregunta, entonación, en el orden, puede alterar su significado y sesgar la respuesta.

Es de vital importancia capacitar al personal y dar todos los detalles para preguntar de manera uniforme y sin sesgar al entrevistado. A continuación se presentan algunos lineamientos para hacer preguntas:

8

Realización de preguntas

1. Conocer a fondo el cuestionario2. Plantear las preguntas en el orden que aparecen en el

cuestionario exclusivamente.3. Utilizar exactamente las palabras que están descritas

en el cuestionario.4. Leer cada pregunta pausadamente.5. Repetir las preguntas que no haya sido entendidas.6. Hacer todas las preguntas aplicables.7. Seguir las indicaciones y esquemas de salto; sondear

cuidadosamente.

9

Sondear significa motivar a los entrevistados para que elaboren, aclaren o expliquen sus respuestas; también es útil para ubicar al entrevistado en el contenido de la entrevista y que sólo proporcione información relacionada al estudio.

A continuación se presentan algunas técnicas comumes de sondeo:

Sondeo

10

1. Repetir la pregunta, esto puedo estimular la respuesta.2. Repetir la respuestas del entrevistado, esto sirve para

alentar al entrevistado para que detalle más de sus propios comentarios.

3. Hacer una pausa o silencio. Esto puede alentar a que el entrevistado complete más su respuesta, pero esto no debe en tanto no sea incómodo.

Sondeo

11

4. Tranquilizar o impulsar al entrevistado. Si la persona entrevistada quiere que se le explique alguna pregunta, no se debe interpretar, se le comenta “lo que signifique para usted”. En el caso de que el entrevistado dude de sus respuestas, se le debe indicar “no existen respuestas buenas o malas, queremos su opinión solamente”.

5. Estimular las aclaraciones. Para que el entrevistado aclare más sus respuestas se le pueden mencionar frases como, “No comprendo bien su respuesta, ¿sería tan amable de decirme algo más por favor?

12

6. Hacer comentarios y preguntas neutras. Algunos comentarios que se utilizan para sondear se abrevian a lado de cada pregunta, deben ser objetivos y neutros como, ¿Algo más? (AM), ¿Por qué opina así? (POA), ¿Alguna otra razón? (AO)

Page 21: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Registro de las preguntas

Se debe especificar claramente el formato en el cual se deben registrar las preguntas. Todos los entrevistadores lo deben de hacer en la misma forma.Cada encuesta o entrevista es diferente, por lo tanto debe de tener indicaciones explícitas de cada punto.Como regla general, las respuestas abiertas se deben de registrar literalmente.

14

Registro de las preguntas

Por ejemplo, el “Survey Research Center” en la ciudad de Michigan, tiene los siguientes lineamientos:

1. Anote las respuestas durante la entrevista.2. Utilice las mismas palabras que el entrevistado.3. No resuma ni parafrasee las respuestas abiertas.4. Incluya todo lo que concierna a los objetivos de la pregunta.5. Incluya todos los sondeos y comentarios.6. Repita la respuesta mientras la escribe.

15

Conclusión de entrevista

La entrevista no debe darse por concluida si se encuentra incompleta. El entrevistador no debe responder ninguna pregunta relacionada con el estudio.El entrevistado debe llevarse una sensación positiva, es importante darle las gracias y expresar su aprecio.

16

Supervisión de los trabajadores de campo

Significa asegurarse de que se estén aplicando las técnicas y procedimientos que se indicaron en la capacitación.La supervisión abarca:• Control de calidad y correcciones• Control del muestreo• Control de fraudes• Control de la oficina central

17

Validación del trabajo de campo

Se deben verificar al azar del 10 al 25% de los cuestionarios o entrevistas, donde se pregunte si efectivamente el entrevistador realizó las preguntas, la duración de la entrevista, la calidad, y datos demográficos básicos. La información demográfica se cruza con la registrada para verificar la autenticidad de las entrevistas.

18

Evaluación de los trabajadores de campo

Se debe evaluar a los trabajadores de campo en base:

• Costos y tiempos• Tasas de respuesta• Calidad de la entrevista• Calidad de los datos

Page 22: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

20

Créditos:

Lic. Ana María López Navarro

Page 23: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 8. Errores en la recolección de datos de campo

2

Errores en la recolección de datos de campo

El error de muestreo es sólo uno de los dos tipos de error que afectan una investigación.

El error de no muestreo incluye lo siguiente:

• Todos los tipos de error que no sean de muestreo• Errores en la recolección de datos• Errores en el manejo de los datos• Errores de análisis• Errores de interpretación

3

También se incluyen errores en la definición del problema, parafraseo de preguntas; pero generalmente el mayor potencial de error no-muestral se encuentra en la etapa de recopilación de datos.

Por lo cual, veremos este tema con mayor detalle, a continuación se presenta una clasificación de los errores no-muestrales:

4

Errores no-muestrales

Errores del trabajadorde campo

Error de losentrevistados

Errores intencionales

Errores no-intencionales

1. Fraude2. Guiar a una respuesta

1. Características del entrevistador2. Malentendidos3. Fatiga

Errores intencionales

Errores no-intencionales

1. Respuestas falsas2. No respuesta

1. Malentendidos2. Supuestos3. Pérdida de atención4. Distracciones5. Fatiga

5

Errores del trabajador de campoIntencionales

FraudeEste ocurre cuando el trabajador de campo concientemente no está incluyendo información representativa de la muestra. Puede ser que esté dando información falsa o que escoja a las personas que más se le faciliten, no las que debe seleccionar. Esto muchas veces se da debido a que se paga por encuesta o entrevista completada.

6

Errores del trabajador de campoIntencionales

Guiar a una respuestaEste ocurre cuando el trabajador de campo concientemente está guiando al entrevistado a que le responda algo en específico.Puede ser mediante la pronunciación, entonación, lenguaje corporal o inclusive el parafraseo de un reactivo.Por ejemplo, no es lo mismo preguntar, ¿Es el tema del gas un problema para usted?, que guiar la pregunta como, ¿Acaso no es el tema del gas un problema para usted?

Page 24: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Errores del trabajador de campoNo-Intencionales

Características del entrevistadorEn este tipo de error influencian las características personales del trabajador de campo, como el sexo, acento, o comportamiento.Bajo ciertas circunstancias el hecho de que el trabajador de campo sea hombre o mujer influye en los resultados según el tema que se esté investigando.En las entrevistas por teléfono puede influenciar mucho el acento, muchas veces las personas tienen prejuicios de acentos de ciertas regiones, se tienen que considerar todos lo factores.

8

Errores del trabajador de campoNo-Intencionales

MalentendidosEn este tipo de error ocurre cuando el personal de campo, cree que comprende bien como administrar la investigación, pero en realidad lo hace incorrectamente.El cuestionario puede incluir instrucciones, diferentes tipos de escala, instrucciones de cómo registrar las respuestas de los entrevistados y otros procedimientos que deben ser comprendidos.Existe una diferencia en educación muy considerable entre los diseñadores de la investigación y el personal de campo, y esta diferencia puede reflejarse en una problema de comunicación.

9

Errores del trabajador de campoNo-Intencionales

FatigaEl tercer error no intencional es referente a la fatiga, esto se da cuando el personal de campo ya se encuentra cansado. El trabajo de campo puede ser muy repetitivo y monótono, por lo cual la gente se fatiga. Al final de un largo día de entrevistas, el personal de campo puede estar menos alerta y descuidar aspectos de la investigación.Puede descuidar patrones de respuesta, como saltar una pregunta en caso de cierta respuesta, o profundizar más en algunas preguntas, o hacerlo más rápido y con menos detalle por la prisa de terminar.

10

Errores de los entrevistadosIntencionales

Respuestas falsasEste tipo de error ocurre cuando el entrevistado no proporciona información veraz, ya sea por proteger su intimidad o por vergüenza.

Existen ciertos temas que son más propensos que otros a recibir respuestas falsas, como por ejemplo, el ingreso que recibe una persona, la edad, o cuestiones de higiene personal.

11

Errores de los entrevistadosIntencionales

No respuestaEste es el error intencional que más se da en una investigación, y es cuando los entrevistados no proporcionan respuesta a un reactivo determinado.Las negativas a participar en una investigación son problemas que el investigador debe enfrentar.

En una investigación por teléfono, por ejemplo, es muy común este problema.

12

Errores de los entrevistadosNo-Intencionales

MalentendidosEs cuando el entrevistado proporciona una respuesta sin comprender la pregunta planteada o el contexto.

Por ejemplo, en una investigación donde se requieren cantidades después de impuestos, una persona puede estar respondiendo en términos brutos, no netos.

Page 25: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Errores de los entrevistadosNo-Intencionales

SupuestosEs cuando el entrevistado proporciona una respuesta de la cual no está seguro de su veracidad y está haciendo un supuesto de la información.

Por ejemplo, en una pregunta como: ¿Cuánto fue el consumo en su hogar de agua el mes pasado en litros?

Muchas personas podrían suponer la cantidad que se le está preguntando, en lugar de ver el recibo de agua y dar el dato verídico.

14

Errores de los entrevistadosNo-Intencionales

Pérdida de atenciónEs cuando el interés del entrevistado decae; el entrevistado no está interesado en la investigación como lo está el investigador, por lo que conforme avance el cuestionario o entrevista cada vez se pierde más y más el interés.

15

Errores de los entrevistadosNo-Intencionales

DistraccionesEs cuando ocurren distracciones o interrupciones durante la entrevista.Por ejemplo, puede ser que al entrevistar a una madre de familia por teléfono la interrumpa el bebé o alguno de sus hijos. En el caso de una encuesta en un centro comercial puede ser que el entrevistado salude a algún conocido o familiar.

16

Errores de los entrevistadosNo-Intencionales

FatigaEs cuando el entrevistado se cansa de participar en la investigación. Cuando esto sucede, las respuestas que se proporcionan ya no son reflexionadas.

Por ejemplo, puede ser que en un cuestionario la persona tienda más a seleccionar la categoría de NR, “no respuesta”, a fin de terminar pronto.

17

Bibliografía

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

• Burns, Alvin. Marketing Research. Estados Unidos: Editorial Prentice Hall 2000, (ISBN 0-13-014411-8).

18

Créditos:

Lic. Ana María López Navarro

Page 26: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 9. Cómo minimizar los errores en la recolección de datos de campo

2

Estrategias de control en la recolección de datos de campo

Como hemos visto, a pesar de que existen muchos factores de error en la recolección de datos de campo, afortunadamente existen también estrategias de control que podemos utilizar para minimizar estos errores.

Cabe mencionar que no se eliminan en su totalidad, sólo podemos disminuir su efecto.

Las estrategias de control se resumen en la siguiente tabla:

3

Cómo controlar (minimizar) los errores

Errores intencionales

Errores no-intencionales

FraudeGuiar a una respuesta

Características del entrevistadorMalentendidosFatiga

Respuestas falsas

No respuesta

Malentendidos

Adivinar respuestasPérdida de atención

DistraccionesFatiga

Errores intencionales

Errores no-intencionales

Tipos de error Mecanismos de control

Errores del trabajador de campo

Error de los entrevistados

SupervisiónValidación

Selección y entrenamiento de los entrevistadoresSesiones de orientación y simulación de rolesDescansos e investigaciones alternas

Asegurar anonimato y confidencialidadIncentivosChequeos de validaciónTécnica de la tercera persona

Asegurar anonimato y confidencialidadIncentivosTécnica de la tercera persona

Cuestionario bien redactadoPreguntas directas

Cuestionario bien redactadoOpciones de respuesta (respuestas cerradas)

Escalas de diferencial semánticoUtilizar apuntadores de avance (frases de ánimo)

4

Estrategias de control para evitar errores del trabajador de campo Intencionales

Existen dos estrategias que se pueden utilizar para evitar los errores intencionales por parte del trabajador de campo:

• Supervisión

• Validación

5

Supervisión

En la supervisión se utiliza una persona para vigilar el trabajo de campo.Por ejemplo, en las entrevistas telefónicas se les escucha o graba para ver si el entrevistador no está sesgando las preguntas o si está entrevistando a las personas de la muestra.En el caso de las entrevistas personales el supervisor puede ir de observador para evaluar el procedimiento.

6

Validación

En la validación se verifica que el trabajador de campo haya hecho el trabajo requerido.

Hay varias formas de hacer esto, por ejemplo, en una encuesta, se contacta nuevamente a la persona para ver si efectivamente participó en la investigación.

Page 27: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

El número estándar que se debe validar es el 10% de la muestra. También es conveniente realizar algunas preguntas nuevamente para comparar los resultados.

Otra forma de validar, es que una persona con experiencia en el campo observe los cuestionarios y detecte si hay algún patrón inconsistente de respuestas; como en el caso de personas muy jóvenes y una gran número de hijos, etc.

8

Estrategias de control para evitar errores del trabajador de campo No-Intencionales

Existen tres mecanismos de control para controlar los errores de campo no-intencionales:

• Sesiones de orientación

• Simulación de roles

• Descansos

9

Sesiones de orientación

Son reuniones en las cuales se orienta a los trabajadores de campo respecto al cuestionario y se les explican los procedimientos de administración.

En estas sesiones se debe ser claro respecto a los patrones de salto de respuestas, alguna instrucción especial o el formato de aplicación del cuestionario.

10

Simulación de roles

La simulación de roles tiene el propósito de que el entrevistador se familiarice con el cuestionario y se le oriente de manera práctica cómo resolver algún problema en la administración del mismo.Se trata de actuar como si fuera una entrevista real, pero haciendo alusión a todos los requisitos de la investigación.

11

Descansos

Con los descansos se pretende evitar la fatiga en los entrevistadores y evitar errores por esta cuestión. Es importante ser firmes en los descansos designados, aún y que el trabajador de campo no los crea necesarios.

En caso de tener varias investigaciones al mismo tiempo, se puede alternar a los trabajadores, para evitar que se fatiguen con la monotonía de un mismo estudio.

12

Estrategias de control para evitar errores de los entrevistados Intencionales

Para controlar este tipo de errores, que son información falsa o falta de respuesta, es importante ofrecer confidencialidad de la información proporcionada por el entrevistado, y anonimato, que su nombre no pueda ser asociado con la información proporcionada.

Otra estrategia es ofrecer incentivos, ya sea económicos, regalos, o algún tipo de recompensa, como cupones, descuentos, etc. De esta forma el entrevistado se sentirámás comprometido a decir la verdad ya que esté siendo remunerado por su participación.

Page 28: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

También se puede utilizar validación de pruebas, según el caso, para reducir el error, por ejemplo, si el entrevistado responde que utiliza cierto tipo de vitaminas, pedirle que muestre el frasco. Si la persona dice tener cierta edad, pedirle una identificación, si queremos el domicilio o colonia, pedirle un comprobante, etc.

14

Por último, podemos utilizar la técnica de la tercera persona, esto es preguntar al entrevistado en términos de alguien más, sobre todo en temas que pueden ser vergonzosos para algunos. Por ejemplo, “¿Piensa usted que alguna persona de su misma edad y condición física podría utilizar medicamentos tomados para evitar la calvicie?”

15

Estrategias de control para evitar errores de los entrevistados No-intencionales

Para controlar este tipo de errores, que son Malentendidos, Adivinar respuestas, Pérdida de atención, Distracciones y Fatiga, es importante ofrecer cuidar el diseño de un cuestionario, se deben ofrecer ejemplos en caso necesario, cuando hay opciones de respuesta, ofrecer alternativas como “Indiferente”, “Sin respuesta”, “Respuesta dudosa”; ya que esto evita que las personas hagan supuestos de la información y adivinen las respuestas.

16

Estrategias de control para evitar errores de los entrevistados No-intencionales

Otra táctica es utilizar escalas de diferencial semántico, y no cargar las respuestas afirmativas o negativas de un solo lado.

Por último, en cuestionarios o entrevistas muy largas, es recomendable utilizar apuntadores de avance, o frases de ánimo, como: “Acabamos de terminar la parte más complicada de la investigación”, “Ya estamos por terminar”, etc.

17

Ajuste de resultados para reducir el error de no- respuesta

El error de no-respuesta por parte del entrevistado, es de lo más común, por lo cual siempre debe ser cuantificado, y si el grado se considera un problema, se deben realizar ajustes; si este factor no es significativo, entonces no existe una razón para hacer ajustes.

En el caso de necesitar ajustes, existen dos métodos de compensación:• Promedios ponderados• Sobremuestreo

18

Bibliografía

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

• Burns, Alvin. Marketing Research. Estados Unidos: Editorial Prentice Hall 2000, (ISBN 0-13-014411-8).

Page 29: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Créditos:

Lic. Ana María López Navarro

Page 30: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 10. Procesamiento de datos

2

1. Validación y edición

2. Codificación

3. Introducción de datos

4. Limpieza de los datos

5. Tabulación y análisis

3

1. Validación y edición

La validación se refiere al proceso de verificar que las entrevistas se hayan realizado de acuerdo a las indicaciones establecidas.Se verifican tanto los errores intencionales como los intencionales por parte del entrevistador y el entrevistado.Sobre todo las omisiones, si se siguieron los patrones de salto, etc.Es muy tedioso este proceso, puesto que a veces son miles de páginas por verificar, pero es algo que se debe realizar para garantizar la calidad de los resultados.

4

2. Codificación

Se refiere al proceso de agrupar y asignar códigos numéricos a las posibles respuestas de una pregunta dentro de un cuestionario o entrevista.

En muchos cuestionarios las respuestas ya están pre-codificadas.

Lo más recomendable en estudios grandes es tener precodificada la mayor parte de la información.

5

Ejemplo de una encuesta pre-codificada

6

Procedimiento para codificación de datos general

Definir claves para cada pregunta cerrada del cuestionario vacío.

Integrar el catálogo de claves

Revisar respuestas a preguntas cerradas

Integrar por separado claves para preguntas

abiertas

Asignar claves a preguntas abiertas

Asignar claves a preguntas cerradas

Revisar respuestas a preguntas

abiertas

Iniciar captura

Page 31: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Ejemplo de libro

de códigos

8

Proceso de codificación para respuestas abiertas

1. Realizar un listado de respuestas. Esto es en el caso de preguntas abiertas, donde se tiene que ver las respuestas que se van dando y agrupar las que se repiten, es como realizar un catálogo, se listan las que van saliendo nuevas y si se repiten se añaden al conteo de las respuestas registradas.

2. Consolidar las respuestas. Varias respuestas se pueden agrupar en una misma categoría, pero esto lo tiene que decidir un investigador calificado y muchas veces se decide también con el cliente.

9

3. Determinar los códigos. Se asigna el código numérico a cada respuesta final.

4. Introducir los códigos.

10

¿Por qué le gusta tomar Coca-Cola?

1. Porque sabe bien2. Porque me gusta3. Por la publicidad4. Porque le gusta a mi esposo/a5. Es la que más se vende6. Es la que siempre encuentro a la mano7. Porque te la traen a domicilio8. Estoy acostumbrado9. Es un hábito10. Es la que beben todos mis amigos11. Porque está en oferta12. Tenía promoción13. Por inercia14. La bebo desde que era niño15. Me ayuda con el dolor estómago16. Me reanima cuando me siento mal17. No hay ninguna razón en particular18. No sé19. No tengo idea

Ejemplo de respuestas a pregunta abierta codificada:

11

3. Introducción de datos

Es el proceso de convertir la datos a un formato electrónico, y nos sirve para poder procesarlos y obtener información relevante del estudio para la toma de decisiones.

Este proceso requiere de un dispositivo para la introducción de datos, como una computadora y un medio de almacenamiento, como cd, disco duro, etc.

12

Generalmente los datos se introducen en un paquete estadístico, como SPSS (ejemplo de pantalla), SAS, Minitab, Excel, por mencionar algunos. El más utilizado en el mercado de investigación de mercados es el SPSS.

Page 32: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

4. Limpieza de datos

En esta parte ya se han introducido los datos a la computadora y es el momento de realizar una verificación final de errores antes de continuar con el análisis estadístico.

Se utilizan técnicas que en principio son para cálculo estadístico pero que nos dan pistas de los posibles problemas.

14

Podemos controlar varios aspectos en los datos:– Valores perdidos– Casos repetidos– Valores imposibles:

Sexo varón, dos embarazos– Valores implausibles:

Altura 1.60 mts, peso 100 kilos

Los valores imposibles deben ser corregidos, los valores implausibles pueden ser valores legítimos y necesitan ser investigados con detalle.

15

• Existen comprobaciones generales en la hoja de cálculo:– Líneas repetidas (SPSS 12 tiene un comando para– esto)– Casillas en blanco– Valores repetidos

• Utilizando técnicas estadísticas. Estas técnicas sondiferentes para variables categóricas o numéricas y también nos permiten ver si hay errores de captura.

16

• Categóricas– Frecuencias para una variable– Cruces de Frecuencias para

más de una variable

• Numéricas– Máximos y mínimos para variables numéricas.También histogramas

17

Diagramas de dispersión para dos variables

18

5. Tabulación y análisis estadístico

Ya que los datos han sido introducidos a la computadora y están libres de errores de captura, están listos para tabularse y realizar análisis estadísticos.

Las tres grandes ramas de tipos de análisis que estaremos viendo en los siguientes módulos son:

Page 33: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Inicio

¿Cuántas variables van

a utilizarse a la vez?

Más de dosUna

Dos

Análisis univariadode datos

Análisis bivariadode datos

Análisis Multivariadode datos

20

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

21

Créditos:

Lic. Ana María López Navarro

Page 34: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 11. Análisis univariado de datos:Estadística descriptiva

2

Análisis de Datos

Revisión del Cuestionario

Edición

Codificación

Transcripción

Depuración de datos

Ajuste estadístico

Estrategia de Análisis

PROCESO DE PREPARACION DE DATOS

3

Estrategia de Análisis

•Número de variables a analizar simultáneamenteUnivariado, Bivariado o Multivariado

•Propiedades de las técnicas estadísticasDescriptivas o Inferenciales

•Conocer características de los datos Escalas de medición de acuerdo al tipo de datos

•Consideraciones durante el proceso de investigaciónDefinición del problema, método y diseño

•Antecedentes y filosofía del investigador

4

¿Cuántas variables se analizarán simultáneamente ?

Univariado Bivariado Multivariado

1 2 Más de 2

Niveles (promedio)Distribución (desviación)

Se enfoca en:

Grado de relaciones(correlaciones y covarianzas)

5

Análisis univariado

• Es el análisis de una variable de manera individual.

• Se utiliza cuando hay una medida única de cada elemento de la muestra o en caso de tener dos o más mediciones de los elementos cada variable se analiza por separado.

• Los datos pueden analizarse solos o agrupados en categorías o clases (frecuencias).

6

Tipos de Análisis de Datos Univariados

Propiedades Técnicas Estadísticas

• Descriptiva. Estadísticas que proporciona medidas resumidas de los datos en sus muestras. Tales como: Medidas de Tendencia Central y Dispersión

• Inferencial. Estadísticas que permiten hacer juicios acerca de la población total basado en resultados generados por las muestras.Tales como: Pruebas z, t y ji cuadrada

Page 35: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Procedimientos univariados

Las estadísticas que se utilizan para analizar los datos univariados van de acuerdo a la escala y el tipo de información que queremos obtener:

Medida deTendencia Medida de

Escala Central Dispersión

Nominal Moda FrecuenciasOrdinal Mediana Rango intercuartilIntervalo Media Desviación estandar

8

Medidas de tendencia central: media

Es la suma de los valores dividido por el tamaño de la muestra. Es lo que se conoce como "promedio". Se usa con datos de intervalos

Ejemplo:Valores: 12,16,15,11 y 9

= 63/5 = 12.6

9

fiXiPunto medio XiNo. de personas fiCategoría/Edad

11214825 a 30 años

1,34464Totales

4162616Mas de 40

528222435 a 40 años

288181630 a 35 años

= 1,344 / 64 = 21

También se puede utilizar cuando los datos de intervalose agrupan en categorías o clases (frecuencias).

10

• Es el valor medio cuando los datos se agrupan en orden de magnitud.• Se utiliza con los datos de escala ordinal o de intervalo.

Observación Valor de Xi X1 15 X2 26 X3 71 X4 84 X5 102

Mediana

Medidas de Tendencia Central: Mediana

Los datos se ordenan de manera creciente o decreciente.

11

Medidas de Tendencia Central: Moda

• Es la categoría de una variable nominal que ocurre con mayor frecuencia.• Se utiliza con datos de escalas nominales o de orden superior.

64Totales16Mas de 402435 a 40 años1630 a 35 años825 a 30 años

Numero de personas fiCategoría/Edad

MODA

12

Medidas de dispersión: Desviación Estándar

• Indica cuánto tienden a alejarse los valores puntuales del promedio. • Se utiliza con datos de Intervalo.• Una desviación estándar grande indica que los puntos están lejos de la media y una desviación pequeña indica que los datos están agrupados cerca de la media. • Se representa con: S o con la letra sigma σ•

L00437889
Stamp
Page 36: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Datos: 20,36,30,24,6,12,10,141) Determinar la media = 192) Raíz Cuadrada de los cuadrados de las desviaciones

de los datos de la media (x- X)2

3) S= Raíz cuadrada de 654/84) S= 25.57

(20-19)^2= 1(36-19)^2= 289(30-19)^2= 121(24-19)^2= 25(6-19)^2= 169(12-19)^2= 49Total 654

14

Medidas de dispersión: Frecuencias

• La frecuencia es la repetición de un proceso.• La distribución de frecuencias es hacer un conteo del numero de respuestas asociadas con diferentes valores de la variable. Se utilizan en Datos de Escala Nominal.

Pueden ser:Absolutas. Son los números de la muestra que aparecen en cada categoría de la variable nominal.

Relativas. Son los porcentajes de los elementos totales que aparecen en cada categoría.

15

Medidas de dispersión: Frecuencias

Ejemplo. ¿Cuántas veces por semana consume leche?

1%1 7 n = 90

4 8 6

20 25 18 8

f absoluta

100%

4%6 8%5 6%4 22.23

27.7%2 20%1

8.88%0 F relativax i

f absoluta / n

16

¿Qué hemos aprendido?

Debemos elegir una técnica estadística en función a:• El número de variables a analizar simultáneamente (análisis UNIVARIADO, bivariado y multivariado).

• Tipo de información estadística deseada: DESCRIPTIVA(descripción de la muestra) e Inferencial.

• En el análisis univariado Descriptivo utilizamos medidas de TENDENCIA CENTRAL y de DISPERSION , y para determinar cuales estadísticos debemos conocer el tipo de ESCALA de los datos (intervalo, ordinal o nominal).

17

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

18

Créditos:

Lic. Ana María López Navarro

L00437889
Stamp
L00437889
Stamp
L00437889
Stamp
L00437889
Stamp
Page 37: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 12. Análisis Univariado Inferencial:Prueba de Hipótesis

2

Análisis Univariado Inferencial

Como vimos en la sesión anterior, de acuerdo al tipo de información, podemos dividir la estadística en dos categorías, la estadística descriptiva e inferencial.

Estadística Inferencial nos permite hacer juicios acerca de la población total basado en resultados generados por las muestras.Ejemplo. Para estimar el consumo de leche en Monterrey, una muestra aleatoria puede someterse a investigación Con base en estos resultados muestrales puede estimarse el consumo de la población.

3

Prueba de Hipótesis

Con frecuencia no es suficiente describir lo que aparece en la muestra, sino se requiere hacer inferencias de la muestra con respecto a la población de la cual se tomó.Para hacer un análisis inferencial, debemos conocer las Pruebas de Hipótesis.

Prueba de Hipótesis: Procedimiento basado en la evidencia muestral y la probabilidad.Es una aseveración de una población con el propósito de verificar si la afirmación es razonable en función a los datos de la muestra.

4

Pasos Prueba de Hipótesis1.Formular hipótesis nula y alternativa

2.Elegir la estadística de prueba

3.Determinar Nivel de significancia

4.Calcular la estadística de prueba

5.Determinar la probabilidad: valor critico

6.Comparar valor critico y tomar decisión

No se rechaza

HO

Se rechaza

HO

5

1. Formular Hipótesis

Hipótesis Nula ( H0 )Enunciado del estado en que se encuentran las cosas y en el que no se espera ninguna diferencia ni efecto, es decir, supone que un parámetro de población adquiere determinado valor o conjunto de valores.La hipótesis nula es la que siempre se pone a prueba.

Alternativa ( H1 )Enunciado en el que se espera alguna diferencia o efecto (opuesto a la hipótesis nula).

6

1. Formular Hipótesis

Las pruebas pueden ser bilateral o de 2 colas o unilateral, una cola, en caso de tener una dirección (> o <).

Page 38: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

2. Elegir la Estadística de Prueba

La estadística de prueba mide la aproximación de la muestra a la hipótesis nula.La prueba apropiada de inferencias estadísticas varía según el nivel de ESCALA de los Datos.

Datos de Intervalo (hipotesis de µ)Prueba z Prueba t

Datos nominales (hipotesis de σ)Prueba ji cuadrada

8

2. Elegir la Estadística de Prueba

Datos de Intervalo

La prueba z y la prueba t, son pruebas sobre el tamaño de la media de la población.

La selección entre las dos depende del conocimiento que tiene el investigador sobre la desviación estándar y el tamaño de la muestra utilizado.

9

2. Elegir la Estadística de Prueba

Datos de Intervalo

Prueba z es adecuada cuando:1)El tamaño de la muestra es de cualquier orden y se

conoce la desviación estándar de la población, o2) El tamaño de la muestra es mayor que 30 y no se

conoce la desviación estándar.

Prueba t es adecuada cuando:1) La n < 30 y no se conoce la desviación estándar.

10

2. Elegir la Estadística de Prueba

Datos Nominales

Prueba ji cuadradaCompara una distribución hipotética de la población con una distribución generada por la muestra.

11

3. Nivel de Significancia (α)

Es la probabilidad de rechazar la hipótesis nula cuando esta es realmente cierta .

Se pueden cometer dos clases de errores:

Error tipo I (α). Es rechazar la hipótesis nula cuando ésta es realmente cierta.

Error tipo II (ß) Es no rechazar la hipótesis nula cuando ésta es realmente falsa. (proporción)

12

3. Nivel de Significancia (α)

Potencia de la prueba (1-ß) Es el complemento de la probabilidad de un error tipo II.El nivel de significancia (α) se escoge de acuerdo al riesgo de rechazar equivocadamente la H0 que se deseé. Los niveles más usados son .10, .05 y .01

Page 39: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

4. Calcular Estadístico de Prueba

Parámetro en Houna población Información Distribución

Estadísticode prueba

µ

σ2

σ

S *Población normal

Población normal

Normal Z

n>30 Normal zn<30 Prueba t

Ji cuadrada

* La s es un estimado de la desviación estándar, ya que no se conoce.Existen fórmulas para calcular las pruebas si se tienen proporciones.

14

5. Determinar Probabilidad: Valor crítico

Valor crítico. Valor que define dónde comienza la región crítica.

Región crítica. Es el conjunto de valores del estadísticode prueba para los que se rechaza H0.La región crítica depende del tipo de hipótesis (una o dos colas), la distribución de probabilidad y el nivel de significancia.

El valor crítico se determina usando el nivel de significancia, una vez que se haya determinado dónde se encuentra la región crítica. (Tablas z y t para hipótesis de medias y de ji cudrada para hipótesis de desviación)

15

6. Comparar valor crítico y Tomar una decisión

Para tomar una decisión debemos comparar los valores críticos con el valor del estadístico de prueba.

Si este último cae dentro de la región crítica entonces rechazamos H0

De lo contrario decimos que no hay suficiente evidencia para rechazar H0

16

Ejemplo: Prueba de Hipótesis µ

Sabritas quiere probar si en su nueva promoción tiene 20 ó más ganadores por día. Un ejecutivo de la empresa asegura que se están sobreestimando el número de ganadores, por lo que decide escoger una muestra de 45 bolsas de papitas y probar con un nivel de significanciade .05. De la muestra se obtuvo una media de 16 y una desviación estándar de 10.Formular la hipótesis:H0: µ ≥ 20H1: µ < 20

Determinar la distribución de probabilidad y la región crítica:

- 1.64Valor crítico Se obtuvo de la tabla Z

17

Ejemplo: Prueba de Hipótesis µ

Calcular el estadístico de prueba:

Tomar una decisión:Como cae en la región crítica rechazamos H0, lo cual quiere decir que el ejecutivo tiene razón, se esta sobreestimando el número de ganadores por día.

-1.64

Z

18

Ejemplo: Prueba de Hipótesis σ2

La nueva presentación de Pepsi contiene 12 oz de refresco, para el director de calidad no sólo es importante que el promedio de oz esté cerca de 12, sino también que la varianza no sea mayor de .200 oz2

Se seleccionó una muestra de 101 latas con un nivel de significancia de .05, dando una media de 11.75 oz y σ2= .245oz2

Formular la hipótesis:H0: σ2 ≤ .200H1: σ2 > .200

Determinar la distribución de probabilidad y la región critica:

Page 40: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Ejemplo: Prueba de Hipótesis σ2

Calcular el estadístico de prueba:

Tomar una decisión:Como el valor crítico no cae en la región, no hay suficiente evidencia para decir que la varianza es mayor a .200 por lo tanto se acepta H0.

20

Análisis Inferencial

Lo que hemos aprendido hasta ahora…

• El análisis inferencial nos permite hacer supuestos de una población con los datos obtenidos de una muestra.

• Para realizar este análisis debemos aplicar la prueba de hipótesis.

• Los pasos de la prueba de hipótesis son:1. Formular la hipótesis (nula y alternativa)2. Seleccionar el estadístico de prueba en función a:

a) Tipo de escala b) La información que tenemos de la muestra y

desviación estándar σ para hipótesis de µ

21

Análisis Inferencial

3. Determinar el nivel de significancia α.4. Considerar los tipos de error I y II.4. Calcular el estadístico de prueba.5. Determinar la probabilidad (valor crítico).6. Considerar una cola o dos colas, se utilizan tablas

para determinar la región crítica con valores de z, t y jicuadrada.

7. Comparar Valor Crítico y tomar una decisión.

22

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

23

Créditos:

Lic. Ana María López Navarro

Page 41: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 13. Análisis bivariado: tablas cruzadas

2

Tablas cruzadas o tablas de contingencia

El objetivo de la tabulación cruzada es identificar la relación que existe entre dos variables.

Con los datos de una muestra podemos observar si existe alguna relación entre dos variables, y la pregunta que surge naturalmente es si esta relación es verdadera o es el resultado del error muestral.

Las tablas de contingencia son tabulaciones cruzadas entre dos variables X e Y con r y c categorías respectivamente. Es decir, que la tabla de contingencia entre X e Y tendrá r filas y c columnas.

3

nCc…C3C2C1Total

RrOrc…Or3Or2Or1Ar

……

R3O3cO33O32O31A3

R2O2cO23O22O21A2

R1O1cO13O12O11A1VAR

A

TotalBc…B3B2B1

VAR B

Los datos se organizan en una tabla de doble entrada, llamada Tabla de contingencia, cuya forma general es la siguiente:

4

Tablas cruzadas o tablas de contingencia

• Oij es el número de sujetos que tienen las características Ai y Bj a la vez.

• Ri (i = 1,…,r) es la suma de la i-ésima fila de la tabla. Es decir, es el total de sujetos que poseen la característica Bi.

• Cj (j = 1,…,c) es la suma de la j-ésima columna de la tabla. Es decir, es el total de sujetos que poseen la característica Ai.

• n representa el total de observaciones tomadas.

5

• ¿Existirá o no relación entre las variables A y B?, es decir si A y B son o no independientes. A y B serán independientes si cada entrada de la tabla es igual al producto de los totales marginales dividido entre el número de datos. Esto es si cumple,

nCR

O jiij =

6

Tablas de Contingencia y Medidas de Asociación

• Se utiliza un test de hipótesis conocido como el test Chi-cuadrado de Pearson. La hipótesis nula del test es que las dos variables analizadas son independientes. La hipótesis alternativa es que las variables no son independientes, es decir, que existe una relación entre las dos variables.

• Ilustremos el test utilizando un ejemplo. La siguiente tabla de contingencia muestra la tabulación cruzada de la variable ingreso anual (dividido en tres categorías) y la última marca de coche comprada (dividida en tres marcas).

Page 42: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Tablas de Contingencia y Medidas de Asociación

Marca del último auto comprado Ford Toyota Renault Total Ingreso anual Menos de 20,000 50 200 125 375 20,000 - 40,000 200 100 350 650 más de 40,000 100 25 50 175 Total 350 325 525 1200

8

Tablas de Contingencia y Medidas de Asociación

• Las entradas de la tabla representan el número de personas en la muestra con cada combinación de ingreso y marca de auto. Por ejemplo, 50 personas que ganan menos de 20,000 $ compraron un auto marca Ford.

• El test Chi-cuadrado de Pearson se basa en encontrar cuál hubiera sido el valor de cada entrada si las variables fueran independientes. Es decir, el valor esperado de cada celda de la tabla si las variables ingreso y marca son independientes.

9

• Si ingreso y marca son independientes, la probabilidad del evento conjunto "A1: ganar menos de $20,000" y "B1: comprar marca Ford" es el producto de esas dos probabilidades:

Pr(A1 y B1) = Pr(A1)*Pr(B1)

Pr(A1) = A1/A = 375/1200, Pr(B1) = B1/B = 350/1200Donde A y B son las frecuencias totales de los eventos.

10

Por lo tanto:

Pr(A1 y B1) = Pr(A1)*Pr(B1) = 375*350/(1200*1200) = 0.091

El número esperado en la entrada A1B1 es entonces:

N* Pr(A1 y B1) = 1200*0.091 = 109.38

11

En general la fórmula del valor esperado es:

Eij = (NAi*NBj)/N.

– Eij = número esperado– NAi= número de elementos en la categoría Ai

– NBi= número de elementos en la categoría Bi

Para A1B1 el número esperado es:– E11 = (375*350)/1200 = 109.38

12

Tablas de Contingencia y Medidas de Asociación

• Este proceso se puede repetir para cada una de las entradas de la tabla. Una vez hecho esto el estadístico Chi-cuadrado se calcula con la siguiente fórmula:

r = número de categorías de la variable en las filasc = número de categorías de la variable en las columnasOij = número observado en entrada ijEij = número esperado en la entrada ij

• Este estadístico Chi-cuadrado tiene (r-1)*(c-1) grados de libertad.

( )∑ ∑

−=

= =

r

i

c

j ij

ijij

EEO

1 1

22χ

Page 43: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

• En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad. Realizando todas las cuentas con la tabla del ejemplo, el estadístico da 252.2.

• Comparando este número con el valor crítico de la distribución Chi-cuadrado con 4 grados de libertad a un nivel de significatividad del 5% el valor crítico correspondiente es 9.49.

• Como 252.2 > 9.49 se rechaza la hipótesis nula. Es decir, las variables no son independientes.

14

Tablas de Contingencia y Medidas de Asociación

El estadístico de Pearson nos dice si dos variables son independientes una de otra pero no nos dice nada acerca de la naturaleza de la relación.

Cuando analizamos variables dicotómicas (adoptan solo los valores 0, 1) el estadístico de Pearson puede ser poco preciso. En esos casos se suelen utilizar otras medidas de asociación.

15

Medidas de Asociación para Tablas de 2x2

El Coeficiente Phi (φ)• Es una medida del grado de asociación entre dos

variables dicotómicas basada en el estadístico Chi-cuadrado de Pearson.

• Este coeficiente toma valores en el intervalo cero-uno. Valores próximos a cero indican poca asociación entre las variables y valores cercanos a uno indican una fuerte asociación.

• El coeficiente φ puede ser calculado como el coeficiente de correlación entre dos variables dicotómicas.

16

Alternativamente, puede ser calculado utilizando el estadístico Chi-cuadrado de Pearson con la siguiente fórmula:

φ = (χ2/N)1/2

donde N es el número de datos.

17

Riesgo Relativo

• El riesgo relativo es una medida del grado de asociación entre dos variables dicotómicas, que compara el producto de las frecuencias en la diagonal principal de la tabla con el producto de las frecuencias en la diagonal opuesta mediante el cociente entre ambos. En consecuencia toma valores positivos y, si las variables son independientes, su valor será próximo a uno.

18

El coeficiente de contingencia

• El coeficiente de contingencia es una extensión del coeficiente φ al caso de que al menos una de las variables presente más de dos categorías. Toma valores entre 0 y Cmax, donde si r y c son el número de categorías de cada una de las variables:

Cmax = [min(r-1,c-1)/(1+ min(r-1,c-1))]1/2

Page 44: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Medidas de Asociación para Tablas Mayores a 2x2

Valores del coeficiente de Contingencia cercanos a 0 indican que no hay asociación entre las variables y valores próximos a Cmax indican una fuerte asociación (note que Cmax es un número que siempre será menor a uno).

20

Medidas de Asociación para Tablas Mayores a 2x2

La V de Cramer

Otra extensión del coeficiente φ al caso de variables con más de dos categorías es la V de Cramer que, a diferencia del coeficiente de contingencia toma valores entre 0 y 1.

Valores de V cercanos a 0 indican que no hay asociación entre las variables y valores cercanos a 1 indican una fuerte asociación.

V = (χ2/(r ó c)*N)1/2

21

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

22

Créditos:

Lic. Ana María López Navarro

Page 45: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 14. Análisis bivariado: correlación

2

Análisis bivariado

Son los métodos estadísticos para analizar la relación entre dos variables de estudio. Se conocen como técnicas bivariadas.

Cuando se analiza el grado de asociación entre dos variables, debe de existir una variable independiente, que es el factor de predicción, y una variable independiente, que es el criterio.

3

Las variables independientes son aquellas que se cree afectan el valor de la variable dependiente.

Por ejemplo, variables independientes tales como precio, distribución, gasto en promoción, etc., se pueden utilizar para describir el tipo de relación y predecir su comportamiento, en variables dependientes como ventas o participación de mercado de un producto.

4

¿Cuál es el nivelde escala de las variables?

• Coeficiente de correlacional lineal r

• Regresión simple

• Coeficiente de correla-ción por rangos• Gamma • Tao

• Coeficiente de contingencia• Lambda

Dos variables

nominales

Dos variables ordinales

Procedimientos bivariados

Dos variables

de intervalo

Prueba t sobre el coeficientede regresión

Prueba z sobre la diferenciaentre medias

Prueba t sobre la diferenciaentre medias

Prueba U de Mann -WhitneyPrueba de Kolmogorov -Smirnov

Prueba de ji cuadrado

5

Análisis bivariado

CORRELACIÓN: Con esta técnica trataremos de dar respuesta a si existe dependencia entre dos variables.Si son independientes, no se sigue estudiando.Si existe dependencia, nos plantearemos el grado de dependencia.

REGRESIÓN: Con esta técnica trataremos de determinar el tipo de dependencia.Si son dependientes intentaremos determinar la variable dependiente a partir de la variable independiente.Y = Variable dependiente o variable respuesta.X = Variable independiente o regresora.

6

Correlación y regresiónVARIABLES CUANTITATIVAS

Estudio de independencia“Dos variables son independientes cuando la frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales”

fi. * f.j = fijSi son independientes ya no seguimos estudiando la relación porque no existe.

2.Estudio del grado de relación

Grado de asociación1.- Coeficiente de asociación (H)2.- otros estadísticos (“ro de Spearman, “tau” de kendall)3.- Test de la X2 (Lo veremos al ver la inferencia)

Correlación1.- Gráficamente.2.-Analíticamente:

Covarianza.Coeficiente de correlación de Pearson.

3. Regresión (estimar los valores de la vble. dep. a partir de la ind.)

Relación lineal.Relación no lineal (no la veremos)

VARIABLES CUALITATIVAS

Page 46: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Introducción: un poco de historia

El término regresión fue introducido por Galton en su libro “Natural inheritance” (1889) refiriéndose a la “ley de la regresión universal”:

– “Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor.”

• Regresión a la media

– Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable).

8

– Pearson (un amigo suyo) realizó un estudio con más de 1000 registros de grupos familiares observando una relación del tipo:

• Altura del hijo = 85cm + 0,5 altura del padre (aprox.)

• Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede decirse de los padres muy bajos.

Hoy en día el sentido de regresión es el de predicción de una medida basándonos en el conocimiento de otra.

9

Correlación

A la derecha tenemos un ejemplo de los datos obtenidos observando dos variables en varios individuos de una muestra.

– En cada fila tenemos los datos de un individuo.

– Cada columna representa los valores que toma una variable sobre los mismos.

– Los individuos no se muestran en ningún orden particular.

...

163

176

166

169

171

158

180

154

162

Altura en cm.

...

68

84

54

60

66

62

78

60

61

Peso en Kg.

10

ANÁLISIS GRÁFICO:Dichas observaciones pueden ser representadas en un diagrama de dispersión (‘scatterplot’). En ellos, cada individuos es un punto cuyas coordenadas son los valores de las variables.

Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.

...

163

176

166

169

171

158

180

154

162

Altura en cm.

...

68

84

54

60

66

62

78

60

61

Peso en Kg.

11

Correlación- Diagramas de dispersión

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión.

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Mid

e 18

7 cm

.

Mide 161 cm.

Pesa 76 kg.

Pesa 50 kg.

12

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión.

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Parece que el peso aumenta con

la altura

Page 47: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Correlación:Predicción de una variable en función de la

otra = Regresión

Aparentemente el peso aumenta 10 kg por cada 10 cm de altura... o sea, el peso aumenta en una unidad por cada unidad de altura.

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

10 cm.

10 kg.

14

Correlación:Cómo reconocer relación directa e inversa.

Incorrelación

30

80

130

180

230

280

330

140 150 160 170 180 190 200

Fuerte relacióndirecta.

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Cierta relacióninversa

0

10

20

3040

50

60

70

80

140 150 160 170 180 190 200

Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Incorrelación.

Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente.

•Para los valores de X mayores que la media le corresponden valores de Y mayores también.

•Para los valores de X menores que la media le corresponden valores de Y menores también.

•Esto se llama relación directa o creciente entre X e Y.

15

Correlación:Covarianza de dos variables X y Y

• La covarianza entre dos variables, Sxy, nos indica si la posible relación entre dos variables es directa o inversa.– Directa: Sxy >0 – Inversa: Sxy <0– No-relacionda: Sxy =0

• El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relación entre las variables.

• Además es una medida que depende de las unidades, por lo que permite comparar entre distribuciones.

))((1 yyxxn

S ii

ixy −−= ∑

16

Correlación:Covarianza de dos variables X y Y

La covarianza tiene el inconveniente de que no estádelimitada, por tanto necesitamos un coeficiente o algún valor que venga definida la relación entre dos variables para poder saber si la relación es fuerte o débil:

COEFICIENTE DE CORRELACIÓN DE PEARSON

17

Correlación:Coeficiente de correlación lineal de Pearson

La coeficiente de correlación lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales).

Tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relación sea directa o inversa.

– s útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones (cuadrática, logarítmica,...)

yx

xy

SSS

r =

18

Correlación:Coeficiente de correlación lineal de Pearson

El coeficiente nos sirve para determinar si existe una relación significativa o no a la asociación en análisis.

Debemos identificar tres aspectos :

1. Grado de presencia : El valor de p, a la hora de calcular el coeficiente, debe ser examinado primero, ya que si la relación es (>.05), siginifica que no existe relación, si p=or<.05, significa que sí existe una relación significativa y procedemos a determinar:

Page 48: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Correlación:Coeficiente de correlación lineal de Pearson

2. Dirección de la asociación: Hay que ver si el coeficiente es negativo (-) o positivo (+).

3. Fuerza de la asociación: El coeficiente de correlación (r) es un número que se encuentra en el rango –1.0 a +1.0. Entre más cercano sea a 1.00 (+ ó -), mayor es la asociación, a continuación presentamos una clasificación que será útil en este aspecto.

20

Correlación:Coeficiente de correlación lineal de Pearson

Después de haber obtenido el coeficiente de correlación y determinar si es estadísticamente significativo, podemos concluir acerca de la fuerza en la asociación de variables.

Si el coeficiente cae entre:

+1 y +.81 ó -1 y -.81 Relación Alta+.80 y +.61 ó -.80 y -.61 Relación Moderada+.60 y +.41 ó -.60 y -.41 Relación Baja+.21 y +.40 ó -.21 y -.40 Relación DébilIgual o menor a ±.20 Inexistente

21

Correlación:Otros coeficientes de correlación

Cuando las variables en vez de ser numéricas son ordinales, es posible preguntarse si hay algún tipo de correlación entre ellas.

Para estos casos, disponemos de dos estadísticos:– ρ (‘ro’) de Spearman– τ (‘tau’) de Kendall

Son estadísticos análogos a r y los podemos aplicar donde las variables no puedan considerarse numéricas.

22

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

23

Créditos:

Lic. Ana María López Navarro

Page 49: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 15. Análisis bivariado: regresión lineal simple

2

Regresión

El análisis de regresión no se debe confundir con el de correlación, el que mide el grado de relación lineal entre las variables, en cambio, el de regresión, mide relaciones de causalidad.

El análisis de correlación supone que todas las variables son aleatorias, en cambio, cuando se regresiona, se supone que las variables explicativas son fijas en muestreos repetidos.

3

El análisis de regresión sirve para predecir una medida en función de otra medida (o varias).

Y = Variable dependiente– predicha– explicadaX = Variable independiente– predictora– explicativa

¿Es posible descubrir una relación?– Y = f(X) + error

• f es una función de un tipo determinado• el error es aleatorio, pequeño, y no depende de X

4

Veremos un ejemplo del estudio de la altura en grupos familiares de Pearson, como la sesión anterior, que estaremos manejando durante el resto del tema.

– Altura del hijo = 85cm + 0,5 altura del padre (Y = 85 + 0,5 X)

• Si el padre mide 200cm ¿cuánto mide el hijo?– Se espera (predice) 85 + 0,5x200=185 cm.

» Alto, pero no tanto como el padre. Regresa a la media.

5

• Si el padre mide 120cm ¿cuánto mide el hijo?– Se espera (predice) 85 + 0,5x120=145 cm.

» Bajo, pero no tanto como el padre. Regresa a la media.

Es decir, nos interesaremos por modelos de regresión lineal simple.

6

Modelo de regresión lineal simple

• En el modelo de regresión lineal simple, dado dos variables–Y (dependiente)–X (independiente, explicativa)•buscamos encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante–Ŷ = b0 + b1X•b0 (ordenada en el origen, constante)•b1 (pendiente de la recta)

•Y y Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad– e=Y-Ŷ se le denomina residuo o error residual.

Page 50: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

•Y y Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad– e=Y-Ŷ se le denomina residuo o error residual.

8

Modelo de regresión lineal simple

En el ejemplo de Pearson y las alturas, él encontró:– Ŷ = b0 + b1X

• b0=85 cm (No interpretar como altura de un hijo cuyo padre mide 0 cm)

• b1=0,5 (En media el hijo gana 0,5 cm por cada cmdel padre)

0

30

60

90

120

150

180

0 10 20 30 40 50 60 70 80 90 100

110120

130140

150160

170

180190

200210

220

b0=85 cm

b1=0,5

9

0

30

60

90

120

150

180

0 10 20 30 40 50 60 70 80 90 100

110

120

130

140

150

160

170

180

190

200

210

220

b0=85 cm

b1=0,5

La relación entre las variables no es exacta. Es natural preguntarse entonces:Cuál es la mejor recta que sirve para predecir los valores de

Y en función de los de XQué error cometemos con dicha aproximación (residual).

10

Modelo de regresión lineal simple

El modelo lineal de regresión se construye utilizando la técnica de estimación mínimo cuadrática:– Buscar b0, b1 de tal manera que se minimice la

cantidad• Σi ei

2

Se comprueba que para lograr dicho resultado basta con elegir:

xbybSSrb

X

Y101 −==

11

Se obtiene además unas ventajas “de regalo”– El error residual medio es nulo.– La varianza del error residual es mínima para

dicha estimación.

• Traducido: En término medio no nos equivocamos. Cualquier otra estimación que no cometa error en término medio, si es de tipo lineal, será peor por presentar mayor variabilidad con respecto al error medio (que es cero).

12

Modelo de regresión lineal simple

• Que el error medio de las predicciones sea nulo no quiere decir que las predicciones sean buenas.

• Hay que encontrar un medio de expresar la bondad del ajuste(bondad de la predicción)

Cometió un error de -30 en

su última predicción

No importa. Con los dos últimos clientes me

equivoqué en +10 y +20. En término medio

el error es cero.

Page 51: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

¿Cómo medir la bondad de una regresión?

Imaginemos un diagrama de dispersión, y vamosa tratar de comprender en primer lugar, qué esel error residual, su relación con la varianza de Y,y de ahí, cómo

medir la bondad de un ajuste.

14

¿Cómo medir la bondad de una regresión?Interpretación de la variabilidad en Y

YEn primer lugar olvidemos que existe la variable X. Veamos cuál es la variabilidad en el eje Y.La franja sombreada indica la zona donde varían los valores de Y.

Proyección sobre el eje Y = olvidar X

15

¿Cómo medir la bondad de una regresión?Interpretación del residuo

Fijémonos ahora en los errores de predicción (líneas verticales). Los proyectamos sobre el eje Y.

Se observa que los errores de predicción, residuos, están menos dispersos que la variable Y original.

Cuanto menos dispersos sean los residuos, mejor será la bondad del ajuste.

Y

16

Regresión: Bondad de un ajusteResumiendo:

• La dispersión del error residual seráuna fracción de la dispersión original de Y

• Cuanto menor sea la dispersión del error residual mejor seráel ajuste de regresión.

Eso hace que definamos como medida de bondad de un ajuste de regresión,o coeficiente de determinación a:

2

22 1

Y

e

SSR −=

Y

22 Ye SS <

17

Regresión: Bondad de un ajusteResumen

•La bondad de un ajuste de un modelo de regresión se mide usando el coeficiente de determinación R2

•R2 es una cantidad adimensional que sólo puede tomar valores en [0, 1]

•Cuando un ajuste es bueno, R2 será cercano a uno.

•Cuando un ajuste es malo R2 será cercano a cero.

18

•A R2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión.

•R2 puede ser pesado de calcular en modelos de regresión general, pero en el modelo lineal simple, la expresión es de lo más sencilla: R2=r2

Page 52: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

20

Créditos:

Lic. Ana María López Navarro

Page 53: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Analisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 16. SPSS

2

SPSS

El paquete estadístico SPSS (Statistical Package for theSocial Sciences) es uno de los muchos que se pueden utilizar para la investigación de mercados. Existen otros paquetes como SAS, Minitab e inclusive Excel que se pueden utilizar, sin embargo, el SPSS es el más empleado actualmente para este rubro.

3

RegresiónSPSS esta estructurado en tres ventanas diferentes:

- Editor de datos de SPSS: es la primera ventana que aparece nada más acceder al programa. Permite visualizar los datos y las variables con los que vamos a trabajar. Recoge todos los menús para trabajar con losdatos y realizar los análisis estadísticos.

- Editor de sintaxis de SPSS: en esta ventana podemos pegar la sintaxis generada al realizar un cálculo, implementar un método, dibujar un gráfico, en general, al implementar cualquiera de las utilidades que nos ofrece SPSS.

- Visor de resultados de SPSS: en esta ventana podemos visualizar los resultados del método implementado.

4

Introducir datos en SPSS

Al abrir el programa SPSS lo primero se solicita es el archivo de trabajo. Se puede seleccionar una base de datos o bien pulsar en el botón Cancelar y acceder directamente a la ventana de Editor de datos del programa SPSS.

En esta ventana se pueden entrar de forma manual los datos o bien cargar unos nuevos datos mediante la opción Abrir Datos del menú Archivo. El programaSPSS trabaja con los datos previamente grabados en un archivo al que denominamos archivo de datos y tiene la extensión obligatoria .sav

5

La ventana de Editor de datos de SPSS dispone de dos pestañas: Vista de datos y Vista de variables.

- Vista de datos: está dividida en columnas y filas dando lugar a celdas o casillas donde se recogen los datos. Cada columna tiene asignado un nombre de variable, ya sea especificado por el usuario o bien por el propio programa SPSS (máximo 8 caracteres). Lasfilas, a su vez, están numeradas de forma correlativa.

6

- Vista de variables: recoge las características de las variables o lo que es lo mismo, de las columnas. Informa sobre el Nombre de la variable, el Tipo (Numérico, Cadena, Fecha,..), el Ancho de la variable, el número de decimales (en el caso de variables numéricas), la Etiqueta (permite introducir una pequeña descripción de la variable), etiquetas para Valores de la variable, etiquetas para identificar valores Perdidos, el ancho de columna, la Alineación y la Medida.

Page 54: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Analisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Creación de un archivo

1. Debemos crear la estructura (definir las variables) de un nuevo archivo de datos de SPSS. Para cada variable habrá que ir especificando cada una de suscaracterísticas, empezando por el nombre (primeracolumna).

2. Definir etiquetas para cada variable, pueden ser de hasta 60 caracteres. se escribe un código en la zona en la que aparece “Valor” y la etiqueta correspondiente en la zona de “Etiqueta de valor” y después pulsar el botón de Añadir; así, en la Figura 3.2, al código 1 se le ha asignado la etiqueta “no”, al código 2 se la ha asignado la etiqueta “moderado” y al código 3 se le añadirá la etiqueta “grave” en cuanto pulsemos el botón Añadir.

8

3. Hay que definir los valores perdidos, que éstos serían las NO-respuestas por parte de los entrevistados, generalmente se le asigna un número grande y fácil de tabular a fin de que no se confunda con los valores de análisis, usualmente se asigna 99.

4. No olvides grabar tu documento para no perder la información almacenada.

9

Vista de archivo

Un archivo de datos tendría mas o menos el siguiente aspecto:

10

Estadísticas Descriptivas

El procedimiento Frecuencias proporciona estadísticos y representaciones gráficas que resultan útiles para describirmuchos tipos de variables. Es un buen procedimiento parauna inspección inicial de los datos.

Supongamos que deseamos estudiar una muestra de 50 sujetos a los que hemos medido cinco variables: edad, sexo, peso y altura. Veamos la salida que nos proporcionael procedimiento frecuencias.

11

En primer lugar, al ejecutar este procedimiento, nosaparece una ventana en la que hemos de seleccionar las variables sobre las que deseamos obtener la información. Supongamos que en nuestro caso, deseamos ver quéocurre si seleccionamos las variables edad y sexo.

12

Estadísticas DescriptivasSi pulsamos aceptar sin modificar ninguna otra opción, la salida que proporciona el programa es la siguiente, paracada variable seleccionada:

Page 55: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Analisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Además, en el procedimiento frecuencias podemosestablecer una serie de opciones. Si en la ventana de Frecuencias elegimos el botón de Estadísticos, podemoselegir un conjunto de ellos sobre las variables seleccionadas (valores percentiles, estadísticos deposición, de dispersión o sobre la forma de la distribución).

14

Si en ese cuadro seleccionamos, por ejemplo, media, mediana, desviación típica y varianza y lo ejecutamos parala variable edad, los resultados proporcionados, ademásdel cuadro referente a las frecuencias, serían:

15

Igualmente, en el procedimiento Frecuencias existe unaopción para dibujar gráficos. Si seleccionamos esa opciónaparecerá la siguiente ventana:

Si seleccionamos la opciónHistogramas, por ejemplo, la salida sería:

16

El procedimiento Descriptivos muestra estadísticos de resumen univariados para variables en una única tabla y calcula puntuaciones tipificadas (puntuaciones z).

17

Estadísticas Descriptivas

Si se ejecuta el procedimiento para el conjunto devariables seleccionadas, la salida que proporciona el programa es la siguiente:

18

Además de los estadísticos que aparecen en el cuadroanterior es posible añadirles otros.

Simplemente en el cuadro de Descriptivos hay que pulsar sobre el botón Opciones y aparecerá la siguiente ventana:

En ella se pueden seleccionarmás estadísticos y elegir el orden de visualización de lasvariables (alfabético o por el valor ascendente odescendente de las medias).

Page 56: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Analisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Tablas Cruzadas

El procedimiento Tablas de contingencia crea tablas de clasificación doble y múltiple y además proporciona 22 pruebas y medidas de asociación para tablas de dobleclasificación.

20

Los estadísticos de tablas de contingencia y las medidasde asociación sólo se calculan para las tablas de dobleclasificación. Si se especifica una fila, una columna y un factor de capa (variable de control), el procedimientotablas de contingencia crea un panel de medidas y estadísticos asociados para cada valor del factor capa.

21

En nuestro ejemplo vamos a realizar una tabla de contingencia para las variables edad en filas y sexo en columnas. Veamos la salida que proporciona:

22

El procedimiento Tablas de contingencia tiene tresposibilidades. Como siempre para acceder a ellasdebemos pulsar los botones de la parte inferior de la ventana de Tablas de contingencia.

La primera opción es Estadísticos. Esta opciónproporciona distintos estadísticos que hemos de seleccionar en función del tipo de variables con las queestamos trabajando (dicotómicas, nominales, ordinales, etc.).

23

Además, el procedimiento permite acceder a la ventana Casillas. Esta ventana permite descubrir las tramas en los datos que contribuyen a una prueba chi-cuadrado significativa. Así permite mostrar las frecuencias esperadas y tres tipos de residuos que miden la diferencia entre las frecuencias observadas y las esperadas. Cada casilla de la tabla puede contener cualquier combinación de recuentos, porcentajes y residuos seleccionados.

24

Por último, la opción Formato permite, como en otrosprocedimientos del programa, elegir las filas en ordenascendente o descendente.

Page 57: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Analisis e interpretación de resultados

5

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

25

Regresión y Correlación

En todo problema de regresión y correlación, el primer paso consiste en dibujar la nube de puntos, con objeto de detectar posibles no-linealidades en la relación o algunaotra falla en las hipótesis del modelo de regresión lineal. El procedimiento que permite dibujar nubes de puntos, lo encuentras en Gráficos Diagrama de Dispersión.

26

Para llevar a cabo una Regresión Lineal, se realiza con el procedimiento Analizar Regresión Linea

Para llevar a cabo una Correlación, se realiza con el procedimiento Analizar Correlaciones Bivariadas

27

Análisis de Varianza

Para llevar a cabo un Análisis de Varianza, se realiza con el procedimiento Analizar Comparar MediasANOVA de un factor

28

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

29

Créditos:

Lic. Ana María López Navarro

Page 58: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 17. Análisis bivariado: varianza (ANOVA)

2

Análisis de Varianza

El análisis de varianza (ANOVA) prueba medias de dos o más poblaciones, se utiliza para analizar resultados experimentales. Generalmente la hipótesis nula es que todas las medias son iguales.Por ejemplo, supongamos que un investigador quiere saber si los consumidores constantes, regulares y ocasionales, más los no-consumidores de la avena en sobres de sabores Quaker, difieren en su preferencia a la avena Quaker, medido en una escala Likert de nueve puntos.La hipótesis nula de que no difiere la preferencia por la avena de los cuatro grupos puede verificarse con un análisis de varianza.

3

El análisis de varianza debe tener una variable dependiente, que en este caso sería la preferencia por la avena, que es métrica (medida en una escala de intervalo o razón).

Las variables independientes deben ser variables no-métricas, como consumo constante, regular u ocasional.

A las variables independientes se les llama factores.

Una combinación particular de niveles de factores se llama tratamiento.

4

El ANOVA puede responder a preguntas cómo:

¿Cómo varía la intención de compra del producto por parte de los consumidores según los niveles de precios?¿Varían las opiniones de las políticas de distribución de la empresa entre los agentes, vendedores y mayoristas?¿Varía el nivel de consumo de mi producto según el segmento?

5

Análisis de VarianzaEstadísticos principales

• Eta2 (η2). La fuerza de los efectos X en Y. El valor de η2 varía entre 0 y 1.

• Estadística F. Con esta estadística se verifica la hipótesis nula de que las medias de las categorías son iguales.

• SCA. También se denota SCx. Es la variación de Y relacionada con la variación de las categorías de X.

• SCE. Se denota con Scerror. Es la variación de Y debido a la variación en cad una de las categorías de X.

• SCy. Variación total de Y.

6

Etapas del ANOVA de un factor

Identificar variables dependiente e independiente

Descomponer la variación total

Medir los efectos

Probar la significación

Interpretar resultados

Page 59: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Etapas del ANOVA de un factor

Todo el proceso se puede hacer en forma manual, pero es muy largo y complicado, y si se tienen gran cantidad de datos tiene que recurrirse a algún tipo de software.

En la práctica todo se resume en un estadístico, F, y tiene desglosados todos los componentes del mismo.

El formato general de una tabla de ANOVA que arrojan los paquetes estadísticos generalmente tiene los siguientes componentes:

8

Tabla de Anova

nT-1SSyTotal

MSE=SCE/nT - k

nT - kSCEError

F = MSTR/MSE

MSTR=SSCA/ k-1

k-1SSCATratamientos

FFuente de Variación

Suma de Cuadrados

Grados de libertad

Cuadrado Medio

Donde: k=número de tratamientos,

nT= Número total de datos

9

Estadístico F

• Este tipo de análisis fue ideado por Sir Ronald A. Fisherque durante los años 1912 a 1962 y contribuyó en forma notable a un modo de pensamiento y filosofía estadística moderna. Fórmula:

F = SCx

Scerror

/ ( c – 1 )

/ ( N – c) )

10

Por ejemplo, si tenemos 3 programas distintos de incentivos y queremos ver cuál aumenta el rendimiento de manera más eficaz, utilizamos el análisis de varianza.

Queremos medir el rendimiento de cada grupo y averiguar si existen o no diferencias entre ellos.

11

Si la probabilidad o significancia del Estadístico F es menor a .05 rechazaremos la hipótesis de igualdad de medias y concluiremos que no todas la medias poblacionales comparadas son iguales. En caso contrario, no podemos rechazar la hipótesis de igualdad y no podremos afirmar que los grupos comparados difieran en sus promedios poblacionales.

12

Estadístico F

418.384498Total

0.119761824374.431188Dentro delos grupos

.0008.2524420.9883275343.95331Entre grupos

Sig.FMedias

cuadráticasGrados de

libertadSumas de cuadrados

En una tabla este es el valor que se evalúa y se compara en base a .05.

Page 60: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003– Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Estadístico F

En este caso, puesto que la significancia da a .000, entonces vemos que .05 es mayor que .000, por lo cual se rechaza la hipótesis nula y podemos concluir que sí existe una diferencia en rendimiento de acuerdo al programa de incentivos utilizado.

14

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

15

Créditos:

Lic. Ana María López Navarro

Page 61: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 18. Análisis multivariante.Técnicas dependientes

2

Análisis multivarainte

Es el análisis simultáneo de más de dos variables.

Se pueden categorizar en función a:• Si alguna de las variables se puede identificar como

dependiente de otra u otras• Existe más de una variable dependiente• La naturaleza de los datos (tipo de escala)

3

Propósitos del análisis multivariante

• Comprender la relación de los datos (mediante las distancias de éstos)

• Visualizarlos• Hacer modelos• Obtener información correlacionada• Reducir los datos o simplificar la estructura de éstos• Sortearlos y agruparlos• Investigar la dependencia entre las variables• Predecir• Construir hipótesis y probarlas

4

Análisis multivarianteTécnicas Multivariantes

Técnicas de Dependencia Técnicas de Interdependencia

Una Variable Mas de Interdepen- SemejanzaDependiente una variable dencia entre

dependiente variables objetos

Regresión Múltiple Correlación Análisis ConglomeradoDiscriminante Canónica Factor Común EscalaMedición Conjunta Multidi-Varianza y Covarianza mensional

5

Técnicas dependientes

Una variable dependienteRegresión MúltipleAnálisis DiscriminanteVarianza y CovarianzaMedición Conjunta

Múltiples variables dependientesCorrelación Canónica

6

Regresión múltiple

Examina la relación entre por lo menos 2 variables independientes de intervalos de escala y una variable dependiente de intervalo de escala.

La ecuación predictiva : Y= a + b1X1 +b2X2

Las variables independientes se utilizan para predecir la dependiente

X1 y X2

a, b1 y b2 son los coeficientes de regresión generados a partir de datos de la muestra, que indica la contribución relativa de dicha variable para explicar la dependiente

Page 62: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Un coeficiente positivo indica una relación directa entre esa variable independiente y la variable dependiente, un coeficiente negativo indica una relación inversa.

El tamaño del coeficiente indica la cantidad de cambio en la variable dependiente asociado con un incremento de una unidad en dicha variable independiente, asumiendo que todas las demás variables independientes permanezcan constantes.

8

Regresión múltiple ejemplo

Considera la siguiente ecuación de regresión múltiple:Y = 121 + 0.2 X1 + 5.2 X2 R2 = 0.42donde:Y = Estimado de ventas, X1 = Costo de publicidad, X2 = Ingresos

Las ventas tienden a aumentar en .2 unidades por cada unidad incrementada en el costo de publicidad y en 5.2 unidades por cada incremento en los ingresos

R2 es el coeficiente de determinación múltiple, indica la proporción de la variación en Y explicado por la regresión.42% de la variación en Ventas pueden ser relacionadas por el costo de publicidad y el ingreso.

9

Análisis discriminante

Este análisis busca generar dimensiones que permitan separar los objetos tanto como sea posible, a partir de grupos ya determinados

Se utiliza con una variable dependiente en escala nominal y un conjunto de variables independientes en escala de intervalo.

10

Análisis discriminante

Objetivos:1) Analizar si existen diferencias entre los grupos en cuanto a su comportamiento con respecto a las variables consideradas y averiguar en qué sentido se dan dichas diferencias (descriptivo).

2) Elaborar procedimientos de clasificación sistemática de individuos de origen desconocido, en uno de los grupos analizados. (predictivo).

11

Análisis discriminante

D= b0 +b1X1+b2X2+b3X3 + … bkXk

Dónde: D = Puntuación discriminantebx = coeficientes o peso discriminanteXs = variables independientes

Función discriminante. Combinación lineal de las variables independientes que diferencie al máximo los puntajes de las medidas a través de categorías de la variable dependiente.

12

Análisis discriminanteEjemplo

Walt Mart está interesado en analizar la opinión de sus clientes con respecto a la tienda. Para ello realiza una encuesta a una muestra de 200 de ellos en las que le pide que valoren su labor haciendo una valoración entre 0 y 5 en los siguientes aspectos: Limpieza, Precios Competitivos, Disponibilidad de Productos, Servicio en Caja, Calidad, Cercanía y Promociones.Además, tiene clasificados a sus clientes en dos grupos de acuerdo a si tienen hijos o no. El número de clientes pertenecientes al grupo de muestra con hijos es igual a 120 y el del grupo sin hijos es de 80.

Page 63: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

El objetivo del estudio es analizar si existen diferencias en cuanto a la percepción de la tienda entre los clientes con hijos y los clientes sin hijos, y en caso de que existan, analizar en qué sentido se dan dichas diferencias.

En este caso, existen 7 variables clasificadoras (p=7) y dos grupos a discriminar (q=2). El tamaño de la muestra es n=200 con n1 = 120 y n2 = 80.

14

Varianza y Covarianza

Análisis de Varianza (ANOVA) se utiliza en el análisis de datos experimentales. Requiere una variable dependiente en escala de intervalos y una variable o variables independientes en escala nominal.

Análisis de Covarianza (ANCOVA) se utiliza en situaciones en donde se descubre después del experimento, que alguna fuente externa de variación contribuye a los valores de la variable dependiente.Se requiere una variable dependiente en escala de intervalos y variables independientes en escala nominal.

15

Medición conjunta

Se ocupa de los efectos conjuntos de dos o más variables independientes nominales en la disposición de una variable dependiente ordinal.

Se utiliza para medir los intercambios que los consumidores hacen sobre atributos de productos; para predecir la participación de mercados o la rentabilidad de un producto que ofrece varias combinaciones de atributos.

Es útil en el diseño de nuevos productos o servicios.

16

Medición conjuntaEjemplo

Importance summary

Factor

Engine size as indicRepairs for one year

Brand NameColour of car

Aver

aged

Impo

rtanc

e

50

40

30

20

10

0

Color del carro Marca Seguridad Tamaño del motor

Impo

rtanc

ia p

rom

edio

Resumen de Importancia de los atributos en la selección de un automóvil

17

Correlación canónica

Es apropiada cuando se tiene un conjunto de variables dependientes en escala de intervalos y un conjunto de variables independientes.El procedimiento implica obtener un conjunto de ponderaciones para las variables dependientes e independientes que proporcione la correlación única máxima entre el conjunto de variables dependientes y el conjunto de variables independientes.

Ejemplo. Para conocer la forma en que un conjunto de actitudes se relacionen con un conjunto de comportamiento.

18

Que hemos aprendido hasta hoy...

El análisis multivariante nos permite analizar múltiples variables simultáneamente para entender la relación (distancia), correlación, agrupar datos o simplificar la estructura de estos.

Podemos definir dos técnicas multivariantes, dependientes e interdependientes.

En las técnicas dependientes una o más variables pueden identificarse como dependientes (el resultado estudiado o evento) y las demás variables como independientes.

Page 64: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

4

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

19

Los métodos estadísticos a utilizar dependen de si tenemos una o más variables dependientes y el tipo de escala de los datos.

Una variable dependiente: Regresión Múltiple, Análisis Discriminante, Varianza y Covarianza, Medición Conjunta.

Múltiples variables dependientes: Correlación Canónica

20

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

21

Créditos:

Lic. Ana María López Navarro

Page 65: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

1

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

1

AM04003-Análisis e interpretación de resultados

Sesión 19. Análisis multivariante:técnicas interdependientes

2

Análisis multivarianteTécnicas Multivariantes

Técnicas de Dependencia Técnicas de Interdependencia

Una Variable Mas de Interdepen- SemejanzaDependiente una variable dencia entre

dependiente variables objetos

Regresión Múltiple Correlación Análisis ConglomeradoDiscriminante Canónica Factor Común EscalaMedición Conjunta Multidi-Varianza y Covarianza mensional

3

Técnicas interdependientes

No hace diferencias entre variables dependientes e independientes, analiza el conjunto completo de la interrelación de las variables.

Enfoque en variablesAnálisis Factor Común

Enfoque en objetosAnálisis Conglomerado (Cluster)Escalas Multidimensionales

4

Análisis de factor común

Procedimiento que selecciona un gran número de variables u objetos y se investiga si tienen un numero pequeño de factores en común que expliquen su intercorrelación.

Pasos:1. Matriz de correlación entre variables:

– Factor R. correlaciones entre variables– Factor Q. correlación entre casos

2. Extracción de factores de la matiz de correlación. 3. Rotación de factores iniciales.

5

Análisis de factor común Ejemplo

X1 X2 X3 X4

X1 1.00 0.85 0.35 0.20

X2 1.00 0.95 0.15

X3 1.00 0.75

X4 1.00

Matriz de correlación

En este ejemplo se tienen 4 variables y mediante la matriz de correlaciones se identificaron2 factores (A y B)

.26.70X3

X4

X2

X1

Variable

-.54.76

.53.48

.38.63

BARotación de Factores

6

Las cargas de la matriz de factores miden cuáles variables están involucradas en qué patrón factorial, hasta qué grado y en qué dirección. (se lee como correlación). Se le asigna a cada factor un nombre creativo que identifique el conjunto de variables.

X2Factor B(seguidores)

X1, X3, x4Factor A(Innovadores)

Interpretación de factores

Page 66: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

2

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

7

Análisis conglomerado

El objetivo es clasificar una muestra de entidades (personas u objetos) en un número pequeño de grupos mutuamente excluyentes basados en similitudes entre las entidades.

En el análisis conglomerado, a diferencia del análisis discriminante, los grupos no están pre-definidos. Por consiguiente, se usa la técnica para identificar los grupos de casos u observaciones relativamente homogéneos.

8

Análisis conglomerado Ejemplo

Se utiliza en: Segmentación de Mercado, definición del mercado meta, posicionamiento de productos y desarrollo de nuevos productos.

Objeto 1Objeto 2

Objeto 3

Objeto 6

Objeto 4

Objeto 3

Distancia

Se mide las distancia entre las similutues/diferencias de los objetos o de la matriz decorrelación para hacer Agrupamientos.

Dendograma.

9

Escala multidimensional MDS

Obtiene las dimensiones de los juicios de los encuestados sobre la similitud o preferencias de los productos transformándolos en distancias.

Se utilizan mapas preceptúales de dos o más dimensiones para tener un diagrama visual de las preferencias y percepciones.

Se utiliza en preferencias por marcas o tiendas.

10

Escala multidimensional MDS Ejemplo

MDS Análisis para los refrescos:– Coca Cola, Pepsi, Big Cola, Fanta, Sprite– Variables que los consumidores clasificaron en 6

atributos:• Buen sabor, Refrescante, Alta calidad, Alto

contenido de azúcar, Quita la sed, Barato.– MDS muestra la relación entre las variables

colocándolas en una espacio multidimensional.– Con estas dimensiones, las cuales fueron definidas

por los atributos de los refrescos, el MDS ilustra la posición de los refrescos en la mente del consumidor.

11

Mapa perceptual refrescos Ejemplo

Barato

Alta calidad

Refrescante

Quita la sed

Buen sabor

Alto en azúcar

∗FANTA

∗COCA COLA

∗PEPSI

∗BIG COLA

∗SPRITE

12

Que hemos aprendido hasta hoy...

El análisis multivariante nos permite analizar múltiples variables simultáneamente para entender la relación (distancia), correlación, agrupar datos o simplificar la estructura de éstos.

Podemos definir dos técnicas multivariantes, dependientes e interdependientes.

Las técnicas interdependientes analizan el conjunto completo de la interdependencia de las variables, sin distinguir variables dependientes.

Page 67: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

3

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006.

13

Se puede clasificar si se tiene enfoque a objetos o a variables, los métodos estadísticos para las técnicas interdependientes están en función de esta clasificación.

Enfoque en variables: Análisis de Factor ComúnEnfoque en objetos: Análisis Conglomerado (Cluster), Escalas Multidimensionales MDS

14

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

15

Créditos:

Lic. Ana María López Navarro

Page 68: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006 1

AM04003-Análisis e interpretación de resultados

Sesión 20. Presentación de resultados

Qué es un reporte de investigación...

• Un documento escrito y/o una presentación oral basada en la documentación escrita que comunica el propósito, los objetivos, el alcance, la hipótesis, la metodología, los hallazgos, las limitaciones y finalmente las recomendaciones del proyecto de investigación.

• Es el ultimo paso del proceso de la investigación de mercados.

• Es más que un resumen de lo investigado, es un registro del proceso de investigación.

Proceso de preparación del reporte

Antes del reporte escrito

ReporteEscrito

Después delReporte Escrito

Definición del problemaDiseño de investigaciónMetodología

Análisis de Datos

Interpretación delos hallazgos

Preparación delInforme

Presentación Oral

Lectura por partedel cliente

SEGUIMIENTO

Consideraciones para la elaboración del

Informe escrito• Considerar la audiencia objetivo

– Empezar con lo simple– Definir términos técnicos– Utilizar palabras sencillas que conozcan los lectores– Utilizar ayudas gráficas o visuales– Facilitar la lectura de cifras, utilizando porcentajes,

redondeo, rangos, etc.

• Tener en cuenta las necesidades de información– Asegurar la relación de los hallazgos con los

objetivos gerenciales.– Entender la información y dar conclusiones

interpretativas de éstas.

• Ser conciso y preciso– Seleccionar la información de manera de no meterse

en detalles, pero si enfocarse en las necesidades de información al momento de redactar el informe.

– En ocasiones una imagen o gráfica dice más que mil palabras.

– No repetir información innecesaria.

• Objetividad– No sesgar ni favorecer la información, debe

presentarse los hallazgos y defender su validez en caso necesario.

• ComunicaciónDefinir un estilo de redacción considerando:– Lenguaje de negocios, breve– Palabras y frases cortas– Ser conciso– Apariencia (utilización de espacios)– Información estadística visual– Utilizar tiempo presente– Voz activa– No modismos– Colocar citas de los encuestados

Page 69: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006 2

Formato del informe escrito

• Portada• Tabla de contenido• Índice de tablas ( gráficas, imágenes, figuras, etc)• Resumen ejecutivo• Cuerpo del informe• Conclusiones y recomendaciones• Apéndice

Portada

• Titulo que trasmita la esencia del estudio, atractivo que invite y despierte el interés por la lectura

• Fecha• Organización o persona que lo emite o presenta• Organización o personas a quien va dirigido

Tabla de contenido• Secuencial de los temas que se cubren en el informe y

paginación • Objetivo. Ayudar en la identificación rápida de los

temas de interés

Índice de tablas• Puede ir junto con la tabla de contenido o por

separado.• Contiene los títulos y la paginación de todos los

apoyos visuales incluidos.

Resumen ejecutivo• Abreviación o síntesis de los aspectos importantes de

la investigación.• Debe tener los hallazgos de mayor impacto, ya que

algunos ejecutivos solo es lo que leen del informe, deben facilitar el emprender una acción.

Debe incluir:– Objetivos de la investigación– Naturaleza del problema de decisión– Resultados– Conclusiones (opiniones basadas en la

investigación)– Recomendaciones

Cuerpo del informe• Introducción

– Información básica del proyecto, naturaleza del problema de decisión y objetivos.

• Metodología– Describir la naturaleza del diseño de la

investigación, plan muestral, procedimiento de recolección y análisis de datos. Tipo de investigación exploratoria o concluyente, especificar las fuentes de datos, el método de recolección.

– Es un resumen de los aspectos técnicos que desarrolla la confiabilidad de la investigación.

Cuerpo del informe• Resultados

– Flujo lógico de información para el propósito de toma de decisiones.

• Limitaciones– Apartado cuya finalidad es permitir al lector juzgar

la validez.– Entre las limitaciones se involucran las

insuficiencias del muestreo.

Page 70: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006 3

Conclusiones– Relación de los hallazgos de la investigación con

las necesidades de información, pueden formularse recomendaciones.

Apéndice– Material no esencial, pero relacionado con el objeto

de estudio, tal como formatos de recolección, detalles del plan de muestreo, estimativos, instrucciones, estadísticas.

Presentación de los datos

Se utilizan apoyos visuales como gráficas o tablas para la presentación de datos cuantitativos o procesos técnicos.

Elementos de los apoyos visuales:Número de la tabla o figura Título del contenido de la tablaTítulos horizontales y verticalesOrganizaciónBases de las medicionesNotas de pie de página

Tipos de Presentación de los datos

TabularPresentación numérica de datos.

Gráficas Presentación de datos (números, tendencias y relaciones)en términos de tamaño interpretados visualmente.

Las más utilizadas son:• Graficas de pastel (representa relaciones

proporcionales).• Graficas de barras (representa magnitud).• Graficas de línea (representa tendencias) (histograma,

polígono de frecuencia, de barras).

Mapas geográficos o perceptualesRepresentan ubicación relativa y/o dimensiones.

PictogramasDespliegue de datos con imágenes o símbolos pequeños.

Presentación Oral

La clave para una presentación eficaz es la preparación.

• Cuidar el lenguaje corporal.• Principio “Dígales”:

1) Dígales que va a decir.2) Dígales.3) Dígales que les dijo.

• Principio SIDI:Hágalo simple y directo.

Antes de la presentación

• Verificar equipo y material a utilizar.• Tener un plan de contingencia en caso de falla de

equipo.• Analizar la audiencia, como será la reacción, se debe

comenzar con ideas en común.• Practicar la presentación varias veces.

Page 71: Analisis e Interpretacion de Resultados

Universidad Tec Milenio: ProfesionalAM04003 – Análisis e interpretación de resultados

D.R. © Universidad TecMilenioLázaro Cárdenas #2610 Col. Del Paseo ResidencialMonterrey, N.L., 2006 4

Durante la presentación

• Empezar con una visión general.• No dar la espalda a la audiencia.• Evitar leer un guión, dirigirse a las personas.• Utilizar notas para evitar olvidar algún punto y dar una

secuencia ordenada a la presentación.• Utilizar apoyos visuales, simples y fáciles de

interpretar.• Evitar poses o movimientos innecesarios.• Evitar muletillas o modismos.• Preguntar si quedo alguna duda (repetir la pregunta,

no inventar respuestas, ser breve).

Bibliografía

• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5).

• Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4).

• Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Créditos:

Lic. Ana María López Navarro