minería de textos sacar más partido de las preguntas abiertas
TRANSCRIPT
A L T E R A N A L I S I S
MINERÍA DE TEXTOS. ¿CÓMO PODEMOS SACAR MÁS
INFORMACIÓN DE LAS PREGUNTAS ABIERTAS?
T E A Y U D A M O S A I N V E S T I G A R …
Las preguntas abiertas condicionan menos a los entrevistados, evita respuestas
convencionales o demasiado convenidas y dejan traslucir mejor las opiniones
reales, a veces mediante respuestas complejas e incluso contradictorias.
Además, las respuestas abiertas proporcionan información sobre la forma de
expresarse y el vocabulario de los entrevistados.
La forma tradicional de explotación de las preguntas abiertas…
Tabulación y análisis de los resultados
Se realiza una tabulación de los resultados que nos permita saber cuántas veces ha sido mencionado cada código.
Codificación de las respuestas
Se buscan esos códigos comunes a lo largo de todas las respuestas obtenidas
Se establece un plan de códigos
Se hace un primer análisis de las respuestas para buscar aquellos elementos (códigos) que se repiten de forma asidua
Para poder tratar de forma
estadística los datos obtenidos, la
forma tradicional de explotar las
preguntas abiertas pasa por la
codificación manual de las
respuestas.
Eso siempre supone una cierta
pérdida de información (forma de expresarse, términos
concretos empleados, etc…)
que puede resultar relevante en
el caso de abordar temas de
cierta complejidad.
Forma tradicional de trabajo:
Los resultados obtenidos se suelen presentar en forma de tabla o gráfico en los que
no aparecen los literales empleados por los entrevistados sino los códigos que los
agrupan. Veamos un ejemplo en forma de tabla:
La forma tradicional de explotación de las preguntas abiertas…
% Bebida sana / contiene fibra natural y frutas ........ 50
Fibra / aporta fibra ............................................... 16
Sano / Más sano que otras bebidas ................... 14
Fruta / Tiene zumo de futas ................................. 11
Fruta y fibra ........................................................... 11
Buena para la dieta ............................................. 10
El envase ..................................................................... 27
El envase ............................................................... 18
La forma / el tamaño ........................................... 5
El color ................................................................... 3
Sabor ........................................................................... 13
Buen sabor ............................................................ 7
Sabor a frutos rojos ............................................... 4
Producto natural ........................................................ 12
Sin colorantes artificiales ...................................... 5
Sin aditivos ............................................................. 5
Natural ................................................................... 4
No sabores artificiales .......................................... 3
Aspectos que más gustan del concepto La tabla obtenida nos muestra
que el contenido en fibras y
frutas y su efecto sobre la salud
han sido los aspectos que más
han interesado.
El envase, también ha
despertado interés.
Sin embargo, el sabor y la
naturalidad de la nueva bebida
han tenido menos impacto.
…pero, ¿eso es todo lo que podemos obtener de
este tipo de preguntas?
¿Cómo podemos sacar más partido a la información de las preguntas abiertas?
En los últimos años, han aparecido dos herramientas que nos permiten
sacarle más partido a la información recogida en este tipo de
preguntas:
Veamos cada una de ellas con mayor detalle:
• Permite presentar los datos de una forma mucho más visual 1. Tag Cloud
• Nuevas herramientas estadísticas que permiten optimizar la información obtenida
2. Minería de textos
¿Cómo podemos usar la tecnología de tag cloud?
Las tag clouds son representaciones visuales de las palabras que conforman un texto, en
donde el tamaño es mayor para las palabras que aparecen con más frecuencia.
Uno de sus usos principales es la visualización de las etiquetas de un sitio web, de modo
que los temas más frecuentes en el sitio se muestren con mayor prominencia. Las etiquetas
son solo palabras y por lo general suelen estar en orden alfabético.
La tag cloud de las respuestas obtenidas en la pregunta abierta de la tabla anterior podría
ser la siguiente:
Podemos ver de una forma muy visual que las mayores menciones se centran en la
incorporación de frutas y fibra y la consiguiente imagen de refresco saludable y la botella.
¿Cómo podemos usar la tecnología de tag cloud?
Las tag cloud no suponen una gran ayuda en el análisis de la información obtenida; sin
embargo, se trata de una forma muy visual de presentar la información obtenida. Por ese
motivo, creemos que su punto fuerte es como herramienta de ayuda en la presentación de
resultados.
Sin embargo, hay que tener en cuenta que presentan dos limitaciones que conviene tener
en cuenta:
• Se suele emplear a nivel de palabras y no de frases. Eso supone que perdemos el
concepto de contexto en el que aparecen las palabras.
• No permiten hacer agrupaciones temáticas (por ejemplo: unir todas las expresiones
que tengan que ver con el concepto de sano: sano, saludable, ingredientes naturales,
etc…)
De todas formas, se está trabajando en algunas líneas de investigación (tag cluster, tag
maps, tag SOM, etc…) que pueden ayudar a solventar estos problemas y aumentar el
potencial de esta herramienta.
¿Cómo nos puede ayudar la minería de textos?
La minería de textos o análisis de datos textuales consiste en aplicar métodos
estadísticos, en especial el análisis de correspondencias, a tablas específicas,
creadas a partir de los datos textuales. Estos métodos se completan con métodos propios del dominio textual como los glosarios de palabras, las concordancias y la
selección del vocabulario más específico de cada texto, para así proveer una
herramienta comparativa de los mismos.
El principio fundamental en esta perspectiva es el análisis a través de la
comparación. Se busca comparar entre sí el discurso de los individuos que han contestado a una encuesta o preguntas pautadas en entrevistas personales, o de
grupos de individuos con características comunes. Por ejemplo: el lenguaje de los
hombres con el de las mujeres, el lenguaje de los jóvenes con el de los mayores.
Un objetivo importante es conectar las repuestas abiertas con toda la información
proporcionada por las respuestas cerradas o variables categóricas relativas a
características contextuales de los individuos.
¿Cómo nos puede ayudar la minería de textos?
De forma muy resumida, la minería de textos se realiza en dos fases sucesivas:
• los textos de las preguntas abiertas se tratan de acuerdo a una serie de pautas establecidas (corrección de errores ortográficos, eliminación de las diferencias de género y número, etc…) con el objetivos de convertirlos en unas tablas que nos permitan establecer las diferencias que existen entre los distintos grupos
1. Procesamiento de la
información
• Se emplean métodos estadísticos avanzados (análisis factorial de correspondencias, análisis de similitudes y diferencias, etc…) para poder descubrir cuáles son las verdaderas diferencias entre los distintos grupos analizados.
2. Análisis de la información
¿Cómo nos puede ayudar la minería de textos?
Tras aplicar la minería de textos a la pregunta que nos ha servido de ejemplo,
podríamos obtener dos gráficos similares a estos
No
Duda
Si
Natural
Fibras
Sana
Botella
Combinación de frutas y fibras
Novedad
Frutas
Sin colorantes artificiales
Sin aromas artificiales
Diseño de la botella
Frutos rojosMás sana que otras
Aporta fibra a la dieta
Refrescante
Buen sabor
La marca
Botella diferente
El sabor
Ayuda para la vida moderna
Sin edulcorantes
Sin aditivos
Color
Aspectos que MÁS GUSTAN del concepto según su intención de comprarlo
No interesados en comprarlo
Interesados en comprarlo
Dudosos
No
Duda
Si
Mal sabor de la fibra
Tamaño pequeño
Nombre poco atractivo
Precio
El sabor
Envase
La fibra
Ya existe
Tiene burbujas
No aporta fibra
La marca
Mal sabor
Sabor de la fibra
Necesitan probarlo
Más sabores
Para niños
No es sano
¿Cómo nos puede ayudar la minería de textos?
Aspectos que NO GUSTAN del concepto según su intención de comprarlo
No interesados en comprarlo
Interesados en comprarlo
Dudosos
¿Cómo nos puede ayudar la minería de textos?
Analizando las diferencias de discurso entre los tres grupos analizados podemos ver
que:
• La comunicación del nuevo producto debería centrarse en tres ejes:
• La combinación de frutas y fibra que lo convierte en una bebida sana y
saludable.
• No tener ni edulcorantes, colorantes o aromas artificiales que refuerza
esa imagen de saludable.
• La novedad que todo ello supone en el mercado.
• Además, hay que tener en cuenta que:
• Uno de los posibles frenos a la compra son las dudas sobre el sabor que
tendrá.
• Otro freno a la compra reside en las dudas sobre el aporte real de fibra
a la dieta.
• Existe también un problema con el nombre del producto que está presente hasta en los más proclives a la compra.
Como vemos, la minería de textos nos ha permitido profundizar en el análisis de la
información y obtener unos insights claves para ayudarnos en la posible
comercialización del producto.
…pero, ¿podemos obtener aún más información?
En algunos casos, podemos emplear una técnica importada de los pretest
publicitarios para poder obtener mayor información de las preguntas abiertas.
Para poder llevarlo a cabo es necesario:
• Pedirle a los entrevistados que, tras responder a la pregunta abierta, nos
valore su propio comentario como:
• Posteriormente, realizar una labor de codificación de “valor añadido”
buscando identificar aquellos comentarios que supongan “implicación” (positiva o negativa) con el concepto. Tras el concepto “implicación” lo que
se quiere analizar es la cantidad de entrevistados que han recibido un
impacto activo (positivo o negativo) y han sido capaces de elaborar un discurso que va más allá de la repetición de alguno de los elementos del
concepto mostrado.
Muy positivo
• +2
Bastante positivo
• +1
Neutro
• 0
Bastante negativo
• -1
Muy negativo
• -2
Parece muy saludable y útil, al concentrar las cantidades de fruta y fibra que se indican
Aspectos muy positivos
¿De qué sirve que valoren sus propios comentarios?
Obtenemos una rica visión de:
• los aspectos que más atraen y, por tanto, que se pueden convertir en
interesantes verbatims para los creativos.
• los aspectos que menos están gustando y como podemos resolverlos
Me tranquiliza la idea de estar haciendo algo más por mi salud
lo que mas me gusta es poder consumir las propiedades de una comida sana, bebiendo
Parece como si quisieran hacernos creer que realmente puedes sustituir una dieta equilibrada
Aspectos muy negativos
existen demasiados productos actualmente que pretenden venderse con la idea de ser más saludables y hasta ahora todos me han defraudado
Comentarios negativosComentarios positivos
¿De qué sirve que valoren sus propios comentarios?
También nos permite conocer en qué grandes ejes se concentran los comentarios
positivos y negativos
40
25
15
10
21
20
10
10
Contenido en frutas y fibras
Salud
Buen sabor
Botella
Muy positivos Bastante positivos
20
18
14
11
11
10
9
5
No se creen la salud
Mal sabor
No es diferente
Botella
Muy positivos Bastante positivos
¿Qué nos aporta la codificación de la implicación?
En el caso de las preguntas abiertas de los test de concepto y/o producto, el
análisis del grado de implicación a través de las preguntas abiertas puede ser
considerado como un indicador del nivel de relevancia y/o interés que despierta
el concepto/producto testado.
Como el grado de implicación varía en función de la categoría de
producto, forma de realizar la entrevista, target de los estudios, etc… los datos
obtenidos en cada caso deben ser contrastados con los de las BB.DD.
Hay que tener en cuenta que la implicación con la idea mostrada puede ser
positiva o negativa. Por lo que, resulta interesante conocer que porcentaje de cada una tiene el concepto/producto mostrado.
Además, puede resultar también sumamente útil saber qué elementos han sido
los que han generado mayor grado de implicación con la idea, porque pueden ser utilizados como ejes de comunicación.
¿Qué nos aporta la codificación de la implicación?
25%19 %Grado de implicación
BB.DD. Concepto testado
Grado de implicación del concepto testado:
22%14%
BB.DD. Concepto testado
Tipo de implicación del concepto testado:
5% 3%
Comentarios negativos Comentarios positivos
Áreas que despiertan más implicación:
10
5
4
3
Contenido en frutas y fibras
Salud
Buen sabor
Botella
Vemos que se trata de un concepto
con potencial ya que su grado de
implicación es superior a la media y con
una clara connotación positiva.
El aporte de frutas y fibras y su efecto
sobre la salud son los aspectos que
mayor grado de implicación han
conseguido.
En definitiva…
En resumen:
• Las herramientas de tag cloud, nos permiten mostrar la información de una
forma mucho más visual y util en las presentaciones.
• La minería de datos, nos permite profundizar en el análisis de la información
y descubrir qué diferencias existen en el discurso de los distintos grupos
analizados.
• La valoración de la respuesta dada nos permite conocer qué aspectos son
los que mayor y menor interés despiertan y son una fuente de verbatims para las agencias de comunicación.
• Analizar el grado de implicación nos permite saber si, más allá de la
respuesta a una pregunta cerrada, el concepto/producto testado despierta
interés. Además, nos ayuda a conocer qué elementos son los que están
generando esa implicación.
Todas estas herramientas que hemos mostrado nos permiten “ir más allá” en el
análisis y presentación de la información obtenida en las preguntas abiertas.