anÁlisis de datos cualitativos
TRANSCRIPT
ANÁLISIS DE DATOS CUALITATIVOS
Ha sido y es una fase necesaria en la investigación de los problemas de
comunicación, marketing u opinión pública que requieren de un estudio preliminar de
tipo exploratorio-cualitativo. Antes de describir es necesario explorar.
La fase cualitativa de la investigación no estructurada cubre los siguientes objetivos
generales:
• Conocer el discurso espontáneo del colectivo a investigar en lo referente al
conocimiento, identificación del producto o marca, así como los ejes imaginarios y
simbólicos sobre los cuales posicionan espontáneamente, desde su propia manera de
pensar y sentir, las opiniones sobre un producto o servicio concreto.
• Conocer el discurso espontáneo del colectivo a investigar en lo relativo a las
expectativas, demandas, opiniones en general, así como el grado de satisfacción y
nivel de información sobre el objeto o producto.
Estos discursos -individuales o grupales- son datos cualitativos expresados en forma
de cadenas verbales ('string' = cadena) o sintagmas lingüísticos.
Estos materiales ('verbatim') no solo pueden ser analizados, interpretados y
modelizados desde marcos teóricos cualitativos (psicológicos, psicoanalíticos,
psicosociales, antropológico culturales, lingüísticos, semiológicos o retóricos, etc.),
sino que se pueden complementar con el uso de análisis estadístico en la
investigación cualitativa.
ANÁLISIS ESTADÍSTICO DE DATOS CUALITATIVOS
Los datos registrados -impresos, manuscritos o desgrabados- en forma de notas
tomadas durante una observación, respuestas libres a preguntas abiertas,
transcripciones de entrevistas individuales o discusiones de grupo, libros, artículos
periodísticos, etc. pueden ser procesados mediante el tratamiento cuantitativo de lo
cualitativo.
Este enfoque no es nuevo en la investigación de mercado. El procedimiento
interpretativo estándar que se da, tanto de las preguntas abiertas como del análisis de
contenido, comprende: reducción de los datos, selección de palabras claves,
agrupamientos de frases en dimensiones, edición de categorías exhaustivas,
codificación de categorías. Pero el análisis se transforma en una cuantificación de
códigos numéricos, el recuento de códigos y la obtención de distribuciones de
frecuencias; independientemente de la estructura y significación del contenido de las
categorías.
El procedimiento tradicional de la cuantificación de datos cualitativos es la
categorización, la codificación y la tabulación. De este modo el dato textual se reduce
a un tratamiento y análisis de datos numéricos. Interesa más la frecuencia de los
códigos que el propio contenido de las categorías.
El enfoque lexicométrico y la estadística textual
Los enfoques lexicométricos o de la estadística textual están apoyados en las técnicas
estadísticas desarrolladas por la Escuela Francesa de Análisis de Datos (Analyse des
Données), (Benzécri, J. P. 1973, 1976).
El Análisis Estadístico de Datos Textuales (ADT) se refiere a procedimientos que
implican contar las ocurrencias de las unidades verbales básicas (generalmente
palabras) y operar algún tipo de análisis estadístico a partir de los resultados de tales
recuentos. Se recurre a la cuantificación de los textos desde el primer momento, sin
que medien operaciones de codificación previas.
El desarrollo de las técnicas de la estadística textual ha hecho que el análisis
estadístico de textos se haya constituido en una herramienta interdisciplinar, integrada
por: la estadística, el análisis del discurso, la lingüística, la informática, el
procesamiento de encuestas, la investigación documental; y es cada vez más utilizada
en diversos campos de las ciencias sociales: historia, política, economía, sociología,
psicología, etc. Y específicamente en el análisis de los discursos sociales en la
investigación del consumidor, del ciudadano, y en general, del sujeto mediático.
Las técnicas de análisis de datos desarrolladas a partir de las aportaciones de Jean
Paúl Benzécri han permitido el análisis de grandes matrices de datos, aplicación del
Análisis Factorial a tablas de contingencia de n (filas) x p (columnas) a partir grandes
matrices de datos extendidas y la visualización de los resultados en un mapa
perceptual.
METODOLOGÍA DEL ANÁLISIS DE DATOS TEXUALES
ANÁLISIS ESTADÍSTICO DE DATOS TEXUTALES (ADT)
Elaboración de documentos lexicométricos
• Definición de los procedimientos asociados al data collection y data cleaning
para el registro apropiado de los datos textuales. En primer lugar, se procede a la
edición del corpus (componentes del corpus: narraciones, artículos periodísticos,
informes, desgrabaciones de entrevistas y grupos, respuestas libres a preguntas
abiertas, y variables sociodemográficas, socioeconómicas, actitudinales, que tipifican
o segmentan las entrevistas o grupos, variables que actúan como predictores -
variable independiente- , del criterio -variable dependiente-).
• Estudio de las unidades estadísticas (formas, lemas, segmentos) que los
algoritmos del análisis textual reconocen en los datos recolectados e identificación de
las frases estadísticamente significativas. La elaboración de documentos
lexicométricos implica un segundo paso de segmentación del texto en unidades. La
segmentación del corpus textual implica diferenciar las unidades elementales: la forma
gráfica (una secuencia de letras comprendidas entre dos espacios), el lema (todos los
vocablos que cuentan con una misma raíz y con significado equivalente, es decir, una
familia de palabras), los segmentos repetidos (una secuencia de dos o más palabras
que aparecen más de una vez en un corpus de datos textuales), los cuasisegmentos
(palabras que aparecen en una determinada secuencia pero que presentan alguna
diferencia en el género o número).
• Estudio de la riqueza de vocabulario: frecuencia de segmentos repetidos. Una vez
segmentados los textos, el tercer paso, consiste en la construcción del vocabulario del
texto. Este se presenta en una tabla de orden lexicométrico donde se muestra el
número identificatorio de cada palabra, la palabra del glosario del corpus, la
frecuencia de aparición y la longitud de la unidad medida en número de caracteres.
• Análisis multivariado de datos textuales. El cuarto paso es la aplicación del
Análisis Factorial de Correspondencias (AFC), sobre las tablas lexicográficas o la
Clasificación Automática (Clasificación jerárquica ascendente) de las formas lexicales
y textos.
• Identificación de respuestas y/o frases modales combinando los resultados del
análisis textual con variables sociodemográficas y actitudinales, se obtiene una
Tipología de individuos o grupos a partir de respuestas y de textos.
• Visualización de los resultados del Análisis multivariado. Representación de
posicionamiento del corpus lexicográfico mediante Mapas preceptúales.
• Análisis discriminante textual. Predicción de las variables objeto del estudio
(opiniones, actitudes, predisposiciones, perfil de imagen, etc.) a partir del texto.
La estadística textual en el Paquete SPAD.T
El paquete de programas SPAD.T (Système Portable pour L'Analyse des Donees
Textuelle) está diseñado específicamente para llevar a cabo análisis estadístico de
datos textuales. De entre el software existente en el mercado, creemos que este
paquete informático es el producto más completo y cuenta con más difusión entre los
aplicadores del análisis estadístico textual (ADT).
Los pasos operativos del procesamiento de datos de textos son los siguientes:
• El procesamiento de datos textuales se realiza mediante el ingreso de los datos
textuales en soporte magnéticos (diskettes o CD-ROMs) con formato .doc o .txt
(mediante procesadores de textos tipo MS Word).
• Los archivos tienen una edición previa (revisión y corrección) según instrucciones
precisas del Director de Proyectos de ADT.
• Las desgrabaciones de los 'verbatin' de las discusiones grupales o de los registros
de las entrevistas individuales son transcripciones textuales de los párrafos más
significativos de las intervenciones de los participantes de los 'focus groups' o de los
entrevistados individuales.
• Las Guías de Pautas para los grupos o las entrevistas está confeccionada de modo
tal que puedan ser numéricamente identificadas cada pauta de indagación de manera
que en la desgrabación de los principales emergentes grupales o individuales quede
perfectamente identificada cada pauta.
• El Director de Proyecto coordina con el área de Procesamiento de datos cualitativos,
a) los ítems de las Guías de Pautas y b) los principales criterios de organización de
los discursos a los efectos de conceptuar mejor la identificación de los factores que
arroje el Análisis Factorial de Correspondencia y facilitar su visualización en los
Mapas de Posicionamiento.
• A partir de los outputs del SPAD-T (simplemente SPAD), tanto de tablas como de
gráficos de mapas de posicionamiento, se realiza el análisis de los datos en función
de los objetivos de la investigación a los efectos de la producción de toda la
información hallada, en el informe final