anÁlisis de datos cualitativos

ANÁLISIS DE DATOS CUALITATIVOS

Ha sido y es una fase necesaria en la investigación de los problemas de

comunicación, marketing u opinión pública que requieren de un estudio preliminar de

tipo exploratorio-cualitativo. Antes de describir es necesario explorar.

La fase cualitativa de la investigación no estructurada cubre los siguientes objetivos

generales:

• Conocer el discurso espontáneo del colectivo a investigar en lo referente al

conocimiento, identificación del producto o marca, así como los ejes imaginarios y

simbólicos sobre los cuales posicionan espontáneamente, desde su propia manera de

pensar y sentir, las opiniones sobre un producto o servicio concreto.

• Conocer el discurso espontáneo del colectivo a investigar en lo relativo a las

expectativas, demandas, opiniones en general, así como el grado de satisfacción y

nivel de información sobre el objeto o producto.

Estos discursos -individuales o grupales- son datos cualitativos expresados en forma

de cadenas verbales ('string' = cadena) o sintagmas lingüísticos.

Estos materiales ('verbatim') no solo pueden ser analizados, interpretados y

modelizados desde marcos teóricos cualitativos (psicológicos, psicoanalíticos,

psicosociales, antropológico culturales, lingüísticos, semiológicos o retóricos, etc.),

sino que se pueden complementar con el uso de análisis estadístico en la

investigación cualitativa.

ANÁLISIS ESTADÍSTICO DE DATOS CUALITATIVOS

Los datos registrados -impresos, manuscritos o desgrabados- en forma de notas

tomadas durante una observación, respuestas libres a preguntas abiertas,

transcripciones de entrevistas individuales o discusiones de grupo, libros, artículos

periodísticos, etc. pueden ser procesados mediante el tratamiento cuantitativo de lo

cualitativo.

Este enfoque no es nuevo en la investigación de mercado. El procedimiento

interpretativo estándar que se da, tanto de las preguntas abiertas como del análisis de

contenido, comprende: reducción de los datos, selección de palabras claves,

agrupamientos de frases en dimensiones, edición de categorías exhaustivas,

codificación de categorías. Pero el análisis se transforma en una cuantificación de

códigos numéricos, el recuento de códigos y la obtención de distribuciones de

frecuencias; independientemente de la estructura y significación del contenido de las

categorías.

El procedimiento tradicional de la cuantificación de datos cualitativos es la

categorización, la codificación y la tabulación. De este modo el dato textual se reduce

a un tratamiento y análisis de datos numéricos. Interesa más la frecuencia de los

códigos que el propio contenido de las categorías.

El enfoque lexicométrico y la estadística textual

Los enfoques lexicométricos o de la estadística textual están apoyados en las técnicas

estadísticas desarrolladas por la Escuela Francesa de Análisis de Datos (Analyse des

Données), (Benzécri, J. P. 1973, 1976).

El Análisis Estadístico de Datos Textuales (ADT) se refiere a procedimientos que

implican contar las ocurrencias de las unidades verbales básicas (generalmente

palabras) y operar algún tipo de análisis estadístico a partir de los resultados de tales

recuentos. Se recurre a la cuantificación de los textos desde el primer momento, sin

que medien operaciones de codificación previas.

El desarrollo de las técnicas de la estadística textual ha hecho que el análisis

estadístico de textos se haya constituido en una herramienta interdisciplinar, integrada

por: la estadística, el análisis del discurso, la lingüística, la informática, el

procesamiento de encuestas, la investigación documental; y es cada vez más utilizada

en diversos campos de las ciencias sociales: historia, política, economía, sociología,

psicología, etc. Y específicamente en el análisis de los discursos sociales en la

investigación del consumidor, del ciudadano, y en general, del sujeto mediático.

Las técnicas de análisis de datos desarrolladas a partir de las aportaciones de Jean

Paúl Benzécri han permitido el análisis de grandes matrices de datos, aplicación del

Análisis Factorial a tablas de contingencia de n (filas) x p (columnas) a partir grandes

matrices de datos extendidas y la visualización de los resultados en un mapa

perceptual.

METODOLOGÍA DEL ANÁLISIS DE DATOS TEXUALES

ANÁLISIS ESTADÍSTICO DE DATOS TEXUTALES (ADT)

Elaboración de documentos lexicométricos

• Definición de los procedimientos asociados al data collection y data cleaning

para el registro apropiado de los datos textuales. En primer lugar, se procede a la

edición del corpus (componentes del corpus: narraciones, artículos periodísticos,

informes, desgrabaciones de entrevistas y grupos, respuestas libres a preguntas

abiertas, y variables sociodemográficas, socioeconómicas, actitudinales, que tipifican

o segmentan las entrevistas o grupos, variables que actúan como predictores -

variable independiente- , del criterio -variable dependiente-).

• Estudio de las unidades estadísticas (formas, lemas, segmentos) que los

algoritmos del análisis textual reconocen en los datos recolectados e identificación de

las frases estadísticamente significativas. La elaboración de documentos

lexicométricos implica un segundo paso de segmentación del texto en unidades. La

segmentación del corpus textual implica diferenciar las unidades elementales: la forma

gráfica (una secuencia de letras comprendidas entre dos espacios), el lema (todos los

vocablos que cuentan con una misma raíz y con significado equivalente, es decir, una

familia de palabras), los segmentos repetidos (una secuencia de dos o más palabras

que aparecen más de una vez en un corpus de datos textuales), los cuasisegmentos

(palabras que aparecen en una determinada secuencia pero que presentan alguna

diferencia en el género o número).

• Estudio de la riqueza de vocabulario: frecuencia de segmentos repetidos. Una vez

segmentados los textos, el tercer paso, consiste en la construcción del vocabulario del

texto. Este se presenta en una tabla de orden lexicométrico donde se muestra el

número identificatorio de cada palabra, la palabra del glosario del corpus, la

frecuencia de aparición y la longitud de la unidad medida en número de caracteres.

• Análisis multivariado de datos textuales. El cuarto paso es la aplicación del

Análisis Factorial de Correspondencias (AFC), sobre las tablas lexicográficas o la

Clasificación Automática (Clasificación jerárquica ascendente) de las formas lexicales

y textos.

• Identificación de respuestas y/o frases modales combinando los resultados del

análisis textual con variables sociodemográficas y actitudinales, se obtiene una

Tipología de individuos o grupos a partir de respuestas y de textos.

• Visualización de los resultados del Análisis multivariado. Representación de

posicionamiento del corpus lexicográfico mediante Mapas preceptúales.

• Análisis discriminante textual. Predicción de las variables objeto del estudio

(opiniones, actitudes, predisposiciones, perfil de imagen, etc.) a partir del texto.

La estadística textual en el Paquete SPAD.T

El paquete de programas SPAD.T (Système Portable pour L'Analyse des Donees

Textuelle) está diseñado específicamente para llevar a cabo análisis estadístico de

datos textuales. De entre el software existente en el mercado, creemos que este

paquete informático es el producto más completo y cuenta con más difusión entre los

aplicadores del análisis estadístico textual (ADT).

Los pasos operativos del procesamiento de datos de textos son los siguientes:

• El procesamiento de datos textuales se realiza mediante el ingreso de los datos

textuales en soporte magnéticos (diskettes o CD-ROMs) con formato .doc o .txt

(mediante procesadores de textos tipo MS Word).

• Los archivos tienen una edición previa (revisión y corrección) según instrucciones

precisas del Director de Proyectos de ADT.

• Las desgrabaciones de los 'verbatin' de las discusiones grupales o de los registros

de las entrevistas individuales son transcripciones textuales de los párrafos más

significativos de las intervenciones de los participantes de los 'focus groups' o de los

entrevistados individuales.

• Las Guías de Pautas para los grupos o las entrevistas está confeccionada de modo

tal que puedan ser numéricamente identificadas cada pauta de indagación de manera

que en la desgrabación de los principales emergentes grupales o individuales quede

perfectamente identificada cada pauta.

• El Director de Proyecto coordina con el área de Procesamiento de datos cualitativos,

a) los ítems de las Guías de Pautas y b) los principales criterios de organización de

los discursos a los efectos de conceptuar mejor la identificación de los factores que

arroje el Análisis Factorial de Correspondencia y facilitar su visualización en los

Mapas de Posicionamiento.

• A partir de los outputs del SPAD-T (simplemente SPAD), tanto de tablas como de

gráficos de mapas de posicionamiento, se realiza el análisis de los datos en función

de los objetivos de la investigación a los efectos de la producción de toda la

información hallada, en el informe final

anÁlisis de datos cualitativos

Documents