incubadora de sondeos y experimentos clm ciclos...
TRANSCRIPT
Incubadora de Sondeos y Experimentos – CLM
2016 Categoría: Bachillerato – Ciclos Formativos
1
Palabras que gustan
Índice 1. Resumen 2
2. Introducción 2
3. Recogida de Datos
3.1. Diseño 3
3.2. Muestreo 4
3.3. Toma de datos 5
3.4. Muestra tomada 6
4. Tratamiento de datos 8
5. Resultados obtenidos 10
5.1. Las palabras en sí 11
5.2. Clasificaciones 13
5.3. Campos semánticos 16
6. Análisis de datos
6.1. Por campo semántico 17
6.2. Por motivación 21
7. Conclusiones 22
8. Posibles líneas de continuación 24
9. Referencias, recursos empleados 25
2
1. Resumen – Abstract
El presente documento recoge nuestra experiencia utilizando los
conocimientos adquiridos en la asignatura Matemáticas aplicadas a las
Ciencias Sociales para diseñar una encuesta relativa a la preferencia por
determinadas palabras del castellano. En el mismo, mostraremos cómo lo
hemos diseñado, llevado a la práctica, analizado los resultados y, por
último, interpretado los resultados.
This document shows our experience using the knowledge acquired
in the subject Mathematics for Social Sciences to design a survey on the
preference for some words of our language (Spanish). We will see how
we have designed, implemented, analyzed the results and, finally,
interpreted the results.
2. Introducción
La idea de este trabajo comenzó a principios de octubre en la clase
de Matemáticas aplicadas a las Ciencias Sociales II, en la que nuestro
profesor, nos ofreció la oportunidad y su ayuda para iniciar un proyecto.
Valoramos varias ideas hasta que decidimos comenzar a desarrollar este
proyecto.
El por qué elegimos éste (palabras que gustan) y no otro, fue
porque lo vimos una idea muy interesante, algo alejada de lo que uno
suele pensar que tratará un estudio estadístico y con el que podríamos
aprender mucho y descubrir palabras nuevas, y a partir de estas palabras
podríamos descubrir otros aspectos de la sociedad que nos permitirían
3
seguir desarrollando otro tipos de trabajos, descubrir posibles líneas de
continuación…
3. Recogida de Datos
3.1. Diseño
Al diseñar la encuesta, nos planteamos no hacerla demasiado
extensa y lo más sencilla
posible tanto para facilitar
la recogida de datos como
para no asustar a las
personas a las que
pidiéramos su
colaboración. De esta
manera, nos planteamos
en realidad tan sólo tres
preguntas, aunque
inocentes y simple en
apariencia, nuestra idea
era poder exprimirlas para
sacar la mayor
información posible.
Las preguntas realizadas en la encuesta de las palabras favoritas y
no favoritas de las personas han ido encaminadas, sobre todo, a buscar el
posible motivo de elección que impulsaba al encuestado a decidirse por
una determinada palabra.
4
También se han
realizado preguntas más
personales para intentar
identificar a quién respondía
dentro de determinados
grupos (sexo, edad, aficiones,
nivel cultura,…) para ver si
después podríamos intentar
detectar alguna pauta de
comportamiento o algunas
diferencias entre grupos en las
preferencias por unas palabras
u otras.
3.2. Muestreo
Para decidir a cuántas personas preguntar, acudimos a la web
del INE y obtuvimos la última cifra oficial de población empadronada:
Lo que nos marcaba un total de 50.035 personas. Dado que el
grupo tan sólo lo componíamos tres alumnos no podíamos acceder a
tantos tramos de edad ni a una muestra demasiado extensa. Intentamos
5
encontrar un equilibrio y optamos por hacer un muestreo estratificado
por sexo y edad, con cuatro estratos de edad (de 0 a 19, de 20 a 39, de
40 a 59 y por último la casilla de más de 60), y con un tamaño muestral de
250 personas (0,5% de la población). De manera que con 8 estratos
tuviéramos una cantidad mínima de personas en cada estrato que nos
permitiera hacer un estudio con cierta fiabilidad. La composición del
muestreo fue:
0 a 19 20 a 39 40 a 59 60 Total
Hombres 25 34 35 28 122 Mujeres 23 33 37 35 128 TOTAL 48 67 72 63 250
Por otra parte, con el objetivo de enriquecer el trabajo, decidimos
preguntarle tres palabras que les pudieran gustar al encuestado, en lugar
de tan sólo una, para aumentar el volumen de datos recogidos sin
aumentar la muestra.
3.3. Toma de datos La recogida de datos se hizo durante la segunda semana de marzo.
En la parte humana, nos planteamos ser lo más transparentes posibles con
los encuestados para así tener la mejor disposición posible. Para ello, el
cuestionario identificaba en el encabezado el objeto del estudio, el centro
al que pertenecíamos, el profesor responsable y una dirección de correo
electrónico en el que poder pedir más información. También llevábamos
el carné de alumnos del centro visible durante la toma de datos en la calle.
La toma de datos la hicimos en dos fases, una primera para poner a
prueba el cuestionario, si se entendía bien y servía para lo que nos
habíamos propuesto y una segunda más extensa en el que ya
completábamos la muestra. En la primera fase, utilizamos el entorno
cercano para buscar el tramo más joven de edad, así preguntamos a niños
6
de primaria y de secundaria para que no fueran respuestas únicamente de
adolescentes. Curiosamente nos parecieron más serias y estudiadas
algunas respuestas de niños de primaria que de secundaria. En la segunda
fase, seguimos rutas aleatorias por diferentes barrios de la localidad para
intentar no quedarnos en el centro y evitar, en lo posible, obtener datos
de un solo entorno socioeconómico.
3.4. Composición de la muestra
Como mencionábamos anteriormente, estructuramos la muestra
por sexo y edad, y aunque tuvimos la intención de ampliar la recogida de
datos con un cuestionario por internet, al ver lo descompensada que
estaba esa muestra no incorporamos dichos datos. Sin embargo, a las 250
personas entrevistadas les hemos hecho preguntas de contextos. A
continuación vemos los resultados
A continuación, vemos la situación laboral por sexos:
0 10 20 30 40 50 60 70 80
Sin estudios o Estudios Obligatorios Incompletos
Educación Obligatoria Completa
Bachillerato o FP
Estudios Universitarios o de Postgrado
NS/NC
Composición de la muestra por formación
H M
7
Por último, la cantidad de libros1 que estiman tienen en casa:
Estos gráficos indican que tenemos una muestra diversa, ya que tenemos bastante bien representados todos los grupos, y equilibrados por sexo, lo que nos proporciona unas ciertas garantías de que las respuestas podrán ser fiables.
1 propios
0 10 20 30 40 50 60 70 80
Medianos y grandes empresarios (+10…
NS/NC
Obrero, agricultor, cooperativista
Grandes empresarios
Pequeños empresarios (10 o menos trabajadores),…
Jubilados y Pensionistas
Funcionarios, trabajadores de educación, sanidad,...
Situaciones no clasificables (parados, estudiantes,…
H
M
23% 15%
21%
36%
5% 12%
21% 27%
38%
3% 0%
5%
10%
15%
20%
25%
30%
35%
40%
Apenas Tengo Un Estante Una Estantería Varias Estanterías NS/NC
Composición de la muestra Libros disponibles por sexo
H M
8
4. Tratamiento de Datos
El tratamiento de datos ha sido fundamentalmente en una hoja de
Microsoft Excel, en la que hemos puesto todos los datos de cada encuesta
organizados por columnas.
Puesto que nuestras preguntas recogían tan sólo información
cualitativa, nos animamos a además de utilizar las palabras recogidas en las
encuestas, a hacer un pequeño estudio sobre las mismas. Así, medimos su
longitud, su composición de vocales y consonantes, la letra de comienzo,
su clasificación morfológica e intentamos agruparlas en campos
semánticos. Esta parte nos ha parecido la más complicada pues hay
palabras que podían estar en más de un campo semántico y campos que
podrían unirse. Para intentar disminuir nuestra subjetividad, hemos
contado con la colaboración de dos profesoras de idiomas de nuestro
centro que, como filólogas, una vez establecida la clasificación inicial nos
ayudaron a depurarla.
9
Durante la recogida de datos se nos ocurrió que podíamos
contrastar los datos recogidos realizando la misma encuesta a través de
internet. Para ello, utilizamos Google Forms y la difundimos por redes
sociales. En tan sólo dos días conseguimos 152 respuestas, y aunque los
resultados tienen similitudes con los datos recogidos en persona,
decidimos no mezclarlos (para no correr riesgos de representatividad) ya
que la muestra online no estaba compensada como puede verse en los
siguientes gráficos:
10
También nos gustaría señalar que nos ha sorprendido muy
agradablemente la seriedad con la que los encuestados se han tomado el
estudio, le dedicaban tiempo, pensaban, muchos no querían que nadie
leyera sus respuestas,… Tan sólo hemos tenido que eliminar 10 palabras
(1,33%) porque el contenido hacía ver falta de seriedad en la respuesta.
5. Resultados obtenidos
Encuestamos a 250 personas, cada persona nos aportaba un máximo
de 3 palabras (750 palabras). Nadie eligió solo una. De las 750 palabras tan
sólo hemos tenido que prescindir de 10 (1,33%). Hemos obtenido 373
palabras, lo que nos da una variabilidad de 1,49 palabras por persona. A
este respecto, haciendo este pequeño análisis para cada grupo de sexo y
edad encuestado observamos:
HOMBRES 0 a 19 20 a 39 40 A 59 > 60
Palabras 59 77 84 63 Personas 25 34 35 28
Índice 2,36 2,26 2,40 2,25
MUJERES 0 a 19 20 a 39 40 A 59 > 60
Palabras 50 74 79 73 Personas 23 33 37 35 Índice 2,17 2,24 2,14 2,09
En el global de hombres (122) aparecieron 231 palabras diferentes
(1,89) mientras que en las mujeres (128) aparecieron 209 palabras
distintas (1,63). Parece claro que al aumentar el tamaño de la muestra en
el estrato que corresponda disminuye la variabilidad pues al aumentar las
respuestas aparecen más coincidencias. Sin embargo, y aunque no hay
grandes diferencias una constante en todos los grupos de edad y en los
11
globales es que los hombres han dado más respuestas distintas que las
mujeres, quizá por una mayor diversidad de intereses mientras que en las
mujeres es posible que tengan sus intereses más concentrados en algunos
aspectos.
5.1. Las palabras en si
Hemos hecho un pequeño estudio del tipo de palabras que nos han
aparecido en la encuesta con los siguientes resultados:
LETRAS VOCALES CONSONANTES VOC/LET VOC/CON
Media 6,37 Media 2,87 Media 3,50 Media 0,45 Media 0,87 Mediana 6 Mediana 3 Mediana 3
Moda 6 Moda 2 Moda 3 Rango 10 Rango 5 Rango 7 Mínimo 3 Mínimo 1 Mínimo 1 Máximo 13 Máximo 6 Máximo 8
En la tabla podemos observar que hemos obtenido palabras entre 3
y 13 letras de longitud, aunque la mayoría se encuentran en el entorno de
las 6 letras de longitud. No parece que haya una uniformidad clara en
cuanto a la presencia de vocales. Las 373 palabras que han aparecido en el
estudio (de 750 posibles) tenían entre 1 y 6 letras, aunque lo más
frecuente era moverse entre 2 y 3. Las consonantes, sin embargo, se han
movido en un rango de entre 1 y 8 con una mayoría de palabras con 3
consonantes, aunque había palabras largas con una mayor cantidad que
hacían subir la media. El porcentaje de vocales frente al total de letras que
componían la palabra era entorno al 45%, y la relación vocales frente a
consonantes por palabra se ha situado en el 87%. Creemos que sería de
interés un estudio más general sobre palabras de todo tipo para saber si
12
esta estructura es habitual en el castellano o si por el contrario este
“retrato” puede caracterizar palabras que gustan (en algún sentido) al
hablante, bien porque suenen mejor que otras, bien porque por su
sonoridad se hayan creado para nombrar cosas agradables y queridas.
Otra característica que hemos estudiado es la frecuencia de la letra
de comienzo de estas 373 palabras surgidas en el cuestionario. En el
siguiente gráfico, vemos el porcentaje de aparición de cada letra en el
estudio frente a la frecuencia con que aparece cada letra en castellano2:
Aunque en el gráfico hay diferencias importantes, la verdad es que
no se compara exactamente lo mismo pues una letra puede aparecer muy
frecuentemente en castellano aunque no tenga por qué ser en la misma
proporción en la primera letra de la palabra. Hemos intentado encontrar
información en internet al respecto, pero tan sólo hemos encontrado una
referencia3 en la que vagamente sin citar fuentes alude a que las letras de
comienzo más frecuentes en castellano son (en orden decreciente): C, A, 2 https://es.wikipedia.org/wiki/Frecuencia_de_aparici%C3%B3n_de_letras 3 Juan Carlos Galende Díaz – 1995, “CRIPTOGRAFÍA. HISTORIA DE LA ESCRITURA CIFRADA” https://goo.gl/gdjT0X
0,00%
2,00%
4,00%
6,00%
8,00%
10,00%
12,00%
14,00%
16,00%
A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z
% aparición letra de comienzo Palabras del Estudio vs frecuencia cada letra en Castellano
FAVORITAS CASTELLANO
13
P, M, S lo que concuerda con los datos del gráfico. Sin embargo, puesto
que también habíamos preguntado por palabras que “no gustaran” al
encuestado, comparamos la frecuencia de las letras de comienzo de
ambas categorías para comprobar si podía haber diferencias significativas.
Como puede observarse, aunque existen diferencias no parecen de
la importancia suficiente como para atribuirlas a otra cosa que las
pequeñas variaciones debidas al azar.
Por último,
mayoritariamente el tipo de
palabras elegidas han sido
SUSTANTIVOS.
90%
6% 4%
Palabras por elementos gramaticales
SUSTANTIVO
ADJETIVO
INFINITIVO
14
5.2. Clasificaciones
Posteriormente, procedimos a hacer un recuento de la frecuencia
de aparición y hemos realizado unos rankings por sexos y edad. Los
porcentajes están calculados en función de los componentes de cada
grupo.
0 a 19 FREC % 20 a 39 FREC % 40 A 59 FREC % Más de 60 FREC % TOTAL FREC % FUTBOL 24% AMISTAD 12% AMOR 14% CAMPOS 18% AMOR 11% AMOR 12% COCHES 12% FAMILIA 11% TELEVISION 14% FAMILIA 10%
FAMILIA 12% FAMILIA 12% HIJOS 9% COCHES 11% COCHES 7% PAZ 9% NATURALEZA 11% NIETOS 11%
0 a 19 FREC % 20 a 39 FREC % 40 A 59 FREC % Más de 60 FREC % TOTAL FREC % AMOR 35% FAMILIA 15% AMOR 27% AMOR 14% AMOR 20%
MUSICA 22% AMIGOS 12% FAMILIA 19% FAMILIA 14% FAMILIA 14% ALEGRIA 9% ROPA 12% ALEGRIA 8% FLOR 14% FLOR 7% FIESTA 9% AMIGOS 8% NIETOS 14%
FUTBOL 9% LUZ 8% SUEÑO 9% SALUD 8% VIDA 9%
En estos resultados, puede apreciarse que aunque hay coincidencias
entre sexos y grupos de edad, también parece haber diversidad de
15
intereses. Sin embargo, si dejamos de lado el sexo y vemos las palabras
más frecuentes por tramos de edad, tenemos:
0 a 19
20 a 39
40 a 59
60 ó mayores
16
Como podemos apreciar aunque los datos parecen apuntar alguna
diversidad de intereses en función de la edad, los lazos familiares, los
sentimientos y las aficiones parecen centrar los intereses de los
encuestados, o al menos, al tener que pensar en una palabra de forma
improvisada, acuden a esos focos.
Ante estos datos, tuvimos la idea de crear campos semánticos para
intentar confirmar si había esa diversidad de intereses.
5.3. Campos Semánticos
Los campos semánticos creados han sido variados. Inicialmente,
intentamos trabajar solo con cinco campos semánticos, pero quedaban
demasiadas palabras sin clasificar claramente por lo que decidimos trabajar
con más campos semánticos. Al final nos hemos quedado con 15:
CALIFICATIVOS DEPORTE ENTORNO AFECTIVO, CERCANO ESTUDIOS-PROFESIONES GASTRONOMIA MODA, COMPLEM. Y COMPRAS MOMENTOS Y LUGARES MÚSICA
NATURALEZA OBJETOS DEL HOGAR OCIO OTRO VOCABULARIO SALUD SENTIMIENTOS, MUESTRAS DE AFECTO VALORES, ACTITUDES
Algunos están próximos pero nos ha parecido interesante no
unirlos. Por ejemplo, en entorno afectivo, cercano hemos incluido
palabras como HIJOS, PADRE, MADRE, AMIGO,… En valores y
actitudes: PAZ, VERDAD, HONESTIDAD, SINCERIDAD,… En
Sentimientos y muestras de afecto: AMOR, CARIÑO, TERNURA,…
No ha sido una tarea fácil y hemos buscado el consejo de filólogos
para dirimir pequeñas discusiones entre nosotros a la hora de clasificar
palabras concretas o sobre si crear o no un campo. Nos ha parecido difícil
17
porque una palabra puede adscribirse en algunos casos a más de uno de
estos campos.
6. Análisis de datos
Veremos qué campos de interés atraían a los encuestados, así como
qué movía a las personas a elegir las palabras.
6.1. Campos Semánticos
En el siguiente gráfico podemos ver un diagrama en el que aparecen
los campos semánticos utilizados para agrupar las palabras en categorías
ordenados por frecuencia:
Si analizamos estos resultados por edades, observamos:
18
CAMPO SEMÁNTICO PALABRAS QUE GUSTAN 0 a 19 20 a 39 40 a 59 ≥ 60 TOTAL
SENTIMIENTOS, MUESTRAS DE AFECTO 19% 15% 17% 12% 16% NATURALEZA 10% 9% 11% 21% 13% ENTORNO AFECTIVO, CERCANO 6% 14% 14% 13% 12% GASTRONOMIA 8% 9% 7% 8% 8% VALORES, ACTITUDES 5% 6% 12% 7% 8% OCIO 6% 7% 6% 7% 7% ESTUDIOS-PROFESIONES 4% 8% 5% 5% 5% DEPORTE 18% 4% 0% 2% 5% MODA, COMPLEMENTOS Y COMPRAS 3% 7% 6% 4% 5% MOMENTOS Y LUGARES 3% 5% 5% 6% 5% SALUD 3% 1% 4% 6% 4% OBJETOS DEL HOGAR 0% 3% 3% 5% 3% OTRO VOCABULARIO 3% 4% 2% 2% 3% MÚSICA 6% 1% 3% 1% 3% CALIFICATIVOS 3% 1% 3% 1% 2% Eliminadas del Estudio 3% 2% 0% 1% 1%
La categoría mayoritaria en todos los tramos de edad es la
correspondiente a SENTIMIENTOS, MUESTRAS DE AFECTO. Sin
embargo, cabe destacar que en el grupo 0 a 19 el DEPORTE juega el
segundo papel, en el grupo 20 a 39, el ENTORNO AFECTIVO,
CERCANO lo que sería la familia. Puede ser congruente con que es un
tramo de edad de independencia respecto a los padres y pasar a tener la
propia familia. Por otra parte, en el tramo 40 a 59, el ENTORNO
AFECTIVO casi comparte posición con los VALORES, ACTITUDES y la
NATURALEZA, puede tener que ver con que es un tramo de edad en el
que se es un modelo para los hijos. Por último, es curioso que en las
personas de 60 ó más la NATURALEZA (SOL, VIDA, CAMPO,…)
19
desbanca a los SENTIMIENTOS y al ENTORNO CERCANO que quedan
prácticamente empatados a puntos.
A continuación desglosamos aún más los resultados por edad y
sexos:
13
15
4
4
4
10
7
5
3
4
5
1
2
3
2
2
21
5
2
3
4
4
-
-
1
3
3
6
3
1
14
17
12
17
5
13
6
13
9
4
15
1
6
3
2
1
5
3
3
8
11
3
6
1
3
11
3
-
-
2
16
21
15
15
7
17
8
7
13
13
5
5
3
2
4
5
1
-
6
4
11
3
3
4
6
7
4
3
3
4
8
14
8
16
21
18
4
11
6
8
3
6
2
2
5
7
3
1
4
8
9
5
5
5
4
3
1
-
-
1
- 10 20 30 40 50 60 70
H M H M H M H M H M H M H M H M H M H M H M H M H M H M H M
SENT
IMI
ENTO
S,M
UEST
RAS
DE
AFEC
TO
ENTO
RNO
AFEC
TIV
O,
CERC
ANO
NAT
URA
LEZA
GAST
RON
OM
IA
VALO
RES,
ACTI
TUDE
S
ESTU
DIO
S-PR
OFE
SIO
NES
OTR
OVO
CABU
LARI
OSA
LUD
DEPO
RTE
MO
MEN
TOS
YLU
GAR
ES
OCI
O
OBJ
ETO
S DE
LHO
GAR
MO
DA,
COM
PLE
MEN
TOS
YCO
MPR
ASM
ÚSIC
ACA
LIFI
CAT
IVO
S
Composición categorías por sexo y edad 0 a 19 20 a 39 40 a 59 Más de 60
20
En general no hay grandes diferencias. Sin embargo, podemos
destacar respecto a las contribuciones relativas de otros tramos de edad
o del otro sexo alguna que otra:
HOMBRES:
x En el grupo de 0 a 19 hay más referencias al DEPORTE
x En el grupo de 20 a 39 hay más relativas a los ESTUDIOS y
PROFESIONES
x En el grupo de 20 a 39 y 40 a 59 hay más referencias al OCIO en
proporción a las mujeres u otros tramos de edad.
x En el grupo de 60 o más, hay más referencias a la NATURALEZA
MUJERES:
x En el tramo de 20 a 39 y de 60 ó más, hay (en proporción) más
referencias GASTRONÓMICAS que respecto a los hombres
x Les interesa más el ENTORNO AFECTIVO y los SENTIMIENTOS-
MUESTRAS DE AFECTO en todos los tramos de edad, pero en
especial en el grupo 60 ó más.
x Les interesa más la NATURALEZA que a los hombres excepto en el
tramo 60 ó más.
x Les interesa menos lo relativo a ESTUDIOS-PROFESIONES que a
los Hombres en los tramos 0 a 19 y 20 a 39, igual en el tramo 40 a
59 y más en el tramo 60 ó más.
x Les interesa más que a los hombres lo referente a MODA,
COMPLEMENTOS en todos los tramos pero sobre todo de 20 a
39.
21
6.2. Por motivación
Si hacemos un análisis de por qué elegían las palabras los
encuestados, vemos que mayoritariamente por el significado (41%), casi
empatado con las connotaciones personales (37%) que pudiera traer a
dicha persona la palabra en concreto. La sonoridad de la palabra aparece
en tercer lugar (15%)y de forma residual el origen de la misma,
etimología u otros motivos.
En el siguiente gráfico, podemos observar las diferencias de
motivación en la elección por sexo y edad:
15%
37%
41%
3% 4% 0%
Motivo Elección Palabra que gusta
SONORIDAD
CONNOTACIONES
SIGNIFICADO
ORIGEN
OTROS MOTIVOS
NS/NC
0%
10%
20%
30%
40%
50%
H M H M H M H M
0 a 19 20 a 39 40 a 59 Más de 60
Motivo para elegir las palabras que gustan
SONORIDAD CONNOTACIONES SIGNIFICADO ORIGEN OTROS MOTIVOS
22
Curiosamente, en todos los tramos el % de hombres que eligen
palabras por su sonoridad es algo mayor que el de mujeres. Como puede
apreciarse, en el tramo 0 a 19 tanto en hombres como en mujeres
predomina las connotaciones personales a la hora de elegir una palabra.
Sin embargo, en los tramos de 40 a 59 y de 60 o más predomina en
ambos sexos el significado de la palabra en la elección. En estos tres
tramos de edad no hay grandes diferencias en la motivación que impulsa a
hombres y mujeres. Tan sólo en el tramo 20 a 39, se presenta una
diferencia por sexo, los hombres siguen eligiendo la palabra por
connotaciones personales y las mujeres ya lo hacen por significado.
7. Conclusiones
Reconocemos que el estudio es algo peculiar, pues la elección de la
palabra no sólo es muy personal sino que también depende del momento
en que se nos pregunte por ella. Es complicado elegir unas pocas palabras
en concreto.
El estudio nos ha hecho descartar que haya un “retrato”, una
“estructura”, una “combinación” de letras, vocales, longitud, para que una
palabra suene bien y se incorpore al lenguaje para nombrar algo que
guste.
Lo analizado parece indicar que no hay grandes diferencias en la
motivación a la hora de elegir palabras que nos gusten, ni por sexo y edad,
aunque si hay pequeñas diferencias como hemos señalado en el punto
anterior (6.2).
También hemos visto que aunque abundan más las coincidencias que
las diferencias en los campos de interés a los que pertenecen las palabras
se aprecian matices que pueden ser debidos bien a la edad, bien a motivos
23
socio culturales asociados al sexo y/o la edad: DEPORTE en hombres
jóvenes, MODA en mujeres jóvenes, NATURALEZA en personas
mayores,… como ya analizamos en el punto 6.1.
De las preguntas de contexto, aunque hay una gran similitud entre
hombres y mujeres, en todos los tramos de edad las mujeres declaran
tener más libros propios y leer más4.
Otra conclusión, aunque no sea directamente relacionada con este
trabajo, fue al analizar los datos recogidos por internet. El perfil de la
persona que había colaborado era con estudios y mayoritariamente
mujeres. Por un lado nos hace sospechar que ese sea el perfil de las
personas que responden a estudios, encuestas, test por internet y/o que
están más atentas o cuidan más el lenguaje. Por otra parte, nos hace
temer que la mayoría de estudios y encuestas publicados que siguen esta
estrategia de recogida de datos tengan sus muestras tan descompensadas
o más como nosotros observamos y por tanto, no tengan el rigor que
deberían.
Por último, a nivel personal nos gustaría decir que realizar este
trabajo durante estos meses ha sido duro y a la vez divertido.
Ha sido duro ya que este trabajo requiere constancia y mucho
tiempo, del cual no disponíamos debido al curso que hemos realizado.
Nos hemos dado cuenta de las dificultades que implica cada paso del
proceso estadístico, incluso el que pudiera parecer más sencillo como es
la simple escritura de datos en la hoja de cálculo da lugar a errores de
transcripción y encontrarlos y subsanarlos lleva mucho esfuerzo y tiempo.
Hemos tenido que aprender a organizarnos para no perder tiempo de
estudio, pero ha merecido la pena por ver el resultado final que nos tenía
sobre ascuas cuando empezamos a recoger los datos.
4 Ver página 7
24
Nos ha parecido muy interesante intentar averiguar intereses,
preocupaciones, valores, a partir de una simple pregunta inocente como
“Piensa una palabra que te guste…”
Por otro lado nos ha resultado divertido ya que hemos pasado
mucho tiempo juntos, al habernos unido para llevarlo a cabo. Nos ha
sorprendido muchísimo la diferencia entre cómo asumía la gente el
trabajo. Había quien no quería que nadie viera qué palabra escribía o
tardaba muchísimo en decidirse a quien decía la primera palabra que se le
ocurría.
También nos ha traído momentos de agobio que han sido
compensados con los momentos buenos como han sido el salir a la calle a
encuestar a la población los tres compañeros juntos.
8. Posibles líneas de continuación
Creemos que un estudio con una muestra más amplia tanto en
número de personas como el ámbito geográfico haría que hubiera más
variedad de palabras elegidas y que fuera más representativa.
Estamos satisfechos con el trabajo realizado. Sin embargo, el tiempo
que ha necesitado y lo exigente del curso de 2º de Bachillerato no nos ha
permitido desarrollar la segunda línea de estudio que teníamos abierta, la
de las palabras que NO GUSTAN. Recogimos los datos y los tenemos en
la hoja de cálculo pero no hemos tenido tiempo de hacer un estudio
similar al hecho para las palabras que GUSTAN. A modo de curiosidad
ésta es la nube de palabras que obtenemos5 con las PALABRAS QUE NO
GUSTAN:
5 Generada en: https://www.jasondavies.com/wordcloud/ El tamaño de la letra con que es representada la palabra es proporcional a la frecuencia con que ha aparecido en el estudio.
25
9. Referencias
x www.rae.es
x Información sobre Excel: http://www.excel-avanzado.com
x Wikipedia
x Google Forms
x www.ine.es
x http://worditout.com/
x https://www.jasondavies.com/wordcloud/