incubadora de sondeos y experimentos clm ciclos...

Incubadora de Sondeos y Experimentos – CLM

2016 Categoría: Bachillerato – Ciclos Formativos

1

Palabras que gustan

Índice 1. Resumen 2

2. Introducción 2

3. Recogida de Datos

3.1. Diseño 3

3.2. Muestreo 4

3.3. Toma de datos 5

3.4. Muestra tomada 6

4. Tratamiento de datos 8

5. Resultados obtenidos 10

5.1. Las palabras en sí 11

5.2. Clasificaciones 13

5.3. Campos semánticos 16

6. Análisis de datos

6.1. Por campo semántico 17

6.2. Por motivación 21

7. Conclusiones 22

8. Posibles líneas de continuación 24

9. Referencias, recursos empleados 25

2

1. Resumen – Abstract

El presente documento recoge nuestra experiencia utilizando los

conocimientos adquiridos en la asignatura Matemáticas aplicadas a las

Ciencias Sociales para diseñar una encuesta relativa a la preferencia por

determinadas palabras del castellano. En el mismo, mostraremos cómo lo

hemos diseñado, llevado a la práctica, analizado los resultados y, por

último, interpretado los resultados.

This document shows our experience using the knowledge acquired

in the subject Mathematics for Social Sciences to design a survey on the

preference for some words of our language (Spanish). We will see how

we have designed, implemented, analyzed the results and, finally,

interpreted the results.

2. Introducción

La idea de este trabajo comenzó a principios de octubre en la clase

de Matemáticas aplicadas a las Ciencias Sociales II, en la que nuestro

profesor, nos ofreció la oportunidad y su ayuda para iniciar un proyecto.

Valoramos varias ideas hasta que decidimos comenzar a desarrollar este

proyecto.

El por qué elegimos éste (palabras que gustan) y no otro, fue

porque lo vimos una idea muy interesante, algo alejada de lo que uno

suele pensar que tratará un estudio estadístico y con el que podríamos

aprender mucho y descubrir palabras nuevas, y a partir de estas palabras

podríamos descubrir otros aspectos de la sociedad que nos permitirían

3

seguir desarrollando otro tipos de trabajos, descubrir posibles líneas de

continuación…

3. Recogida de Datos

3.1. Diseño

Al diseñar la encuesta, nos planteamos no hacerla demasiado

extensa y lo más sencilla

posible tanto para facilitar

la recogida de datos como

para no asustar a las

personas a las que

pidiéramos su

colaboración. De esta

manera, nos planteamos

en realidad tan sólo tres

preguntas, aunque

inocentes y simple en

apariencia, nuestra idea

era poder exprimirlas para

sacar la mayor

información posible.

Las preguntas realizadas en la encuesta de las palabras favoritas y

no favoritas de las personas han ido encaminadas, sobre todo, a buscar el

posible motivo de elección que impulsaba al encuestado a decidirse por

una determinada palabra.

4

También se han

realizado preguntas más

personales para intentar

identificar a quién respondía

dentro de determinados

grupos (sexo, edad, aficiones,

nivel cultura,…) para ver si

después podríamos intentar

detectar alguna pauta de

comportamiento o algunas

diferencias entre grupos en las

preferencias por unas palabras

u otras.

3.2. Muestreo

Para decidir a cuántas personas preguntar, acudimos a la web

del INE y obtuvimos la última cifra oficial de población empadronada:

Lo que nos marcaba un total de 50.035 personas. Dado que el

grupo tan sólo lo componíamos tres alumnos no podíamos acceder a

tantos tramos de edad ni a una muestra demasiado extensa. Intentamos

5

encontrar un equilibrio y optamos por hacer un muestreo estratificado

por sexo y edad, con cuatro estratos de edad (de 0 a 19, de 20 a 39, de

40 a 59 y por último la casilla de más de 60), y con un tamaño muestral de

250 personas (0,5% de la población). De manera que con 8 estratos

tuviéramos una cantidad mínima de personas en cada estrato que nos

permitiera hacer un estudio con cierta fiabilidad. La composición del

muestreo fue:

0 a 19 20 a 39 40 a 59 60 Total

Hombres 25 34 35 28 122 Mujeres 23 33 37 35 128 TOTAL 48 67 72 63 250

Por otra parte, con el objetivo de enriquecer el trabajo, decidimos

preguntarle tres palabras que les pudieran gustar al encuestado, en lugar

de tan sólo una, para aumentar el volumen de datos recogidos sin

aumentar la muestra.

3.3. Toma de datos La recogida de datos se hizo durante la segunda semana de marzo.

En la parte humana, nos planteamos ser lo más transparentes posibles con

los encuestados para así tener la mejor disposición posible. Para ello, el

cuestionario identificaba en el encabezado el objeto del estudio, el centro

al que pertenecíamos, el profesor responsable y una dirección de correo

electrónico en el que poder pedir más información. También llevábamos

el carné de alumnos del centro visible durante la toma de datos en la calle.

La toma de datos la hicimos en dos fases, una primera para poner a

prueba el cuestionario, si se entendía bien y servía para lo que nos

habíamos propuesto y una segunda más extensa en el que ya

completábamos la muestra. En la primera fase, utilizamos el entorno

cercano para buscar el tramo más joven de edad, así preguntamos a niños

6

de primaria y de secundaria para que no fueran respuestas únicamente de

adolescentes. Curiosamente nos parecieron más serias y estudiadas

algunas respuestas de niños de primaria que de secundaria. En la segunda

fase, seguimos rutas aleatorias por diferentes barrios de la localidad para

intentar no quedarnos en el centro y evitar, en lo posible, obtener datos

de un solo entorno socioeconómico.

3.4. Composición de la muestra

Como mencionábamos anteriormente, estructuramos la muestra

por sexo y edad, y aunque tuvimos la intención de ampliar la recogida de

datos con un cuestionario por internet, al ver lo descompensada que

estaba esa muestra no incorporamos dichos datos. Sin embargo, a las 250

personas entrevistadas les hemos hecho preguntas de contextos. A

continuación vemos los resultados

A continuación, vemos la situación laboral por sexos:

0 10 20 30 40 50 60 70 80

Sin estudios o Estudios Obligatorios Incompletos

Educación Obligatoria Completa

Bachillerato o FP

Estudios Universitarios o de Postgrado

NS/NC

Composición de la muestra por formación

H M

7

Por último, la cantidad de libros1 que estiman tienen en casa:

Estos gráficos indican que tenemos una muestra diversa, ya que tenemos bastante bien representados todos los grupos, y equilibrados por sexo, lo que nos proporciona unas ciertas garantías de que las respuestas podrán ser fiables.

1 propios

0 10 20 30 40 50 60 70 80

Medianos y grandes empresarios (+10…

NS/NC

Obrero, agricultor, cooperativista

Grandes empresarios

Pequeños empresarios (10 o menos trabajadores),…

Jubilados y Pensionistas

Funcionarios, trabajadores de educación, sanidad,...

Situaciones no clasificables (parados, estudiantes,…

H

M

23% 15%

21%

36%

5% 12%

21% 27%

38%

3% 0%

5%

10%

15%

20%

25%

30%

35%

40%

Apenas Tengo Un Estante Una Estantería Varias Estanterías NS/NC

Composición de la muestra Libros disponibles por sexo

H M

8

4. Tratamiento de Datos

El tratamiento de datos ha sido fundamentalmente en una hoja de

Microsoft Excel, en la que hemos puesto todos los datos de cada encuesta

organizados por columnas.

Puesto que nuestras preguntas recogían tan sólo información

cualitativa, nos animamos a además de utilizar las palabras recogidas en las

encuestas, a hacer un pequeño estudio sobre las mismas. Así, medimos su

longitud, su composición de vocales y consonantes, la letra de comienzo,

su clasificación morfológica e intentamos agruparlas en campos

semánticos. Esta parte nos ha parecido la más complicada pues hay

palabras que podían estar en más de un campo semántico y campos que

podrían unirse. Para intentar disminuir nuestra subjetividad, hemos

contado con la colaboración de dos profesoras de idiomas de nuestro

centro que, como filólogas, una vez establecida la clasificación inicial nos

ayudaron a depurarla.

9

Durante la recogida de datos se nos ocurrió que podíamos

contrastar los datos recogidos realizando la misma encuesta a través de

internet. Para ello, utilizamos Google Forms y la difundimos por redes

sociales. En tan sólo dos días conseguimos 152 respuestas, y aunque los

resultados tienen similitudes con los datos recogidos en persona,

decidimos no mezclarlos (para no correr riesgos de representatividad) ya

que la muestra online no estaba compensada como puede verse en los

siguientes gráficos:

10

También nos gustaría señalar que nos ha sorprendido muy

agradablemente la seriedad con la que los encuestados se han tomado el

estudio, le dedicaban tiempo, pensaban, muchos no querían que nadie

leyera sus respuestas,… Tan sólo hemos tenido que eliminar 10 palabras

(1,33%) porque el contenido hacía ver falta de seriedad en la respuesta.

5. Resultados obtenidos

Encuestamos a 250 personas, cada persona nos aportaba un máximo

de 3 palabras (750 palabras). Nadie eligió solo una. De las 750 palabras tan

sólo hemos tenido que prescindir de 10 (1,33%). Hemos obtenido 373

palabras, lo que nos da una variabilidad de 1,49 palabras por persona. A

este respecto, haciendo este pequeño análisis para cada grupo de sexo y

edad encuestado observamos:

HOMBRES 0 a 19 20 a 39 40 A 59 > 60

Palabras 59 77 84 63 Personas 25 34 35 28

Índice 2,36 2,26 2,40 2,25

MUJERES 0 a 19 20 a 39 40 A 59 > 60

Palabras 50 74 79 73 Personas 23 33 37 35 Índice 2,17 2,24 2,14 2,09

En el global de hombres (122) aparecieron 231 palabras diferentes

(1,89) mientras que en las mujeres (128) aparecieron 209 palabras

distintas (1,63). Parece claro que al aumentar el tamaño de la muestra en

el estrato que corresponda disminuye la variabilidad pues al aumentar las

respuestas aparecen más coincidencias. Sin embargo, y aunque no hay

grandes diferencias una constante en todos los grupos de edad y en los

11

globales es que los hombres han dado más respuestas distintas que las

mujeres, quizá por una mayor diversidad de intereses mientras que en las

mujeres es posible que tengan sus intereses más concentrados en algunos

aspectos.

5.1. Las palabras en si

Hemos hecho un pequeño estudio del tipo de palabras que nos han

aparecido en la encuesta con los siguientes resultados:

LETRAS VOCALES CONSONANTES VOC/LET VOC/CON

Media 6,37 Media 2,87 Media 3,50 Media 0,45 Media 0,87 Mediana 6 Mediana 3 Mediana 3

Moda 6 Moda 2 Moda 3 Rango 10 Rango 5 Rango 7 Mínimo 3 Mínimo 1 Mínimo 1 Máximo 13 Máximo 6 Máximo 8

En la tabla podemos observar que hemos obtenido palabras entre 3

y 13 letras de longitud, aunque la mayoría se encuentran en el entorno de

las 6 letras de longitud. No parece que haya una uniformidad clara en

cuanto a la presencia de vocales. Las 373 palabras que han aparecido en el

estudio (de 750 posibles) tenían entre 1 y 6 letras, aunque lo más

frecuente era moverse entre 2 y 3. Las consonantes, sin embargo, se han

movido en un rango de entre 1 y 8 con una mayoría de palabras con 3

consonantes, aunque había palabras largas con una mayor cantidad que

hacían subir la media. El porcentaje de vocales frente al total de letras que

componían la palabra era entorno al 45%, y la relación vocales frente a

consonantes por palabra se ha situado en el 87%. Creemos que sería de

interés un estudio más general sobre palabras de todo tipo para saber si

12

esta estructura es habitual en el castellano o si por el contrario este

“retrato” puede caracterizar palabras que gustan (en algún sentido) al

hablante, bien porque suenen mejor que otras, bien porque por su

sonoridad se hayan creado para nombrar cosas agradables y queridas.

Otra característica que hemos estudiado es la frecuencia de la letra

de comienzo de estas 373 palabras surgidas en el cuestionario. En el

siguiente gráfico, vemos el porcentaje de aparición de cada letra en el

estudio frente a la frecuencia con que aparece cada letra en castellano2:

Aunque en el gráfico hay diferencias importantes, la verdad es que

no se compara exactamente lo mismo pues una letra puede aparecer muy

frecuentemente en castellano aunque no tenga por qué ser en la misma

proporción en la primera letra de la palabra. Hemos intentado encontrar

información en internet al respecto, pero tan sólo hemos encontrado una

referencia3 en la que vagamente sin citar fuentes alude a que las letras de

comienzo más frecuentes en castellano son (en orden decreciente): C, A, 2 https://es.wikipedia.org/wiki/Frecuencia_de_aparici%C3%B3n_de_letras 3 Juan Carlos Galende Díaz – 1995, “CRIPTOGRAFÍA. HISTORIA DE LA ESCRITURA CIFRADA” https://goo.gl/gdjT0X

0,00%

2,00%

4,00%

6,00%

8,00%

10,00%

12,00%

14,00%

16,00%

A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z

% aparición letra de comienzo Palabras del Estudio vs frecuencia cada letra en Castellano

FAVORITAS CASTELLANO

13

P, M, S lo que concuerda con los datos del gráfico. Sin embargo, puesto

que también habíamos preguntado por palabras que “no gustaran” al

encuestado, comparamos la frecuencia de las letras de comienzo de

ambas categorías para comprobar si podía haber diferencias significativas.

Como puede observarse, aunque existen diferencias no parecen de

la importancia suficiente como para atribuirlas a otra cosa que las

pequeñas variaciones debidas al azar.

Por último,

mayoritariamente el tipo de

palabras elegidas han sido

SUSTANTIVOS.

90%

6% 4%

Palabras por elementos gramaticales

SUSTANTIVO

ADJETIVO

INFINITIVO

14

5.2. Clasificaciones

Posteriormente, procedimos a hacer un recuento de la frecuencia

de aparición y hemos realizado unos rankings por sexos y edad. Los

porcentajes están calculados en función de los componentes de cada

grupo.

0 a 19 FREC % 20 a 39 FREC % 40 A 59 FREC % Más de 60 FREC % TOTAL FREC % FUTBOL 24% AMISTAD 12% AMOR 14% CAMPOS 18% AMOR 11% AMOR 12% COCHES 12% FAMILIA 11% TELEVISION 14% FAMILIA 10%

FAMILIA 12% FAMILIA 12% HIJOS 9% COCHES 11% COCHES 7% PAZ 9% NATURALEZA 11% NIETOS 11%

0 a 19 FREC % 20 a 39 FREC % 40 A 59 FREC % Más de 60 FREC % TOTAL FREC % AMOR 35% FAMILIA 15% AMOR 27% AMOR 14% AMOR 20%

MUSICA 22% AMIGOS 12% FAMILIA 19% FAMILIA 14% FAMILIA 14% ALEGRIA 9% ROPA 12% ALEGRIA 8% FLOR 14% FLOR 7% FIESTA 9% AMIGOS 8% NIETOS 14%

FUTBOL 9% LUZ 8% SUEÑO 9% SALUD 8% VIDA 9%

En estos resultados, puede apreciarse que aunque hay coincidencias

entre sexos y grupos de edad, también parece haber diversidad de

15

intereses. Sin embargo, si dejamos de lado el sexo y vemos las palabras

más frecuentes por tramos de edad, tenemos:

0 a 19

20 a 39

40 a 59

60 ó mayores

16

Como podemos apreciar aunque los datos parecen apuntar alguna

diversidad de intereses en función de la edad, los lazos familiares, los

sentimientos y las aficiones parecen centrar los intereses de los

encuestados, o al menos, al tener que pensar en una palabra de forma

improvisada, acuden a esos focos.

Ante estos datos, tuvimos la idea de crear campos semánticos para

intentar confirmar si había esa diversidad de intereses.

5.3. Campos Semánticos

Los campos semánticos creados han sido variados. Inicialmente,

intentamos trabajar solo con cinco campos semánticos, pero quedaban

demasiadas palabras sin clasificar claramente por lo que decidimos trabajar

con más campos semánticos. Al final nos hemos quedado con 15:

CALIFICATIVOS DEPORTE ENTORNO AFECTIVO, CERCANO ESTUDIOS-PROFESIONES GASTRONOMIA MODA, COMPLEM. Y COMPRAS MOMENTOS Y LUGARES MÚSICA

NATURALEZA OBJETOS DEL HOGAR OCIO OTRO VOCABULARIO SALUD SENTIMIENTOS, MUESTRAS DE AFECTO VALORES, ACTITUDES

Algunos están próximos pero nos ha parecido interesante no

unirlos. Por ejemplo, en entorno afectivo, cercano hemos incluido

palabras como HIJOS, PADRE, MADRE, AMIGO,… En valores y

actitudes: PAZ, VERDAD, HONESTIDAD, SINCERIDAD,… En

Sentimientos y muestras de afecto: AMOR, CARIÑO, TERNURA,…

No ha sido una tarea fácil y hemos buscado el consejo de filólogos

para dirimir pequeñas discusiones entre nosotros a la hora de clasificar

palabras concretas o sobre si crear o no un campo. Nos ha parecido difícil

17

porque una palabra puede adscribirse en algunos casos a más de uno de

estos campos.

6. Análisis de datos

Veremos qué campos de interés atraían a los encuestados, así como

qué movía a las personas a elegir las palabras.

6.1. Campos Semánticos

En el siguiente gráfico podemos ver un diagrama en el que aparecen

los campos semánticos utilizados para agrupar las palabras en categorías

ordenados por frecuencia:

Si analizamos estos resultados por edades, observamos:

18

CAMPO SEMÁNTICO PALABRAS QUE GUSTAN 0 a 19 20 a 39 40 a 59 ≥ 60 TOTAL

SENTIMIENTOS, MUESTRAS DE AFECTO 19% 15% 17% 12% 16% NATURALEZA 10% 9% 11% 21% 13% ENTORNO AFECTIVO, CERCANO 6% 14% 14% 13% 12% GASTRONOMIA 8% 9% 7% 8% 8% VALORES, ACTITUDES 5% 6% 12% 7% 8% OCIO 6% 7% 6% 7% 7% ESTUDIOS-PROFESIONES 4% 8% 5% 5% 5% DEPORTE 18% 4% 0% 2% 5% MODA, COMPLEMENTOS Y COMPRAS 3% 7% 6% 4% 5% MOMENTOS Y LUGARES 3% 5% 5% 6% 5% SALUD 3% 1% 4% 6% 4% OBJETOS DEL HOGAR 0% 3% 3% 5% 3% OTRO VOCABULARIO 3% 4% 2% 2% 3% MÚSICA 6% 1% 3% 1% 3% CALIFICATIVOS 3% 1% 3% 1% 2% Eliminadas del Estudio 3% 2% 0% 1% 1%

La categoría mayoritaria en todos los tramos de edad es la

correspondiente a SENTIMIENTOS, MUESTRAS DE AFECTO. Sin

embargo, cabe destacar que en el grupo 0 a 19 el DEPORTE juega el

segundo papel, en el grupo 20 a 39, el ENTORNO AFECTIVO,

CERCANO lo que sería la familia. Puede ser congruente con que es un

tramo de edad de independencia respecto a los padres y pasar a tener la

propia familia. Por otra parte, en el tramo 40 a 59, el ENTORNO

AFECTIVO casi comparte posición con los VALORES, ACTITUDES y la

NATURALEZA, puede tener que ver con que es un tramo de edad en el

que se es un modelo para los hijos. Por último, es curioso que en las

personas de 60 ó más la NATURALEZA (SOL, VIDA, CAMPO,…)

19

desbanca a los SENTIMIENTOS y al ENTORNO CERCANO que quedan

prácticamente empatados a puntos.

A continuación desglosamos aún más los resultados por edad y

sexos:

13

15

4

4

4

10

7

5

3

4

5

1

2

3

2

2

21

5

2

3

4

4

-

-

1

3

3

6

3

1

14

17

12

17

5

13

6

13

9

4

15

1

6

3

2

1

5

3

3

8

11

3

6

1

3

11

3

-

-

2

16

21

15

15

7

17

8

7

13

13

5

5

3

2

4

5

1

-

6

4

11

3

3

4

6

7

4

3

3

4

8

14

8

16

21

18

4

11

6

8

3

6

2

2

5

7

3

1

4

8

9

5

5

5

4

3

1

-

-

1

- 10 20 30 40 50 60 70

H M H M H M H M H M H M H M H M H M H M H M H M H M H M H M

SENT

IMI

ENTO

S,M

UEST

RAS

DE

AFEC

TO

ENTO

RNO

AFEC

TIV

O,

CERC

ANO

NAT

URA

LEZA

GAST

RON

OM

IA

VALO

RES,

ACTI

TUDE

S

ESTU

DIO

S-PR

OFE

SIO

NES

OTR

OVO

CABU

LARI

OSA

LUD

DEPO

RTE

MO

MEN

TOS

YLU

GAR

ES

OCI

O

OBJ

ETO

S DE

LHO

GAR

MO

DA,

COM

PLE

MEN

TOS

YCO

MPR

ASM

ÚSIC

ACA

LIFI

CAT

IVO

S

Composición categorías por sexo y edad 0 a 19 20 a 39 40 a 59 Más de 60

20

En general no hay grandes diferencias. Sin embargo, podemos

destacar respecto a las contribuciones relativas de otros tramos de edad

o del otro sexo alguna que otra:

HOMBRES:

x En el grupo de 0 a 19 hay más referencias al DEPORTE

x En el grupo de 20 a 39 hay más relativas a los ESTUDIOS y

PROFESIONES

x En el grupo de 20 a 39 y 40 a 59 hay más referencias al OCIO en

proporción a las mujeres u otros tramos de edad.

x En el grupo de 60 o más, hay más referencias a la NATURALEZA

MUJERES:

x En el tramo de 20 a 39 y de 60 ó más, hay (en proporción) más

referencias GASTRONÓMICAS que respecto a los hombres

x Les interesa más el ENTORNO AFECTIVO y los SENTIMIENTOS-

MUESTRAS DE AFECTO en todos los tramos de edad, pero en

especial en el grupo 60 ó más.

x Les interesa más la NATURALEZA que a los hombres excepto en el

tramo 60 ó más.

x Les interesa menos lo relativo a ESTUDIOS-PROFESIONES que a

los Hombres en los tramos 0 a 19 y 20 a 39, igual en el tramo 40 a

59 y más en el tramo 60 ó más.

x Les interesa más que a los hombres lo referente a MODA,

COMPLEMENTOS en todos los tramos pero sobre todo de 20 a

39.

21

6.2. Por motivación

Si hacemos un análisis de por qué elegían las palabras los

encuestados, vemos que mayoritariamente por el significado (41%), casi

empatado con las connotaciones personales (37%) que pudiera traer a

dicha persona la palabra en concreto. La sonoridad de la palabra aparece

en tercer lugar (15%)y de forma residual el origen de la misma,

etimología u otros motivos.

En el siguiente gráfico, podemos observar las diferencias de

motivación en la elección por sexo y edad:

15%

37%

41%

3% 4% 0%

Motivo Elección Palabra que gusta

SONORIDAD

CONNOTACIONES

SIGNIFICADO

ORIGEN

OTROS MOTIVOS

NS/NC

0%

10%

20%

30%

40%

50%

H M H M H M H M

0 a 19 20 a 39 40 a 59 Más de 60

Motivo para elegir las palabras que gustan

SONORIDAD CONNOTACIONES SIGNIFICADO ORIGEN OTROS MOTIVOS

22

Curiosamente, en todos los tramos el % de hombres que eligen

palabras por su sonoridad es algo mayor que el de mujeres. Como puede

apreciarse, en el tramo 0 a 19 tanto en hombres como en mujeres

predomina las connotaciones personales a la hora de elegir una palabra.

Sin embargo, en los tramos de 40 a 59 y de 60 o más predomina en

ambos sexos el significado de la palabra en la elección. En estos tres

tramos de edad no hay grandes diferencias en la motivación que impulsa a

hombres y mujeres. Tan sólo en el tramo 20 a 39, se presenta una

diferencia por sexo, los hombres siguen eligiendo la palabra por

connotaciones personales y las mujeres ya lo hacen por significado.

7. Conclusiones

Reconocemos que el estudio es algo peculiar, pues la elección de la

palabra no sólo es muy personal sino que también depende del momento

en que se nos pregunte por ella. Es complicado elegir unas pocas palabras

en concreto.

El estudio nos ha hecho descartar que haya un “retrato”, una

“estructura”, una “combinación” de letras, vocales, longitud, para que una

palabra suene bien y se incorpore al lenguaje para nombrar algo que

guste.

Lo analizado parece indicar que no hay grandes diferencias en la

motivación a la hora de elegir palabras que nos gusten, ni por sexo y edad,

aunque si hay pequeñas diferencias como hemos señalado en el punto

anterior (6.2).

También hemos visto que aunque abundan más las coincidencias que

las diferencias en los campos de interés a los que pertenecen las palabras

se aprecian matices que pueden ser debidos bien a la edad, bien a motivos

23

socio culturales asociados al sexo y/o la edad: DEPORTE en hombres

jóvenes, MODA en mujeres jóvenes, NATURALEZA en personas

mayores,… como ya analizamos en el punto 6.1.

De las preguntas de contexto, aunque hay una gran similitud entre

hombres y mujeres, en todos los tramos de edad las mujeres declaran

tener más libros propios y leer más4.

Otra conclusión, aunque no sea directamente relacionada con este

trabajo, fue al analizar los datos recogidos por internet. El perfil de la

persona que había colaborado era con estudios y mayoritariamente

mujeres. Por un lado nos hace sospechar que ese sea el perfil de las

personas que responden a estudios, encuestas, test por internet y/o que

están más atentas o cuidan más el lenguaje. Por otra parte, nos hace

temer que la mayoría de estudios y encuestas publicados que siguen esta

estrategia de recogida de datos tengan sus muestras tan descompensadas

o más como nosotros observamos y por tanto, no tengan el rigor que

deberían.

Por último, a nivel personal nos gustaría decir que realizar este

trabajo durante estos meses ha sido duro y a la vez divertido.

Ha sido duro ya que este trabajo requiere constancia y mucho

tiempo, del cual no disponíamos debido al curso que hemos realizado.

Nos hemos dado cuenta de las dificultades que implica cada paso del

proceso estadístico, incluso el que pudiera parecer más sencillo como es

la simple escritura de datos en la hoja de cálculo da lugar a errores de

transcripción y encontrarlos y subsanarlos lleva mucho esfuerzo y tiempo.

Hemos tenido que aprender a organizarnos para no perder tiempo de

estudio, pero ha merecido la pena por ver el resultado final que nos tenía

sobre ascuas cuando empezamos a recoger los datos.

4 Ver página 7

24

Nos ha parecido muy interesante intentar averiguar intereses,

preocupaciones, valores, a partir de una simple pregunta inocente como

“Piensa una palabra que te guste…”

Por otro lado nos ha resultado divertido ya que hemos pasado

mucho tiempo juntos, al habernos unido para llevarlo a cabo. Nos ha

sorprendido muchísimo la diferencia entre cómo asumía la gente el

trabajo. Había quien no quería que nadie viera qué palabra escribía o

tardaba muchísimo en decidirse a quien decía la primera palabra que se le

ocurría.

También nos ha traído momentos de agobio que han sido

compensados con los momentos buenos como han sido el salir a la calle a

encuestar a la población los tres compañeros juntos.

8. Posibles líneas de continuación

Creemos que un estudio con una muestra más amplia tanto en

número de personas como el ámbito geográfico haría que hubiera más

variedad de palabras elegidas y que fuera más representativa.

Estamos satisfechos con el trabajo realizado. Sin embargo, el tiempo

que ha necesitado y lo exigente del curso de 2º de Bachillerato no nos ha

permitido desarrollar la segunda línea de estudio que teníamos abierta, la

de las palabras que NO GUSTAN. Recogimos los datos y los tenemos en

la hoja de cálculo pero no hemos tenido tiempo de hacer un estudio

similar al hecho para las palabras que GUSTAN. A modo de curiosidad

ésta es la nube de palabras que obtenemos5 con las PALABRAS QUE NO

GUSTAN:

5 Generada en: https://www.jasondavies.com/wordcloud/ El tamaño de la letra con que es representada la palabra es proporcional a la frecuencia con que ha aparecido en el estudio.

https://www.jasondavies.com/wordcloud/

25

9. Referencias

x www.rae.es

x Información sobre Excel: http://www.excel-avanzado.com

x Wikipedia

x Google Forms

x www.ine.es

x http://worditout.com/

x https://www.jasondavies.com/wordcloud/

http://worditout.com/

https://www.jasondavies.com/wordcloud/

incubadora de sondeos y experimentos clm ciclos...

Documents