universidad pompeu fabra ciencias políticas y de la ... · metodología cuantitativa ii sílvia...

61
Universidad Pompeu Fabra Ciencias Políticas y de la Administración Metodología Cuantitativa II Estadística Descriptiva Jordi Pascual 1r Curso 3r Trimestre Grupo 1 Sílvia Caufapé Hostench

Upload: doantram

Post on 22-Sep-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Universidad Pompeu Fabra

Ciencias Políticas y de la Administración

Metodología Cuantitativa II Estadística Descriptiva Jordi Pascual 1r Curso 3r Trimestre Grupo 1

Sílvia Caufapé Hostench

Page 2: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 2

Guion de la Asignatura

Tema 1. Introducción a la Estadística Introducción a la estadística: orígenes, concepto y ramas. Conceptos centrales. Lectura crítica de estadísticas.

Tema 2. Medidas de Posición Tablas de frecuencias y porcentajes Medidas de posición o tendencia central

Formas de una distribución

Tema 3. Medidas de Dispersión Medidas de dispersión Coeficiente de variación Variables tipificadas

Tema 4. Herramientas de Representación Gráfica

Gráficos para variables categóricas Gráficos para variables cuantitativas

El uso correcto de los gráficos

Tema 5. Estadística Descriptiva Bivariable con Variables

Categóricas Relaciones entre variables categóricas

Relaciones entre variables categóricas y variables cuantitativas

Tema 6. Estadística Descriptiva Bivariable con Variables

Numéricas Estadística descriptiva bivariable

Page 3: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 3

Diagramas de dispersión Medir relaciones lineales

Evaluación Examen tercer seminario: 30% de la nota

Examen final: 70% de la nota

Page 4: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 4

Tema 1. Introducción a la Estadística Orígenes de la estadística

• Raíz de la palabra: Estado.

• La estadística se utiliza en un principio como medida de control de la población sobre la fiscalidad y con finalidad recaudatoria.

• Cronología: - Año 3050 a.C: recuento de las riquezas y la población de Egipto, a fin de

construir las pirámides (Heródoto) - S. XV-XVII Maquiavelo y la ciencia del Estado (la Statistica) - S.XVIII-XIX Aparición de la estadística como disciplina utilitarista, ligada al

poder del estado sobre la sociedad, junto a la economía, demografía y agronomía.

Tipos de estadística

• Estadística descriptiva: - Presentación ordenada de los datos observados en tablas y gráficos - Reducción de los datos a un pequeño número de medidas que permiten la

comparación - Estadísticas sobre la población de un país, una región, un municipio... - Resultados de encuestas y sondeos

• Estadística inductiva: Estimación de las probabilidades de éxito de cada una

de las decisiones posibles

• Diferencia entre estadísticas y encuestas:

Page 5: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 5

- Estadísticas → población

- Encuestas → muestra

- Pero en ambos casos las estadísticas se utilizan para presentar y comunicar información sobre datos

- El objetivo es describir las características o las preferencias de una población.

• Estadística: - Tener información sobre las características y comportamiento de las

poblaciones. - Herramienta de investigación social - Conseguir datos para responder preguntas relativas a la sociedad

• Ejemplos:

Page 6: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 6

Lectura crítica de las estadísticas

• Estadísticas: observar la forma de presentar los datos:

- Cifras absolutas / relativas - Comparativas

• Encuestas: - Analizar el proceso de elaboración (Entrar en la cocina) - Cómo se hacen las preguntas

Estadística: conceptos básicos

• Tipos de datos: - Datos numéricos y datos textuales:

o En la mayoría de los casos, las estadísticas se basan en datos numéricos. Pero el análisis estadístico no se limita a los datos numéricos.

o También podemos analizar, por ejemplo, datos de textos escritos. o Ejemplo: "nube de palabras" para presentar los temas principales de un

discurso político. - Datos individuales y datos agregados:

o Datos agregados: datos sobre agregados de individuos o de otro tipo

de observaciones. Estos son datos que se calculan sobre la base de observaciones más detalladas. § Ejemplos: tasa de paro, tasa de fertilidad, participación en una

elección. o Datos individuales: datos sobre individuos (en un sentido estadístico) y

sobre sus características, sus decisiones, opiniones, etc. § Ejemplo: encuestas políticas.

Page 7: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 7

• Términos centrales (1): Población y muestra - Población: un grupo entero de individuos sobre el que queremos obtener

información (Moore: 209) - Muestra: “Una muestra es la parte de la población que realmente

examinamos con el objetivo de obtener información” (Moore: 209)

• Términos centrales (2): Individuo - En estadística, un individuo no es necesariamente una persona. - “Los individuos son cada uno de los componentes de la población”

(Fernández et al.: 21)

- La palabra individuo se utiliza también para describir los componentes de

un conjunto de datos (Moore: 4) - A veces, el termino “observación” también se utiliza para describir los

individuos de una muestra. • Estructura de un archivo de datos:

- Para analizar datos, es necesario recogerlos en un archivo de datos. Un archivo de datos es una tabla de datos o “matriz” de datos.

- Estas matrices de datos se organizan siempre de la misma manera, con la misma estructura de variables.

- Ejemplo: archivo de datos sobre los equipos de la primera división de

hockey sobre patines.

Page 8: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 8

• Concepto de variable:

Tipos de variables

• Variables cuantitativas y variables cualitativas - Variables cuantitativas: Características de las observaciones susceptibles

de tomar valores numéricos. Ejemplos: edad, peso, número de hijos, etc.

- Variables cualitativas o categóricas: Características no susceptibles de ser

medido numéricamente. Indican a qué grupo pertenece un individuo. Ejemplos: color de los ojos, ocupación, confianza en el Gobierno (mucha,

alguna, poca, ninguna), partido votado en una elección, etc.

• Variables cuantitativas discretas y continuas (1): - Variables cuantitativas continuas:

o Pueden tomar un número infinito de valores diferentes

Page 9: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 9

o Las unidades con las cuales se mide la variable pueden (en teoría) admitir un número infinito de valores intermedios

o Ejemplo: tamaño de una persona. Se puede medir en metros, centímetros, milímetros, micrómetros, etc.

- Variables cuantitativas discretas o discontinuas: o Las unidades de medida no se pueden subdividir más que un cierto

límite o Ejemplo: número de hijos.

• Variables cuantitativas discretas y continuas (2):

- En la práctica, la distinción entre variable discreta y continua no es fácil. - El carácter discreto o continuo de una variable no sólo depende del objeto

de estudio, sino también de cómo se define la variable - Duración de los estudios: continua - Número de años de estudios: discreta

• Ejercicio: ¿de qué tipo son estas variables?

- Edad en años → Cuantitativa discreta

- Partido político al que se votó en las últimas elecciones → Cualitativa

- Tiempo necesario para ir al trabajo → Cuantitativa continua

- Año de nacimiento → Cuantitativa discreta

- Salario → Cuantitativa continua

- Número de niños → Cuantitativa discreta

- Opción sexual → Cualitativa

Page 10: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 10

Nivel de medida o escala de medición

• El nivel de medida se relaciona con el nivel de contenido de la información

implícita en el conjunto de valores.

• Depende de las propiedades o relaciones de orden y distancia que tienen los datos.

• Cuatro niveles de medida

- Medida nominal - Medida ordinal

- Medida de intervalo - Medida de razón o racional

• Variables cuantitativas (niveles de intervalo y racional) - Tienen en común:

o Los datos pueden clasificarse según su orden creciente o decreciente o Es posible medir una distancia entre dos valores

§ 1r ejemplo: salarios: la diferencia entre € 1'800 y € 1'500 es la

misma que entre € 2'300 y € 2'000

§ 2º ejemplo: temperaturas en ºC: La diferencia entre 10 ºC y 20 ºC es la misma que entre 30 ºC y 40 ºC

- Diferencia entre los niveles de intervalo y racional:

Page 11: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 11

o Medida de intervalo § Temperaturas en ºC:

§ Relaciones entre dos valores no tienen un significado particular. 20 ºC no es dos veces más calor que 10 ºC.

§ El valor 0 ºC es arbitrario. No significa una ausencia total de calor. 20 ºC / 10 ºC = 2. Pero, las mismas temperaturas en ºF: 68 ºF / 50 ºF = 1.36

o Medida de razón : Valor de cero tiene un significado especial. Salarios:

0 significa una ausencia total de salario.

Page 12: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 12

Tema 2. Medidas de posición

Estadística descriptiva univariable

• Herramientas para presentar y resumir el contenido de variables aisladas

• Presentar la distribución de una variable

• Resumir las características de una distribución con medidas estadísticas

Tabla de frecuencias

• Las frecuencias muestran el número de casos que corresponden a cada valor de la variable

• Ejemplo: frecuencia de la variable sexo en el grupo de estudiantes de estadística descriptiva:

Género Frecuencia (f)

Hombres 55

Mujeres 44

Total (N) 99

Porcentajes

• Los porcentajes indican cuál sería la frecuencia de cada categoría de la variable si el número total de observaciones fuese cien.

Page 13: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 13

• Ejemplo: Frecuencia de la variable sexo en el grupo de estudiantes de Estadística descriptiva (aula 1).

• Porcentaje = (f / N) × 100

- f: Frecuencia de la categoría

- N: Número total de observaciones.

• Ventaja de los porcentajes: - Es más fácil de identificar su significado - Permite comparar el tamaño de las categorías.

• Porcentaje acumulado: porcentaje de todos los casos igual o inferior a un cierto valor de la variable - Sólo tienen sentido con variables cualitativas de medida ordinal y variables

cuantitativas (es decir, de intervalo o de razón).

Page 14: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 14

Datos perdidos (missing cases)

• Cuando se analizan datos “reales”, frecuentemente hay observaciones para

los que no sabemos el valor de una o más variables.

• Esto es a menudo el caso con datos de encuestas. Siempre hay algunas personas que no responden a una pregunta.

• Ejemplo: Variable estado civil de la encuesta European Social Survey (ESS)

- Categorías de respuesta: o Casado/a

o Separado/a o Divorciado/a o Viudo/a o Soltero/a

- Categorías adicionales: o No contesta o No sabe o No respuesta

• Cuando hay datos perdidos, se hace una distinción entre los porcentajes “normales” y los porcentajes válidos.

Page 15: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 15

• Los porcentajes válidos se calculan sin tener en cuenta las categorías de valores perdidos.

• La distinción entre diferentes tipos de valores perdidos (no sabe, no respuesta, etc.) se ignora a menudo.

• Es posible agrupar estas observaciones en una categoría general de datos

perdidos.

• No hay una definición absoluta de lo que representa datos perdidos. Depende

de la cuestión de investigación. - Ejemplo: intenciones de voto en la próxima elección: "No sabe":

o Datos perdidos si el objetivo es explicar a qué partido votar.

o Datos válidos si el objetivo es explicar que personas tienen o no una preferencia.

Tablas para variables continuas

• Ejemplos anteriores: variables categóricas, número limitado de valores

diferentes.

Page 16: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 16

• Con variables continuas (o variables categóricas con muchas categorías), las tablas de frecuencias no son muy útiles. Es necesario agrupar los valores en

categorías. - Ejemplo: variable edad en los datos ESS.

• Por lo tanto agrupamos los datos:

• Es necesario agrupar los valores en categorías.

• No existe una regla absoluta sobre cómo agrupar los valores de una variable.

Page 17: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 17

• Encontrar un equilibrio entre: - Demasiadas categorías (número muy pequeño de observaciones en cada

categoría) - No suficiente categorías (significa perder una gran cantidad de información

de la variable original).

• En general, una dosis de sentido común es suficiente. Construcción de tablas de frecuencias

• Título claro y completo

• Las filas y las columnas deben tener títulos claros y describir su contenido de manera correcta. Es importante comunicar claramente las unidades utilizadas (sobre todo indicar si son porcentajes)

• Incluir el número total de observaciones

• Indicar la fuente de los datos.

• Número de decimales: Generalmente, un decimal es suficiente. Siempre utilizar el mismo número de decimales para todas las entradas en una

columna.

• Redondeo: por convención, cifras inferiores del 5 se redondean por debajo y cifras iguales o superior del 5 se redondean arriba.

- Ejemplos: 17.34 à 17.3, 17.35 à 17.4.

• No escribir el símbolo % después de cada porcentaje (indicarlo en el título de la columna).

Page 18: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 18

• No utilizar líneas verticales.

• Evitar poner demasiado líneas horizontales.

Medidas de tendencia central

• Calcular frecuencias y porcentajes es una forma de resumir la información disponible sobre las variables de interés.

• A menudo, queremos resumir la información más a fondo, particularmente con variables cuantitativas.

• Se utilizan dos tipos de estadísticos: - Medidas de tendencia central (o “de centro”, o “de posición”): centro de

gravedad de una distribución. - Medidas de dispersión: carácter disperso o concentrado de la distribución.

Moda

• La moda de una distribución se define como el valor más frecuente.

• Es posible que una variable tenga dos o más modas.

• Para una variable con un número relativamente pequeño de categorías, la moda se puede identificar fácilmente en una tabla de frecuencias.

• Si una variable puede tomar muchas variables diferentes, la moda es menos informativa.

- Ejemplo: edad en los datos ESS.

Page 19: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 19

o Moda = 35 años (2.11% de las observaciones). Hay varias otras edades con un número de observaciones casi igual.

• Con datos agrupados en clases o categorías, solo es posible determinar la

clase modal. - Ejemplo: ingreso en los datos del ESS.

• La clase modal es muy sensible a la definición (arbitraria) de los intervalos de valores.

Media

• Es la medida de tendencia central más utilizada

• La media es igual a la suma de todas las observaciones dividida por el número de observaciones

• Cálculo: - X: una variable (aquí: la edad) - X1: valor de la variable X en la primera observación,

- X2: valor de X en la segunda observación, etc. - N: número total de observaciones

Page 20: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 20

- X: media de la variable X

( ) NXXXXXXXXXXX 10987654321 +++++++++=

Page 21: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 21

• Media con datos agrupados: - Cuando se trabaja con datos agrupados en intervalos o clases, no es

posible calcular el valor exacto de la media. - Pero podemos hacer una aproximación de la media. - Ejemplo: datos sobre el ingreso, datos ESS. Intervalos de ingreso:

o Menos de €150

o Entre €150 y menos de €300 o Entre €300 y menos de €500

o Etc. - Se da un valor asignado: Valor en medio del intervalo

o €1000-€1500 à €1250 o €1500-€2000 à €1750

- ¿Valores asignados para las primera y última categorías? o Menos de €150 à €150 o €10.000 o más à €10.000

Page 22: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 22

• Problemas con la media: - A veces, la media puede ser un indicador problemático.

- La media puede estar fuertemente influenciada por valores extremos (observación atípica o “outlier”).

• Alternativa: la mediana (Me). - Mediana: Valor de la observación que se encuentra en medio de la

distribución, por lo que hay el mismo número de observaciones en cada lado.

Mediana

• Para encontrar la mediana: ordenar las observaciones en orden ascendente

• Número impar de observaciones: la mediana es el valor de la observación (N +1)/2.

• Ejemplos: - Primer grupo de alumnos: 18 19 20 20 21 21 21 22 22 22 23

- Segundo grupo de alumnos: 18 19 20 20 21 21 21 22 22 23 51

• Si el número de observaciones es par, la mediana es la media de las observaciones (N/2) y (N/2 + 1).

• Ejemplo:

- Tercer grupo de alumnos: 18 18 19 19 20 20 21 22 22 22 23 23 - Me = 20.5

• La mediana es el valor de la variable para el cual el porcentaje acumulado supera el 50%.

Page 23: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 23

• Ejercicio: Ránking de CCA según PIB per cápita anual (2015)

• Mediana con datos agrupados: - Con datos agrupados, no podemos determinar exactamente la mediana. - Problema similar al cálculo de la media con datos agrupados. - Utilizando los porcentajes acumulados, es fácil determinar en qué intervalo

está la mediana. Este intervalo se llama la clase mediana.

Page 24: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 24

• ¿Cómo podemos determinar con mayor precisión el valor del ingreso mediano?

- Debemos hacer una suposición sobre la distribución de las observaciones dentro de los intervalos de ingresos.

- Se supone que los individuos se distribuyen de manera uniforme. Es decir, se supone que hay tantas personas que ganan entre 1500 y 1600, como personas que ganan entre 1600 y 1700, entre 1700 y 1800, etc.

- Sabemos que el 46,4% de las personas ganan menos de 1500 euros y que el 58,7% de las personas ganan menos de 2000 euros.

- ¿Cuál es el ingreso que ganan menos del 50% de la gente?

Page 25: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 25

Forma de una distribución

• Con muchas variables, la mediana y la media dan indicaciones similares. Esto

sucede cuando la distribución de los valores de una variable es simétrica.

• “Una distribución es simétrica si los lados derecho e izquierdo del histograma son aproximadamente imágenes especulares el uno del otro” (Moore: 14).

• Ejemplo típico de una distribución simétrica: distribución en forma de campana

(distribución normal o Gaussiana).

• Una gran discrepancia entre la mediana y la media es un signo de que la distribución es asimétrica.

• Distribución asimétrica hacia la derecha o positiva: - La cola de la derecha se extiende mucho más lejos que la cola de la

izquierda. - Mediana < media.

Page 26: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 26

• Distribución asimétrica hacia la izquierda o negativa: - La cola de la izquierda es más larga que la cola de la derecha.

- Media < mediana.

• Distribución asimétrica:

- Hay observaciones atípicas a la izquierda (distribución asimétrica hacia la izquierda) o a la derecha (distribución asimétrica hacia la derecha).

- Estas observaciones “tiran” la media en su dirección. - Ejemplo: variable ingreso (ESS). Gran diferencia entre la media (2160€) y la

mediana (1646€).

- à Distribución asimétrica hacia la derecha.

Page 27: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 27

Tema 3. Medidas de dispersión

Medidas de dispersión

• Indican si las observaciones están muy concentradas alrededor de la media o mediana o si los valores observados están muy dispersos o distantes en relación a la medida de tendencia central.

• Ejemplo: distribución de la edad en dos muestras de personas, población

general y estudiantes en la universidad.

Amplitud

• Amplitud (o "rango", o "recorrido"): diferencia entre los valores mayor y menor.

• Amplitud = observación más grande – observación más pequeña

• La amplitud es muy sensible a la presencia de valores atípicos

Page 28: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 28

Cuartiles

• Mediana: divide las observaciones en dos partes iguales.

• Si dividimos las dos mitades en partes iguales, tenemos cuatro porciones de

igual tamaño.

• Los puntos que dividen la distribución de esta manera se denominan cuartiles.

• Ejemplo:

- 25% obs. < primer cuartil (Q1) - Q1 < 25% obs. < Me (= Q2) - Me < 25% obs. < Q3 - 25% > Q3

• La amplitud intercuartil es la distancia entre el primer cuartil y el tercer cuartil.

• Se llama también la amplitud intercuartílica o el rango intercuartil/intercuartílico.

• La amplitud intercuartil no es sensible a la presencia de valores atípicos. • Ordenar las observaciones en orden creciente y localizar la mediana (Me).

• El primer cuartil (Q1) es la mediana de las observaciones situadas a la izquierda de la mediana global.

• El tercer cuartil (Q3) es la mediana de las observaciones situadas a la derecha de la mediana global.

Page 29: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 29

Desviación estándar o típica

• La manera más común para resumir la dispersión de una variable consiste en

calcular una diferencia media entre las observaciones y el valor medio.

• Hay diferentes posibilidades para resumir las diferencias entre las observaciones y el valor medio. La medida de dispersión más común se llama

la desviación estándar o desviación típica (s).

• El cálculo de este estadístico requiere varios pasos. Base para el cálculo de la desviación típica: diferencia entre cada observación y el valor medio.

- Desviación = 𝑋" − 𝑋 - ¿Como resumir estas desviaciones? - Desviación media:

𝑋" − 𝑋$"%&

𝑁 = 0

• Dos posibilidades para resumir las desviaciones:

- Calcular desviaciones absolutas, o - Calcular desviaciones cuadráticas.

Page 30: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 30

• Desviaciones absolutas: valores de las desviaciones sin tener en cuenta los signos positivos o negativos.

- Desviación media absoluta:

1𝑁 𝑋" − 𝑋

$

"%&

• Desviaciones cuadráticas: elevar cada desviación al cuadrado. - Desviación cuadrática media:

1𝑁 𝑋" − 𝑋 +

$

"%&

• Si trabajamos con datos de una muestra, la desviación cuadrática media no es un buen indicador de dispersión de la población.

• La desviación cuadrática media calculada a partir de datos de una muestra subestima la desviación de la población.

• Si el objetivo es estimar la desviación en la población, se calcula la varianza en lugar de la desviación cuadrática media.

Page 31: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 31

( )∑=

−−

==N

ii XX

NVarianzas

1

2

11

Varianza

• Diferencia entre la varianza y la desviación cuadrática media: las desviaciones

se dividen por N – 1.

• Varianza (denotada s2)

• La desviación estándar (s) es la raíz cuadrada de la varianza:

• La escala de la desviación típica es la misma que la escala de la variable que se resume.

- Ejemplo: datos sobre la altura en centímetros. Una desviación estándar de 20,5 significa 20,5 centímetros.

Page 32: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 32

Xs

CV x=

• La varianza, en cambio, no estará en centímetros o metros.

• La desviación estándar da información sobre la distancia típica entre una observación y el valor medio. Esta información permite decir algo sobre el

carácter de la distribución de una variable.

• Con variables menos familiares, una interpretación intuitiva es difícil.

• Es importante comparar la desviación estándar y la media. - Ejemplo: datos sobre los gastos mensuales de dos grupos de personas

sobre las compras de libros: o Grupo 1: = 15 €, s = 5 €. o Grupo 2: = 40 €, s = 5 €.

- ¿En qué grupo es la variabilidad de los gastos más alta? En términos

relativos, podemos decir que hay una mayor variabilidad en el primer grupo. En el segundo grupo, las observaciones son más homogéneas.

Coeficiente de variación

• Para comparar la desviación estándar y la media, se puede utilizar el coeficiente de variación (o “desviación estándar relativa”). - Coeficiente de variación (CV):

- A veces, el CV se multiplica por 100 para expresarlo como un porcentaje.

• La media es más representativa cuanto menor sea el CV, es decir cuanto menos dispersión presente la distribución.

Page 33: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 33

Variables tipificadas

• A veces, queremos expresar los valores de una variable de una manera que

sea más fácil de comparar los valores individuales con el resto de la distribución.

• Por ejemplo, podemos querer comparar las notas de un estudiante en dos cursos: - Filosofía política: 7/10

- Estadística: 8/10

• ¿Es el estudiante mejor en estadística que en la filosofía política?

• En otras palabras, ¿es el éxito del estudiante, en comparación con los otros estudiantes, mejor en la filosofía política que en estadística?

• Por esto, necesitamos saber algo sobre la distribución de las notas en las dos clases.

• Podemos expresar el éxito del estudiante de manera más directa mediante la estandarización de las variables.

• La normalización, estandarización o tipificación de una variable significa un cambio de su escala, por lo que se expresa en relación a la distribución de la

variable.

Page 34: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 34

X

ii s

XXZ

−=

2157=

−=FPZ 1

5.15.68=

−=EZ

• Una variable tipificada es igual a la variable menos su media y dividido por su desviación estándar:

• Aplicando esta fórmula a las notas del estudiante:

• La nota de filosofía política es dos desviaciones estándar por encima de la media. La nota de estadística es una desviación estándar por encima de la media.

• El éxito del estudiante es mejor en la filosofía política que en estadística.

• Variables tipificadas siempre tienen una media de 0 y una desviación estándar de 1

Page 35: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 35

Tema 4. Herramientas de Representación Gráfica

Tipos de variables y formas de representación gráfica

• Variables categóricas: - Medida nominal u ordinal. - Son variables discretas. En la mayoría de los casos, el número de valores

diferentes es bastante limitado.

• Dos tipos de gráficos: - diagramas de sectores - diagramas de barras

• Ejemplo: Estado civil, datos European Social Survey (ESS).

Diagrama de sectores

Page 36: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 36

• Con variables nominales.

• Una de las formas más frecuentes de visualizar la distribución de datos categóricos.

• Se utiliza con frecuencia en las publicaciones no científicas.

• Este tipo de gráfico tiene desventajas importantes. Difícil comparar el tamaño de los grupos.

• Es posible añadir más información en el gráfico. Por ejemplo: tamaño de las diversas categorías.

• Cómo ordenar los sectores: no hay reglas absolutas para decidir.

Dependiendo del programa utilizado, estas se presentarán, por ejemplo, por tamaño o según el valor numérico de las categorías de la variable.

• El otro tipo de gráfico para representar la distribución de una variable

categórica es un diagrama de barras.

Diagrama de barras

Page 37: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 37

• Cada categoría de la variable se representa con una barra

• La altura de la barra es proporcional al tamaño de la categoría.

• La escala del eje vertical puede indicar frecuencias o porcentajes

• También es posible añadir etiquetas por cada barra que indican el número de observaciones o el porcentaje de observaciones en esta categoría.

¿Gráficos o tablas?

• Indica cuál es el gráfico más adecuado para la presentación de los siguientes tipos de variables:

- Ránking de 10 países de la UE con más número de refugiados acogidos

→ Barras

- Continente de procedencia de los refugiados acogidos por Alemania →

Sectores (si fueran países sería mejor de barras)

- Comparativa de tasas de paro por sexo y país entre EEUU, Canadá y

México. → Barras

Page 38: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 38

• Muestra una información muy difusa, necesitaríamos otro tipo de gráfico

Gráficos para variables cuantitativas

• Variables categóricas: Diagramas de sectores y diagramas de barras.

• Variables cuantitativas: histogramas y diagramas de caja. Otros: gráficos de evolución temporal y mapas estadísticos.

• Tipo de gráfico más común: histograma.

• Ejemplo: distribución de la edad en los datos de la encuesta ESS.

Page 39: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 39

Histograma

• Cada columna representa un intervalo de valores de la variable.

• No hay espacios entre las barras.

• Eje vertical: porcentaje o número absoluto de observaciones.

• Eje horizontal: corresponde a la escala de la variable y representa los diferentes valores en orden ascendente.

• Primer ejemplo: intervalo de valores de 1 año.

• Es más común utilizar un número más pequeño de intervalos de valores.

• No hay una sola elección correcta del número de clases de un histograma.

• El área de las columnas debe ser proporcional al número de observaciones en la categoría.

• Cuando se dibuje un histograma con un programa estadístico, cada columna

tendrá la misma anchura.

• No es posible hacer un histograma estándar con una variable agrupada que tiene intervalos de varias amplitudes

Diagrama en caja

• Cinco números importantes para resumir una distribución: valor mínimo, primer cuartil, mediana, tercer cuartil, valor máximo.

Page 40: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 40

• Un diagrama de caja representa estos valores de manera gráfica.

• Ejemplo: distribución de la edad en España (datos ESS).

• Los diagramas de caja se pueden dibujar de forma horizontal o vertical

• La mediana sitúa el centro de la distribución

• Los cuartiles muestran la dispersión del 50% de los datos centrales.

• Los extremos muestran la dispersión de todos los datos.

• Un diagrama de caja también informa sobre la simetría o la asimetría de la distribución.

• Un diagrama de caja es particularmente útil para comparar la distribución de

una variable entre diferentes grupos de observaciones, o para comparar la

distribución de varias variables en el mismo grupo de observaciones.

- Ejemplo: distribución de la edad en España, por estado civil (datos ESS).

Page 41: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 41

• Cuando se dibuje un diagrama de caja, los valores atípicos normalmente no se incluyen en el intervalo de valores indicado por los bigotes. Estos valores se

representan con otros símbolos.

• La convención utilizada por SPSS es la siguiente:

- La longitud máxima de los bigotes es 1,5 veces la longitud de la caja (es decir, 1,5 veces la amplitud intercuartil).

- Valores más extremos se representan con símbolos. - Valores que se encuentran a una distancia del final de la caja de entre 1,5 y

3 veces la longitud de ésta se representan con círculos ("valores atípicos")

- Valores que se encuentran a una distancia del final de la caja de más de 3

veces la longitud de la caja se representan con estrellas ("valores extremos")

Page 42: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 42

Gráfico de evolución temporal

• ¿Cuál será el tipo de gráfico más adecuado para representar las siguientes variables? - Evolución del índice de participación electoral en los últimos 20 años en las

elecciones generales españolas → Gráfico de evolución temporal

- Distribución de población por grupos de edad quinquenales → Histograma

- Comparación de la distribución de trabajadores por sectores de

producción y edad en Cataluña → Diagrama de caja

- Primera fuerza política por Comunidad Autónoma en la últimas elecciones

generales → Mapa estadístico

Uso correcto de los gráficos

• Es importante que la figura tenga un título claro.

• Los ejes, así como las categorías, también deben tener etiquetas. • Debe haber información suficiente para que el lector entienda lo que está en el

gráfico. • Tener cuidado con el uso de los colores (¡La mayoría de los documentos se

imprimen en blanco y negro!).

Page 43: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 43

Tema 5. Estadística Descriptiva Bivariable con

Variables Categóricas Relaciones entre variables categóricas

• La relación entre dos variables categóricas se analiza mediante una tabla de contingencia.

• Una tabla de contingencia muestra la frecuencia de cada combinación de valores de las dos variables.

• Ejemplo: - Dos preguntas de la encuesta ESS (solo las observaciones de España):

o Cuanto menos intervenga el gobierno en la economía, mejor será para España

o El crecimiento económico siempre acaba dañando el medioambiente - Categorías de respuesta:

o De acuerdo o Ni de acuerdo ni en desacuerdo o En desacuerdo

• Porcentajes: - Para las distribuciones marginales, los porcentajes son idénticos a los

porcentajes de una tabla de frecuencia.

Page 44: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 44

- Para las combinaciones de valores de las dos variables: o Porcentajes del total, o

o Distribuciones condicionales.

Distribuciones condicionales

• Para examinar si hay una relación entre las variables, se calculan distribuciones condicionales.

• Una distribución condicional es la distribución de una variable por un valor dado de otra variable.

• Ejemplo: la distribución de la opinión sobre la intervención del gobierno en la economía dado que una persona está en desacuerdo con la proposición que

el crecimiento económico daña el medioambiente. • Las distribuciones condicionales son útiles para ver si existe una relación entre

dos variables.

• Dependido de que variable sea la variable dependiente e independiente, se utilizan porcentajes por columna o por fila.

a) Si x (variable columna) → y (variable fila)

→ Porcentajes por columna

Page 45: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 45

• Ejemplo: deseamos ver si la opinión sobre el rol económico del gobierno influye en la opinión sobre el medioambiente.

b) Si x (variable fila) → y (variable columna)

→ Porcentajes por fila

• Ejemplo: deseamos ver si la opinión sobre el medio ambiente influye en la opinión sobre el rol económico del gobierno.

Tablas de contingencia: Tipos de relaciones

• Ejemplo: Relación entre la edad (variable independiente) y el nivel de interés político (variable dependiente).

Page 46: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 46

• Relación positiva perfecta

• Relación negativa perfecta

• No relación: - Si no hay ninguna relación entre las variables, las distribuciones

condicionales serán iguales a las distribuciones marginales. - Recuentos esperados: números de observaciones que esperamos si no

hay ninguna relación entre las variables. - Recuento esperado = (N fila * N columna) / N tabla

Page 47: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 47

• Ejercicio

• Ji Cuadrado

- Los recuentos esperados son el elemento central para determinar si dos variables están relacionadas.

- Si hay una relación entre dos variables, habrá diferencias importantes entre los recuentos observados y los recuentos esperados.

- Estadístico para resumir las diferencias entre los recuentos observados y

esperados: Ji cuadrado.

- Si no hay ninguna relación entre las variables, los recuentos observados son iguales a los recuentos esperados y el Ji cuadrado es igual a 0.

( )∑= esperado recuento

esperado recuento - observado recuento 22χ

Page 48: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 48

02 =χ

02 >χ

- Si hay diferencias, existe relación entre variables y el valor de Ji cuadrado es superior a cero.

- Para interpretar el valor del Ji cuadrado, es necesario tener en cuenta el tamaño de la tabla de contingencia.

- Condiciones mínimas: todos los recuentos mayores de 1 y no menos del 20 % menores de 5.

Construir e interpretar tablas de contingencia

• Las tablas de contingencia se pueden construir con cualquier tipo de variable. Pero son más frecuentes (y más útiles) con variables categóricas (nominales u ordinales).

• Con variables nominales, el orden de las columnas o filas es arbitrario. Con variables ordinales, el orden debe corresponder al orden ascendente o descendente de las categorías de la variable.

• Los conceptos de relaciones positivas y negativas solo tienen sentido con variables ordinales (o cuantitativas).

• Con variables cuantitativas, es mejor agrupar los valores en un número más

pequeño de categorías.

• Normalmente, los datos perdidos no se incluyen en una tabla de contingencia.

Page 49: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 49

• No hay una regla absoluta para decidir que variable es la variable fila o columna. A menudo, la variable columna es la variable con el número más

pequeño de categorías. Estadística bivariable: tipos de relación

• Relación entre una variable categórica y una variable cuantitativa

- Ejemplo: relación entre el sistema electoral (mayoritario, proporcional o mixto) y el número de partidos políticos: o X: sistema electoral (variable categórica). o Y : número de partidos (variable cuantitativa).

- Comparar los valores medios de la variable dependiente por cada categoría de la variable independiente.

o Hay herramientas estadísticas para medir la fuerza de este tipo de

relaciones (por ejemplo: coeficiente η2)

Page 50: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 50

- Qué herramienta se puede utilizar para establecer relación entre variable o Tabla de contingencia por distribuciones condicionales:

x (ideología política) y (problema más importante) Contraste de valor observado y esperado (porcentajes por columna)

o La prueba del Ji cuadrado no puede aplicarse puesto que más del 20 % de casos observados son menores de 5.

Page 51: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 51

Tema 6. Estadística Descriptiva Bivariable con

Variables Numéricas Estadística bivariable: tipos de relación

Relación entre variables cuantitativas

• Para identificar las características de una relación entre dos variables cuantitativas, lo más simple es representar esta relación de manera gráfica.

• Tipo de gráfico más común: diagrama de dispersión. - Ejemplo: Relación entre el PIB y el nivel de corrupción.

Page 52: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 52

• Diagrama de dispersión: - Muestra la relación entre dos variables cuantitativas medidas en los

mismos individuos. - Cada individuo aparece como un punto del diagrama - Un individuo puede ser: persona, Estado, ciudad, escuela… - Los valores de una variable aparecen en el eje horizontal (abscisas) y los de

la otra en el eje vertical (ordenadas). - Por ejemplo, en estos datos España tiene un PIB de 21460 $ y un nivel de

corrupción de 2.9 (0=no corrupción, 10=mucha corrupción). - Cuando se construye un diagrama de dispersión, la convención es situar:

o Variable independiente (x): eje horizontal o Variable dependiente (y): eje vertical

- Esta convención se utiliza siempre. También si no hay una relación de causalidad muy clara.

- En este ejemplo, supongamos que el nivel de corrupción (Eje Y) depende del nivel de desarrollo económico (Eje X).

- Cuatro cosas se pueden ver en un diagrama de dispersión: o La forma de la relación, o La dirección de la relación, o La fuerza de la relación, o La presencia de observaciones atípicas.

• Forma de relación: - La forma de la relación depende de cómo estas variables están

relacionadas.

- La forma más intuitiva es una relación lineal: los puntos del diagrama de dispersión se sitúan aproximadamente a lo largo de una recta.

- Ejemplo de relación lineal: Corrupción y PIB.

Page 53: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 53

• Dirección de la relación: - Una relación lineal puede ser positiva o negativa. - La asociación es positiva cuando los valores altos de las dos variables

tienden a ocurrir simultáneamente. - La asociación es negativa cuando los valores altos de una variable tienden

a coincidir con los valores bajos de la otra. - PIB y corrupción: asociación negativa. Un valor más alto del Producto

Interno Bruto tiende a ir acompañado de un valor más bajo del índice de corrupción.

- Ejemplo relación positiva:

Page 54: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 54

- Ejemplo relación negativa:

• Fuerza de la relación: - La fuerza de una relación lineal entre variables es determinada por la

proximidad de los puntos del diagrama a la recta que resume la relación. - Si la dispersión de los valores de la variable dependiente para un valor

dado de la variable independiente es más grande, la relación es más débil.

Page 55: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 55

• Relaciones no lineales: Muchas otras formas de relaciones son posibles: - Relación curvilínea

- Relación exponencial

- Relación logarítmica - Etc.

• Medir relaciones lineales: - Con diagramas de dispersión, se pueden identificar las características más

importantes de una relación.

Page 56: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 56

- Para caracterizar de manera más exacta las propiedades de la relación (lineal) entre variables, es necesario resumirlas con estadísticos.

- El estadístico central para resumir la fuerza y la dirección de una relación: coeficiente de correlación.

• De un gráfico a un estadístico: - Relación lineal positiva: Una relación lineal es positiva cuando valores altos

de las dos variables tienden a ocurrir simultáneamente.

- Relación lineal negativa: Una relación lineal es negativa cuando valores altos de una variable tienden a coincidir con valores bajos de la otra.

• ¿Cómo es posible caracterizar esta propiedad de manera más exacta? - Una posibilidad es comparar los valores de las diferentes observaciones

con el valor medio de la variable. Da un criterio más preciso para determinar que valores de la variable son bajos o altos.

- Entonces: una relación es positiva si los valores de una variable superiores a su valor medio tienden a coincidir con valores de la otra variable superiores a su propia media.

- Las diferencias entre los valores de una variable y el valor medio se llaman desviaciones (𝑋" − 𝑋 ).

Page 57: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 57

( )( )YYXX ii −−

( ) ( )( )∑ −−=N

ii YYXXN

YX1

1,cov

- Entonces: Hay una asociación positiva cuando desviaciones positivas de las dos variables tienden a ocurrir simultáneamente.

- De esta manera, hemos reemplazado una definición intuitiva con una definición más exacta, basada la en términos estadísticos.

- Para ver si el valor positivo o negativo de las desviaciones de una variable tienden a coincidir con desviaciones del mismo signo en la otra variable, podemos multiplicar las desviaciones de cada observación:

o Si = posiitu → Dirección de la relación positiva

o Si = negatiu → Dirección de la relación negativa

• Covarianza:

- La covarianza es el valor medio de los productos de las desviaciones:

- Una covarianza positiva indica una relación positiva. - Una covarianza negativa indica una relación negativa. - El signo de la covarianza se puede interpretar. Pero su valor no se puede

interpretar fuera de contexto. Este depende de las unidades de medida de las variables.

- Ejemplo 1:

( )( )YYXX ii −−

( )( )YYXX ii −−

Page 58: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 58

- Ejemplo 2:

Page 59: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 59

( )YX

xy ssYX

r,cov

=

• Coeficiente de correlación: - El coeficiente de correlación es una transformación de la covarianza.

- La correlación es igual a la covarianza dividida por el producto de las

desviaciones estándares. - Valor entre 0 y 1

o Cerca de 1→ alta correlación

o Cerca de 0 → baja correlación

- La correlación es equivalente a la covarianza de las variables tipificadas.

• Interpretación de la correlación: - La correlación exige que las dos variables sean cuantitativas. - La correlación entre X y Y es la misma que entre Y y X.

Page 60: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 60

( )∑=

−N

ii XX

N 1

21

( )∑=

−−

=N

ii XX

Ns

1

22

11

( )YX

xy ssYX

r,cov

=

- La correlación no varía cuando cambiamos las unidades de medida de las variables (toma valores entre -1 y 1)

- Una correlación positiva indica una asociación positiva entre las variables. Una correlación negativa indica una asociación negativa.

- La correlación mide la fuerza, pero no la forma de una relación lineal entre dos variables.

- La correlación mide la dirección (signo) y la fuerza (valor). Pero una correlación de 0.8 no indica una relación “más positiva” que una

correlación de 0.4.

• Correlación: muestra vs. población - En una clase anterior, hemos visto que la dispersión de una variable se

puede medir de maneras diferentes. - Con datos de toda la población, se calcula la Desviación cuadrática media:

- Con datos de una muestra, la desviación en la población se puede aproximar con la varianza:

- De manera semejante, la correlación no se calcula de la misma manera si

trabajamos con datos de la población o con datos de una muestra.

- La formula general siempre es la misma:

- Pero, las desviaciones estándares y la covarianza se calculan de manera diferente a partir de una muestra.

Page 61: Universidad Pompeu Fabra Ciencias Políticas y de la ... · Metodología Cuantitativa II Sílvia Caufapé Hostench Universitat Pompeu Fabra 2 Guion de la Asignatura Tema 1. Introducción

Metodología Cuantitativa II Sílvia Caufapé Hostench

Universitat Pompeu Fabra 61

• Observaciones atípicas: - Las observaciones atípicas son valores individuales que quedan fuera del

aspecto general de la relación. - Las observaciones atípicas pueden tener una gran influencia sobre la

correlación u otros estadísticos que se pueden calcular para resumir las características de la relación entre dos variables.