Tema 3Aplicación de los modelos matemático-estadísticos a la investigación social y la medición en las ciencias sociales
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
EL PROBLEMA DE LA MEDICIÓN EN EL ANÁLISIS SOCIAL
Punto de partida: isomorfismo entre la realidad social y los axiomas matemáticos
Para medir correctamente un objeto o hecho debe de existir Una igualdad entre las operaciones que se pueden hacer con Los números y las que se pueden realizar con los propios objetos o hechos
El problema de múltiples paradigmas teóricos deviene en un problema metodológico. Falta de definiciones conceptuales unívocas que resulten operativas
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
EL PROCESO DE MEDICIÓN
Definición: (Stevens) Procedimiento de asignación de numerales a objetos o acontecimientos de acuerdo con ciertas reglas. Es decir, medir es asignar números a objetos o eventos en modo de significado y de acuerdo a unas reglas, para que presenten sus propiedades y relaciones. Estas son fundamentales porque determinan el tipo de operaciones matemáticas que es posible realizar con cada medición
EL PROBLEMA DE LA MEDICIÓN EN EL ANÁLISIS SOCIAL
Esta problemática se refleja en tres aspectos fundamentales:
Medir fenómenos no directamente observables, felicidad, opiniones, valores...es necesario localizar las asociaciones o efectos de éstos
Medir fenómenos de naturaleza cualitativa, separar las dimensiones y buscar indicadores o medirlos sólo parcialmente
Falta de instrumentos de medida generalizados, se hace necesaria una construcción ad hoc y además su validez es transitoria debido a la dinámica intrínseca de los fenómenos sociales
EL PROCESO DE MEDICIÓN
ETAPAS BASICAS: Definición del objeto de medición Operacionalización a partir de la definición
PASOS TECNICOS: Dar un significado al concepto Identificación de dimensiones Creación y selección de indicadores Especificación de la relación entre indicadores y conceptos Construcción de escalas Aplicación de escalas Obtención de datos Criterios para la definición y operacionalización de conceptos
Especificar claramente las definiciones utilizadas Utilizar las definiciones empleadas más frecuentemente Bondad de las definiciones e indicadores: validez y fiabilidad
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Proceso de medición y escalas
Escala: constructo o esquema relacional para la obtenciónde datos y que, a su vez, condiciona las operaciones que sePueden llevar a cabo con los mismos.
Los diferentes tipos de escala se configuran en función de los distintos supuestos numéricos que se puedan asumir. En este sentido, los datos obtenidos podrán ser aplicables a un mayor o menor número de análisis, respecto a estos mismos supuestos numéricos
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Definición
Las escalas se configuran como órdenes o constructos, que permiten atribuir números a fenómenos que observamos,convirtiéndolos en datos que podemos manejar según unas reglas. Son precisamente estas reglas las que constituyen y diferencian cada tipo de escala.
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Criterios para la elaboración de escalas
1 Si una variable puede ser medida a partir de distintas escalas deberemos optar por el nivel de medida que posibilite utilizar los test estadísticos más poderosos -potentes, - con este concepto nos referimos a la capacidad o fuerza matemática de una técnica para rechazar la hipótesis nula-.
2 El criterio que debe de guiar la elección de cada escala es conseguir medir el fenómeno con la máxima precisión
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Criterios para la elaboración de escalas
Ejemplo: “asistencia al cine” como indicador del “Nivel cultural”, puede ser medido utilizando diferentes escalas:
NOMINAL : ¿Va usted al cine ?1 Si2 NO
ORDINAL : ¿Con qué frecuencia va usted al cine?1 Todos y casi todos los días2 Una vez a la semana3 Varias veces al mes4 Una vez al mes5 Casi nunca o nunca
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Criterios para la elaboración de escalas
Ejemplo: “asistencia al cine” como indicador del “Nivel cultural”, puede ser medido utilizando diferentes escalas:
INTERVALO : ¿Cuántas veces, al mes, va al cine?
RAZÓN : ¿Cuántas veces, al mes, va al cine?
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
INFORMACION DE LOS NIVELES DE MEDICIONINFORMACION DE LOS NIVELES DE MEDICION
De este modo la calidad y cantidad de información recogidaPor cada tipo de escala es diferente
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Estrategias para diferenciar tipos de escalas
Tienen más de dos categorías
si
si
si
no
no
noEscala dicotómica
Escala de intervalo o razón
Escala ordinal
Escala nominal
La distancia entre las categorías es la misma
Pueden ordenarse las categorías según rangos
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
INFORMACION DE LOS DISTINTOS NIVELES DE MEDICIÓN
Nivel de medición
Clasifica Ordena Unidades iguales
Cero absoluto
NOMINAL SI NO NO NO
ORDINAL SI SI NO NO
INTERVAL SI SI SI NO
RAZÓN SI SI SI SI
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
ANÁLISIS ESTADÍSTICO Y NIVEL DE MEDICIÓN
Nivel de medición
MODA MEDIANA MEDIA
NOMINAL SI NO NO
ORDINAL SI SI NO
INTERVAL SI SI SI
RAZÓN SI SI SI
Nivel de medición Propiedades Operaciones
Nominal Igualdad o desigualdad entre las unidades de análisis. Equivalencia a=b; Simetría Si a=b, b=a; y Transitividad Si a=b y b=c entonces a=c
Equivalencia
Ordinal Igualdad y desigualdad entre las unidades de análisis, además diferencia en grado. Simetría Si a>b, b<a; y Transitividad Si a>b y b>c entonces a>c
Op. Rango
Intervalo Igualdad y desigualdad entre las unidades de análisis, además diferencia en unidades constantes, Pero no cero absoluto. Simetría Si a>b, b<a; y Transitividad Si a>b y b>c entonces a>c
Suma
Resta
Razón Igualdad y desigualdad entre las unidades de análisis, además diferencia en unidades constantes y cero absoluto. Simetría Si a>b, b<a; y Transitividad Si a>b y b>c entonces a>c
Suma
Resta
Multiplicación
División
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Diferencia entre escalas de intervalo y de razón
La diferencia de escalas de intervalo y de razón fue enunciada por Stevens
Tipo de escala Limite de la escala
Intervalo Sin cero absoluto (arbitrario)
Razón Con cero absoluto
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Diferencia entre escalas de intervalo y de razón
La diferencia de escalas de intervalo y de razón fue enunciada por Stevens
Tipo de escala Limite de la escala
Intervalo 1 2 3 4 5 6 7 8 9 10
Razón 0 1 2 3 4 5 6 7 8 9
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Diferencia entre escalas de intervalo y de razón
“Supongamos que dos individuos se sitúan en una escala de autoidentificación política ( de 0 a 9) con las puntuaciones de 2 y 4 respectivamente. En este caso, la puntuación del segundo es el doble de la del primero. Si alteramos el cero de la escala y lo situamos al nivel 1, la puntuación 2 se convertirá en 3 y la de 4 en 5. En este caso 5 no es el doble de 3”.
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Nivel de medición Descripción Estadísticos y gráficos
NOMINAL Valores no numéricos con
ausencia de orden entre ellos
Distribución de
frecuencias
Moda
Diagrama de barras
ORDINAL Valores no numéricos con
presencia de orden entre
ellos
Mínimo Máximo Mediana
Cuartiles Percentiles
Rango intercuartílico
Gráfico de Caja con
bigotes
INTERVALO
O RAZON
Cuantitativa discreta: únicamente puede tomar una cantidad finita o numerable de valores numéricos
Cuantitativa continua: puede tomar cualquier valor numérico en un intervalo
En escala de intervalo: únicamente tiene sentido la diferencia entre sus valores
Escala de razón: si, además de la diferencia, tiene sentido la razón entre sus valores
Media
Rango
Varianza
Desviación típica
Coeficiente de variación
Coeficiente de asimetría
Coeficiente de curtosis
Histograma
Gráfico de caja con
bigotes
Gráfico de tallo y hojas
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
El nivel de medición utilizado condiciona los procedimientos estadísticos a utilizar, y en sentido inverso la utilización de diversos procedimientos estadísticos exige determinados niveles de medición para su uso
EL PROCESO DE MEDICIÓN
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Introducción al Análisis Multivariable
Idoneidad de la aplicación del Análisis Multivariable bajo el principio de “Causación Múltiple”
Sinergia social
Principio de parsimonia informativa
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Análisis Multivariable: definiciones
Kendall: “Conjunto de técnicas estadísticas que analizan simultáneamente más de dos variables en una muestra de observaciones” Cuadras: “El Análisis Multivariable es una rama de la estadística y del análisis de datos que estudia interpreta y elabora el material estadístico sobre la base de un conjunto n>1 variables, que pueden ser de tipo cuantitativo, cualitativo o una mezcla de ambos ”
(September 6, 1907 March 29, 1983)
EL PROBLEMA DE LA MEDICIÓN EN EL ANÁLISIS SOCIAL
La base del Análisis Multivariable es el cálculo matricial.Las matrices se estructuran en:
Filas: unidades de análisis
Columnas: Variables
En ellas se recoge la información transformada en datos Numéricos correspondientes a las variables analizadas
Fases en el desarrollo del Análisis Multivariable
Elaboración de la matriz de datos
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Fases en el desarrollo del Análisis Multivariable
Elaboración de la matriz de datos
Depuración de datos
Análisis univariable: descriptivo y exploratorio
Análisis Bivariable
Análisis Multivariable
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Fases en el desarrollo del Análisis Multivariable
Criterios de clasificación de las Técnicas Multivariables
OBJETIVO O FINALIDAD DEL ANÁLISIS : Exploratorias y descriptivas Explicativas y confirmatorias
TIPO DE RELACIÓN ENTRE LAS VARIABLES Y NÚMERO DE VARIABLES (dependientes o independientes):
Técnicas de dependencia Técnicas de interdependencia
NIVEL DE MEDICION DE LAS VARIABLES: Técnicas paramétricas Técnicas no paramétricas
La combinación de estos tres niveles y sus respectivas categorías, da lugar a múltiples clasificaciones
TécnicasMultivariables
Propósito del
Análisis
Contrastes CorrelaciónMétodos
DescriptivosAjuste deModelos
Predicción dePertenencia
VD=1
Númerode VD
VD>1
VD=1
Nºde VD
VD>1
Reducción
dela
información
Tipo de
descripción
Clasificació
n
Sincrónico
Tipo de
Ajuste
Diacrónico
K=2
Nºde grupos
K>2
K=2
Nºde grupos
K>2
VI=1
Nºde VI
I>1
CTipo
N CTipo
N
T d
e S
tude
nt
Con
tras
tes
nopa
ram
étric
os
AN
OV
A
T d
e H
otel
ing
MA
NO
VA
R d
e P
ears
on
Cor
rela
ción
no
para
mét
rica
Reg
resi
ónM
últi
ple
Cor
rela
ción
Can
ónic
a
Aná
lisis
Dis
crim
inan
te
Aná
lisis
Fa
cto
ria
l
Esc
alas
Mul
tidi
men
sion
ales Aná
lisis
de
Co
rres
pon
denc
ia
s
Clu
ste
rA
nális
is
Mo
de
los
Cau
sale
s
Mod
elo
s de
Ser
ies
Te
mpo
rale
sA
RIM
A
Mod
elos
Log-
linea
les
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Supuestos paramétricos
Normalidad multivariable Homocedasticidad Tamaño muestral n>30 Linealidad Nivel de medición continuo
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Supuestos paramétricos
Normalidad multivariable
Un requisito de la mayor parte de los análisis multivariables es la normalidad multivariable, que a su vez incluye como condición la normalidad univariable. Este requisito es una condición necesaria pero no suficiente, ya que el hecho de que todas las variables se ajusten a la ley normal no implica que conjuntamente sigan una distribución normal multivariable. Es necesario, por tanto, que todas las variables se distribuyan normalmente para los valores dados de las otras variables.
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Supuestos paramétricosHomocedasticidad
Según este supuesto, las varianza de las variables implicadas en el análisis no puede ser significativamente diferente, en caso contrario se habla de heterodasticidad. En resumen, las variables incluidas en un mismo análisis deben presentar una varianza similar.
S21F = ___
S22Siendo S21>S22
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Supuestos paramétricos
Linealidad
Lleva implícita la aditividad y no multicolinealidad
Y = a + b1x1 + b2x2 + ...bkxk + e
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Supuestos paramétricos
Linealidad
La no multicolinealidad se refiere a que las variables independientes, no deben estar relacionadas entre sí
Y = a + b1x1 + b2x2 + ...bkxk + e
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Supuestos paramétricos
Tamaño muestral n>30
Tamaño a partir del cual los estadísticos son estables
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Supuesto paramétricos
Nivel de medición continuo
Los análisis paramétricos requieren el cálculo de parámetros, como la media, desviación típica, varianza
correspondientes únicamente a variables continuas
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Construcción de variables “Dummy”
Nivel de desarrollo regional
Variables dummy o ficticias
1 Subindustrial
2 Semi-industrial
3 Industrial
4 Postindustrial
Z1 Subindustrial (Si =1)(No=0)
Z2 Semi-industrial (Si =1)(No=0)
Z3 Industrial (Si =1)(No=0)
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Construcción de variables “Dummy”
Y = a + b1X1 + b2X2 + c1Z1 + c2Z2 + c3Z3
Y = (a + c1) + b1X1 + b2X2 SubindustrialY = (a + c2) + b1X1 + b2X2 Semi-industrialY = (a + c3) + b1X1 + b2X2 + c3 IndustrialY = a + b1X1 + b2X2 Postindustrial
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Construcción de variables “Dummy”
Categoría Variable
Casado
Variable Soltero
Variable
Viudo1 Persona
Casada1 0 0
2 Persona
Soltera0 1 0
3 Persona
Viuda0 0 1
4 Persona
Divorciada0 0 0
S o c i o l o g í a d e l a t e c n o l o g í a . U n i v e r s i d a d d e A l i c a n t e . S o c i o l
o g í
Construcción de variables “Dummy”
Satisfacción = a + b1 Salud + b2 casado + b3 soltero + b4 viudo
Satisfacción = 20 + 3 Salud + 11,5 casado + 5 soltero - 3 viudo
Para los casados que tienen asignado el valor 1 en la variable CASADO y 0 en el resto al sustituir estos valores en la ecuación:Satisfacción = 20 + 3 Salud + 11,5 casado = 31,5 + 3 salud
Para los solteros:Satisfacción = 20 + 3 Salud + 5 soltero = 25 + 3 salud
Para los viudos:Satisfacción = 20 + 3 Salud - 3 viudo = 17 + 3 salud
Para los divorciados:Satisfacción = 20 + 3 Salud