comprobacio 769 n de supuestos spss

Upload: andresfuend

Post on 07-Jul-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    1/24

    Comprobación de supuestos para estadísticamultivariada en SPSS

    Felipe Ruiz 

    Carolina García Ayudantía Estadística IV 2015.

    Aspectos previos:

     Trabajaremos con el archivo “Ejemplo Supuestos (SPSS)” en formato S!"#

    disponible para descar$ar desde %&Cursos Es una base de datos 'ue contiene

    seis variables especialmente preparada para la sesión de audantía

    Normalidad Univariante:

    Para comprobar normalidad univariante podemos observar# en primer lu$ar# el

    histo$rama de nuestras variables para ver de forma $r*ca como se comporta

    la variable Para eso vamos a ir a “ Analizar ”# “Estadísticos Descriptios”#

    !Frecuencias” e in$resar los tres índices 'ue utli+aremos para el anlisis

    "amos a ,r*cos le pedimos "isto#ra$as  $ostrar cura nor$al en el

    %isto#ra$a

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    2/24

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    3/24

     Tenemos una primera evidencia de la no normalidad de nuestras variables

    !dems# e/isten dos tests estadístico para corroborar normalidad univariada

    cuo uso es limitado se$0n el tama1o muestral.

    • Shapiro&2il3s. para tama1os muestrales 'ue van entre 4 54 casos

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    4/24

    • 6olmo$orov&Smirnov. para tama1os muestrales 'ue oscilan entre 54

    7444 casos

    Estos test nos dicen 'ue si el la si$ni*cación estadística (el valor p) es mayor

    o igual a 0,05 (si estamos trabajando con tal límite)# la distribución muestral

    de la curva teórica la distribución muestral de los datos observados seasemejan con una si$ni*cación estadística 'ue se encuentra dentro de los

    mr$enes de error aceptables (er$o# la distribución de datos observada# puede

    ser considerada como normal se$0n un mar$en de con*an+a)

    Como tenemos 844 casos empleamos el test 6&S.

    En el si$uiente cuadro de dilo$o in$resamos todas nuestras variables en

    anlisis en el cuadro &ista Contrastar aria'les9 en Distri'uci(n de contraste

    nos ase$uramos de 'ue est: marcada la opción )or$al.

    En los resultados nos interesa el $r*co titulado *rue'a de +ol$oro,-$irno 

     para una $uestra9 nos muestra el valor del estadístico su si$ni*cación#

    mediante la cual podemos determinar si la variable se distribue o no de

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    5/24

    acuerdo a una distribución normal En este caso# la si$ni*cación estadísitica del

    test# para cada variable# es menor a 4#45# por lo 'ue podemos asumir 'ue

    nin$una se distribue normalmente

    Prueba de Kolmogorov-Smirnov para una muestra

    SAT CLAB CONFLIC

    N 200 200 200

    Parámetros normalesa,bMedia 3,121 2,221 2,!"0

    #es$ia%i&n t'(i%a ,)1"* 1,00*+* 1,03213

    #ieren%ias más e-tremas

     Absol.ta ,203 ,1!0 ,1!1

    Positi$a ,11) ,1!0 ,1!1

    Ne/ati$a ,203 ,0)0 ,0)0

    de olmo/oro$Smirno$ 2,")) 1,)) 2,001

    Si/ asint&t 4bilateral5 ,000 ,001 ,001

    !un'ue no es el caso# debido a nuestro tama1o muestral# e/plicaremos como

    obtener el estadístico de Shapiro&2il3s# 'ue utili+aremos con muestras

    pe'ue1as (54 o menos casos) cómo obtener los valores de si$etría  curtosis

    'ue nos servirn para el caso de muestras $randes (ms de 7444 casos) Estaopción nos entre$a tanto los valores de simetría curtosis# los valores de la

    prueba 6olmo$orov&Smirnov como los valores de Shapiro&2il3s

    En este caso# in$resaremos sólo una de nuestras variables de inter:s

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    6/24

    En la opción Estadísticos# marcamos la opción Descriptios  podemos tambi:n

    establecer el intervalo de con*an+a deseado.

    En la opción Gr/cos marcamos la opción Gr/cos con prue'as de nor$alidad

     ojo 'ue a'uí no estamos solicitando los histo$ramas con la curva normal# sino

    los test 6&S ; S&2 # des seleccionamos lo 'ue est: marcado en Descriptios dejamos el resto por defecto.

    En los resultados nos interesan dos tablas.

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    7/24

    En primer lu$ar a'uella titulada Descriptios# 'ue nos indica los valores de

    si$etría curtosis.

    Descriptivos

    6stad'sti%o 6rror t'(

    SAT

    Media 3,121 ,0*0"

    Inter$alo de %onian7a (ara la media al *8

    L'mite inerior 3,020

    L'mite s.(erior 3,221

    Media re%ortada al *8 3,1!0

    Mediana 3,100

    9arian7a ,*1+

    #es$ t'( ,)1"*

    M'nimo 1,0

    Má-imo *,0

    :an/o !,0

     Am(lit.d inter%.artil ,*

     Asimetr'a ,*0+ ,1)2

    C.rtosis 1,*+1 ,3!2

    En este caso# el valor de la simetría es < 4#5= Empleando la si$uiente fórmula

    podemos calcular el valor del > de simetría determinar si respecto a tal valor

    la variable distribue o no normalmente ?a idea es 'ue si nos da entre el

    intervalo de con*an+a especi*cado ( @& 7#A=)# la variable distribue

    normalmente.

    Zsimetría=Simetría

    √6

    n

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    8/24

    −3,233=−0,56

    √  6

    200

     Tambi:n es posible calcular el > de curtosis empleando la si$uiente ecuación.

    Zcurtosis=Curtosis

    √24

    n

    En se$undo lu$ar# nos interesa la tabla *rue'as de nor$alidad# donde

    podemos acceder a los valores del test 6olmo$orov&Smirnov Shapiro&2il3s (la

    forma para interpretarlos est e/plicada ms arriba).

    Pruebas de normalidad

    olmo/oro$Smirno$a S;a(iro

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    9/24

    %na ve+ marcada la opción dispersionBPuntos# nos va a abrir un cuadro de

    dilo$o vamos a pedir una “ispersión Datricial”

    %na ve+ abierta la ventana de la dispersión matricial# in$resamos los índices

    como variables de la matri+# vamos a “-pciones” seleccionamos e/cluir casos

    variables por variable

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    10/24

    Continuamos obtenemos la sifuiente matri+.

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    11/24

    Esta matri+ de colinealidad permite evidenciar a cierta linealidad en la

    relación entre las variables9 siendo mu alta para el caso de la relación etre

    condiciones laborales conictividad

     Tambi:n podemos pedir una matri+ de correlación# empleando la correlación de

    Pearson# para evaluar 'ue tan fuerte es la correlación entre las variables

    Fecordar 'ue Pearson es un coe*ciente param:trico# por lo 'ue re'uiere 'ue

    estemos trabajando con variables de num:ricas con distribución normal e

    no cumplir con estos re'uisitos# esto debe ser evidenciado a la hora de

    interpretar el estadístico

    Para obtener el estadístico vamos a Analizar Correlaciones 3iariadas.

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    12/24

    En el cuadro de dilo$o se in$resan todas las variables a anali+ar9 se marca la

    opción *earson en el apartado Coe/cientes de correlaci(n El resto se deja por

    defecto

    En la matri+ de correlaciones obtenida# como era esperable dada la $r*ca

    observada# podemos observar coe*cientes 'ue nos indican la presencia de un

    alto $rado de correlación entre las variables (coe*cientes maores al valor

    absoluto 4#5)

    Correlaciones

    S!T C?!G C-HI?JC

    S!T Correlación de Pearson 7 KLAMM K45MM

    Si$ (bilateral) #444 #444

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    13/24

    H 844 844 844

    C?!G

    Correlación de Pearson KLAMM 7 #KALMM

    Si$ (bilateral) #444 #444

    H 844 844 844

    C-HI?JC

    Correlación de Pearson K45MM #KALMM 7

    Si$ (bilateral) #444 #444

    H 844 844 844

    Multicolinealidad

    Para evaluar la multicolinealidad# es decir# para evaluar la relación lineal entrelas variables en su dimensión multivariante# ocuparemos una re$resión lineal

    En el cuadro de dilo$o in$resamos las variables Si no tenemos una variable

    independiente# podemos in$resar cual'uier otra num:rica (aun'ue no forme

    parte de nuestro anlisis) con la condición de 'ue sea independiente de

    nuestro objeto de estudio (la variable folio incluida en la maor parte de los

    estudios sirve para ello) Todas las variables de inter:s las in$resamos como

    dependientes

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    14/24

    En la opción “estadísticos4 # pedimos los dia#n(sticos de colinealidad# para

    comprobar la independencia de las variables dependientes

    Hos interesa la 0ltima tabla de los resultados# titulada Dia#n(sticos de

    Colinealidad. Jnteresa el índice de condición en la 0ltima *la del modelo

    Diagnósticos de colinealidada

    Modelo #imensi&n A.to$alores >ndi%e de %ondi%i&n Pro(or%iones de la $arian7a

    4Constante5 SAT CLAB CONFLIC

    1 1 3,)"" 1,000 ,00 ,00 ,00 ,00

    2 ,1+ !,32 ,00 ,0! ,02 ,02

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    15/24

    3 ,012 1",0)+ ,00 ,01 ,+" ,!

    ! ,00! 31,+1! , ,+ ,30 ,0!

    e 4 a 74 las variables multicolineada es baja• Entre 74 L4 tenemos una multicolineadad moderada

    • Sobre L4 tenemos una multicolinealidad alta

    En tal medida# los valores del índice de condición# para el $rupo de tres

    variables estudiadas# indica 'ue e/iste una relación lineal alta entre las

    variables en su dimensión multivariante

    Homocedasticidad

    ?a homocedasticidad es un suepuesto de la estadística param:trica re*ere ala homo$eneidad de varian+as en las poblaciones estudiadas Para su anlisis#

    se re'uire establecer relaciones de dependencia trabajar con variables

    normales Como vimos anteriormente# nuestras variables no cumplen el

    supuesto de normalidad# pero haremos i$ual el ejercicio para aprender como

    funciona

    Para ver la relación de las varian+as de dos variables m:tricas podemos ocupar

    test $r*cos de i$ual dispersión de varian+as ?a aplicación de esta forma de

    evaluación se produce en la re$resión m0ltiple# en relación con la dispersión de

    la variable dependiente a lo lar$o de las variables independientes m:tricas

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    16/24

    Seleccionamos re$resión lineal e in$resamos nuestras variables ?a variable

    satisfacción entraría como la dependiente# las condiciones laborales la

    conictividad como las independientes# de acuerdo a los antescedentes de la

    investi$ación

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    17/24

    "amos a la opción Gr/cos  le pedimos #enerar todos los #r/cos parciales

    Hos arrojar los si$uientes $r*cos.

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    18/24

    ?as

    distribuciones esperadas de para una distribución homocedastica

    heterocedastica son las si$uientes.

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    19/24

    Podemos concluir preeliminarmente 'ue no ha homocedasticidad en ladispersión de nuestra variable dependiente a los lar$o de nuestras variables

    independientes# lo 'ue puede e/plicarse en parte por la no normalidad de

    nuestras variables

    El test estadístico para ver la dispersión de la varian+a de una variables en

    distintos $rupos es el test de &eene Este suele utili+arse para ver si las

    varian+as de las variables m:tricas son i$uales o varin a lo lar$o de cual'uier

    cantidad de $rupos

    Para ello vamos a  Analizar  Co$parar $edias Anoa de una actor   e

    in$resaremos nuestros índices como variables dependientes la variable

    6ra$os de Edad  como factor (independiente) Esta variable $enerar los

    $rupos 'ue sevirn para ver como se comporta la varian+a de cada una de

    nuestras variables en los distintos $rupos :tareos9 es decir# veri*car si# en

    relación a los tramos de edad# los $rupos poseen homocedasticidad (i$ualdad

    de varian+a) o heterocedasticidad (la varian+a no es constante a lo la$o de los

    $rupos)

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    20/24

    En 7pciones marcarmos *rue'as de %o$o#eneidad de arianzas.

     ; obtenemos como resultado la si$uiente tabla.

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    21/24

    ado 'ue nuestra hipótesis nula es 'ue las varian+as de los $rupos son i$uales#

    si buscamos homocedasticidad# re'uerimos una valor de si$ni*cación maor a

    4#45# a un nivel de con*an+a del A5N En este caso# de acuerdo a los

    resultados obtenidos# sólo el Jndice de Conictividad $eneraría $rupos con

    varian+as homo$eneas Sin embar$o# estos resultados no son vlidos por'ue

    nuestras variables no poseen normalidad univariante

    Si 'ueremos evaluar la homocedasticidad multivariable de nuestras variables

    m:tricas utili+amos el estadísitico 8 de 3o9. En SPSS# la 0nica forma de

    solicitar esta prueba es a trav:s del modelo de discriminante# el 'ue ser

    revisado en detalle ms adelante

    Detección multivariante de casos atípicos

    Oaremos un m:todo de detección de casos atípicos utili+ando la 8 (distancia)

    de Dahalanobis9 a tales valores se les aplica una prueba de si$ni*caciónestadística. si la si$ni*cación estadística es menor a 4#447 lo consideraremos

    como un caso atípico7

    Para obtener la distancia de Dahalanobis debemos reali+ar una re#resi(n

    lineal. Para el modelo necesitamos a$re$ar una variable dependiente Se

    a$re$a la variable I-?J- (no nos interesa la re$resión por sí misma# sino por la

    8 de Dahalanobis) %tili+aremos esta variable para ejempli*car en este caso#

    a 'ue Dahalanobis no re'uiere relaciones de dependencia

    7 Fecordar 'ue en clase fue revisado el m:todo de anlisis de Fesiduos

    estandari+ados para la detección de casos atípicos

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    22/24

    En la opción $uardar# le pedimos solamente la distancia de Dahalanobis# todo

    lo dems 'ueda sin marcar

    Fespecto a esta operación# no nos interesan las salidas9 sólo interesa 'ue creó

    una variable con la medición m:trica de las distancias por variable

    ! tal variable nueva# debemos aplicar una prueba de si$ni*cación estadística"amos a calcular aria'le  aplicamos una si$ni*cación estadística chi

    cuadrado# con L $rados de libertad8

    En Grupo de Funciones pulsamos -i#ni/caci(n# en Funciones y aria'les

    especiales hacemos doble clic sobre Si$Chis'# lo 'ue pone tal comando como

    primer elemento en la E9presi(n )u$:rica. ?ue$o hacemos doble clic sobre la

    variable 8a%alano'is Distance# la in$resamos al par:ntesis de la función9

    inmediatamente lue$o de la variable < dentro del par:ntesis# a$re$amos una

    coma un L (el n0mero de $rados de libertad) En Varia'le de destino

    8 ?os $rados de libertad corresponden al n0mero de variables independientes con el'ue se calculó la distancia de Dahalanobis# en este caso eran tres variables

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    23/24

    tipeamos -i#ni/caci(n8ala%a 'ue ser el nombre de la nueva variable creada

    Pulsamos aceptarBpe$ar

    Huevamente no nos interesan los resultados del anlisis# sino 'ue se creó una

    nueva variable con la si$ni*cación estadística para cada distancia de

    Dahalanobis

    -rdenamos los casos de la variable reci:n creada de modo ascendente# para

    evaluar cules cuantos casos 'uedan fuera

    Fecordemos 'ue si la si$ni*cación estadística es menor a 0,00 el caso ser

    considerado como un caso atípico En este ejemplo# podemos observar 'ue

    solamente los tres primeros casos presentan una si$ni*cación menor a 4#447#

    por lo 'ue solamente tres casos podrían ser considerados atípicos en la

    dimensión multivariante

  • 8/18/2019 Comprobacio 769 n de Supuestos SPSS

    24/24

    Para eliminarlos de la base# basta con mantener seleccionados los tres casos#

    presionar el botón derecho oprimir 'orrar 

    Dar+o 8475