42107537 escala de likert

Universidad de Via del Mar Escuela de Ciencias Sociales Carrera de Sociologa

TECNICAS CUANTITATIVAS

ESCALA LIKERT La escala Likert, creada en 1932 por el psiclogo norteamericano Rensis Likert (1903-1981), es el instrumento ms usado para medir actitudes. La escala Likert es un conjunto de aseveraciones (items) ante las cuales la persona expresa su grado de acuerdo o desacuerdo o indecisin. Cada tem tiene habitualmente cinco opciones de respuesta: Muy de acuerdo (MA), De acuerdo (A), Indeciso (I), En desacuerdo (D) y Muy en desacuerdo (MD). No hay respuestas correctas o incorrectas. Hay items positivos, que expresan actitud positiva hacia el objeto, e items negativos, que expresan actitud negativa hacia el objeto. Si estamos midiendo actitud hacia la televisin, un tem positivo sera la televisin sirve para estar al da en muchos temas y uno negativo sera ver televisin es perder el tiempo. Es conveniente que la escala tenga ambos tipos de items para controlar la tendencia a estar de acuerdo con las aseveraciones o a contestar mecnicamente. Los puntajes van de 1 a 5, dando mayor puntaje a la opcin de respuesta que indica actitud positiva hacia el objeto. Si el tem es positivo, la opcin MA recibe 5 puntos; si es negativo, la opcin MD recibe 5 puntos. En el ejemplo del prrafo anterior, recibe puntajes mximos quien est muy de acuerdo con que la televisin sirve para estar al da, y muy en desacuerdo con que ver televisin es perder el tiempo. El puntaje de una persona en la escala es la suma de los puntajes que ha obtenido en los items. A mayor puntaje en la escala, ms positiva es su actitud.

La escala Likert se aplica habitualmente como parte de un cuestionario, que puede

contener varias escalas y otros instrumentos. La escala Likert es una escala sumatoria: sus puntajes son la suma de los puntajes de los items. Otras escalas sumatorias son las de items con opciones de respuesta de 0 a 10, y las de items dicotmicos (1=s, 0=no). La escala Likert fue diseada para medir actitudes pero, por lo fcil que es construirla, contestarla y analizarla, y porque sus propiedades psicomtricas (validez, confiabilidad) son relativamente fciles de evaluar, es usada para medir opiniones, percepciones, valores, aspectos de personalidad y otras variables. Por ejemplo, la

----------------------------------------------------------------------------------------------------------- J. Rodrguez Cano, U.de Via del Mar, [email protected]

pregunta Qu le pareci la seleccin de ftbol en el ltimo partido? puede tener las opciones de respuesta muy bien, bien, regular, mal y muy mal, con puntajes 5 a 1 respectivamente.

Un problema de esta escala radica en el elemento conductual de las actitudes: es

la distancia que hay entre la respuesta a palabras escritas en un papel y la conducta real. Las palabras aslan la conducta, la sacan de contexto real. Revelan en parte el deber ser. Son la respuesta verbal a una situacin simblica. La conducta se da en una situacin concreta, en un contexto con muchos otros elementos, no equivalente a la respuesta escrita. Pero no tenemos mejor alternativa: una buena medicin debe contextualizar lo ms posible el estmulo que aparece en el papel. Una limitacin de toda medicin en papel es que exige un grado mnimo de comprensin de lectura. En general, es problemtico aplicarla a nios o a personas de muy bajo nivel educacional o con grados de analfabetismo.

Hay varias recetas para escribir items. Aqu hay unas cuantas:

Evitar aseveraciones que se refieran a hechos del pasado. Las personas suelen contestar tratando de ser consistentes con su actitud actual. Si simplemente no recuerdan, suelen idealizar el pasado o inventarlo.

Evitar items que contengan dos o ms aseveraciones. En vez de un tem con dos aseveraciones, es preferible dos items con una cada uno.

Los items deben ser cortos, estar escritos en forma directa, con palabras simples, entendibles y familiares para el que contesta.

Evitar items extremos, en que todos o nadie estarn de acuerdo. Los items extremos no discriminan y, por lo tanto, no entregan informacin. Las diferencias en los extremos de la escala no se detectan con items extremos sino con el uso de las opciones de respuesta de los items.

Evitar palabras como slo, solamente, principalmente, y similares. No usar, salvo que se justifique, palabras como todos, nadie, siempre, nunca,

ninguno, etc. Evitar aseveraciones de hechos objetivos o de conocimientos. Cuntos items debe tener una escala? No se recomienda ms de quince o veinte items. Una escala larga puede aburrir y hacer que las respuestas al resto de la escala no sean contestadas o lo sean mecnicamente. Esto depende de las caractersticas de las personas a las que se les va a aplicar y del lugar donde se har. Por otra parte, cuantos ms items haya, mayor ser la confiabilidad, porque el error sistemtico tender a compensarse.

Aunque la confiabilidad de una escala aumenta al tener ms items, el aumento va disminuyendo al agregar (ver ms adelante el coeficiente Spearman-Brown). Tambin se supone que una escala mide una sola dimensin y esto es menos sostenible al haber ms items. ----------------------------------------------------------------------------------------------------------- J. Rodrguez Cano, U.de Via del Mar, [email protected]

Las etapas en la construccin de la escala son: 1. Definir el concepto nominal y operacionalmente. 2. Construccin de items. Escribir items positivos y negativos. (Crear ms de los

necesarios, para posibles reemplazos.) 3. Aplicar un pretest. Los sujetos del pretest, de caractersticas similares a los que se

les va a aplicar la escala definitiva, contestan los items e indican qu problemas han tenido al hacerlo.

4. Se analizan los items, la validez y confiabilidad de la escala y, si corresponde, se

modifican. 5. Se aplica la escala.

Para cada persona se suman los puntajes que obtuvo en los items. La suma es su puntaje en la escala. Esto se hace porque, aunque las opciones de respuesta de los items son variables ordinales, se les considera cuantitativas porque tienen ms de tres categoras de respuesta. Esto se justifica adems, tericamente, en que la actitud que la subyace es continua, cuantitativa.

ANALISIS DE LOS ITEMS El anlisis de los items sirve para determinar cules se mantendrn en la escala y cules se han de eliminar. Se espera que los items discriminen y que se correlacionen positivamente entre s. Un tem discrimina si separa a los sujetos en el tem en forma similar a como los separa en la actitud, expresada en el puntaje de la escala. Para evaluarlo se pueden tomar los grupos de los cuartiles extremos (4 y 1) en el puntaje total y comparar sus promedios en el tem mediante un Anova. Otra forma de hacerlo es correlacionar los puntajes del tem y la escala.

Likert indica algunas posibles causas de que un tem no discrimine:

Es poco entendible.


Se refiere a algo diferente del resto de los items (por lo tanto, personas en diferentes posiciones de la escala tienen igual probabilidad de estar de acuerdo).

Es respondido igual (o casi igual) por todo el grupo. Esto se da habitualmente en

items muy extremos. La correlacin disminuye si los items tienen poca varianza. Esta atenuacin tambin ocurre cuando se disminuye el nmero de opciones de respuesta de los items.

Los items deben estar correlacionados entre s. Por lo tanto, deben estar tambin correlacionados con la escala, que es la suma de los items. Un tem que discrimina adecuadamente est tambin correlacionado con los dems items y con la escala. Si dos items estn correlacionados, quiere decir que miden lo mismo, el mismo concepto. Cuanto ms alta es la correlacin, mayor es la medicin comn del concepto.

Sin embargo, si la correlacin entre dos items, y de cada uno con los dems, es extremadamente alta, conviene eliminar uno porque est midiendo lo mismo que el otro. Adems de alargar intilmente la escala, da doble ponderacin al aspecto medido.

Los items que estn poco correlacionados miden cosas diferentes. Hay que tener presente que aunque un tem no est correlacionado con ninguno otro, su correlacin con la escala no ser 0 porque el tem es parte de la escala. Cuando hay pocos items conviene correlacionar cada tem con la escala sin el tem.

Se deben eliminar los items que estn poco correlacionados con los dems y con la escala. Si la correlacin es negativa hay que considerar invertir su codificacin. Un tem debe ser tambin eliminado si est correlacionado positivamente con algunos items y negativamente con otros; adems, probablemente su correlacin con la escala ser baja.

Un tem poco correlacionado no aporta a la escala y disminuye su validez y su

confiabilidad. Un peligro al eliminar muchos items es que algunas dimensiones pueden quedar con muy pocos items o con ninguno.

CONFIABILIDAD: CONSISTENCIA INTERNA

Se han analizado antes dos formas de confiabilidad: la estabilidad del instrumento y el grado de acuerdo entre jueces. Se ver aqu otra forma de confiabilidad, la consistencia interna, especialmente aplicable a escalas y tests.

La consistencia interna de un instrumento consiste en que cada parte de la escala mida lo mismo, produzca resultados similares, de manera que sea indiferente cul parte del instrumento usamos en nuestra medicin.


Los primeros mtodos usados fueron los de equivalencia, como el split-half, que correlaciona los puntajes de las dos mitades del test. Si miden lo mismo, si son

equivalentes, la correlacin ser alta. sta no indica la confiabilidad del instrumento sino la de cada una de las mitades. Est atenuada porque cada parte tiene la mitad de los items del test. (Se sabe que la confiabilidad aumenta al alargar un test.)

La frmula de Spearman-Brown sirve para estimar la confiabilidad al alargar o acortar un instrumento, al aumentar o disminuir el nmero de items:

'

1 ( 1) 'krrk r

= + en que r es la confiabilidad de la escala inicial, k es el tamao de la nueva escala con respecto a la escala inicial (por ejemplo, k=2 si se aumenta al doble, k=.5 si se acorta a la mitad), y r es la confiabilidad de la nueva escala.

Por ejemplo, se quiere acortar un test de treinta a veinte items, eligindolos al azar. Si la confiabilidad del test de treinta items es .85, la confiabilidad estimada del nuevo test ser:

( )( )2 (.85)3 .7921 1 (.85)3

r = =+

en que k = 20/30 = 2/3. El nuevo test tendr una confiabilidad de .79. Si se duplica el tamao del test, como cuando sabemos la confiabilidad de las mitades y queremos conocer la del test entero, k = 2. Se puede ver que en este caso, la frmula del coeficiente de Spearman-Brown se simplifica a:

2 '

1 'rrr

= + Por ejemplo, si la correlacin de las mitades ( ) es .60, la confiabilidad del test

entero ser

'r2(.60) .75

1 (.60)r = =+

Se puede tambin usar la frmula de Spearman-Brown para estimar cuntos items se necesitan para conseguir una determinada confiabilidad:

(1 ')'(1 )

r rkr r

= Por ejemplo, si un escala de quince items tiene confiabilidad .70, cuntos items se estima debera tener para que la confiabilidad fuera .80? La respuesta es 26 items. ----------------------------------------------------------------------------------------------------------- J. Rodrguez Cano, U.de Via del Mar, [email protected]

No hay una relacin proporcional entre el aumento del largo del test y el aumento de la confiabilidad. sta crece en menor proporcin, y es aun menor al continuar aumentando k, y tambin menor cuanto mayor sea r. Esto se debe al factor techo: r no puede ser mayor de 1.

La objecin que se hace al mtodo de split-half es que el cansancio o la reactividad pueden hacer diferentes las respuestas de cada mitad. Esto se puede superar correlacionando los puntajes de los items pares e impares. Pero, dado que la ubicacin de los items en la escala es arbitraria, pueden haber muchas correlaciones.

Si se parte un test en todos las posibles pares de mitades y se calcula una

correlacin para cada par, el promedio de estas correlaciones es numricamente igual al coeficiente creado por Lee Cronbach en los aos 50.

El coeficiente es la medida ms usada para medir confiabilidad de escalas y

tests. Mide el grado en que los items son consistentes, en que miden lo mismo, que van en la misma direccin.

El clculo de no se realiza correlacionando todos los pares de mitades, sino de una manera ms fcil, usando la matriz de covarianza de los items.

Es sabido que si 1 2x x x= + , la varianza de x es igual a la suma de la varianza de 1x ms la de 2 x ms dos veces la covarianza de 1x y 2x . Si x es la suma de k

elementos, su varianza es:

i jv

, en que i

Cuanto mayores son los valores de las covarianzas y menores los de las varianzas, ms consistente es la escala.

La frmula de es:

k2i

i 12x

sk 1

k 1 s=

=

en que k es el nmero de items, es la varianza del tem i, y 2is

2xs es la varianza de la

escala total. La frmula contiene un factor de correccin (k / k-1) y la proporcin de varianza buena (igual a uno menos la proporcin de varianza mala). Los valores de van de 0 a 1. Se considera que un valor superior a .70 .80 es aceptable. Si es menor, pueden desecharse los items que menos aportan a la confiabilidad de la escala (la salida de Spss indica qu pasara si se eliminara cada tem). Se presenta abajo una salida de Spss a la que he agregado comentarios. Muestra el anlisis de la consistencia interna de una escala Likert. Una escala Likert de cinco items es aplicada a doce personas. En la tabla de datos siguiente, los items estn en las columnas y las personas en las lneas. ITEMS

1 2 3 4 5

3 2 1 4 3 4 2 2 4 4 4 3 2 5 3 3 2 2 5 2 2 1 1 4 2 3 1 2 3 3 4 4 3 5 3 4 3 3 5 4 3 3 2 4 4 2 3 1 3 2 3 3 3 3 3 5 4 3 3 3

--------------------------------------------------------------


Se muestra a continuacin la matriz de covarianzas (llamada a veces, como en esta salida de Spss, de varianza-covarianza). Es simtrica:

sus tringulos superior e inferior son iguales. Spss muestra slo uno, el inferior. En la diagonal principal aparecen las varianzas de cada tem. VARIANCE-COVARIANCE MATRIX ITEM1 ITEM2 ITEM3 ITEM4 ITEM5 ITEM1 0.787879 ITEM2 0.515152 0.992424 ITEM3 0.515152 0.492424 0.628788 ITEM4 0.181818 0.090909 0.090909 0.727273 ITEM5 0.363636 0.181818 0.272727 0.090909 0.545455 --------------------------------------------------------------- R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A) N of Statistics for Mean Variance Std Dev Variables SCALE 15.0000 9.2727 3.0451 5 ---------------------------------------------------------------- ITEM-TOTAL Statistics Scale Scale Corrected Mean Variance Item- Alpha if Item if Item Total if Item Deleted Deleted Correlation Deleted ITEM1 11.6667 5.3333 .7687 .6098 ITEM2 12.4167 5.7197 .5374 .7064 ITEM3 12.9167 5.9015 .7118 .6436 ITEM4 11.0000 7.6364 .1929 .8175 ITEM5 12.0000 6.9091 .4683 .7281 Alpha = .7537 El coeficiente es aceptable (.7537), pero la ltima columna (Alpha if Item Deleted) nos dice que puede aumentar a .8175 si se elimina el tem 4. Se puede ver la baja correlacin de este tem con el conjunto de los dems: .1929 (columna Corrected Item-Total Correlation).


A continuacin, los cambios que ha producido la eliminacin del tem 4: R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A) N of Statistics for Mean Variance Std Dev Variables SCALE 11.0000 7.6364 2.7634 4 ITEM-TOTAL Statistics Scale Scale Corrected Mean Variance Item- Alpha if Item if Item Total if Item Deleted Deleted Correlation Deleted VAR00001 7.6667 4.0606 .7793 .6996 VAR00002 8.4167 4.2652 .5781 .8099 VAR00003 8.9167 4.4470 .7656 .7155 VAR00005 8.0000 5.4545 .4743 .8375 Alpha = .8175 Ejercicio 1. Calcular a partir de la siguiente matriz de covarianzas. Despus calcularlo eliminando slo el item1, despus slo el item 2, despus slo el item 3.

Item 1 Item 2 Item3

Item 1 10 5 4

Item 2 5 5 3

Item 3 4 3 8

Ejercicio 2. Analizar la siguiente salida de Spss para una escala de cinco items. R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A) Scale Scale Corrected Mean Variance Item- Alpha if Item if Item Total if Item Deleted Deleted Correlation Deleted ITEM1 14.0667 6.7810 .4441 .6667 ITEM2 12.4000 6.8286 .5282 .6434 ITEM3 12.4000 7.1143 .2396 .7515 ITEM4 13.1333 6.2667 .5402 .6282 ITEM5 12.5333 4.8381 .6430 .5696 Alpha = .7066


A veces puede aparecernos un negativo. En la frmula de se puede ver que

esto es posible slo si

2

12

k

ii

x

s

s=

es mayor que 1, o sea, si el numerador es mayor que el

denominador. Para que esto ocurra, la suma de las covarianzas tiene que ser negativa. Esto puede producirse: (1) cuando los items negativos no han sido recodificados; (2) si los items tienen realmente covarianzas negativas porque miden cosas diferentes, y hay que rehacer la escala. El coeficiente KR20 de Kuder-Richardson es usado para medir la consistencia interna de escalas de items dicotmicos. La frmula es similar a , con la varianza (piqi) del tem dicotmico i.

k

i ii 1

2x

p qkKR20 1

k 1 s=

=

Una escala de items dicotmicos presenta aseveraciones y las personas optan por las respuestas s o no, con puntajes 1 y 0 respectivamente. p es la proporcin de personas de acuerdo con el tem, y q es la proporcin en desacuerdo; por lo tanto, p + q = 1. El promedio de un tem dicotmico es p y su varianza es pq. Para demostrar esto empecemos calculando el promedio Lo haremos con la siguiente tabla, en que las frecuencias estn expresadas en proporciones (p y q) cuya suma es n = 1. x f fx

1 p p 0 q 0 1 p


El promedio de la variable dicotmica es: 1

fx pX pn

= = = . El promedio de un item dicotmico es la proporcin de casos de acuerdo con el tem. Por lo tanto, si el promedio = p = .60, quiere decir que 60 % de las personas est de acuerdo. Que tenga sentido calcular el promedio de una variable dicotmica, que el resultado sea interpretable, significa que es una variable cuantitativa. Hay que recordar que esto es posible slo si los valores asignados a las respuestas son 1 (s) y 0 (no).

Demostremos que la varianza de un tem dicotmico es pq usando la siguiente

tabla. La frmula de la varianza en tablas de frecuencia es: 2

2 ( )f x Xsn=

x f x - X (x - X )2 f (x - X )2

1 p q q2 pq2

0 q -p p2 p2q 1 pq(p+q)

Dado que p+q=1, y que n=1, la varianza de un tem dicotmico es:

2

2 ( )1

f x X pqs pn

q= = =

El coeficiente KR20 fue creado por G. F. Kuder y M. W. Richardson a fines de los aos 30. El coeficiente de Cronbach, creado unos quince aos despus, es una generalizacin del KR20 para todo tipo de items. INTERPRETACION DE PUNTAJES La escala Likert diferencia personas: a mayor puntaje, ms positiva es su actitud. Sin embargo, no es posible interpretar un puntaje en forma absoluta, sino con respecto al grupo. Salvo que una persona tenga el puntaje mximo o el mnimo, o muy cercanos a ellos, no se puede decir que tenga una actitud positiva o negativa. No existe un puntaje


neutral; no lo es el puntaje central de la escala (el punto medio entre el mnimo y el mximo posibles).

Tampoco estar sobre la mediana de los puntajes del grupo indica una actitud positiva; slo que se est en la mitad de la muestra que tiene una actitud ms favorable (o menos desfavorable).

Cuando los puntajes son estandarizados (se transforman a desviaciones standard:

puntaje z), los valores son referidos al grupo, y sirven para comparar. Si se aplica la escala a una o ms muestras, grande(s) y representativa(s) de una

poblacin especfica, se pueden asociar puntajes a percentiles. En este caso se habla de establecer normas, que permiten interpretar puntajes refirindolos a la poblacin. Se dice que la escala ha sido estandarizada. Los puntajes, expresados en percentiles, sirven para comparar, no ya con el grupo o muestra, sino con lo que podra ser considerada la poblacin. VENTAJAS DE LA ESCALA LIKERT

Es un instrumento estructurado, lo que disminuye sus problemas de confiabilidad: las personas reciben los items presentados de la misma manera, con igual introduccin, recomendaciones, formato y opciones de respuesta.

Aplicada en un cuestionario, es rpida y barata. Puede abarcarse a gran cantidad

de personas. El costo por persona es relativamente bajo. Como los items no consisten en preguntas sino en aseveraciones, la persona se

siente ms libre para opinar sobre temas comprometedores. La responsabilidad de lo afirmado en la aseveracin se traslada del entrevistado al entrevistador.

Como cada tem tiene varias opciones y los puntajes de los items se suman, la

escala muestra las diferencias entre las actitudes de las personas. Esto hace inncecesario formular items extremos (que adems no discriminan) para detectar diferencias.

Los datos que produce son fciles de manejar usando programas estadsticos, que

habitualmente contienen los coeficientes necesarios para evaluar las propiedades de la escala.

Si la escala tiene buena validez y confiabilidad, puede ser usada como

instrumento permanente.


42107537 escala de likert

Documents